EC2内のネットワークでちょっとハマったこと

EC2内でサーバ名での名前解決ができなくなったり

という現象が発生しました。忘備録の意味も含めてメモします。

現象

先日、AWSのEC2上で構築していた開発環境でサーバ名の名前解決が突然されなくなってしまう、という現象が発生しました。 以下の構成になってて、すべてのサーバはドメイン参加しています。

  • DCサーバ
  • Exchangeサーバ
  • SharePointサーバ
  • Webアプリサーバ
  • クライアント(Windows 10)

クライアント以外はプライベートIPしか割り振っていない状態です。

正確にはWebアプリサーバからExchangeサーバに対してリモートシェルを実行していたのですが、急にエラーを出すようになっていました。

New-PSSession で サーバー名を解決できないので、WinRM クライアントは要求を処理できません が出力されてました。

後述でも記載していますが、サーバ名での名前解決ができなくなっていたので、FQDNの指定にして試したのですが、エラー内容が リモート ホストへの接続が拒否されました。 に変わりはしたものの、解消にはいたらず…

何か設定を変えたのではないか

繋がらなくなってしまった前日までは問題はなかったのですが、ある日を境にWebアプリが動作しなくなってしまっていました。 利用者曰く、何も設定は触っていない、とのこと。

でも繋がらなくなってるから何かやっちゃったんでしょ、みたいな疑いをみんなが持ってしまってました。

「何もしてないけど、PCが動かなくなった」みたいなアレですね…

不思議なことにFQDNでは問題ない

nslookupping コマンドでサーバ名(ex2019serverみたいな)とかで指定するとunknownな状態になってしまいますが、FQDNで指定(ex2019.sample.comみたいな)してあげると問題なくIPが引ける状態でした。

DNSサーバも問題なし、サービスにも問題なし。

hostsにサーバ名書いてあげればとりあえず良さそうな感じではありましたが、急に繋がらなくなった、ということでちょっと気持ち悪い感じがしたので調べてました。

結果的には

結論としては、ネットワークの設定がなぜか変更されていました。

ドメイン参加した後ではシステム情報からDNSサフィックスの情報が参照できるのですが、そこの設定値ではなくネットワークの設定の部分が変わっていました。

IPv4プロトコルの設定画面のところで、DNSサフィックスに関する設定があるのですが、ここがプライマリ設定ではなくAWSの設定に戻ってました。

f:id:akky97:20210717223734p:plain

通常、下記のようにプライマリ設定になっているのですが、EC2サービスでは上記のようにDNSサフィックスの設定になっています。

f:id:akky97:20210717224052p:plain

この設定はドメイン構成時にプライマリ設定に変えているのですが、この設定が元に戻ってました。(AWS設定に戻ってた)

ネットワークの設定で、「イーサネット3」とか「イーサネット4」とかになってたので、何かのタイミングで新しい接続が勝手に増えてるのかなぁ、という気がしています。(ネットワークリソースが変わってたりする?)