Linuxでは(私のライブサーバーはRHEL 5.5にあります。以下のLXRリンクは対応するカーネルバージョンです)、次のようにman 7 ip
言います。
SO_REUSEADDRフラグが設定されていない場合、バインドされたTCPローカルソケットアドレスは閉じられてから一定期間使用できません。
を使用していませんSO_REUSEADDR
。 「期間」はどのくらいですか?どのくらい持続するのか、どのように変更するのか、どうすればわかりますか?
私はこの問題をインターネットで検索していくつかの情報を見つけましたが、それらのどれもアプリケーションプログラマーの観点から実際にこれを説明していませんでした。気をつけて:
- TCP_TIMEWAIT_LENinは
net/tcp.h
「TIME-WAIT状態を破壊する前に待たなければならない時間」で、「約60秒」に固定されています。 - /proc/sys/net/ipv4/tcp_fin_timeout「ソケットが私たちの側で閉じられている場合、ソケットをFIN-WAIT-2状態に保つ時間」、「デフォルトは60秒」です。
私が経験している問題は、TCPライフサイクルのカーネルモデルとプログラマーのポート非可用性モデルとの間のギャップを解消することです。
答え1
プログラムでソケットを使用できないようにするアイデアは、まだ送信されているすべてのTCPセグメントが到着してカーネルによって削除されるようにすることです。つまり、アプリケーションはclose(2)
ソケットを呼び出すことができますが、ルーティング遅延または制御パケットの障害により、TCP接続のもう一方の端から一時的にデータを送信できます。アプリケーションはもはやTCPセグメントを処理しないことを示したので、カーネルはTCPセグメントが入るとそれを破棄する必要があります。
私はタイムアウトを確認するためにコンパイルして使用できる小さなプログラムをCで書いています。
#include <stdio.h> /* fprintf() */
#include <string.h> /* strerror() */
#include <errno.h> /* errno */
#include <stdlib.h> /* strtol() */
#include <signal.h> /* signal() */
#include <sys/time.h> /* struct timeval */
#include <unistd.h> /* read(), write(), close(), gettimeofday() */
#include <sys/types.h> /* socket() */
#include <sys/socket.h> /* socket-related stuff */
#include <netinet/in.h>
#include <arpa/inet.h> /* inet_ntoa() */
float elapsed_time(struct timeval before, struct timeval after);
int
main(int ac, char **av)
{
int opt;
int listen_fd = -1;
unsigned short port = 0;
struct sockaddr_in serv_addr;
struct timeval before_bind;
struct timeval after_bind;
while (-1 != (opt = getopt(ac, av, "p:"))) {
switch (opt) {
case 'p':
port = (unsigned short)atoi(optarg);
break;
}
}
if (0 == port) {
fprintf(stderr, "Need a port to listen on\n");
return 2;
}
if (0 > (listen_fd = socket(AF_INET, SOCK_STREAM, 0))) {
fprintf(stderr, "Opening socket: %s\n", strerror(errno));
return 1;
}
memset(&serv_addr, '\0', sizeof(serv_addr));
serv_addr.sin_family = AF_INET;
serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_addr.sin_port = htons(port);
gettimeofday(&before_bind, NULL);
while (0 > bind(listen_fd, (struct sockaddr *)&serv_addr, sizeof(serv_addr))) {
fprintf(stderr, "binding socket to port %d: %s\n",
ntohs(serv_addr.sin_port),
strerror(errno));
sleep(1);
}
gettimeofday(&after_bind, NULL);
printf("bind took %.5f seconds\n", elapsed_time(before_bind, after_bind));
printf("# Listening on port %d\n", ntohs(serv_addr.sin_port));
if (0 > listen(listen_fd, 100)) {
fprintf(stderr, "listen() on fd %d: %s\n",
listen_fd,
strerror(errno));
return 1;
}
{
struct sockaddr_in cli_addr;
struct timeval before;
int newfd;
socklen_t clilen;
clilen = sizeof(cli_addr);
if (0 > (newfd = accept(listen_fd, (struct sockaddr *)&cli_addr, &clilen))) {
fprintf(stderr, "accept() on fd %d: %s\n", listen_fd, strerror(errno));
exit(2);
}
gettimeofday(&before, NULL);
printf("At %ld.%06ld\tconnected to: %s\n",
before.tv_sec, before.tv_usec,
inet_ntoa(cli_addr.sin_addr)
);
fflush(stdout);
while (close(newfd) == EINTR) ;
}
if (0 > close(listen_fd))
fprintf(stderr, "Closing socket: %s\n", strerror(errno));
return 0;
}
float
elapsed_time(struct timeval before, struct timeval after)
{
float r = 0.0;
if (before.tv_usec > after.tv_usec) {
after.tv_usec += 1000000;
--after.tv_sec;
}
r = (float)(after.tv_sec - before.tv_sec)
+ (1.0E-6)*(float)(after.tv_usec - before.tv_usec);
return r;
}
私は3つの異なるコンピュータでこのプログラムを試しましたが、カーネルがroot以外のユーザーがソケットを再度開くことを許可しなかったとき、55秒から59秒の間の可変時間を得ました。上記のコードを「opener」という実行ファイルにコンパイルし、次のように実行しました。
./opener -p 7896; ./opener -p 7896
別のウィンドウを開き、次の操作を行いました。
telnet otherhost 7896
これにより、「opener」の最初のインスタンスが接続を受け入れてから閉じます。 「opener」の2番目のインスタンスは、bind(2)
毎秒TCPポート7896にアクセスしようとします。 「opener」は55〜59秒の遅延を報告します。
インターネット検索後、次のような提案をする人を見つけました。
echo 30 > /proc/sys/net/ipv4/tcp_fin_timeout
この間隔を減らすために。これは私には効果がありません。私がアクセスできる4台のLinuxマシンのうち、2台は30台、2台は60台です。また、値を10に低く設定しました。 「オープナー」プログラムと違いはありません。
この方法:
echo 1 > /proc/sys/net/ipv4/tcp_tw_recycle
それは状況を変えます。 2番目の「オープナー」は、新しいソケットを取得するのに約3秒しかかかりませんでした。