無論你用任何語言或者是網絡庫,你都可以設置網絡操作的超時時間,特別是connect,read,write的超時時間。
你可以在代碼中把超時時間設置任意大小值,但是connect方法會有一點特殊。
connect的超時時間在任意的內核實現上都有一個可以設置的最大值,你的代碼中設置的超時值并不能超過這個最大值(即使你設置的值超過這個最大值,其仍然會在最大超時時間后time out)。
tcp建立連接的過程從客戶端發送syn包開始。如果客戶端沒有收到這個syn包的回復,內核會重試多次發送syn包,每次重試的間隔都會逐漸增加,避免發送太多的syn包影響網絡。
所有的內核對syn包發送的重復次數都有一個上限值。在BSD衍生的內核中(包括Mac OS X),會在第一次發送syn包后的6秒重試第二次,在第二次嘗試后的18秒嘗試第三次,如果第3次還不能成功就認為connect超時(此時經過了75秒)。
然而,在linux系統上,整個syn包發送的事件過程才差不多20幾秒。linux系統比bsd類系統重發syn包的時間間隔要密。linux在20多秒內發送5個syn包(其中包括原始的syn包和后面的重發包),其依次在首包發送的3s,6s,12s,24s后發送。
如果你的程序設置的connect超時時間比20s小,那么沒有問題。但是如果你的設置值大于20s,那么你會發現內核會將該值截斷為20s。
改變這個系統上限值也比較容易,由于需要改變系統配置參數,你需要root權限。
相關的命令是sysctl net.ipv4.tcp_syn_retries(針對于ipv4)。
在設置該值時還是要比較保守的,因為每次syn包重試的間隔都會增大(比如BSD類的系統實現中間隔會以2到3倍增加),所有tcp_syn_retries的一個微小變化對connect超時時間的影響都非常大,不過擴大這個值也不會有什么壞處,因為你代碼中設置的超時值都能夠生效。但是如果代碼中沒有設置connect的超時值,那么connect就會阻塞很久,你發現對端機器down掉的間隔就更長。
作者建議設置這個值到6或者7,最多8。6對應的connect超時為45s,7對應90s,8對應190s.
你能通過以下命令修改該值:
sysctl -w net.ipv4.tcp_syn_retries=6
查看該值的命令是:
sysctl net.ipv4.tcp_syn_retries
如果希望重啟后生效,將net.ipv4.tcp_syn_retries = 6放入/etc/sysctl.conf中。
/proc/sys/net/ipv4/tcp_syn_retries
顯示或設定 Linux 核心 在新建連線時,會嘗試多少次重新發送初始 SYN 封包后才決定放棄。
tcp_syn_retries 的值必須為正整數,并不能超過 255。因為每一次重新發送封包都會耗費約 30 至 40 秒去等待才決定嘗試下一次重新發送或決定放棄。tcp_syn_retries 的缺省值為 5,即每一個連線要在約 180 秒 (3 分鐘) 后才確定逾時。(這個資料來源于http://wiki.debian.org.hk,不同os會有差異)
超時設置
- 建立socket
- 將該socket設置為非阻塞模式
- 調用connect(),如果失敗,則等待一定時間,如此反復直到超時轉4.成功轉5
- 鏈接超時,或者失敗。結束
- 鏈接成功,如果需要將該socket設置為阻塞模式。
代碼實現
int set_socket_nonblock( int fd)
{
int flags;
if((flags = fcntl(fd, F_GETFL, 0)) < 0) {
return -1;
}
if(fcntl(fd, F_SETFL, flags | O_NONBLOCK) < 0) {
return -1;
}
return 0;
}
int set_socket_block( int fd)
{
int flags;
if((flags = fcntl(fd, F_GETFL, 0)) < 0) {
return -1;
}
if(fcntl(fd, F_SETFL, flags & ~O_NONBLOCK) < 0){
return -1;
}
return 0;
}
#define MAXSLEEP 128
/* * *
* max sleep time = 1 + 2 + 4 + 8 + 18 + . . . + 64 = 2^7 - 1 = 127 ( s)
* * */
int connect_retry( int sockfd, const struct sockaddr * srv_addr, socklen_t addrlen,int overtime)
{
int nsec;
int count=0;
int ret = set_socket_nonblock( sockfd);
if(ret<0)
return -1;
for ( nsec = 1; nsec <= MAXSLEEP; nsec <<= 1)
{
if ( connect( sockfd, srv_addr, addrlen) == 0)
{
return set_socket_block(sockfd);
}
count+=nsec;
if(count>overtime)
goto OUT;
/* connection accepted */
if ( nsec <= MAXSLEEP/2) /* < = 2^7 /2 = 64*/
sleep ( nsec) ;
}
OUT:
errno =ETIME;
return - 1;
}
int setsocket_readwrite_overtime(int fd,int overtime)
{
struct timeval timeout={overtime,0};//3s
int ret=setsockopt(fd,SOL_SOCKET,SO_SNDTIMEO,(const char*)&timeout,sizeof(timeout));
return ret=setsockopt(fd,SOL_SOCKET,SO_RCVTIMEO,(const char*)&timeout,sizeof(timeout));
}
int connectServer(HttpUriInfo *info)
{
int sockefd;
T("connect %s,%s,%d,%s\n",info->host,info->ip,info->port,info->resource);
struct sockaddr_in server_addr;
if((sockefd = socket(AF_INET,SOCK_STREAM,0)) == -1)
{
return sockefd;
}
bzero(&server_addr,sizeof(server_addr));
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(info->port);
inet_aton(info->ip, (struct in_addr *)&server_addr.sin_addr);
int ret=-1;
//ret =connect(sockefd, (struct sockaddr *)(&server_addr),sizeof(struct sockaddr));
ret =connect_retry(sockefd, (struct sockaddr *)(&server_addr),sizeof(struct sockaddr),75);
if (ret<0)
{
int tmperror=errno;
T("errno=%s\n",strerror(errno));
errno = tmperror;
return -1;
}
setsocket_readwrite_overtime(sockefd,20);
return sockefd;
}