在TCP网络通信中,经常会出现客户端和服务器之间的非正常断开,需要实时检测查询链接状态。常用的解决方法就是在程序中加入心跳机制。
从网络上找到,主要有以下方法实现TCP异常断开的检测:
SO_KEEPALIVE,SIO_KEEPALIVE_VALS 和Heart-Beat线程。
(1)SO_KEEPALIVE 机制
? ? ? ? 这是socket库提供的功能,设置接口是setsockopt API:
? BOOL bSet=TRUE;
? setsockopt(hSocket,SOL_SOCKET,SO_KEEPALIVE,(const char*)&bSet,sizeof(BOOL));
? ? ? 根据MSDN的文档,如果为socket设置了KEEPALIVE选项,TCP/IP栈在检测到对方掉线后,
? 任何在该socket上进行的调用(发送/接受调用)就会立刻返回,错误号是WSAENETRESET ;
? 同时,此后的任何在该socket句柄的调用会立刻失败,并返回WSAENOTCONN错误。
? 该机制的缺点:
一、SO_KEEPALIVE无法控制,它会每时每刻都发;
二、SO_KEEPALIVE设置空闲2小时才发送一个“保持存活探测分节”,不能保证实时检测。对于判断网络断开时间太长,对于需要及时响应的程序不太适应。
? 当然也可以修改时间间隔参数,但是会影响到所有打开此选项的套接口!关联了完成端口的socket可能会忽略掉该套接字选项。
(2)SIO_KEEPALIVE_VALS 机制
? ? 设置接口是WSAIoctl API:
? ? DWORD dwError = 0L ;
? ? tcp_keepalive sKA_Settings = {0}, sReturned = {0} ;
? ? sKA_Settings.onoff = 1 ;
? ? sKA_Settings.keepalivetime = 5500 ; // Keep Alive in 5.5 sec.
? ? sKA_Settings.keepaliveinterval = 3000 ; // Resend if No-Reply
? ? if (WSAIoctl(skNewConnection, SIO_KEEPALIVE_VALS, &sKA_Settings,
? ? ? ? ? sizeof(sKA_Settings), &sReturned, sizeof(sReturned), &dwBytes,
? ? ? ? ? NULL, NULL) != 0)
? ? {
? ? ? ? ? dwError = WSAGetLastError() ;
? ? }
? ? 实现时需要添加tcp_keepalive and SIO_KEEPALIVE_VALS的定义文件MSTCPiP.h
? ? 该选项不同于SO_KEEPALIVE 机制的就是它是针对单个连接的,对系统其他的套接
? ? 口并不影响。
? ? ? ? 针对完成端口的socket,设置了SIO_KEEPALIVE_VALS后,激活包由TCP STACK来负责。
? ? 当网络连接断开后,TCP STACK并不主动告诉上层的应用程序,但是当下一次RECV或者SEND操作
? ? 进行后,马上就会返回错误告诉上层这个连接已经断开了.如果检测到断开的时候,在这个连接
? ? 上有正在PENDING的IO操作,则马上会失败返回.
? ? 该机制的缺点:
? ? 不通用。MS的API只能用于Windows。?
(3)Heart-Beat线程
? ? 这个是最常用的简单方法。在接收和发送数据时个人设计一个守护进程,定时发送Heart-Beat包,客户端/服务器收到该小包后,立刻返回相应的包即可检测对方是否实时在线。
该方法的好处是通用,但缺点就是会改变现有的通讯协议!大家一般都是使用业务层心跳来处理,主要是灵活可控。
UNIX网络编程不推荐使用SO_KEEPALIVE来做心跳检测,还是在业务层以心跳包做检测比较好,也方便控制,楼上给的代码是UNIX下的,WIN下不适用。Windows下此处的”非正常断开”指TCP连接不是以优雅的方式断开,如网线故障等物理链路的原因,还有突然主机断电等原因。
有两种方法可以检测:1.TCP连接双方定时发握手消息 2.利用TCP协议栈中的KeepAlive探测
第二种方法简单可靠,只需对TCP连接两个Socket设定KeepAlive探测。
第一种方法是自己给SOCKET设置个timeout,如果超时则认为对方客户端断掉,需重新连接.
//处理通信
void do_client_work(int client_sock,struct sockaddr_in client)
{
? ? unsigned char cmd;
? ? int val;
? ? char *VideoPtr;
? ? send_client_info(client_sock,"hello",5);
? ? TCP_VIDEO_AGAIN_FLAG = 1;
? ? printf("\nrecv start ...\n");
? ? while(1) {
? ? ? fd_set rds;
? ? ? struct timeva l step;
? ? ? int ret;
? ? ? FD_ZERO(&rds);
? ? ? FD_SET(client_sock,&rds);
? ? ? step.tv_sec = 0;
? ? ? step.tv_usec = 1000;
? ? ? ret = select(client_sock+1,&rds,NULL,NULL,&step);
? ? ? if(ret < 0) {
? ? ? ? perror("select");
? ? ? ? exit(-1);
? ? ? }
? ? ? if(ret == 0) {
? ? ? ? ? ...//执行等待超时命令
? ? ? } else if(FD_ISSET(client_sock,&rds)) {
? ? ? ? ? val = recv_client_info(client_sock,&cmd,1);
? ? ? ? ? if(val < 0) {
? ? ? ? ? ? break;
? ? ? ? ? } else {
? ? ? ? ? ...//执行读写客户端数据操作
? ? ? ? ? if(TcpOutFlag==1) {
? ? ? ? ? ? TcpOutFlag=0;
? ? ? ? ? ? break;
? ? ? ? ? }
? ? ? ? ? }
? ? ? }
? ? }
}
//TCP接收数据
int? recv_client_info(int client_sock,char* info,int length)
{
? ? int num;
? ? struct timeva l tv;
? ? tv.tv_sec = 15;
? ? tv.tv_usec = 0;
? ? if (setsockopt(client_sock, SOL_SOCKET, SO_RCVTIMEO, &tv, sizeof(tv))>=0) {
? ? ? ? num = recv(client_sock,info,length,MSG_NOSIGNAL);
? ? ? ? if(num < 0) {
? ? ? ? perror("recv");
? ? ? ? return 0;
? ? ? ? } else if(num == 0) {
? ? ? ? printf("recv over\n");
? ? ? ? return -2;
? ? ? ? } else {
? ? ? ? pthread_mutex_lock(&mutex);
? ? ? ? TCP_Timeout = 0;
? ? ? ? pthread_mutex_unlock(&mutex);
? ? ? ? return 0;
? ? ? ? }
? ? } else {
? ? ? ? printf("TCP CONNECT超时...\n");
? ? ? ? return -1;
? ? }
}
第二种方法在Linux,Window2000下的实现Windows 2