您的位置:首页 > 编程语言 > C语言/C++

C++编程 (三)--- 深入C++后台开发

2015-10-28 18:11 627 查看
    搞了很久搜索了,可是做的很多都是业务逻辑和PM的需求,也没有高大上的技术。感觉随着开源项目的成熟技术的门槛在逐渐的降低,曾经高大上的技术已经渐渐变得没什么门槛了。。。(记得脉脉上看到一句很好玩的话,程序员是一个高大上的职业,直到JAVA语言的出现。。。)不过我也还是认真总结和实践了一些深入的技术,在做业务的时候也有一些积累的吧。总的来说C++后台开发深入一些的有网络编程、多线程编程、进程/线程同步/通信和调度、动态链接库使用、常用的框架的深入阅读和理解、常用的运行时程序问题排查(内存泄露、无法响应新的请求)、分布式系统的使用、高并发系统优化。所以本文一共分为如下十一个部分:

一、网络编程

二、多线程编程

三、多进程/线程同步/通信/调度

四、动态链接库使用

五、开源框架的深入阅读和理解(以thrift为例)

六、常用运行时程序问题排查

七、分布式系统问题

八、高并发系统的优化

九、代码风格和设计模式

十、C++语言的新特性

十一、Linux内核知识

一、网络编程:

             1. TCP与UDP:

                      a. TCP与UDP报头

                          1). TCP报头(最少20个字节):源端口、目的端口、序号、确认号、数据偏移、ACK、RST、SYN、FIN、窗口、校检和、紧急指针、选项、填充。

                          2). UDP报头:(8个字节)预案端口、目的端口、用户数据包长度、校检和、数据。

                      b. TCP与UDP的区别

                          1). TCP是面向连接的服务,有拥塞控制和超时重传,因此有滑动窗口。

                          2). UDP是非面向连接的服务,支持一对多通信,如广播。

             2. TCP 3次握手、4次挥手过程:

                               


                            a. TCP三次握手、四次挥手漏洞分析,天网如何使用TCP协议中断翻墙协议访问。

                                    为什么要进行三次握手?因为双方要交换序列号和窗口大小,发送方确认接收方接收到了syn请求,防止出现死锁。

                                   TCP三次握手的漏洞,SYN FLOOD攻击:客户端不停的伪造IP来给服务端发起请求,服务端对每个syn都要分配一个TCB,通常每个TCB至少280个字节。应对:syn cookie技术,使用双方通信信息、MSS、时间等计算,看看与对方回报文中的sequence number是否相同。

                                   TCP四次挥手?因为TCP连接有个半连接状态,假设AB要释放,那么A发送了一个释放请求给B,B立即回复确认。但在此之间B发送的数据A依然需要接受,B需要回复给A它不再发送数据了。

                                   为什么TIME_WAIT需要有2MSL的时间?为了避免最后一个ACK没有被接收到,预留重发时间。

                  3.  多路IO复用模型:

                          a. 阻塞、非阻塞:应用程序的调用是否立即返回!

                          b. 异步、同步:数据拷贝的时候进程是否阻塞!

                          c. select、poll、epoll

                              1). 三种IO复用模型对比:
                                        select支持最大打开文件数目有限(一般select使用32个32位整数作为文件描述符集)、用户态数据需要拷贝到内核态、每次都需要线性遍历每个FD,速度太慢;
poll最大打开fd数目不限;epoll克服了上面所有的缺点,但是如果每个连接都是活跃的,效率也不高。
                              2). select:

                                        select执行流程:

                                        a). 设置maxfd,将fd加入select监控集,使用一个array保存放到select监控集中的d,一是用于在select返回后,array作为源数据和fdset进行fd_isset判断。二是在select返回后会把以前加入的但并无事件发生的fd清空,则每次开始select都要从array取得fd逐一加入。(select模型必须在select前循环array(加fd,取maxfd),返回后循环array。)

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
参数:    
        sockfd: socket 函数返回的套接字描述符
        readfds : 读描述符集合
        writefds: 写描述符集合
        errorfds: 错误描述符集合
        timeout:  超时
返回值
        成功:返回值 0:无 >0:描述符就绪的总位数
        错误:返回INVALID_SOCKET(-1)
示例:
<span style="font-size:12px;">/* 实现功能:通过select处理多个socket
* 监听一个端口,监听到有链接时,添加到select的w.
*/
#include "select.h"
#include <stdio.h>
#include <stdlib.h>
#include <sys/socket.h>
#include <sys/select.h>
#include <sys/time.h>
#include <netinet/in.h>

typedef struct _CLIENT{
int fd;
struct sockaddr_in addr; /* client's address information */
} CLIENT;

#define MYPORT 59000

//最多处理的connect
#define BACKLOG 5
//最多处理的connect
CLIENT client[BACKLOG];

//当前的连接数
int currentClient = 0;

//数据接受 buf
#define REVLEN 10
char recvBuf[REVLEN];
//显示当前的connection
void showClient();

int main()
{
int i, ret, sinSize;
int recvLen = 0;
fd_set readfds, writefds;
int sockListen, sockSvr, sockMax;
struct timeval timeout;
struct sockaddr_in server_addr;
struct sockaddr_in client_addr;

for(i=0; i<BACKLOG; i++)
{
client[i].fd = -1;
}

//socket
if((sockListen=socket(AF_INET, SOCK_STREAM, 0)) < 0)
{
printf("socket error\n");
return -1;
}

bzero(&server_addr, sizeof(server_addr));
server_addr.sin_family  =  AF_INET;
server_addr.sin_port = htons(MYPORT);
server_addr.sin_addr.s_addr  =  htonl(INADDR_ANY);

//bind
if(bind(sockListen, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0)
{
printf("bind error\n");
return -1;
}

//listen
if(listen(sockListen, 5) < 0)
{
printf("listen error\n");
return -1;
}

for(i=0; i<BACKLOG; i++)
{
client[i].fd = -1;
}

//select
while(1)
{
FD_ZERO(&readfds);
FD_SET(sockListen, &readfds);
sockMax = sockListen;

//加入client
for(i=0; i<BACKLOG; i++)
{
if(client[i].fd >0)
{
FD_SET(client[i].fd, &readfds);
if(sockMax<client[i].fd)
sockMax = client[i].fd;
}
}

timeout.tv_sec=3;
timeout.tv_usec=0;
//select
ret = select((int)sockMax+1, &readfds, NULL, NULL, &timeout);
if(ret < 0)
{
printf("select error\n");
break;
}
else if(ret == 0)
{
printf("timeout ...\n");
continue;
}
printf("test111\n");

//读取数据
for(i=0; i<BACKLOG; i++)
{
if(client[i].fd>0 && FD_ISSET(client[i].fd, &readfds))
{
if(recvLen != REVLEN)
{
while(1)
{
//recv数据
ret = recv(client[i].fd, (char *)recvBuf+recvLen, REVLEN-recvLen, 0);
if(ret == 0)
{
client[i].fd = -1;
recvLen = 0;
break;
}
else if(ret < 0)
{
client[i].fd = -1;
recvLen = 0;
break;
}
//数据接受正常
recvLen = recvLen+ret;
if(recvLen<REVLEN)
{
continue;
}
else
{
//数据接受完毕
printf("%s, buf = %s\n", inet_ntoa(client[i].addr.sin_addr) , recvBuf);
//close(client[i].fd);
//client[i].fd = -1;
recvLen = 0;
break;
}
}
}
}
}

//如果可读
if(FD_ISSET(sockListen, &readfds))
{
printf("isset\n");
sockSvr = accept(sockListen, NULL, NULL);//(struct sockaddr*)&client_addr

if(sockSvr == -1)
{
printf("accpet error\n");
}
else
{
currentClient++;
}

for(i=0; i<BACKLOG; i++)
{
if(client[i].fd < 0)
{
client[i].fd = sockSvr;
client[i].addr = client_addr;
printf("You got a connection from %s \n",inet_ntoa(client[i].addr.sin_addr) );
break;
}
}
//close(sockListen);
}
}

printf("test\n");
return 0;
}

//显示当前的connection
void showClient()
{
int i;
printf("client count = %d\n", currentClient);

for(i=0; i<BACKLOG; i++)
{
printf("[%d] = %d", i, client[i].fd);
}
printf("\n");
}</span>


                                        b). int poll(struct pollfd *fds, nfds_t nfds, int timeout);
参数:

    fds:是一个struct pollfd结构类型的数组,用于存放需要检测其状态的Socket描述符;每当调用这个函数之后,系统不会清空这个数组,操作起来比较方便;特别是对于socket连接比较多的情况下,在一定程度上可以提高处理的效率;这一点与select()函数不同,调用select()函数之后,select()函数会清空它所检测的socket描述符集合,导致每次调用select()之前都必须把socket描述符重新加入到待检测的集合中;因此,select()函数适合于只检测一个socket描述符的情况,而poll()函数适合于大量socket描述符的情况;
    nfds:nfds_t类型的参数,用于标记数组fds中的结构体元素的总数量;
    timeout:是poll函数调用阻塞的时间,单位:毫秒;
返回值:

    >0:数组fds中准备好读、写或出错状态的那些socket描述符的总数量;
    ==0:数组fds中没有任何socket描述符准备好读、写,或出错;此时poll超时,超时时间是timeout毫秒;换句话说,如果所检测的       socket描述符上没有任何事件发生的话,那么poll()函数会阻塞timeout所指定的毫秒时间长度之后返回,如果timeout==0,那么poll() 函数立即返回而不阻塞,如果timeout==INFTIM,那么poll() 函数会一直阻塞下去,直到所检测的socket描述符上的感兴趣的事件发生是才返回,如果感兴趣的事件永远不发生,那么poll()就会永远阻塞下去;
     -1: poll函数调用失败,同时会自动设置全局变量errno;

示例:

<span style="font-size:12px;">/* 实现功能:通过poll, 处理多个socket
* 监听一个端口,监听到有链接时,添加到poll.
*/
#include "select.h"
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <poll.h>
#include <sys/time.h>
#include <netinet/in.h>

typedef struct _CLIENT{
int fd;
struct sockaddr_in addr; /* client's address information */
} CLIENT;

#define MYPORT 59000

//最多处理的connect
#define BACKLOG 5

//当前的连接数
int currentClient = 0;

//数据接受 buf
#define REVLEN 10
char recvBuf[REVLEN];

#define OPEN_MAX 1024

int main()
{
int i, ret, sinSize;
int recvLen = 0;
fd_set readfds, writefds;
int sockListen, sockSvr, sockMax;
int timeout;
struct sockaddr_in server_addr;
struct sockaddr_in client_addr;

struct pollfd clientfd[OPEN_MAX];

//socket
if((sockListen=socket(AF_INET, SOCK_STREAM, 0)) < 0)
{
printf("socket error\n");
return -1;
}

bzero(&server_addr, sizeof(server_addr));
server_addr.sin_family  =  AF_INET;
server_addr.sin_port = htons(MYPORT);
server_addr.sin_addr.s_addr  =  htonl(INADDR_ANY);

//bind
if(bind(sockListen, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0)
{
printf("bind error\n");
return -1;
}

//listen
if(listen(sockListen, 5) < 0)
{
printf("listen error\n");
return -1;
}

//clientfd 初始化
clientfd[0].fd = sockListen;
clientfd[0].events = POLLIN; //POLLRDNORM;
sockMax = 0;
for(i=1; i<OPEN_MAX; i++)
{
clientfd[i].fd = -1;
}

//select
while(1)
{
timeout=3000;
//select
ret = poll(clientfd, sockMax+1, timeout);

if(ret < 0)
{
printf("select error\n");
break;
}
else if(ret == 0)
{
printf("timeout ...\n");
continue;
}

if (clientfd[0].revents & POLLIN)//POLLRDNORM
{
sockSvr = accept(sockListen, NULL, NULL);//(struct sockaddr*)&client_addr

if(sockSvr == -1)
{
printf("accpet error\n");
}
else
{
currentClient++;
}

for(i=0; i<OPEN_MAX; i++)
{
if(clientfd[i].fd<0)
{
clientfd[i].fd = sockSvr;
break;
}
}
if(i==OPEN_MAX)
{
printf("too many connects\n");
return -1;
}
clientfd[i].events = POLLIN;//POLLRDNORM;
if(i>sockMax)
sockMax = i;
}

//读取数据
for(i=1; i<=sockMax; i++)
{
if(clientfd[i].fd < 0)
continue;

if (clientfd[i].revents & (POLLIN | POLLERR))//POLLRDNORM
{
if(recvLen != REVLEN)
{
while(1)
{
//recv数据
ret = recv(clientfd[i].fd, (char *)recvBuf+recvLen, REVLEN-recvLen, 0);
if(ret == 0)
{
clientfd[i].fd = -1;
recvLen = 0;
break;
}
else if(ret < 0)
{
clientfd[i].fd = -1;
recvLen = 0;
break;
}
//数据接受正常
recvLen = recvLen+ret;
if(recvLen<REVLEN)
{
continue;
}
else
{
//数据接受完毕
printf("buf = %s\n",  recvBuf);
//close(client[i].fd);
//client[i].fd = -1;
recvLen = 0;
break;
}
}
}
}
}
}

return 0;
}</span>

                                        c).  int epoll_create(int size);
                                              int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event );

                                              int epoll_wait(int epfd,struct epoll_event * events,int maxevents,int timeout);

epoll_create生成一个 Epoll 专用的文件描述符,其实是申请一个内核空间,用来存放你想关注的 socket fd 上是否发生以及发生了什么事件。 size 就是你在这个 Epoll fd 上能关注的最大 socket fd 数,大小自定,只要内存足够。

epoll_ctl控制某个 Epoll 文件描述符上的事件:注册、修改、删除。其中参数 epfd 是 epoll_create() 创建 Epoll 专用的文件描述符。相对于 select 模型中的 FD_SET 和 FD_CLR 宏。op:EPOLL_CTL_ADD  Register the target file descriptor fd on the epoll instance, EPOLL_CTL_MOD Change the event event associated with the target
file descriptor fd, EPOLL_CTL_DEL Remove  (deregister)  the  target  file descriptor fd from the epoll instance。

<span style="font-size:12px;">/* 实现功能:通过epoll, 处理多个socket
* 监听一个端口,监听到有链接时,添加到epoll_event
*/
#include "select.h"
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <poll.h>
#include <sys/epoll.h>
#include <sys/time.h>
#include <netinet/in.h>
typedef struct _CLIENT{
int fd;
struct sockaddr_in addr; /* client's address information */
} CLIENT;
#define MYPORT 59000
//最多处理的connect
#define MAX_EVENTS 500
//当前的连接数
int currentClient = 0;
//数据接受 buf
#define REVLEN 10
char recvBuf[REVLEN];
//EPOLL相关
//epoll描述符
int epollfd;
//事件数组
struct epoll_event eventList[MAX_EVENTS];
void AcceptConn(int srvfd);
void RecvData(int fd);

int main()
{
int i, ret, sinSize;
int recvLen = 0;
fd_set readfds, writefds;
int sockListen, sockSvr, sockMax;
int timeout;
struct sockaddr_in server_addr;
struct sockaddr_in client_addr;
//socket
if((sockListen=socket(AF_INET, SOCK_STREAM, 0)) < 0)
{
printf("socket error\n");
return -1;
}
bzero(&server_addr, sizeof(server_addr));
server_addr.sin_family  =  AF_INET;
server_addr.sin_port = htons(MYPORT);
server_addr.sin_addr.s_addr  =  htonl(INADDR_ANY);
//bind
if(bind(sockListen, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0)
{
printf("bind error\n");
return -1;
}
//listen
if(listen(sockListen, 5) < 0)
{
printf("listen error\n");
return -1;
}
//1. epoll 初始化
epollfd = epoll_create(MAX_EVENTS);
struct epoll_event event;
event.events = EPOLLIN|EPOLLET;
event.data.fd = sockListen;
//2. epoll_ctrl
if(epoll_ctl(epollfd, EPOLL_CTL_ADD, sockListen, &event) < 0)
{
printf("epoll add fail : fd = %d\n", sockListen);
return -1;
}
//epoll
while(1)
{
timeout=3000;
//3. epoll_wait
int ret = epoll_wait(epollfd, eventList, MAX_EVENTS, timeout);
if(ret < 0)
{
printf("epoll error\n");
break;
}
else if(ret == 0)
{
printf("timeout ...\n");
continue;
}
//直接获取了事件数量,给出了活动的流,这里是和poll区别的关键
int n = 0;
for(n=0; n<ret; n++)
{
//错误退出
if ((eventList
.events & EPOLLERR) ||
(eventList
.events & EPOLLHUP) ||
!(eventList
.events & EPOLLIN))
{
printf ( "epoll error\n");
close (eventList
.data.fd);
return -1;
}

if (eventList
.data.fd == sockListen)
{
AcceptConn(sockListen);

}else{
RecvData(eventList
.data.fd);
//不删除
//   epoll_ctl(epollfd, EPOLL_CTL_DEL, pEvent->data.fd, pEvent);
}
}
}
close(epollfd);
close(sockListen);
printf("test\n");
return 0;
}
/**************************************************
函数名:AcceptConn
功能:接受客户端的链接
参数:srvfd:监听SOCKET
***************************************************/
void AcceptConn(int srvfd)
{
struct sockaddr_in sin;
socklen_t len = sizeof(struct sockaddr_in);
bzero(&sin, len);
int confd = accept(srvfd, (struct sockaddr*)&sin, &len);
if (confd < 0)
{
printf("bad accept\n");
return;
}else
{
printf("Accept Connection: %d", confd);
}
//setnonblocking(confd);
//4. epoll_wait
//将新建立的连接添加到EPOLL的监听中
struct epoll_event event;
event.data.fd = confd;
event.events =  EPOLLIN|EPOLLET;
epoll_ctl(epollfd, EPOLL_CTL_ADD, confd, &event);
}

//读取数据
void RecvData(int fd)
{
int ret;
int recvLen = 0;

memset(recvBuf, 0, REVLEN);
printf("RecvData function\n");

if(recvLen != REVLEN)
{
while(1)
{
//recv数据
ret = recv(fd, (char *)recvBuf+recvLen, REVLEN-recvLen, 0);
if(ret == 0)
{
recvLen = 0;
break;
}
else if(ret < 0)
{
recvLen = 0;
break;
}
//数据接受正常
recvLen = recvLen+ret;
if(recvLen<REVLEN)
{
continue;
}
else
{
//数据接受完毕
printf("buf = %s\n",  recvBuf);
recvLen = 0;
break;
}
}
}

printf("content is %s", recvBuf);
}</span>


                   4. 网络协议分层模型: 
                   5. 其他一些小问题:
                       a. 网络模型直接排序一般采用大端存储的。
                       b. keepalive???:
                       c. 长连接、短连接:

                       d. 防火墙如何利用TCP协议终止你的翻墙请求?

                   6. 网络分层模型和不同层的支持的协议:

(如何画时序图)

二、多线程编程:

                   1. 线程与进程:

                        线程共享:进程指令、大多数数据、打开的文件、信号处理函数和信号处置、当前工作目录、用户id和组ID

                        进程共享:线程ID、寄存器集合(程序计数器和函数指针)、栈、errno、信号掩码、优先级

                        线程&进程:线程是系统调度的最小单元,fork需要把父进程内存影响复制到子进程;fork返回以后父子进程需要进行IPC通信。 

                   2. 多线程编程:
                        pthread_create( pthread_t *tid, const pthread_attr_t *attr, void *(*func)(void *), void arg);

                                    pthread_join(pthread_t *tid, void **status) //如果status指针非空,把线程的返回值、一个指向某个对象的指针存入status指向的位置

                                    pthread_self(void) // 线程自身id

                                    pthread_detach(tid)// 线程终止时,所有资源被释放

                                    pthread_exit(void *status)//线程终止
                   3. 多进程编程:
                        fork()//创建子进程

                                    exec()//4个函数族。创建进程,但子进程执行时废弃当前进程的数据段和堆栈段

                   4. 进程/线程间同步\通信:
                      一般我们讨论进程间共享数据,线程间同步。因为线程很多数据都是共有的,而进程间很难共享数据,因此线程的同步和进程的数据共享一般都是我们面临的问题的。
                      a. 进程间共享/通信数据(IPC)方法:

                          管道、FIFO、共享内存、消息队列、信号、socket

                           对比:

                                    1. 管道:速度慢、容量有限、只有父子进程通讯

                                    2. FIFO: 任何进程都能通信,但速度慢

                                    3. 消息队列:容量受限

                                    4. 信号量:不能传递复杂信息

                                    5. 共享内存:速度快、容量大。需要注意同步

                          1). 

                      b. 线程间同步方法(SYNC):
                          临界区、锁、信号量、事件、interlocked variable

                          1). 锁:

                                            pthread_mutex_t counter_mutex=PTHREAD_MUTEX_INITIALIZER; COND

                                            pthread_mutex_lock(pthread_mutex_t * mptr);

                                            // do something

                                            pthread_mutex_unlock(pthread_mutex_t *mptr);

                           http://www.cnblogs.com/memewry/archive/2012/08/22/2651696.html
五、开源框架深入阅读和理解:

                 1. thrift协议的数据类型、协议、传输、服务类型

                 2. thrift协议源代码阅读

六、常用运行时程序排查:

                 1. 使用cp替换so文件为什么服务会core?

                 2. 如何排查内存泄露

七、分布式系统问题:

十、C++语言的新特性:

             1. 智能指针 std::shared_ptr 用法:

                           a). 智能指针是用来实现指针对象的共享和内存生存期自动管理(一般使用引用计数实现,我理解智能指针就是一个栈对象,在智能指针的生命期结束时,对智能指针指向的动态内存使用减1,如果计数减为0,则释放内存)。

                           b). 所有的智能指针都会重载* -> 等符号。

#include <boost/shared_ptr.hpp>
using namespace std;
class implementation
{
public:
~implementation() { std::cout <<"destroying implementation\n"; }
void do_something() { std::cout << "did something\n"; }
};
void test(){
boost::shared_ptr<implementation> sp1(new implementation());
boost::shared_ptr<implementation> sp2 = sp1;
sp2.reset();
boost::shared_ptr<int> a1(ptr);
std::cout<<*ptr<<endl;
}


                           b). 使用智能指针注意事项:

                                 a. 不要把原生指针给多个shared_ptr管理。

                                 b. 不要在函数实参里创建shared_ptr。

                                 c. shared_ptr作为被保护对象时小心循环引用。

                                 d. 不要把this指针传给shared_ptr。

                           c). static_ptr_cast ???:

                                 

                  2. auto用法:

参考文献:
1. Unix网络编程:
2. thrift服务源代码分析: http://yanyiwu.com/work/2014/12/06/thrift-tnonblockingserver-analysis.html
3. 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: