简介
前文介绍了asio如何实现并发的长连接tcp服务器,今天介绍如何实现http服务器,在介绍实现http服务器之前,需要讲述下http报文头的格式,其实http报文头的格式就是为了避免我们之前提到的粘包现象,告诉服务器一个数据包的开始和结尾,并在包头里标识请求的类型如get或post等信息。
HTTP包头信息
一个标准的HTTP报文头通常由请求头和响应头两部分组成。
HTTP 请求头
HTTP请求头包括以下字段:
- Request-line:包含用于描述请求类型、要访问的资源以及所使用的HTTP版本的信息。
- Host:指定被请求资源的主机名或IP地址和端口号。
- Accept:指定客户端能够接收的媒体类型列表,用逗号分隔,例如 text/plain, text/html。
- User-Agent:客户端使用的浏览器类型和版本号,供服务器统计用户代理信息。
- Cookie:如果请求中包含cookie信息,则通过这个字段将cookie信息发送给Web服务器。
- Connection:表示是否需要持久连接(keep-alive)。
比如下面就是一个实际应用
1 | GET /index.html HTTP/1.1 |
上述请求头包括了以下字段:
- Request-line:指定使用GET方法请求/index.html资源,并使用HTTP/1.1协议版本。
- Host:指定被请求资源所在主机名或IP地址和端口号。
- Accept:客户端期望接收的媒体类型列表,本例中指定了text/html、application/xhtml+xml和任意类型的文件(*/*)。
- User-Agent:客户端浏览器类型和版本号。
- Cookie:客户端发送给服务器的cookie信息。
- Connection:客户端请求后是否需要保持长连接。
HTTP 响应头
HTTP响应头包括以下字段:
- Status-line:包含协议版本、状态码和状态消息。
- Content-Type:响应体的MIME类型。
- Content-Length:响应体的字节数。
- Set-Cookie:服务器向客户端发送cookie信息时使用该字段。
- Server:服务器类型和版本号。
- Connection:表示是否需要保持长连接(keep-alive)。
在实际的HTTP报文头中,还可以包含其他可选字段。
如下是一个http响应头的示例
1 | HTTP/1.1 200 OK |
上述响应头包括了以下字段:
- Status-line:指定HTTP协议版本、状态码和状态消息。
- Content-Type:指定响应体的MIME类型及字符编码格式。
- Content-Length:指定响应体的字节数。
- Set-Cookie:服务器向客户端发送cookie信息时使用该字段。
- Server:服务器类型和版本号。
- Connection:服务器是否需要保持长连接。
客户端的编写
客户端每次发送数据都要携带头部信息,所以为了减少每次重新构造头部的开销,我们在客户端的构造函数里将头部信息构造好,作为一个成员放入客户端的类成员里。
1 | client(boost::asio::io_context& io_context, |
我们的客户端构造了一个request_
成员变量,依次写入请求的路径,主机地址,期望接受的媒体类型,以及每次收到请求后断开连接,也就是短链接的方式。
接着又异步解析ip和端口,解析成功后调用handle_resolve
函数。handle_resolve
函数里异步处理连接
1 | void handle_resolve(const boost::system::error_code& err, |
处理连接
1 | void handle_connect(const boost::system::error_code& err) |
在连接成功后,我们首先将头部信息发送给服务器,发送完成后监听对端发送的数据
1 | void handle_write_request(const boost::system::error_code& err) |
当收到对方数据时,先解析响应的头部信息
1 | void handle_read_status_line(const boost::system::error_code& err) |
上面的代码先读出HTTP版本,以及返回的状态码,如果状态码不是200,则返回,是200说明响应成功。接下来把所有的头部信息都读出来。
1 | void handle_read_headers(const boost::system::error_code& err) |
上面的代码逐行读出头部信息,然后读出响应的内容,继续监听读事件读取相应的内容,直到接收到EOF信息,也就是对方关闭,继续监听读事件是因为有可能是长连接的方式,当然如果是短链接,则服务器关闭连接后,客户端也是通过异步函数读取EOF进而结束请求。
1 | void handle_read_content(const boost::system::error_code& err) |
在主函数中调用客户端请求服务器信息, 请求的路由地址为/
1 | int main(int argc, char* argv[]) |
服务器设计
为了方便理解,我们从服务器的调用流程讲起
1 | int main(int argc, char* argv[]) |
主函数里构造了一个server对象,然后调用了run函数使其跑起来。
run函数其实就是调用了server类成员的ioservice
1 | void server::run() |
server类的构造函数里初始化一些成员变量,比如acceptor连接器,绑定了终止信号,并且监听对端连接
1 | server::server(const std::string& address, const std::string& port, |
接收连接
1 | void server::do_accept() |
接收函数里通过connection_manager_
启动了一个新的连接,用来处理读写函数。
处理方式和我们之前的写法类似,只是我们之前管理连接用的server,这次用的conneciton_manager
1 | void connection_manager::start(connection_ptr c) |
start函数里处理读写
1 | void connection::start() |
处理读数据比较复杂,我们分部分解释
1 | void connection::do_read() |
通过request_parser_
解析请求,然后根据请求结果选择处理请求还是返回错误。
1
2
3
4
5
6
7
8
9
10
11std::tuple<result_type, InputIterator> parse(request& req,
InputIterator begin, InputIterator end)
{
while (begin != end)
{
result_type result = consume(req, *begin++);
if (result == good || result == bad)
return std::make_tuple(result, begin);
}
return std::make_tuple(indeterminate, begin);
}
parse是解析请求的函数,内部调用了consume不断处理请求头中的数据,其实就是一个逐行解析的过程, consume函数很长,这里就不解释了,其实就是每解析一行就更改一下状态,这样可以继续解析。具体可以看看源码。
在consume()函数中,根据每个字符输入的不同情况,判断当前所处状态state_,进而执行相应的操作,包括:
- 将HTTP请求方法、URI和HTTP版本号解析到request结构体中。
- 解析每个请求头部字段的名称和值,并将其添加到request结构体中的headers vector中。
- 如果输入字符为
\r\n
,则修改状态以开始下一行的解析。
最后,返回一个枚举类型request_parser::result_type作为解析结果,包括indeterminate、good和bad三种状态。其中,indeterminate表示还需要继续等待更多字符输入;good表示成功解析出了一个完整的HTTP请求头部;bad表示遇到无效字符或格式错误,解析失败。
解析完成头部后会调用处理请求的函数,这里只是简单的写了一个作为资源服务器解析资源请求的逻辑,具体可以看源码。
1 | void request_handler::handle_request(const request& req, reply& rep) |
上述代码根据url中的.
来做切割,获取请求的文件类型,然后根据/
切割url,获取资源目录,最后返回资源文件。
如果你想实现普通的路由请求返回json或者text格式,可以重写处理请求的逻辑。
总结
本文介绍了如何使用asio实现http服务器,具体可以查看下方源码,其实这些仅作为了解即可,不推荐从头造轮子,我们可以用一些C++ 成熟的http服务库比如beast,下一节再介绍。
视频连接https://space.bilibili.com/271469206/channel/collectiondetail?sid=313101