介绍几个python中常见的第三方库.
Pillow
Pillow简称PIL,是python中常用的图形图像处理模块。写一个简单的例子
1 | from PIL import Image, ImageFilter |
介绍几个python中常见的第三方库.
Pillow简称PIL,是python中常用的图形图像处理模块。写一个简单的例子
1 | from PIL import Image, ImageFilter |
前几篇文章介绍了urllib库基本使用和爬虫的简单应用,本文介绍如何通过post
信息给网站,保存登陆后cookie
,并用于请求有
权限的操作。保存cookie需要用到cookiejar类,可以输出cookie信息查看下
这一篇巩固前几篇文章的学到的技术,利用urllib库爬取美女图片,其中采用了多线程
,文件读写
,目录匹配
,正则表达式解析
,字符串拼接等知识
,这些都是前文提到的,综合运用一下,写个爬虫
示例爬取美女图片。
先定义几个匹配规则和User_Agent
1 | USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0' |
读者可以根据不同网站的代码去修改这些规则,达到匹配一些网站的目的。
利用前面学到的文件、正则表达式、urllib的知识,综合运用,爬取糗事百科的段子
先用urllib库获取糗事百科热帖第一页的数据。并打开文件进行保存,正好可以熟悉一下之前学过的文件知识。
1 | from urllib import request, parse |
C++ 教程网大并发服务器:
链接: 大并发服务器 密码: 6edt
陈硕网络编程实践:
链接: 陈硕网络编程实践 密码: 7x1d
达内C++学习:
链接: 达内C++学习 密码: bwj7
轩辕LinuxC:
链接: 轩辕LinuxC 密码: 62nt
自己总结的python源码和demo:
链接:python例子和源码
精品电子书
链接: 精品电子书 密码: 7bd5
python3.6爬虫最细教程
链接: python3.6爬虫最细教程 密码: ct27
区块链2018教程
链接: 区块链2018教程 密码: dqk5
基于epoll,select模型封装的服务器模型
链接: 基于epoll,select模型封装的服务器模型
基于libevent网络库封装的服务器模型
链接: 基于libevent网络库封装的服务器模型
基于boost::asio 封装的异步通信网络模型
链接: 基于boost::asio 封装的异步通信网络模型
Go 封装的tcp框架,同时集成了websocket,http等。
链接: golang实现的tcp框架wentby
Go 基于wentby框架封装的游戏服务器wentserver
链接: golang实现游戏服务器wentserver
python多进程
1 | from multiprocessing import Process |