在本篇内容里小编给大家分享了关于Python数据抓取爬虫代理防封IP方法讲解,需要的朋友们可以跟着学习下。

爬虫:一段自动抓取互联网信息的程序,从互联网上抓取对于我们有价值的信息,一般来说,Python爬虫程序很多时候都要使用(飞猪IP)代理的IP地址来爬取程序,但是默认的urlopen是无法使用代理的IP的,我就来分享一下Python爬虫怎样使用代理IP的。(推荐飞猪代理IP注册可免费使用,浏览器搜索可找到)

1、划重点,小编我用的是Python3哦,所以要导入urllib的request,然后我们调用ProxyHandler,它可以接收代理IP的参数。代理可以根据自己需要选择,当然免费的也是有的,但是可用率可想而知的。(飞猪IP)

2、接着把IP地址以字典的形式放入其中,这个IP地址是我乱写的,只是用来举例。设置键为http,当然有些是https的,然后后面就是IP地址以及端口号(9000),具体看你的IP地址是什么类型的,不同IP端口号可能不同根据你在飞猪提取的端口为准。

3、接着再用build_opener()来构建一个opener对象。

4、然后调用构建好的opener对象里面的open方法来发生请求。实际上urlopen也是类似这样使用内部定义好的opener.open(),这里就相当于我们自己重写。

5、当然了,如果我们使用install_opener(),就可以把之前自定义的opener设置成全局的。

6、设置成全局之后,如果我们再使用urlopen来发送请求,那么发送请求使用的IP地址就是代理IP,而不是本机的IP地址了。

7、最后再来说说使用代理遇到的错误,提示目标计算机积极拒绝,这就说明可能是代理IP无效,或者端口号错误,这就需要使用有效的IP才行哦。(这边现在是乱填写的IP地址)可选择飞猪的代理IP。

总结:以上就是本次关于Python数据抓取爬虫代理防封IP方法,感谢大家的阅读和对爱安网的支持。

最新资讯
5G新材料市场需求爆发 中国市场独具研发优势

5G新材料市场需求爆发

作为新一代移动通信技术,5G网络将满足2020年以后来自终
媒体:陆金所计划停止网贷业务 将进行转型

媒体:陆金所计划停止网

陆金所计划停止网贷业务,将进行转型。
欧洲央行管委:金融监管不会为创新而牺牲安全

欧洲央行管委:金融监管

欧洲央行管理委员会委员暨法国央行总裁维勒鲁瓦周四称
中国电子联合会发布2019年电子百强企业 华为居首位

中国电子联合会发布20

中国电子信息行业联合会发布了2019年(第33届)电子信息百
滴滴顺风车整改:增加人脸识别频次 无具体上线时间

滴滴顺风车整改:增加人

自2018年滴滴连续发生两起恶性安全事件后,滴滴暂停了顺
作业盒子品牌升级为“小盒科技” D轮融资1.5亿美元

作业盒子品牌升级为“

作业盒子今日举办品牌升级暨战略发布会,作业盒子升级为
最新文章
python+pyqt5实现图片批量缩放工具

python+pyqt5实现图片

这篇文章主要为大家详细介绍了Python+pyqt5实现图片批
python+pyqt5编写md5生成器

python+pyqt5编写md5

这篇文章主要为大家详细介绍了python+pyqt5编写md5生
Python动态赋值的陷阱知识点总结

Python动态赋值的陷阱

在本文中我们给大家整理了关于Python动态赋值的陷阱的
Python中super函数用法实例分析

Python中super函数用

这篇文章主要介绍了Python中super函数用法,结合实例形
Python操作MySQL数据库的两种方式实例分析【pymysql和pandas】

Python操作MySQL数据

这篇文章主要介绍了Python操作MySQL数据库的两种方式,
matplotlib实现区域颜色填充

matplotlib实现区域颜

这篇文章主要为大家详细介绍了matplotlib实现区域颜色