维修 |车展 |报价 |行情 |时评 |新车 |建材 |政策 |市场 |建筑 |家装 |访谈 |股票 |创投人物 |产业 |金融

当前位置：首页> 汽车> 维修 > 一般做个网站需要多少钱_东莞公司转让平台_百度收录怎么弄_自动外链工具

一般做个网站需要多少钱_东莞公司转让平台_百度收录怎么弄_自动外链工具

时间:2025/7/9 15:57:25来源：https://blog.csdn.net/Gxy_sh/article/details/143926759 浏览次数: 0次

一般做个网站需要多少钱_东莞公司转让平台_百度收录怎么弄_自动外链工具

如何利用Scrapy框架实战提取百度首页热榜新闻的排名、标题和链接

一、安装Scrapy库

在这里插入图片描述

二、创建项目（以BaiduSpider为例）

scrapy startproject BaiduSpider

在这里插入图片描述

生成每个文件的功能：

在这里插入图片描述

二、创建爬虫脚本（爬虫名：news）

scrapy genspider news www.baidu.com

命令执行成功后，spider目录中将生成news.py文件

在这里插入图片描述

（1）name：在同一个项目中，名字是唯一的，用来区分不同的spider。
（2）allowed_domains：允许爬取的域名，如果初始或后续请求的URL不是这个域名下的，则请求会被过滤掉，可以根据需要编辑或添加。
（3）start_urls：spider初始爬取的URL列表，可以根据需要编辑或添加。
（4）parse(self，response)：解析返回的响应，提取数据或新的URL，response是请求start_urls后返回的响应。

三、修改settings脚本（位置：settings.py）

设置请求头中的User-Agent和不遵守Robots协议

在这里插入图片描述

四、完善爬虫（位置：news.py）

编写解析方法

在这里插入图片描述

五、运行爬虫

正常运行爬虫命令

scrapy crawl news

不打印日志文件运行爬虫命令

scrapy crawl news --nolog

在这里插入图片描述

六、数据保存

6.1 修改items脚本（位置：items.py）

scrapy库提供Item对象来实现将爬取到的数据转换成结构化数据的功能。实现方法是定义Item类（继承scrapy.Item类），并定义类中的数据类型为scrapy.Filed字段。

在这里插入图片描述

6.2 编写解析方法（位置：news.py）

在这里插入图片描述

6.3 保存为JSON文件

scrapy crawl news -o news.json

命令执行成功后，BaiduSpider目录中将生成news.json文件

在这里插入图片描述

注意：使用-o输出JSON文件时，会默认使用unicode编码，当内容为中文时，输出的JSON文件不便于查看。此时，可以在settings.py文件中修改默认的编码方式，即增加设置FEED_EXPORT_ENCODING = ‘utf-8’。

关键字：一般做个网站需要多少钱_东莞公司转让平台_百度收录怎么弄_自动外链工具

版权声明:

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：

>> 相关文章

>> 热门图片

网络seo推广培训_c2c代表网站_长沙网站seo诊断_seo黑帽培训骗局

网络seo推广培训_c2c代表网站_长沙网站seo诊断_seo黑帽培训骗局

wap平台_dreamweaver cs6教程_长春seo培训_外贸独立站推广

wap平台_dreamweaver cs6教程_长春seo培训_外贸独立站推广

济宁网站建设哪家好_品牌注册查询系统_做高端网站公司_yandex搜索引擎

济宁网站建设哪家好_品牌注册查询系统_做高端网站公司_yandex搜索引擎

百分百营销软件官网_企业信息查询app哪个最好_seo公司推荐_看颜色应该搜索哪些词汇

百分百营销软件官网_企业信息查询app哪个最好_seo公司推荐_看颜色应该搜索哪些词汇

免费咨询身高问题_四川公众项目咨询管理有限公司_seo优化是利用规则提高排名_推广普通话手抄报简单又好看

免费咨询身高问题_四川公众项目咨询管理有限公司_seo优化是利用规则提高排名_推广普通话手抄报简单又好看

在线查询营业执照_百度seo优化方案_百度竞价点击神器奔奔_重庆seo网络推广平台

在线查询营业执照_百度seo优化方案_百度竞价点击神器奔奔_重庆seo网络推广平台

什么是网站建设?_人力资源招聘公司_专业网站制作网站公司_奉化seo页面优化外包

什么是网站建设?_人力资源招聘公司_专业网站制作网站公司_奉化seo页面优化外包

公司网站制作哪个公司好_加强专业建设的主要举措_佣金高的推广平台_东莞seo网站排名优化公司

公司网站制作哪个公司好_加强专业建设的主要举措_佣金高的推广平台_东莞seo网站排名优化公司

>> 热门搜索

评论排行

图片新闻

一般做个网站需要多少钱_东莞公司转让平台_百度收录怎么弄_自动外链工具

怎么加密文件夹？文件夹加密软件推荐

Springboot访问resources下的静态资源遇到的问题

中国建设银行招聘_四川政府采购招标网官网_百度认证服务平台_深圳搜索排名优化

点击排行