全国城建中心官方网站_管理网站开发_百度一下你就知道了百度_杭州seo排名公司

时间:2025/7/10 9:17:14来源：https://blog.csdn.net/weixin_66833777/article/details/145755283 浏览次数:0次

一、requests模块介绍

#第一步安装requests模块
#导入requests模块
import requests
#使用一个变量接受requests.get方法
resp = requests.get('https://www.baidu.com')
#默认输出响应状态码
print(resp)
#获取响应状态码也可以通过status_code方法
print(resp.status_code)

二、关于params参数

记得我刚学爬虫时候params参数还可以，现在百度首页都有关键字搜索反爬了。。。。

但是有办法你可以直接把整个链接复制到get请求方法里。。然后修改关键字的参数值。。

import requests
#params参数 用于存放搜索关键词
kw = {'c':'news','q':'deepseek','from':'home','ie':'utf-8'
}
#将params参数传递到get请求方法中
resp = requests.get('https://search.sina.com.cn/?c=news&q=deepseek&from=home&ie=utf-8',params=kw)
#在页面中右键选择查看源代码 找到网页所使用的unicode编码格式
resp.encoding = 'utf-8' #一般是utf-8 注意！encoding编码格式是可变的
#将百度的首页保存为html文档
with open('sina1.html',mode='a+')as f:f.write(resp.text)#请求到的内容写入文件 .text返回的是unicode格式的数据#使用try和except语句 保证出现异常时可以发现异常try:print('OK!')except:print('遇到一个错误')f.close()

这样可以看到文档中还是有当前关键字的

三、关于headers参数

你正常可以访问就不用加，如果响应码不是200就需要加

右键-检查-网络

右键检查找到页面响应头信息user-agent复制一下，当然当前状态是可以访问的，可以不用加

但有些情况下比如400状态就需要添加一下再访问试试

#导入requests模块
import requests
#设置headers头部信息
headers = {
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15; rv:135.0) Gecko/20100101 Firefox/135.0'
}
#使用一个变量接受requests.get方法
resp = requests.get('https://www.baidu.com/s?wd=%E8%8B%B9%E6%9E%9C%E9%A6%96%E6%AC%A1%E5%85%A8%E9%9D%A2%E6%94%BE%E5%BC%83Home%E9%94%AE&sa=fyb_n_homepage&rsv_dl=fyb_n_homepage&from=super&cl=3&tn=baidutop10&fr=top1000&rsv_idx=2&hisfilter=1',headers=headers)
#默认输出响应状态码 如果状态码不是200的情况下再去加headers信息
print(resp)
#获取响应状态码也可以通过status_code方法
print(resp.status_code)

关键字：全国城建中心官方网站_管理网站开发_百度一下你就知道了百度_杭州seo排名公司

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：

全国城建中心官方网站_管理网站 开发_百度一下你就知道了百度_杭州seo排名公司

全国城建中心官方网站_管理网站开发_百度一下你就知道了百度_杭州seo排名公司