当前位置: 首页> 房产> 家装 > 全国城建中心官方网站_管理网站 开发_百度一下你就知道了百度_杭州seo排名公司

全国城建中心官方网站_管理网站 开发_百度一下你就知道了百度_杭州seo排名公司

时间:2025/7/10 9:17:14来源:https://blog.csdn.net/weixin_66833777/article/details/145755283 浏览次数:0次
全国城建中心官方网站_管理网站 开发_百度一下你就知道了百度_杭州seo排名公司

一、requests模块介绍

#第一步安装requests模块
#导入requests模块
import requests
#使用一个变量接受requests.get方法
resp = requests.get('https://www.baidu.com')
#默认输出响应状态码
print(resp)
#获取响应状态码也可以通过status_code方法
print(resp.status_code)

 

二、关于params参数

记得我刚学爬虫时候params参数还可以,现在百度首页都有关键字搜索反爬了。。。。

但是有办法你可以直接把整个链接复制到get请求方法里。。然后修改关键字的参数值。。

import requests
#params参数 用于存放搜索关键词
kw = {'c':'news','q':'deepseek','from':'home','ie':'utf-8'
}
#将params参数传递到get请求方法中
resp = requests.get('https://search.sina.com.cn/?c=news&q=deepseek&from=home&ie=utf-8',params=kw)
#在页面中右键选择查看源代码 找到网页所使用的unicode编码格式
resp.encoding = 'utf-8' #一般是utf-8 注意!encoding编码格式是可变的
#将百度的首页保存为html文档
with open('sina1.html',mode='a+')as f:f.write(resp.text)#请求到的内容写入文件 .text返回的是unicode格式的数据#使用try和except语句 保证出现异常时可以发现异常try:print('OK!')except:print('遇到一个错误')f.close()

 

这样可以看到文档中还是有当前关键字的

 三、关于headers参数

你正常可以访问就不用加,如果响应码不是200就需要加

右键-检查-网络

右键检查找到页面响应头信息user-agent复制一下,当然当前状态是可以访问的,可以不用加

但有些情况下比如400状态就需要添加一下再访问试试

#导入requests模块
import requests
#设置headers头部信息
headers = {
'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15; rv:135.0) Gecko/20100101 Firefox/135.0'
}
#使用一个变量接受requests.get方法
resp = requests.get('https://www.baidu.com/s?wd=%E8%8B%B9%E6%9E%9C%E9%A6%96%E6%AC%A1%E5%85%A8%E9%9D%A2%E6%94%BE%E5%BC%83Home%E9%94%AE&sa=fyb_n_homepage&rsv_dl=fyb_n_homepage&from=super&cl=3&tn=baidutop10&fr=top1000&rsv_idx=2&hisfilter=1',headers=headers)
#默认输出响应状态码 如果状态码不是200的情况下再去加headers信息
print(resp)
#获取响应状态码也可以通过status_code方法
print(resp.status_code)

关键字:全国城建中心官方网站_管理网站 开发_百度一下你就知道了百度_杭州seo排名公司

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

责任编辑: