1导入相应的库
2爬取网站url:
?b=341c==
3找到爬取的内容
4具体的代码实现
url='?b=341c=='
={ ' User-Agent ' : ' Mozilla/5.0(windows nt 6.3;Win64' x64)'
AppleWebKit/537.36(KHTML,喜欢壁虎)Chrome/69。0 .3497 .100 safari/537.36 ' }
URL=请求。获取(网址,标题=标题)
网址。编码=URLs。指定编码(_ o)
text=urls.text
汤=美化组(文本,' lxml ')
c=汤。find _ all(class _=' list-title ')
he=[i.get_text()foriinc]
q=soup.find_all('td ',class_='last ')
qq=[i.get_text().strip()[foriinq]
打印(' { :25 } \ t { ' ."格式("标题,”搜索指数))fori,yinzip(he,qq):print('{:20}\t{}。格式(I,y))
5测试
相关阅读
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除
标签: #关于百度的热门事件