瑞客论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 998|回复: 2

[经验求助] 爬取搜索到的网站信息

[复制链接]

0

主题

2

帖子

38

积分

新手上路

Rank: 1

威望
11
贡献
12
热心值
0
金币
15
注册时间
2021-8-31
发表于 2021-8-31 10:11 | 显示全部楼层 |阅读模式
10金币
本帖最后由 CCTLE别难过 于 2021-8-31 10:15 编辑

网站 :https://weixin.sogou.com/

我要爬取的信息是:xxxx年xx月xx日的招聘信息

然后把搜索到的相关信息都爬取下来最终保存为CSV文件。
有翻页,翻页之后的所有内容都要爬取下来。
做成文件其titili共分为三大类
第一列为文章内容
第二列为发布文章的公众号名称
第三列为发布时间

有提供一个图片 图片中红色框框为第一列的文章内容



图片.png
回复

使用道具 举报

0

主题

61

帖子

326

积分

中级会员

Rank: 3Rank: 3

威望
159
贡献
102
热心值
0
金币
65
注册时间
2021-8-24
发表于 2021-8-31 16:33 | 显示全部楼层
666666
回复

使用道具 举报

0

主题

2832

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

威望
4992
贡献
4924
热心值
0
金币
5417
注册时间
2019-7-25
发表于 2021-9-4 13:43 | 显示全部楼层
先遍历获取所有你需要的文章链接,然后对每个链接的文本提取对应内容就行
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2024-5-2 03:39

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表