Skip to content

CescMessi/tieba_spider

Repository files navigation

贴吧爬虫

目前仅能爬取前200页的帖子标题、作者、链接及回复数。

使用方法

  1. 安装依赖:
$ pip install -r requirements.txt
  1. 修改配置文件 修改config.py,具体含义见注释。若存在安全验证的情况,可考虑添加Cookies。

  2. 运行main.py

python main.py

示例图片

About

爬取贴吧数据,生成词云

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages