Skip to content

az13js-org/tieba-spider

Repository files navigation

百度贴吧活动用户搜集

这是一个采用PHP编写的百度贴吧相关信息的爬虫应用,获取的是百度贴吧的公开信息。

目前实现了以下的功能:

  1. 保存百度指定贴吧首页出现的用户。

用户显示

  1. 显示当前的热帖(通过贴吧页面HTML的meta标签解析,不是特别实时)。

热门帖子

  1. 显示部分最新的帖子(从首页获取)。

最新帖子

安装和使用方法

使用PHP 7(具备CURLPDOMySQLmbstring扩展)、MySQL/MariaDB以及提供Web服务(如NginxApache,不需要查看页面的话就不用)的服务器足以满足要求。

假设服务器软件能满足要求,那么:

  1. 配置Nginx或Apache的Web目录到此项目的public文件夹。
  2. 复制项目的config.example.php文件为config.php,然后修改config.php内的配置。
  3. 配置后台任务运行php test.php,或者work.sh脚本,用于爬数据。

About

百度贴吧信息爬取

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published