BUPT Crawer 是一个为方便北邮学生获取数据而编写的爬虫程序
请在使用时遵循以下规定
自动爬取设定平台上的新通知新消息,并转发到已配置的推送平台上。
支持的平台列表:
- 信息服务门户-校内通知
- 大学生创新创业计划训练平台-公告中心
北京邮电大学邮箱制作中云邮教学空间-消息通知制作中云邮教学空间-所有课程的公告制作中
支持的推送方式列表:
-
准备工作
- 个人配置
- 在
config/bupt.json.example
中填入校园网账号和密码,并重命名文件为config/bupt.json
。
- 在
- 飞书-应用机器人(推荐)
- 在
config/feishu.json.example
中填入以下内容,并重命名文件为config/feishu.json
:- 飞书自建应用的
appid
和appsecret
- 管理员的账号信息,
mobile
填入手机号码,email
填入邮箱地址,open_id
填入Open ID,三选一即可无论填入何子项,为保护隐私,该父项随后均会被管理员的Open ID覆盖 请只填入一项,其余两项填写null
- 飞书自建应用的
- 注意应用应开启以下权限:
im:chat
(获取与更新群组信息)im:message
(获取与发送单聊、群组消息)im:resource
(获取与上传图片或文件资源)contact:user.id:readonly
(通过手机号或邮箱获取用户 ID)
- 在
- 飞书-自定义机器人
- 开发中...
- 个人配置
-
运行程序
- 控制台运行:
# 直接运行 python getInfo.py # 后台运行 nohup python getInfo.py > BUPT_Crawler.log 2&>1 &
- 使用docker运行
docker build -t bupt_crawler . docker run -td bupt_crawler
- 控制台运行:
TODO:
处理飞书返回HTTP错误码(飞书专用错误处理)