這個 Program 是讓我用來練習爬蟲的基本概念,搭配多執行緒的使用
希望大家有建議或是批評都可以寫信給我,對我來說這是有效率的學習機會。
但是比較傾向自己改 code, 謝謝大家寶貴的意見!
$ python beauty_spider2.py 爬蟲起始的頁面 爬幾頁 推文多少以上
如果要從最新頁面開始爬 第一個參數請填 -1
目前各種 bug 效能未優化。
爬蟲是利用 PTT 網頁版,所以頁面以網頁版為標準。
請參考:
https://www.ptt.cc/bbs/Beauty/index.html
使用:
$ python beauty_spider2.py -1 100 100