这个repository最初是源于我在知乎上一个问题的回答(http://www.zhihu.com/question/24368542/answer/27579662),涉及了两个方面:数据抓取和数据分析。
- 爬取对象:淘宝“连衣裙 夏”的搜索结果。爬取对象的选择分析我在文章中也有提及。
- 工具:Scrapy。Repository内容即为当时实现的代码。
- 分析内容可见此Repository的Wiki。也可见上面问题链接。
- 工具:ipython & matplotlib。
分析内容放在了Wiki中,链接:https://github.com/younghz/TBBKAnalysis/wiki
如果Wiki中图片不能正常显示,请使用较高版本的Chrome打开。