最近一直有朋友问我改版的煎蛋网妹子图怎么爬,因为他们花费精力结果抓了一整个文件夹的防盗图。我之前在很久以前的一篇博客说过,对于这种js处理的网页,要想抓取到网页上看到的数据,大致有三种方法: Selen......
4月1号那天,网易云下架了周杰伦的音乐,也是那天我在地铁上卸载了这个我使用4年的软件。这个月很多歌火了,前几天室友刷抖音,视频的bgm是一首叫《离人凑》的歌。他觉得好听,就搜出来听。我刚听就觉得熟悉,......
之前写爬虫的时候,经常遇到被封IP的情况。解决办法是控制爬虫请求的时间,这样效率低很多,而且一般网站都会有ip访问阈值监控,超过访问阈值仍然可能会被封。最直接的办法是更换ip,如果可以建议选择付费的代......
写爬虫的时候,习惯性会把爬取到的数据存入mongodb。为了方便,也为了每次抓取完数据,不在后面接插入数据的生涩代码。最好的选择是简单的封装mongodb的增删改查功能,如果后面使用mongodb的时......