yokon's blog

Python爬虫(7):多进程抓取拉钩网十万数据

由于拉钩网页面做了一些更新,之前的程序无法正常工作,本篇文章做一次更新。只更新一些程序和一些程序的实现方法。由于没有仔细修改,可能前后语言不通顺,大家谅解。


大家好,几天没有更新了。相信大家经过前两篇的练手爬虫,大家已经知道如何抓取一个简单网站。

......

Python爬虫(6):煎蛋网全站妹子图爬虫

上一篇文章中我们抓取了豆瓣图书的数据,如果大家运行成功,并且看到文件夹下的 txt 文件了。是不是有一种刚接触编程,第一次输出Hello world!时的欣喜。和上一篇实践不同,我们这一次来爬取 煎蛋网 全站妹子图,并且保存到指定文件夹下。

......

Python爬虫(5):豆瓣读书练手爬虫

我们在之前的文章中基本上掌握了Python爬虫的原理和方法,不知道大家有没有练习呢。今天我就来找一个简单的网页进行爬取,就当是给之前的兵书做一个实践。不然不就是纸上谈兵的赵括了吗。

好了,我们这次的目标是豆瓣图书Top250,地址是:https://book.douban.com/top250?start=0

......

行走世间都是妖怪

热的时候喊热是无济于事的。顶着火红的太阳,看着姗姗来迟的 138 路公交,无奈的翻翻白眼。

南京的天气一如既往的热,由于科目二考试将至,连安静呆在宿舍的想法都无法满足。不过年轻人就是应该多出来走走,不然就无法看到外面美丽的姑娘们了。钱钟书说暴露的姑娘是局部的真理,我觉得这再合适不过了,真理总是赤裸的。正值躁动青春期的室友,掩饰不住自己对真理渴望的心,时不时露出莫名其妙的笑。

......