最近无聊的时候逛知乎收到几个伙伴的私信,是我之前在专栏写的一个小说网站的代码不能用了。由于我之前说过不在更新那个项目了,所以我也没想去改,我知道大部分原因是爬虫抓取的小说网站更新了,爬虫代码用不了了。然后我看了一下之前的代码,我靠,怎么跟屎一样。这样的代码真的对不起认真阅读的伙伴,于是我将github
上的代码全部删了,就重新实现了一下。
实现
实现的大部分方式都写在知乎上,如果大家感兴趣不妨看一下:zhihu
实现后的效果如下:
首页:
搜索结果页:
章节页:
文章页:
主要使用xpath
加requests
抓取顶点网的小说数据,利用flask
写web
端,使用bootstrap
做前端页面。
项目地址:
小说网站:MyNovels
谢谢阅读