最近无聊的时候逛知乎收到几个伙伴的私信,是我之前在专栏写的一个小说网站的代码不能用了。由于我之前说过不在更新那个项目了,所以我也没想去改,我知道大部分原因是爬虫抓取的小说网站更新了,爬虫代码用不了了。然后我看了一下之前的代码,我靠,怎么跟屎一样。这样的代码真的对不起认真阅读的伙伴,于是我将github上的代码全部删了,就重新实现了一下。
实现
实现的大部分方式都写在知乎上,如果大家感兴趣不妨看一下:zhihu
实现后的效果如下:
首页:

搜索结果页:

章节页:

文章页:

主要使用xpath加requests抓取顶点网的小说数据,利用flask写web端,使用bootstrap做前端页面。
项目地址:
小说网站:MyNovels
谢谢阅读