学到的东西以及遇到的问题
学到的东西
本次培训我学会了如何写(抄)爬虫代码,了解了部分html、Java方法、正则表达式和就soup与爬虫的知识。
遇到的问题
- 由于只顾着抄代码,没有细究count<=的意义,于是在爬取小说的时候没有从第一章开始爬取,后来分析出了count应该小于等于的数值,能够从第一章开始爬取而不是最新章节。
- 一开始没有注意爱下书网站和演示网站的不同,导致url出错,后来重新加了一个url来拼接
本次培训我学会了如何写(抄)爬虫代码,了解了部分html、Java方法、正则表达式和就soup与爬虫的知识。