学爬虫有感()
学到的东西
1.爬取网站上的内容然后保存到文档中,学会了很多方法用于灵活处理爬取数据的形式。
2.学会了结合markdown语法把文本排版的更清楚
3.学会了如何处理换行问题,对程序运行的逻辑有了更深的理解。
4.学会了一些html的语法,对html语法的理解更深刻并且能在一定程度上通过html内容来编写爬虫程序
不会的东西
1.对输出流不太理解,不知道数据在这过程中发生了什么。
2.具体来讲,就是不知道
还有空格是怎么消失(变成了空格)而只爬取了文本信息。
3.对element这个类及其所拥有的方法不是很理解。只能乱蒙加查资料来做。