今天来学一学爬虫…… Mad_Fish 2022年10月23日22:12:52 这几天感冒得厉害…… 所以这篇文章我恐怕没有精力再去像往常那样写那么多了…… 真是非常地抱歉啊…… 不过呢 课程是认真学了…… 代码的爬虫部分自然是照搬 接下来便是在其上方做出了一些改进: 1.Markdown排布(自认为弄得还算观感良好) 2.(很简陋的)检验URL 3.自定义...
【后端二】冯羽
- 0
今天来学一学爬虫…… Mad_Fish 2022年10月23日22:12:52 这几天感冒得厉害…… 所以这篇文章我恐怕没有精力再去像往常那样写那么多了…… 真是非常地抱歉啊…… 不过呢 课程是认真学了…… 代码的爬虫部分自然是照搬 接下来便是在其上方做出了一些改进: 1.Markdown排布(自认为弄得还算观感良好) 2.(很简陋的)检验URL 3.自定义...
目录 一、学习内容 css盒模型 css布局 js初步 二、作业内容 三、感想 学习内容 1.css盒模型 padding:边框与内容之间的填充部分,一个值设定四个方向,两个值对应上下、左右,或分别 padding-bottom padding-top padding-left padding-right margin:用合适的间距将两个盒子分开 border:盒子的边框 box-sizing:bo...
第二次前端作业 流程 周二和周三把这次作业的主干写了出来,就是if语句,二分,建立输入框以及按钮以及打印,此时页面无任何美化效果,所有东西都在左上角堆着~~~ (1)周四开始美化,首先找了一个个人感觉比较和善的图片,费尽心机,把他插了进去,然后 background-size: 100%; (2)建了两个盒子,分别是两个游戏...
前端第二次培训- 一.css盒模型 1.盒子属性: margin: 盒子边缘距 margin:25px 50px 75px 100px; // 顺序:上 右 下 左 margin:25px 50px 75px; // 顺序:上 (左右) 下 margin:25px 50px; // 顺序:上下 左右 margin:25px; // 顺序:所有方向 border:边框 border-style: 边框样式(dotted/dashed/solid/doble/groove...
首先我的吐槽 P社的游戏不知道大家玩过没,游戏教程:你是一名二战时期新兵,现在你会移动和开枪了,快去干掉希特勒法西斯吧。我觉得和我们的培训是差不多的(狗头保命)。 这样是有利有弊的,弊端是对于我这样的纯萌新,一开始听了培训也是无从下手,毫无思路,非常劝退。 但好处也很明显,对于游戏,当游戏内容过多时...
盒子模型 四部份 1.content:用以填充盒子内容 2.border:盒子的边框 3.padding:边框与内容的距离,可使内容放在合适位置进而美观 4.maegin:两个盒子之间距离,使布局美观 注:各方向所需不同时可分别设置 js 赋值 js中变量是弱变量,可以用let,var声明 Api 弹出警告:window.alter() 控制台打印信息:consol...
HTML的常用标签 1. 标题标签h? 一至六级标签:<h1></h1>~<h6></h6> 效果:加粗加大,占一行 2. 段落标签p 语法格式:<p></p> 效果:文本会根据浏览器大小自动换行,段落见有间隔 3. 换行标签br 语法格式:<br> 效果:强制换行,行与行之间无间隔 4. 文本格式化标签(css均能...
第一次作业总结 <div class=".pic"><img src="beauty.jpg" alt="bicycle" title="bicycle"> <h4>Bicycle</h4> </div> 一开始想不到方法直接把这个代码了复制二十次 <script> var html = ''; ...
CSS之盒模型 一些理论 html对容器进行定义,比如<div>可以用来声明容器,一个容器包含Margin、Border、Padding、Content四个部分。 其中Margin、Border、Padding,可以在后面加上-bottom、-top、-left、-right等来进行相关量的设置。 Padding有两个数时,采取上下 左右的方式排列,当有四个数时按照上右下左的方...
笔记 一,css盒模型 html对每个容器进行了定义。这些容器之间的排版是由css来定义的。 (1)一个容器包含Margin,Border,Padding,Content四个部分。 content指的是你的真正的内容。 border是盒子的边框 padding是边框与你的内容之间的填充部分 margin是盒子之间的间距。 (2)padding 画框与画之间的填充部分...
问题1 起初,按照培训时的代码运行,发现会报错 报错内容是url illegal了 看了看发现 try{ chapter = Jsoup.connect(menuUrl+sublink).get(); }catch(IOException ewww){ ewww.printStackTrace(); } 这一步中menuUrl+sublink的结果是错的 举个例子,形如这种 https://www.aixiaxsw.com/61/61977//61/61...
简易爬虫 一、产品介绍 1.基本功能 程序运行后能够爬取爱下书小说网(www.aixiaxsw.com)任意小说 2.操作指南 程序运行后在控制台输入准备爬取的小说目录页的url(如:https://www.aixiaxsw.com/104/104509/) 注:若输入url格式不对,则无法正常运行。 3.爬取结果 程序运行结束后,所得小说将存至.md文档中。 二、拓...
1写爬虫框架时遇到的问题 zygg的教程视频中的地址栏中直接输入"https://www.xbiquge.so/book/10415/"就可以但是爱下书的如果直接输入"https://www.aixiaxsw.com/111/111972/"则在爬取时会报错因为进入的文章中也有"111/111972/"所以必须这样弄 try { document = Jsoup.connect(menuUrl + "111/11...
学到的东西以及遇到的问题 学到的东西 本次培训我学会了如何写(抄)爬虫代码,了解了部分html、Java方法、正则表达式和就soup与爬虫的知识。 遇到的问题 由于只顾着抄代码,没有细究count<=的意义,于是在爬取小说的时候没有从第一章开始爬取,后来分析出了count应该小于等于的数值,能够从第一章开始爬取而不是最...
我的任务是实现课表小组件的逻辑图 成功将三种大小的小组件逻辑实现 【超级会员V1】通过百度网盘分享的文件:FE73E430…等3个文件 链接:https://pan.baidu.com/s/1ZLmyoL_rCTVPeNtbOS2FWA 提取码:b9sv 复制这段内容打开「百度网盘APP 即可获取」
爬虫 关于html: 定义:超文本标记语言(HyperText Markup Language,简称:HTML)是一种用于创建网页的标记语言。 格式:一个html文档一般由head标签和body标签组成,head主要包含标题、脚本、样式等信息,body主要包含显示在网页上的信息。 关于java方法: 方法的命名:第一个单词应以小写字母作为开头,后面的单词...
初定产品方案 定产品想法时,小组选择了线下开会讨论。给人最大的感受是产品经理经常打架的传闻名不虚传,每个人都有自己的想法,都想按着自己的想法来做,具体要做什么,难以决定,从图书馆位置具体有无电脑的显示,到二维码扫描问题,又到淋浴室的查询与预约问题,到最后的小组件方案确定,其中考虑到多方面的问题,...
学习到的东西 正则表达式 正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。 正则表达式在线测试工具:https://regex101.com/ 学到的匹配符匹配符: d? d出现0/1次 a* a可以出现0/多次 a+ a出现一次以上 a{6} a出现6次 a{2...
基于Jsoup的网文爬虫 一、正则表达式 用处:检验字符串是否满足一定的规则(用来查找特定内容),并用来核验数据结构的合法性。 字符类(只匹配一个字符) [abc] 只能是abc [^abc] 除abc以外的其他字符 [a-zA-Z] a到z,A到Z [a-d[m-p]] a到z或m到p [a-z&&[ ^bc]] a到z和非bc的交集 预定义字符(...
基于Jsoup的网络小说爬虫 一.HTML阅读 \ 与 之间的文本描述网页 \ 与 之间的文本是可见的页面内容 \ 与 之间的文本被显示为标题 \ 与 之间的文本被显示为段落 \中的文本为超链接URL 二.Maven 1.Maven 是一款基于 Java 平台的项目管理和整合工具,只需要做一些简单的配置,Maven 就可以自动完成项目的编译、测试、打...
Jsoup爬虫学习 (我还是用了笔趣阁作为下载源== 因为之前就这么写了没改) 目前实现功能: ① 用户在终端输入书名进行检索,自动抓取匹配的书籍,并输出 ② 用户输入相应的编号开始下载 ③ 下载内容存在resources内用md格式存储,自带标题格式,段落与缩进 ④ 可以自定义每行的字数,并自动换行 输入书名 检索 斗罗 输入序号进...
制作能爬取[爱下书小说站]任意小说的爬虫 遇到的问题: 1.下载的小说排版困难: 解决: 通过正则表达式判断段落,然后分别写入文件,再用css进行排版 2.将工件打包时无法运行jar包: 解决: 1.更换maven下载源,改为阿里镜像(加快下载速度),同时创建本地仓库存放依赖 2.调整环境变量将%JAVA_HOME%\bin置于最前. 因为电脑...
学爬虫有感() 学到的东西 1.爬取网站上的内容然后保存到文档中,学会了很多方法用于灵活处理爬取数据的形式。 2.学会了结合markdown语法把文本排版的更清楚 3.学会了如何处理换行问题,对程序运行的逻辑有了更深的理解。 4.学会了一些html的语法,对html语法的理解更深刻并且能在一定程度上通过html内容来编写爬虫程序...
成果 成功利用Intent实现了页面的跳转 搭建起了一个主要的用于显示各个代办的滚动视图
代办APP到底要怎么V才能进入移动? 一、界面布局 欢迎页 注册页 登录页 代办页 设置页 …… 二、程序逻辑 欢迎页: 跳转至注册页 跳转至登录页 销毁欢迎页 注册页: 获取并存储注册用户名 获取并存储注册密码 上传注册用户名与注册密码以实现注册 跳转至登录页 销毁注册页 登录页 获取并存储登录用户名 获取并存储...