基于网络数据自动提取的爬虫设计与实现|张璐璐;吴丽杰;孙俊杰;王星月 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于网络数据自动提取的爬虫设计与实现

文献摘要：

"互联网+"的兴起打破了数据信息的壁垒,网络爬虫被广泛应用于数据采集与数据分析中.以"豆瓣电影top250"为目标,采用基于Python语言的爬虫技术,对比BeautifulSoup、Re和Xpath 3种网页解析方式的不同,完成目标数据的爬取.实验结果表明:在数据解析速度上,Re最优;在网页解析逻辑上,BeautifulSoup最优;在综合使用角度上,Xpath较为适宜.

文献关键词：

网络爬虫;Python;BeautifulSoup;Re;Xpath

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机软件（TP31） / 程序设计、软件工程（TP311）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

作者姓名：

张璐璐;吴丽杰;孙俊杰;王星月

作者机构：

安徽粮食工程职业学院信息技术系,安徽合肥230031

文献出处：

广州航海学院学报

引用格式：

[1]张璐璐;吴丽杰;孙俊杰;王星月-.基于网络数据自动提取的爬虫设计与实现)[J].广州航海学院学报,2022(04):74-78

A类：

top250,Xpath

B类：

网络数据,自动提取,网络爬虫,豆瓣,Python,爬虫技术,BeautifulSoup,Re,网页,爬取,数据解析

AB值：

0.288875

相似文献

基于离子电流与LSTM神经网络的汽油机早燃判断

丁伟奇;王金秋;胡宗杰;李明龙;董光宇;李理光-同济大学汽车学院,上海201804

大数据分析的船舶航迹拟合研究

陶丽;陈天伟-四川师范大学计算机科学学院,四川成都610066;四川城市职业学院信息技术学院,四川成都610101

舰船机械状态监测特征参数选取系统

庄敏;张玲玲-浙江大学,浙江杭州311402;杭州科技职业技术学院,浙江杭州311402;武警杭州士官学校船艇系,浙江杭州311402

基于遥感数据的水边线提取方法比较——以海南岛为例

苏倩欣;李高聪;李志强;胡鹏鹏-广东海洋大学电子与信息工程学院,广东湛江 524088

基于遥感和OpenCV的海域使用疑点疑区自动提取与变化检测方法研究

付弘涛;张昊睿;秦平;王丽琳-自然资源部东海预报中心,上海 200136

基于BP-LSTM网络的列车脱轨系数预测

张卜;刘怡伶;张文静-201620 上海市上海工程技术大学机械与汽车工程学院

基于深度强化学习的蛇形机械臂控制策略研究

唐超;张帆;王文龙;李徐-201620 上海市上海工程技术大学机械与汽车工程学院

某款进气歧管EGR进气均匀性设计优化

周婷婷;芦俊洁;王磊;张亚洲-宁波吉利罗佑发动机零部件有限公司,浙江宁波,315336

高Re数弹性支撑圆柱的涡激振动数值分析

周军伟;闫文辉;杨天福;梅蕾;郭彬;于东-哈尔滨工业大学(威海)海洋工程学院,山东威海264209;北方工业大学机械与材料工程学院,北京100144

基于LBM的方柱流固耦合数值研究

谢振武;杨旖旎;邹明松-中国船舶科学研究中心,江苏无锡214082

大数据环境下的海量多维舰船故障信息控制系统设计

张伟;谢朋文;周淑秋-河南油田工程科技股份有限公司,河南郑州450000;中国劳动关系学院应用技术学院,北京100048

基于神经网络的船舶通信网络异常数据识别

田银磊;刘书伦-济源市网络智能创新集成应用技术研究中心,河南济源459000;济源职业技术学院,河南济源459000

基于数据挖掘的船舶通信网络失效节点自动识别方法

陈文庆-江苏师范大学计算机科学与技术学院,江苏徐州221000;中国劳动关系学院应用技术学院,北京100048

基于大数据技术的船舶智能终端数据管理系统

王英-天津海运职业学院,天津300350

基于无线网络的舰船实时导航数据采集与传输研究

熊志文-广西船联网工程技术研究中心,广西南宁530007;广西感知物联网生产力促进中心,广西南宁530007

船舶远距离通信网络数据流低延时传输方法设计

周立炎;王天闻-江苏海事职业技术学院,江苏南京211170

基于RGB-D图像的移动端点云分割方法研究

余方洁;王斌-中国科学院长春光学精密机械与物理研究所,长春 130033;中国科学院大学,北京 100049

CNN与SVM和ResNet相结合的牛脸识别系统模型研究与实现

朱敏玲;赵亮亮;和首杰-北京信息科技大学计算机学院,北京 100101

一种基于DensePoint的牙颌模型语义分割方法

马天;翟洁晨;杨逸舟;杨嘉怡;刘佳-西安科技大学计算机科学与技术学院,西安 710054;西安科技大学理学院,西安 710054

安全级DCS机柜抗震性能时程分析及试验研究

代俊安;魏新宇;王东伟;胡利鸿;吴霄;刘丽-西安交通大学能源与动力工程学院, 西安 710049;中国核动力研究设计院核反应堆系统设计技术重点试验室, 成都 610041

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。