基于网络爬虫的世纪佳缘网数据分析 摘 要 随着社会和人口的快节奏发展,男女比例失调,人口老龄化等一系列社会问题随之产生,大龄未婚男女的数量越来越庞大,随之带来的就是各种婚恋交友网站的产生和发展。本文选择了时下比较热门的世纪佳缘网进行了数据采集分析。 本文的主要工作如下: (1)了解学习使用一款网络爬虫软件对世纪佳缘网进行数据采集。 (2)了解数字可视化理论相关,学习使用一款数据分析软件对采集来的数据进行绘图分析。 最后,本文总结了注册世纪佳缘网的大龄未婚男女的各类自身条件情况以及各类择偶标准。 关键词:男女比例失调; 大龄未婚男女; 网络爬虫; 数字可视化; 择偶标准 目 录 摘 要........................................................................................................i ABSTRACT...................................................................................................ii 第一章 绪 论...................................................................................1 1.1 研究背景及意义........................................................................................1 1.1.1 研究背景............................................................................................1 1.1.2 研究意义.........................................................................................2 1.2 本文主要工作和研究内容..................................................................3 1.3 论文结构安排......................................................................................3 1.4 本章小结...............................................................................................4 第二章 数据采集分析相关技术...................................................................5 2.1 数据收集方法.......................................................................................................................5 2.2 网络爬虫相关技术...............................................................................................................5 2.2.1 网络爬虫的定义与介绍............................................................................................5 2.2.2 网络爬虫的分类........................................................................................................6 2.2.3 网络爬虫的工作流程................................................................................................7 2.3 数据可视化理论相关...........................................................................................................9 2.3 本章小结.............................................................................................................................10 第三章 基于网络爬虫的世纪佳缘网数据采集............................................................................11 3.1 采集工具................................................................................................11 3.2 采集流程................................................................................................11 3.3 本章小结..............................................................................................12 第四章 基于数字可视化理论相关的世纪佳缘网数据分析............................13 4.1 对世纪佳缘网的数据分析........................................................................13 4.1.1 男女用户的居住省份分布情况.....................................................13 4.1.2 男女工资收入水平情况.................................................................14 4.1.3 最萌身高差投票情况.....................................................................15 4.1.4 学历情况统计................................................................................16 4.2 分析情况总结...........................................................................................17 4.3 本章小结...................................................................................................17 第五章 全文总结与后续展望...........................................................................18 5.1 本文总结.....................................................................................................18 5.2 未来展望.....................................................................................................18 致谢……………………………………………………………………………………19 参考文献................................................................................................................20 |
基于网络爬虫的世纪佳缘网数据分析
更新时间:2019-08-04
下一篇:基于微信的课堂签到系统设计与实现