首页
会员中心
到顶部
到尾部
任务书

基于Java的网络爬虫实时新闻监测分析系统的设计任务书

时间:2020/10/21 12:47:27  作者:  来源:  查看:0  评论:0
内容摘要: 毕业设计(论文)任务书第1页 毕业设计(论文)题目: 基于Java的网络爬虫实时新闻监测分析系统的设计与实现 毕业设计(论文)要求及原始数据(资料): 1.综述国内外网络爬虫技术研究现状; 2.深入...

毕业设计(论文)任务书

第1页

毕业设计(论文)题目:

基于Java的网络爬虫实时新闻监测分析系统的设计与实现

毕业设计(论文)要求及原始数据(资料):

1.综述国内外网络爬虫技术研究现状;

2.深入了解网络爬虫与文字分析的相关技术;

3.熟练掌握网络爬虫爬取策略以及分析策略;

4.设计并实现针对网络新闻的爬虫程序;

5.深入分析与整合爬取到的网络新闻数据;

6.训练检索文献资料和利用文献资料的能力;

7.训练撰写技术文档与学位论文的能力。

第2页

毕业设计(论文)主要内容:

1.综述网络爬虫在大数据分析中的应用;

2.了解网络爬虫以及文字分析的相关技术;

3.熟悉网络爬虫的开发环境;

4.设计以网络新闻为目标的爬虫程序;

5. 学习研究文字分析的关键技术与编写网络爬虫的设计流程;

6.熟练掌握程序绘制分析结果统计图的技术;

7.设计与实现针对网络新闻爬取与分析整合的程序。

学生应交出的设计文件(论文):

1.内容完整、层次清晰、叙述流畅、排版规范的毕业设计论文;

2.包括毕业设计论文、源程序等内容在内的毕业设计电子文档及其它相关材料。

第3页

主要参考文献(资料):

[1] 于娟,刘强. 主题网络爬虫研究综述[J]. 计算机工程与科学, 2015, 37(02):231-237.

[2] 张红云. 基于页面分析的主题网络爬虫的研究[D]. 武汉理工大学, 2010.

[3] 张莹. 面向动态页面的网络爬虫系统的设计与实现[D]. 南开大学, 2012.

[4] 张晓雷. 面向Web挖掘的主题网络爬虫的研究与实现[D]. 西安电子科技大学, 2012.

[5] 奉国和,郑伟. 国内中文自动分词技术研究综述[J]. 图书情报工作, 2011, 55(2):41-45.

[6] 许智宏,张月梅,王一. 一种改进的中文分词在主题搜索中的应用[J]. 郑州大学学报, 2014(5):44-48.

[7] 欧振猛,余顺争. 中文分词算法在搜索引擎应用中的研究[J]. 计算机工程与应用, 2000, 36(08):80-82.

[8] Batsakis.S, Petrakis E G M, Milios E. Improving the performance of focused web crawlers[J]. Data & knowledge engineering, 2009, 68(10):1001-1013.

[9] Pant.G, Menczer F. MySpiders:Evolve Your Own Intelligent Web Crawlers[J]. Autonomous agents and multi-agent systems, 2002, 5(2):221-229.

[10] Ahmadi-Abkenari F, Ali S. A Clickstream-based Focused Trend Parallel Web Crawler[J]. International Journal of Computer Applications, 2010, 9(5):24-28.


  


相关评论
广告联系QQ:45157718 点击这里给我发消息 电话:13516821613 杭州余杭东港路118号雷恩国际科技创新园  网站技术支持:黄菊华互联网工作室 浙ICP备06056032号