基于文本挖掘的智能检索技术应用_VC毕业设计

- 登录 / 注册 / 忘记密码 2025年4月6日 3:58:37 星期日
- 距『劳动节』还有25天
联系我们我要留言

VC毕业设计: 基于文本挖掘的智能检索技术应用
时间：2020/10/13 21:14:27 作者：来源：查看：36 评论：0
<
内容摘要： 1.研究背景 12.国内外研究现状 23.文本挖掘中的分词技术 24.文本的特征提取 25.聚类分析的原理与方法 36.研究目标和具体思路 36.1向量空间模型（VSM） 46.2 统计分析 11参考文献 20六、结论本次毕业设计建模的主要目标是通过文献聚类发现...

1.研究背景 1
2.国内外研究现状 2
3.文本挖掘中的分词技术 2
4.文本的特征提取 2
5.聚类分析的原理与方法 3
6.研究目标和具体思路 3
6.1向量空间模型（VSM） 4
6.2 统计分析 11
参考文献 20
六、结论
本次毕业设计建模的主要目标是通过文献聚类发现学科交叉和学科热点等隐藏在数据背后的学科知识。在建模中，我们选取了05年图书情报学的681篇文献作为统计建模的数据，由于采用了系统抽样的方法，因此研究的数据具有一定的代表性。通过数据的采集和预处理、模型的建立、实验仿真、结果的统计分析和结果检验等各个环节，我们比较顺利地完成了本次建模任务。经检验，模型是科学的，结果是正确的。主要的创新点：（1）在设计的模型中，我们提出了一种新的相似度加权模型，从而使得FCM聚类所得的结果更加合理和准确。（2）设计了学科交叉表。从学科交叉表中可以一目了然地看出哪些学科在哪些方面交叉，同时还可以看出哪些课题是学科之间的热点及新的增长点。这样研究人员、学者就可以在第一时间很清楚地了解到交叉学科的热点及增长点，不仅节省花在查找方面的时间与精力，更为重要地是，可以时刻掌握先机，抢占科学前沿。该模型还需改进的方面有：（1）模型只考虑了摘要词对关键词的贡献度，还可以考虑标题词对关键词的贡献度，以进一步加强文献间相似度的精确性；（2）由于FCM是一种没有聚类结果无交叉的算法，因此在该模型中可以引入模糊理论，使得聚类的结果有重合，对于研究学科交叉将更为直接。

上一篇：基于权重均值的不良网页过滤算法研究开题报告
下一篇：基于krisch算子的边缘检测系统的设计与实现

相关评论: 数据加载中...
数据加载中...

VC毕业设计

本类更新

本类推荐

本类排行

: 小程序中文网 | 小白教程网 | 小程序教学网 |

关于我们 - 服务报价 - 付款方式

广告联系QQ：45157718

电话：13516821613 杭州余杭东港路118号雷恩国际科技创新园网站技术支持:黄菊华互联网工作室浙ICP备06056032号