首页
会员中心
到顶部
到尾部
VC毕业设计

基于文本挖掘的智能检索技术应用

时间:2020/10/13 21:14:27  作者:  来源:  查看:0  评论:0
内容摘要: 1.研究背景 12.国内外研究现状 23.文本挖掘中的分词技术 24.文本的特征提取 25.聚类分析的原理与方法 36.研究目标和具体思路 36.1向量空间模型(VSM) 46.2 统计分析 11参考文献 20六、结论本次毕业设计建模的主要目标是通过文献聚类发现...

1.研究背景 1

2.国内外研究现状 2

3.文本挖掘中的分词技术 2

4.文本的特征提取 2

5.聚类分析的原理与方法 3

6.研究目标和具体思路 3

6.1向量空间模型(VSM 4

6.2 统计分析 11

参考文献 20

、结论

本次毕业设计建模的主要目标是通过文献聚类发现学科交叉和学科热点等隐藏在数据背后的学科知识。在建模中,我们选取了05年图书情报学的681篇文献作为统计建模的数据,由于采用了系统抽样的方法,因此研究的数据具有一定的代表性。通过数据的采集和预处理、模型的建立、实验仿真、结果的统计分析和结果检验等各个环节,我们比较顺利地完成了本次建模任务。经检验,模型是科学的,结果是正确的。主要的创新点:(1)在设计的模型中,我们提出了一种新的相似度加权模型,从而使得FCM聚类所得的结果更加合理和准确。(2)设计了学科交叉表。从学科交叉表中可以一目了然地看出哪些学科在哪些方面交叉,同时还可以看出哪些课题是学科之间的热点及新的增长点。这样研究人员、学者就可以在第一时间很清楚地了解到交叉学科的热点及增长点,不仅节省花在查找方面的时间与精力,更为重要地是,可以时刻掌握先机,抢占科学前沿。该模型还需改进的方面有:(1)模型只考虑了摘要词对关键词的贡献度,还可以考虑标题词对关键词的贡献度,以进一步加强文献间相似度的精确性;(2)由于FCM是一种没有聚类结果无交叉的算法,因此在该模型中可以引入模糊理论,使得聚类的结果有重合,对于研究学科交叉将更为直接。

  


相关评论
广告联系QQ:45157718 点击这里给我发消息 电话:13516821613 杭州余杭东港路118号雷恩国际科技创新园  网站技术支持:黄菊华互联网工作室 浙ICP备06056032号