六、结论
本次毕业设计建模的主要目标是通过文献聚类发现学科交叉和学科热点等隐藏在数据背后的学科知识。在建模中,我们选取了05年图书情报学的681篇文献作为统计建模的数据,由于采用了系统抽样的方法,因此研究的数据具有一定的代表性。通过数据的采集和预处理、模型的建立、实验仿真、结果的统计分析和结果检验等各个环节,我们比较顺利地完成了本次建模任务。经检验,模型是科学的,结果是正确的。主要的创新点:(1)在设计的模型中,我们提出了一种新的相似度加权模型,从而使得FCM聚类所得的结果更加合理和准确。(2)设计了学科交叉表。从学科交叉表中可以一目了然地看出哪些学科在哪些方面交叉,同时还可以看出哪些课题是学科之间的热点及新的增长点。这样研究人员、学者就可以在第一时间很清楚地了解到交叉学科的热点及增长点,不仅节省花在查找方面的时间与精力,更为重要地是,可以时刻掌握先机,抢占科学前沿。该模型还需改进的方面有:(1)模型只考虑了摘要词对关键词的贡献度,还可以考虑标题词对关键词的贡献度,以进一步加强文献间相似度的精确性;(2)由于FCM是一种没有聚类结果无交叉的算法,因此在该模型中可以引入模糊理论,使得聚类的结果有重合,对于研究学科交叉将更为直接。