学号 | 学生姓名 | |||||||
专业班级 | 届别 | |||||||
指导教师姓名 | 职称 | 讲师 | 所在系 | 网络工程 | ||||
申报选题名称 | 基于WEKA的多标记文本分类算法的研究与实现 | |||||||
选题性质 | B | 选题来源 | X | 是否为上届雷同题目 | 否 | |||
选题简介 | 选题目的、意义、预计工作量大小和难易程度 随着互联网和数字多媒体技术的普及,数字文本的数量迅速增加,文本分类问题受到了研究者们的广泛关注。许多情况下,一个文档会与多个概念标记相关,传统的单标记学习中每个示例只对应唯一的概念标记,因此无法准确描述与一篇文档相关的所有概念。多标记学习的目标是从已知的多标记训练集合中学习一个映射函数对训练集以外的新样本进行预测,它可以刻画这种同时具有多个标记的对象。 | |||||||
设计要求 (包括应具备 的条件) | 设计内容、设计目标(主要技术指标)、基本要求、应搜集的资料和主要参考文献 本课题要求基于WEKA尝试利用新型的多标记学习技术来辅助提高文本分类技术的性能,主要包括利用已有的特征选择方法对多标记数据进行降维,利用最近邻等经典分类方法对多标记数据进行标注,并通过图表等形式显示分类结果。 要求学生掌握基本的数据挖掘原理和JAVA语言编程技术。 | |||||||
学院意见 | 负责人(签名): 年 月 日 |