课题名称 | 微博信息的情感挖掘系统的设计与实现 | |||||
学生姓名 | 杨华 | 系别 | 计算机科学与技术系 | 专业班级 | 13软工2班 | |
课题类型 | D | A、理论研究 B、实验研究 C、工程设计 D、工程技术研究 E、软件开发 | ||||
毕业设计(论文)的主要内容、基本要求 | 主要内容: 我国微博网名达到3.31亿之多,微博平台信息发布与传播快,产生巨大的信息量,如何从这些数据中挖掘出有价值的信息,特别是对热点问题的情感态度,对分析社会的正能量和不稳定因素有重要意义。系统功能主要分为以下几个方面: 1、 微博信息的格式化处理:主要挖掘微博标题、微博内容、发送时间、转发数、评价数等存入数据库中; 2、 微博信息的数据清洗:采用分词系统对热门微博进行分词,去停用词和特殊符号等数据清理工作; 3、 情感词库的建立:建立消极情感词库和积极情感词库,为情感挖掘服务; 4、 利用蚁群算法信息素挥发原理,对微博信息进行动态情感分析,主要完成以下几种关联: a) 事件与情感的关联,发现一些引起积极情感的事件,和一些引起负面情感的事件; b) 用户与情感的关联,发现一些用户在某个时间段与积极情感或消极情感的关联,给出用户的情感变化曲线 5、 以曲线的方式,给出直观的情感的波动。 基本要求: (1)研究目的明确,设计开发合理,有一定的见解和特色; (2)要求生成开发过程中关键文档; (3)独立完成毕业论文(设计)任务,不弄虚作假、抄袭别人的成果,保质保量的按时完成规定的任务; (4)完成相关英文资料的阅读与翻译; (5)提交经测试运行正确的软件系统源代码; (6)按毕业论文(设计)的规范化要求撰写毕业论文。 |