设计(论文)题目 | 基于hadoop的小红书电商网站用户行为分析系统 |
一、设计(论文)主要内容 设计并开发一个网站用户行为分析系统。主要功能包括: 1. 数据采集系统:主要负责各种用户信息数据的收集工作。 2. 原始数据存储系统:主要负责把收集出来打大量数据储存到可以做分析的系统平台上。 3. 原始数据清洗系统:主要负责原始数据的格式化清洗和查询出自己业务需要的数据格式。 4. 可用数据存储模块:主要负责把清除出来的需要用的数据放到数据仓库中使之可以用hql进行查询分析,然后得出每个业务需要的不同数据指标。 5. 数据分析展示系统:主要负责把分析出来的数据指标展示出来给人们分析这个网站的友好度,和他的完成度或者找出网站中出现了什么问题,来分析用户行为的特征做出不同的策略。 二、要求完成的主要任务及其时间安排 要求完成的主要任务: 1. 查阅资料,参考文献不少于10篇(其中至少有2篇外文文献); 2. 进行方案论证,写出开题报告; 3. 进行总体设计和详细设计,完成软硬件设计; 4. 完成系统的联调,按系统设计要求,能独立运行、演示程序; 5. 撰写论文并准备答辩,要求论文语言通顺,整篇论文不少于10000汉字,查重率原则上低于35%。 时间安排: 1. 2018年12月28日前下设计任务书。 2. 2019年1月11日前完成开题报告并提交开题报告给指导教师审阅、批复。 3. 2019年1月12日~2019年4月19日(寒假+第8学期1~8周)系统设计,撰写论文。 其间:(1)毕业设计的开题答辩在第8学期第1周; (2)毕业设计的期中检查在第8学期第5周; (3)2019年4月13日~2019年4月19日(第8学期第8周)指导教师评阅论文,学生修改论文; 4. 2019年4月20日~2019年5月3日(第8学期第9~10周)答辩小组内交换评阅论文,学生制作PPT进行答辩准备。 5. 2019年5月12日(第8学期第11周周日)前进行公开答辩和普通毕业答辩。 6. 2019年5月24日(第8学期第13周周五)前进行二次答辩。 三、必读参考资料 [1] Stephen Prata . C++ Primer Plus(第6版) [M].人民邮电出版社,2012年. [2] 张海藩.软件工程导论[M].清华大学出版社,2013年. [3] 张**.数据库系统.清华大学出版社,2018年. 指导教师签名: 负责人签名: |