本文在目前流行的关联规则挖掘算法的基础上进行了算法的具体实现,讨论了如何将数据挖掘应用于“超市数据挖掘系统”当中去,并详细阐述了“超市数据挖掘系统”的需求分析,系统设计和具体实现。该系统是专门为商场主管进行购物分析和客户分析的一套综合管理软件,其技术平台在WINDOWS XP,ODBC上构建,是一个DELPHI应用程序。商场主管只要运行该软件就可以进行相关的信息分析。
本文主要研究内容
目前,由于条码技术的发展,顾客在超市中购买商品的信息可以很方便的被存放在数据库中,针对数据库中大量的数据,我们如何发现它们之间存在的关联是本文主要讨论的问题。关联规则的挖掘问题就是在超市事务数据库DB中找出具有用户给定的最小支持度和最小置信度的关联规则。关联规则的挖掘对市场调节和争取顾客方面的应用是极有价值的。因此,有必要采用快速算法从超市事务数据库中挖掘关联规则。
在交易数据项目之间挖掘关联规则的问题(Mining Association Rules[1])是R. Agrawal等人首先引入的。典型的关联规则的例子就是“90%的顾客在购买面包和黄油的同时也会购买牛奶”,其直观的意义是,顾客在购买某些东西的时候有多大的倾向也会购买另外一些东西,找出所有类似这样的规则,对于确定市场策略是很有价值的。
本文以数据挖掘中关联规则的挖掘方法为主要研究内容,并讨论了如何将数据挖掘应用于商场信息分析系统当中去。本文介绍的主要研究内容包括有:单维布尔关联规则挖掘等。
本毕业设计的工作是利用经典的关联规则挖掘算法,把它应用到自己的商场信息分析系统中去,开发有上述研究内容功能的应用软件。为了在设计、开发过程中少走弯路,我在设计、开发该系统的过程中完全遵循软件工程中软件开发的步骤:即问题定义、可行性研究、需求分析、总体设计、详细设计、编码与单元测试、综合测试、软件维护(即如瀑布模型)等几个阶段来完成的。
在本文的第二章,详细介绍了显示目前销售信息分析存在的问题,并针对商场主管对开发一个销售信息分析系统进行需求分析。接着介绍了该系统的运行环境和开系统的开发工具。
在本文的第三章,介绍了根据需求分析而制定的系统的总体功能,包括如何获取数据源,数据源用的驱动,系统具备的功能和各个模块具体实现的功能等。
在本文的第四章,介绍了根据系统的总体设计而进行系统的详细设计,包括数据源驱动的连接方法,系统总体框架设计,人机交互界面的设计,各个模块详细实现的功能设计。
在本文的第五章,介绍了程序的编码过程。该章详细叙述了数据源的连接方法,对数据源操作的代码,人机交互界面的实现代码,并且详细描述了各个模块功能实现的算法,及相关操作的实现方法。