毕业设计摘要
本文首先论述了手写体数字识别所涉及的相关理论,介绍了有关理论的历史背景和发展现状,还介绍了模式识别的基础理论,包括预处理和分类理论。
近年来模式识别领域,神经网络理论的发展十分迅速,应用领域非常广泛,所以,尤其重点讨论了神经网络方面的理论。包括及发展历史、基本原理,重点探讨了神经网络中的BP算法。
实现的系统使用的是感知机理论。在理论方面文章分析了最简单的感知机理论和本理论的缺点。
系统主要包含学习环节和训练环节。在学习环节,利用含有1-9九个数字的文本文件learn.dat来产生9*25个噪声数据,使用这些噪声数据来构造权值矩阵。在训练环节,用户载入图像,点击分类后,系统使用权值矩阵来进行分类并输出结果。
在最后得实验部分,通过对100个数字的识别,统计得到了系统的识别率,并具体分析了对某一数字的分析过程和分析结果。
关键词:手写体数字、模式识别、神经网络、BP算法、感知机
本文中主要设计的字符识别指数字的识别。数字类别比较少,笔划又简单,其识别问题似乎不是很困难,但事实上,一些测试结果表明,这些字符的正确识别率并不如印刷汉字识别正确率高,甚至也不如联机手写体汉字识别率高,而只仅仅由于脱机手写体汉字识别。主要原因是:第一,数字的字型信息量很小, 不同字符写法和字型相差不大,使得准确区分某些字符相当困难;第二,虽然字符的笔划比较简单,但同一数字和字母的写法千差万别,全世界各个国家各个地区的人都用,其书写上带有明显的区域特性,很难完全做到兼顾世界各种写法的极高的通用型识别系统。另外,在实际应用中,对峙包含数字或字母的数据信息的识别正确率的要求比对文字识别要苛刻得多。因为,这些数据信息没有相关的上下文可以参考,而且通常这些数据都涉及到财会,金融领域,其重要性不言而喻。因此用户的要求不仅是高的正确率,更是极低的误识率。而且大批数据的处理更是要求相当的速度。所有的这些条件使得研究高性能的手写体字符识别算法成为了一个非常具有挑战意义的工作。
在整个OCR领域中,最为困难的就是脱机手写体字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜的成就,但距实用还有一定的距离。
随着OCR技术的逐渐成熟以及其他一些多媒体技术的不断发展,输入瓶颈问题一定会得到解决。OCR极大的潜在市场也将是该方面的研究工作具有非常大的实用意义。
说明:为了防止网络上可以查找到本毕业设计的论文及实际界面信息保护购买者的利益1、本计算机毕业设计样本提供的只是有关此设计论文和程序的简单介绍,要想取得完整的作品,需要你与本站联系。2、本样本只是从论文中摘录一部分,在内容、字体、字号排版上与实际作品有一定的差别,请以本站实际提供的作品为准。需要了解本计算机毕业设计的具体详细信息请联系本站客服。