作为网络业最古老的商业模式之一,搜索引擎不仅只是一个工具,更重要的它是一种产品,一种能为企业带来利润的产品,它具有许多亟待开发的价值。以目前的应用来说,主要表现在通过为各种有需求的用户提供各种搜索引擎基础应用级软件、解决方案等ASP服务来创造效益。成立于2000年初的百度在线网络技术有限公司主要提供互联网信息技术检索服务,其中一个最主要的服务对象就是为门户网站提供ASP服务,随着在搜索的相关性上的不断升级。百度也把门户网站用的搜索引擎技术应用于中小网站和企业的需要。虽然对于搜索引擎的应用各有其招,但从目前国内搜索引擎的发展来看,其潜在价值的开发还是明显不够。随着搜索引擎作为基础软件在国外逐渐被认同,下一步的发展方向可以是加快网站内和企业局域网内搜索引擎的普及化发展。除此之外,实时新闻检索(包括新闻订阅、监控、定向情报收集等)的应用发展、搜索引擎统计数据的应用、搜索引擎收费登录服务、多媒体搜索引擎也是亟待挖掘的方向。
根据iResearch艾瑞市场咨询最近数据显示,在中国网民最常使用的搜索引擎中,国内著名的搜索引擎“百度”高居榜首,达到了48.2%,超过了Google18.4个百分点,说明了中国用户对国内的搜索引擎使用程度更为习惯。在使用过得搜索引擎的评测中,“搜狐”、“新浪”等几大门户也榜上有名,这主要归功于其巨大的访问量优势,但是其搜索引擎技术一般还是需要专业公司提供。
站内搜索引擎毕业设计需要实现的目标说明
为自己的网站定制一套专门的信息检索系统,用来让浏览者快速找到有效信息的做法,是一件非常自然甚至可以说理所应当的事情。浏览国外公司的网站,会发现几乎所有网站都在首页最明显的区域放置了一个搜索框,让用户使.丛冢我们可以看到,站内搜索引擎对于网民来说是充分利用网站资源,迅速得到所需信息,节省精力和时间的最佳工具。本搜索引擎的具体的功能与普通的搜索引擎是相同,总的来说应该具备速度、准确性与可靠性三者的统一。
速度是指搜索引擎从成千上万的信息中找到和用户检索词相关的内容的速度,它主要是由系统的效率和相关算法的先进程度决定。可靠性的含义在于:当众多用户同时使用一套搜索系统(这种情况在Internet上是常会出现的)时,不会出现系统崩溃或长时间得不到响应的现象。要想实现高可靠性,搜索系统在执行效率和多线程并行处理搜索请求等方面都必须非常出色。准确性是指当搜索系统找到上百篇甚至数千篇和用户搜索词相关的网页时,必须通过一些算法来决定这些结果的排序,尽量做到把最相关最有用的页面放在前面。这些算法包括分析搜索词在页面中出现的位置、频率以及结果页面被链接的次数等等,内容相当复杂。不同搜索系统在准确性方面有很大的差异。
从速度性上来讲:本引擎制作的目的是用来进行站内搜索的,而相对于其它的引擎来说例如百度,本引擎搜索的资料和内容都是很少的。所以它的搜索速度还是很快。
从准确性和可靠性上来讲,本引擎支持模糊搜索,也就在用户不知道或者不清楚自己要搜索的关键字或内容时,也可以进行搜索。(当然用户不能一点都不知道)。下面是这样的一个例子:例如用户不知道“网络终端协议Telnet”的定义,但知道其与协议有关,就可以在搜索框中输入协议,及可以找到本站中所介绍的所有的协议的相关内容的超链接,当然也就可以找到自己所要的“网络终端协议Telnet”的定义。
这个站内搜索还支持二次搜索也就是在搜索页中还可以进行新的搜索。对于这两种用途可以有下面的图示来解释。
如果用户还想知道连续ARQ协议的相关的内容,可以有两种查找的方式一种就是退回到原来的查找的页面在“请输入关键字”字样的后面的文本框中输入“协议”就会出现如图4.2的一个页面。在这个页面中找到自己所要的“连续ARQ协议”,点击进入就可以了。当然如果用户知道所要查找的是“连续ARQ协议”的相关的内容,就可以在图4.1中直接输入“连续ARQ协议”就可以直接定位到标有“连续ARQ协议”字样的超链接上(图4.3)这就是所谓
的准确的查找,而上面所说的是模糊查找。第二种方法是在搜索结果中进行查找,及在图4.2中的文本框中输入“连续ARQ协议”就可以了。