首页
会员中心
到顶部
到尾部
计算机

我们如何搜索万维网?九种搜索引擎事务日志的比较

时间:2020/10/14 13:38:44  作者:  来源:  查看:0  评论:0
内容摘要: 1 介绍Web现在是许多人的主要信息来源(Cole, Suman, Schramm, Lunn, & Aquino,2003;福克斯,2002)。超过80%的网络搜索者使用网络搜索引擎来定位在线信息或服务(Nielsen Media,1997)。人们迫切需要了解人...

1 介绍
Web现在是许多人的主要信息来源(Cole, Suman, Schramm, Lunn, & Aquino,2003;福克斯,2002)。超过80%的网络搜索者使用网络搜索引擎来定位在线信息或服务(Nielsen Media,1997)。人们迫切需要了解人们如何使用网络搜索引擎。Amichai-Hamburger(2002)回顾了Web的影响以及用户对Web系统和站点内容的设计缺乏意识。本文的研究试图为这种对话做出贡献。大多数网络搜索研究很少提供纵向、区域或跨系统分析。我们需要更清楚地了解不同的全球区域和不同的Web搜索引擎之间出现的网络搜索趋势,以便设计更好的搜索系统。
这一重要的研究领域直接影响点击付费营销,网站优化策略,以及Web和Intranet搜索引擎的设计。它补充了研究,如 Liawa和 Huangb(2003)进行的研究,显示个人经验、个人动机、搜索引擎质量和用户对技术接受的感知都是影响个人使用网络搜索引擎的因素。
在本文中,我们提出了九个主要的网络研究,四个欧洲和五个基于美国的网络搜索引擎,经过七年的比较。我们提供了一个时间比较的网页搜索之间的差异之间和美国和欧洲之间的网络搜索,因为人们可能会期望一些分歧,由于语言学和接口因素(Spink, Ozmutlu, Ozmutlu, & Jansen,2002年B)。我们具体研究搜索引擎和Web搜索引擎之间的交互性,识别网络搜索交互复杂性的变化。此外,我们还对人们在网上搜索的信息类型进行了纵向分析。
我们的研究集中在用户和搜索引擎之间的交互分析上。交互在信息搜索中具有多个意义,尽管定义通常包括查询公式、查询修改和检查结果列表等。 Belkin, Cool, Stein和 Theil(1995)在信息会话中广泛地探索用户交互。Efthimiadis 和Robertson(1989)从信息寻求研究中提出并分类了信息检索过程中的各个阶段的交互作用。Bates(1990)提出了四个层次的互动,即行动、策略、策略和策略。 Lalmas 和Ruthven(1999)提出了两组交互,这是在会话中发生的,在会话中发生的。
会话内的类别是我们在本研究中研究的交互类型。我们考虑交互作为搜索器和系统之间的任何特定的交换(即提交查询、点击超链接等)。我们定义一个搜索情节作为一系列的相互作用在有限的时间内,以解决一个或多个信息需求。这个持续时间通常很短,Web研究人员使用5到120分钟来定义会话持续时间(C.F.,HE,Go E.KER,HARPER,2002;ManggMoRe&FalutsOS,2001;Sulvistin,Henzinger,Marais,Myrz,1999)。搜索器可以是搜索事件中的多任务(SPink,2004),或者该事件可以是搜索者进行连续搜索的实例(Lin,2002;Spink,Wilson,埃利斯,Ford,1998)。
我们开始广泛的文献回顾与快速增长的领域的网络搜索引擎研究。然后,我们提出了在本研究中使用的数据集。我们讨论的分析,结果,以及网页搜索系统的设计结果的影响。
2 近期研究
已经有一些关于Web搜索的评论文章。Jansen和PooCH(2001)通过2000对Web搜索引擎和个人网站的Web交易日志进行了综述。Hsieh Yee(2001)回顾了1995到2000年间进行的关于网络搜索行为的研究。研究者发现许多因素对搜索行为的影响,包括信息的组织和呈现、搜索任务的类型、网络体验、认知能力和情感状态。Hsieh Yee(2001)也指出许多研究缺乏外部效度。Bar Ilan(2004)提出了网络搜索引擎的扩展和综合概述,以及网络搜索引擎在信息科学研究中的应用。Bar Ilan(2004)提供了多种视角,包括用户研究、社交方面、Web结构和搜索引擎评价。我们在本节中扩展这些评论文章,为我们的分析设置阶段。
Web搜索研究分为三类:(1)主要使用事务日志分析的方法,(2)将用户纳入实验室调查或其他实验设置,以及(3)检查与Web搜索相关或影响Web搜索的问题。在本文中,我们专注于研究使用事务日志分析。Romano, Donovan, Chen, and Nunamaker (2003)提出了一种用于事务日志数据的一般定性分析的方法。Wang、Berry、Yang(2003)和Spink和Jansen(2004)也对交易日志分析方法进行了详细的解释。
在对单个网站的调查中,Yu和Apple(2000)使用事务日志数据来检查超级日志项目中的用户行为。23个月(1997年2月至1998年12月),研究人员记录了102966个日志记录动作,这些动作与四个主题集群、49个期刊、838个期刊问题、15786篇文章和三个网络搜索引擎相关。在另一项涵盖1月1日至2000年9月18日的研究中,KEA、Kwakkelaarb、Taic和Chen(2002)审查了ELSVEVIES SCIONTION中的用户行为,该数据库承载了超过1300个期刊的书目信息和全文文章,估计有625000个用户。Loken, Radlinski, Crespi, Millet和 Cushing(2004)利用基于Web的系统对100000多名学生进行在线自学习的交易日志数据进行了研究,以准备美国大学入学考试几个月的使用。研究者注意到一些非最佳行为,包括推迟学习的倾向和对简短回答的口头问题的偏好。研究者讨论了他们的研究结果与在线学习的相关性。
3 讨论
随着Web正在成为一种世界性的现象,我们需要更好地了解Web搜索的新趋势,因为Web搜索引擎对引导在线信息和服务的巨大影响。我们的研究结果表明,网络搜索引擎和搜索者之间的交互作用并没有变得越来越复杂,并且在某些方面,变得不那么复杂了。我们的比较分析也表明,从一个专注于一个Web搜索引擎的研究中发现,不能广泛应用于所有的Web搜索引擎。
会话长度不会随着查询次数的增加而增加。一个学期的百分比保持稳定,随着时间的推移和跨网络搜索引擎。1998阿尔塔维斯塔研究有差异,但这似乎是由研究人员使用的人工短会话持续时间造成的。查询长度也没有增加,由数量的条款来衡量。在德国火球网络搜索引擎上的一个术语查询的百分比有统计学差异,这可能是由于与其他网络搜索引擎的语言差异。单项查询的百分比保持稳定,查询操作符的使用也保持稳定。未来的网络搜索引擎可以更好地利用来自这种交互的隐含反馈来提供更个性化的结果(Calaand Simon,2003)。然而,Web搜索引擎之间的查询操作符的使用变化很大,因此在这一领域中,从一个研究中得到的结果不可能被应用于预测其他Web搜索引擎上的行为。
只看到第一页的结果是非常高的,并且随着时间的推移,它在激动人心的Web搜索引擎上显著增加。这可能表明在交互中增加了简单性。这也可能是Web搜索引擎能够更有效地检索和排序Web文档的能力的指示。当然,需要更多的研究集中于Web文档和虚拟文档(Watters,1999)的分析水平。
随着时间的推移,随着网络用户数量的急剧增加,使用ExcTE用户查看较少的结果页面的趋势可能与研究期间的用户基数相关。ExcTITE是第二个最受欢迎的网站1997(MunRiz,1997),是第五最流行的1999和2001,由独特的访问者的数量(Cyber Atlas,1999, 2001)。
美国和基于欧洲的网络搜索引擎的使用既有相似之处又有差异。搜索者在会话长度、查询长度和查看结果页面的数量方面都是相似的。此外,两个Web查询运算符的使用都相当稳定。然而,这些先进的Web查询运算符在基于美国的Web搜索引擎上的使用率要高于欧洲同类搜索引擎。在调查这一差异时,我们排除了内容集合的大小(它们都是巨大的)、用户基础(它们都是数以百万计的)或算法复杂度(它们在性能测试中都是相似的)。FielBand和BWEE并没有显著地显示先进的Web搜索选项;然而,可能是这些Web搜索引擎的用户不使用查询操作符。这增加了针对这些用户的Web提供商的关键字和短语选择的临界性。
火球是一种通用的网络搜索引擎,但BWIE也是一个搜索目录。搜索目录补充整个目录集合与基于目录的搜索的查询匹配(C.F.,雅虎http://wwwayyo.com或OpenDirectory http://dMOZ.org/)。目录服务背后的思想是向内容提供额外的组织。然而,一些研究已经表明,基于目录的搜索不能提高搜索性能,也需要更长的时间(丹尼斯,Bruza,Mcththr,2002)。搜索目录的变体包括专门的或利基的网络搜索引擎,这些搜索引擎在特定的网络搜索引擎中提供内容,包括计算机科学文献(CITESER http://www-ScReChanDeX.com)、电子商务(FROGOLE http://FrooL.C.com)、或个人信息网络。信息(C.F.,http://www. witcBoo.com)。一些Web搜索引擎提供群集(ViVISIMO http://viistimo.com),可以将其视为自动化、实时和虚拟目录服务。
然而,AutoWebWeb具有广泛的高级Web搜索功能。此外,2002 AutoWebWeb数据集的结果不符合其他基于欧洲的Web搜索引擎的研究结果。一个可能的原因可能是AutoWebWeb吸引了搜索者在其传统的欧洲市场之外。从我们分析的AutoWebWeb交易日志中,将近90%的查询请求是英文的,有6%法语,1%西班牙语、德语、意大利语和其他各种语言组成其余的语言。进一步的研究将需要隔离语言差异的影响。
网络搜索主题正在发生变化。在基于欧洲和美国的网络搜索引擎中,性别搜索的减少占了整个网络搜索的百分比。总的趋势是使用网络作为信息或商业的工具,而不是娱乐。与欧洲的搜索者相比,这种趋势在美国更为明显。这一分析肯定证实了调查和其他数据,网络现在是大多数人信息的主要来源(Cole et al., 2003;福克斯,2002)。越来越多的使用Web作为经济资源和工具(Lawrence & Giles,1999;Spink等人,2002年A),人们使用Web的信息任务越来越多(Fox,2002;国家电信和信息管理局,2002)。
网络搜索交互水平的降低可能是网络搜索引擎开发人员和那些提供基于Web的信息内容、产品和服务的不受欢迎的消息。Web用户似乎不愿意投入额外的努力来定位相关的Web内容。只浏览第一个结果页面的趋势对于那些试图吸引访问者访问他们的网站或试图通过广告印象来产生收入的网络搜索引擎来说是一个挑战。用户对通过第一页查看任何结果的容忍度很低。他们倾向于重新构建Web查询而不是涉足结果列表。在Web搜索引擎的第一页中放置一个精确的摘要似乎是吸引特定网站的流量的决定性因素。
我们继续进行网络搜索趋势的持续分析,以提供宝贵的洞察这一重要和关键领域的人机交互和电子商务。

  


相关评论
广告联系QQ:45157718 点击这里给我发消息 电话:13516821613 杭州余杭东港路118号雷恩国际科技创新园  网站技术支持:黄菊华互联网工作室 浙ICP备06056032号