信息检索结课论文-搜索引擎

时间:2025-07-06

信息检索结课论文

题目:搜索引擎个性化服务学习与探讨

学 院:计算机科学与工程学院 专业:计算机技术

学生姓名:

学号:

授课教师:

搜索引擎个性化服务学习与探讨

摘 要:文中通过分析中国互联网络信息中心发布的关于网民搜索行为的报告,以及对搜索引擎发展现状的分析,提出搜索引擎个性化服务的重要性。在搜索引擎的基础上,介绍其个性化服务的发展概况、基本架构、工作模块等方面的知识,并分析指出当前个性化服务中需要解决的问题。最后提出对搜索引擎的展望。

关键词:搜索引擎;个性化服务;潜在问题

The Learning and Discussion of Personalization of Search Engine

Service

Abstract: This paper analyzes the report about the search behavior of Internet users which is released by the China Internet Network Information Center, as well as the status of the development of the search engine, and then proposes the importance of

personalization of search engine service. On the basis of the search engine this paper introduce the knowledge of its personalization service about development overview architecture, the work of the module and other aspects. Then, it analyzes and indicates the current problem of personalization service which need to be solved. Finally, it puts forward the outlook of the search engines. Key words: search engine; personalized services; potential problem

1 绪论

1.1研究背景

1.1.1中国搜索引擎网民规模

CNNIC(中国互联网络信息中心)在2013年8月发表的《2013年中国网民搜索行为研究报告》[1]中指出,截至2013年6月底,中国搜索引擎网民规模为4.70亿,与去年同期相比增长了4177万人,同比增长9.7%。搜索引擎作为互联网的基础应用,是网民获取信息的重要工具,其使用率自2010年后始终保持在80%左右水平,使用率在所有应用中稳居第二。由于使用率已经较高,用户规模提升空间进一步减小,搜索引擎网民增长率近两年来一直保持在10%左右的水平,与整体互联网网民发展速度基本一致,相关数据如图1所示。

1

图1 中国历年搜索引擎网民规模和增长率

1.1.2 网民电脑搜索行为概述

网民通过电脑使用搜索的渠道中,通过综合搜索网站、购物网站和视频网站进行搜索的比例明显高于其它网站。最近半年使用电脑搜索过信息的人群中,绝大部分人都使用过综合搜索网站,它的使用比例为98.1%,其次为购物网站,使用比例为69.3%,再次为视频网站,使用比例为68.5%。此外,随着微博使用范围的扩展,在微博上进行搜索的网民比例也高达50.5%,微博已经成为人们寻找热点事件的重要来源。其它方面,网民在分类网站、社交网站、垂直搜索等搜索信息的比例均未超过35%。相关数据如图2所示。 作者简介:金义冬(1990-),男,江苏东台人,桂林电子科技大学研究生,主要研究方向为数据挖掘。

图2 2013年PC端各类型搜索的网民渗透率

1.1.3 电脑上常用搜索情景

网民之所以通过电脑使用搜索引擎,绝大部分是想了解与学习生活相关的内容以及了解当下感兴趣的信息,二者比例分别为75.6%和73.5%。此外,还有58.9%的电脑搜索网民通过搜索了解热点事件发生、56.8%通过搜索引擎了解日常生活信息、56.7%通过搜索引擎下载软件。此外,有50.4%的电脑搜索网民外出旅行,预订车票时候,会用搜索引擎搜索信息,44.5%的搜索网民在线购物时会使用搜索引擎。相关数据如图3所示。

图3 2013年PC端网民使用搜索引擎的搜索情景

1.1 搜索引擎发展概况

目前公认的第一代搜索引擎是以Yahoo为代表的人工目录分类导航检索的网站搜索,它开始了互联网

搜索的时代。这是最为传统的搜索引擎,主要缺陷在于检索结果的相关性差,检索结果杂乱无章且数量庞

大,与用户所想检索的结果差异太大,无法做到较为精确的检索。

第二代搜索引擎是以Google为代表的,基于关键词和特殊算法的搜索,是依靠机器抓取的、建立在超链分析基础上的大规模网页搜索,相较于第一代搜索引擎提高了查准率、查全率和检索速度。但是仍然不能满足网民的检索需求,用户在信息检索过程中有仍存在查全率、查准率低,检索多媒体信息的能力差等。

自从进入第三代搜索引擎,全球都在不断探索和完善搜索引擎技术,经过多年的探索和市场历练,现今已露端倪。这一端倪包括两个趋势:一是以Google为主要代表技术驱动型理念,还包括雅虎、搜狐等;二是以Jwm guagua为主要代表的服务驱动型理念。以上两种类型的理念体现了第三代搜索引擎的智能化、人性化特征,不再局限于机械的关键词检索,可以直接对用户输入的检索词进行语义分析整合,满足了用户更快、更准、更方便的查询需求。

2搜索引擎相关技术

2.1 搜索引擎概述

用户输入所需查询条件后,根据此查询条件在网络或者其他数据来源中按照某种方式在数据源中检索并搜集信息,同时对所获取到的信息进行一系列的处理,例如分析和存储等,并将处理后的结果返回给用户,这种能够为用户提供信息导航作用的系统称为搜索引擎[2]。

全文搜索引擎、元搜索引擎,以及目录索引类搜索引擎是当前主要的搜索引擎分类,这三类搜索引擎的差别,主要是按照 …… 此处隐藏:5477字,全部文档内容请下载后查看。喜欢就下载吧 ……

信息检索结课论文-搜索引擎.doc 将本文的Word文档下载到电脑

    精彩图片

    热门精选

    大家正在看

    × 游客快捷下载通道(下载后可以自由复制和排版)

    限时特价:7 元/份 原价:20元

    支付方式:

    开通VIP包月会员 特价:29元/月

    注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
    微信:fanwen365 QQ:370150219