[硕士论文] 垂直搜索引擎的设计与实现(5)
发布时间:2021-06-07
发布时间:2021-06-07
[硕士论文] 垂直搜索引擎的设计与实现
西北工业大学硕士学位论文第一章绪论
第一章绪论
1.1研究背景
随着信息技术的快速发展,互联网得到了飞速的发展,成为人们学习、工作、
生活中的最重要的知识和信息来源。根据CNNIC(中国互联网络信息中心)2006年1月17日发布的<中国互联网络发展状况统计报告》“1,截止到2005年12月31日,我国的网民总人数为11100万人,上网计算机总数已达4950万台,我国网站数为694,200个.目前,整个互联网中文网页数超过20亿,Google收录了5亿中文网页,百度收录了8亿中文网页嘲.
Internet上的信息资源随着Internet的发展呈现出以下特点;
l、信息量大而且分散
2、自治性强
3、信息资源多种多样
4、不一致和不完整
为了获取所需的信息,用户必须借助一定的工具,他们通常使用以下两类网
站:一
第一类是分类目录式搜索引擎,其典型代表是Yahoo。它主要采用人工方式
或半自动方式收集和整理Internet上的信息,根据所搜集网页的内容再手工将其网址分配到所采用的分类主题目录的不同层次级别类目之下。用户查询时,通过逐级层层浏览这些类目,寻找自己所需的网址信息。这类搜索引擎因为加入了
人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少等。
第二类是基于查询串方式的搜索引擎(也称为通用搜索引擎),这类搜索引
擎指的是一种在Web上应用的软件系统,它以一定的策略在Web上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。从使用者的角度看,这种软件系统提供一个网页界面,让他通过浏览器提交一个词语或者短语,
然后很快返回一个可能和用户输入内容相关的信息列表。这类通过关键词匹配实现查询的自动更新的搜索引擎优点是涵盖的网页数量巨大,因为它拥有基于关键字的全文索引,它为所有网上冲浪的用户提供了一个入口,所有的用户都可以从搜索引擎出发到达自己想去的网上任何地方。搜索引擎对用户是这样的重要,成为了用户上网的常用服务,根据《中国互联网络发展状况统计报告》“1,用户经常使用的网络服务是:浏览新闻(67.996)、搜索引擎(65.7%)、收发邮件(64.7%)、
上一篇:微生物学第四章 2015
下一篇:03.新中文DC油圧回路