搜索引擎方面有关本科毕业论文范文,与搜索引擎运作原理的相关论文范文数据库

时间:2020-07-05 作者:admin
后台-系统-系统设置-扩展变量-(内容页告位1-手机版)

本论文是一篇搜索引擎方面有关论文的目录怎么写,关于搜索引擎运作原理的相关在职研究生毕业论文范文。免费优秀的关于搜索引擎及信息及网页方面论文范文资料,适合搜索引擎论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

摘 要 :1994年,万维网的出现,使得信息进入了一个超高速膨胀的时期.作为一个新的信息源,它给信息检索领域及检索技术带来了新的发展机遇和挑战.搜索引擎是一种在Web上的应用系统,通过某种策略和方法对互连网上的信息进行搜集和整理后,为用户提供查询服务.本文描述了搜索引擎的现状,分析并介绍搜索引擎的分类和实现的基本原理.

关 键 词 :搜索引擎;web;信息

中图分类号:G718文献标识码:B文章编号:1672-1578(2013)07-0154-01

随着web的发展,信息量极端膨胀.在如此众多的信息中,人们要找到自己所需的信息就如同大海捞针一般.而搜索引擎的出现,恰好迎合了人们的需要,它以一定的策略在web中收集信息,并对收集到的信息进行处理,建立数据库,当用户提交查询申请之后,返回数据库中与用户要求匹配的数据或数据所在.这些经过处理的数据,大大的节省了用户自己区分信息的时间.同时,因为是提供服务的网络软件,用户对它也提出了很高的要求.高效响应,高质量的返回结果,个性化的服务等等,都抬高了进入这个领域的门槛.现今,正在运行的比较有代表性的搜索引擎有:google,yahoo!,alltheweb,altavista,baidu,搜狐,新浪,网易,天网等.

1.现状

搜索引擎的应运而生,使得它具有极高的经济价值,引起了信息产业的高度关注,故对其的研究在商业领域极为活跃,各大搜索引擎公司都在投入巨资研制搜索引擎系统,新的具有特色的系统不断产生.

在搜索引擎成为信息领域产业的背景下,各大学和科研机构更多的投入到了相关技术领域的研究当中.Google,alltheweb等今天举足轻重的搜索引擎,都开始于大学的学术研究,并逐步发展成为运作成功的商业引擎.

2.搜索引擎概述

什么是搜索引擎?关于搜索引擎的定义,给出以下两个:

2.1搜索引擎(Search Engines)是一个对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分.

2.2搜索引擎是一个提供信息"检索"服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息.

上述定义,给出了搜索引擎的功能和基本工作原理,即搜索引擎是根据检索关键字,返回互联网上相关信息的软件.

3.搜索引擎的分类,工作原理及代表

搜索引擎按照其搜集方法和提供服务的方式,可分为三种:全文搜索引擎,目录搜索引擎,元搜索引擎.

全文搜索引擎,即本文主要讨论的搜索引擎,工作原理主要是通过自动搜索引擎的搜集子系统在web上搜集网页信息,并建立数据库或租用其它引擎数据库以备用户使用时直接从数据库中调用.信息量大,更新及时,不需要人工干预是全文搜索引擎的优势,但是它也存在返回的信息过多,结果质量不高的问题.国外的Google,AllWeb,AltaVista以及国内的百度等,都是全文搜索引擎的典型代表.

目录搜索引擎,以人工或者半自动的方式搜集信息,由编辑员察看信息之后,人工形成信息摘 要 ,并将信息置于事先确定的文类框架中.提供给用户的是网站链接列表,用户可以提交搜索词,由系统引导用户到匹配的网站;用户甚至可以不用输入检索关键字,仅通过分类目录即可查询到相关性最大的信息.目录搜索具有准确性高,导航质量高的特点,但是它需要人工介入,维护量大,故信息量相对少且更新不及时.其代表有Yahoo!,About,新浪,搜狐,网易.

搜索引擎运作原理的参考属性评定
有关论文范文主题研究: 关于搜索引擎的文章 大学生适用: 在职研究生论文、大学毕业论文
相关参考文献下载数量: 84 写作解决问题: 写作资料
毕业论文开题报告: 标准论文格式、论文结论 职称论文适用: 刊物发表、职称评初级
所属大学生专业类别: 写作资料 论文题目推荐度: 优质选题

元搜索引擎,则是通过使用多个独立的搜索引擎进行信息检索,并将所得信息从新排序或直接返回给用户,相对于前两者,它的信息量更大,但是也同样存在着结果质量的问题.Vivisimo,搜星都是这样的搜索引擎.

4.搜索引擎工作原理

4.1概述.搜索引擎是一个网络应用软件系统,搜集、预处理、服务构成了其三段式的工作流程,相应的,搜索引擎也可分为三个功能模块或者子系统:网页搜集、预处理和查询服务.在下文中,将进一步讨论这三个功能模块或子系统的工作原理.

4.2网页搜集.对于一个搜索引擎,面对海量的网络数据,用户查询的不可预测和网络的其它不可预测的因素,要在秒量级在网络里通过一次搜索给用户返回匹配的信息是相当困难的.因此,大规模的搜索引擎服务通常都预先搜集并处理好一批网页,建立系统网页数据库.当搜索引擎提供搜索服务时,其返回的结果就出自这个系统网页数据库.网页的搜集是搜索引擎工作的前提和基础.

4.3预处理.在网页收集之后,我们得到了大量的原始网页集合,而现实对搜索引擎的要求是严苛的.对于相应的时间和结果的准确率都有很高的要求.面对如此巨大的信息库,要从中快速的检索到高匹配的信息,是项极富挑战的工作.为了使后期的查询服务达到快速而准确,我们有必要对原始网页进行处理.所以寻找并建立一个合适的数据结构是这一阶段我们所要进行的工作的关键."倒排文件"是用文档中所含关 键 词 作为索引,文档作为索引目标的一种结构,是现行最有效的数据结构.

预处理主要是给原始网页库建立索引,成为索引网页库,并对索引网页库进行网页分析和建立倒排文件.

4.4查询服务.查询服务是我们进行之前所有工作的最终目的,特别是倒排文件的建立,使得获得关键字后,系统能够迅速的检索到相关文档编号,并集合输出.搜索引擎返回给用户的是个列表,这正是服务子系统得主要工作.

在实际使用的搜索引擎中,索引词表和近期查询过的结果都是缓存在内存当中的,当内存足够大时,倒排表也可以驻留内存中,如此才能使搜索引擎在大量数据和访问量的情况下得到秒级相应.

参考文献

&

后台-系统-系统设置-扩展变量-(内容页告位2-手机版)
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:123456789@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。
后台-系统-系统设置-扩展变量-(内容页告位3-手机版)