对搜索引擎的认知

原创 海中金  2017-11-07 22:47 

什么是搜索引擎?      

seo图片

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
常用的索引擎有:百度,360(soso),搜狗,谷歌
引擎工作的原理,在国内我们都知道百度是行业老大;所以今天我们就主要说说

百度搜索引擎工作的原理。

一、搜索引擎工作的原理呢?
1、简单点来说搜索引擎工作的原理就是:抓取--过滤--收录--排序4个过程。

搜索引擎工作原理

 2、什么是抓取?
1、抓取就是蜘蛛会浏览你编辑的文章内容。
2、什么是蜘蛛:就是互联网各大搜索开发的程序 。
3、我们怎么知道蜘蛛来抓取过呢?
1)首先我们要知道蜘蛛抓取的原理,蜘蛛抓取是以代码形式;比如我们右键查看源代码就是蜘蛛抓取的信息如百度。
2)我们可以利用百度站长工具查看数据(zhanzhang.baidu.com),查看是否有抓取过:如图:

搜索引擎工作原理
3)没有被抓取过我们如何来让他抓取呢?
    我们这里常见的一个方法:可以通过人工操作,吸引蜘蛛的抓取网页抓取,链接提交自动,手动都可以,如果备案新站还有扶持特权;如下图:
搜索引擎工作原理

3、什么叫过滤?哪些数据是会被过滤掉?
最关键的一步,如果你的文章内容有大量和它已经储存的内容重复,它会把你的文章删除;这就是过滤。比如果我们在选水果一样,我们会把不好的丢掉一样。
说到这里我们要讲到一个百度的临时数据库
1)什么叫临时数据库?
就是蜘蛛会把抓取的文章内容存放的地方。
    2)哪些数据是会被过滤掉?
百度蜘蛛抓取过后有重复纪录的内容,和一些低质量的内容;这些都会让过滤掉。会在百度的临时数据库中删除掉。
3)什么是收录?
页面被Baiduspider发现、分析过也就是索引。
1)什么叫索引?
Baiduspider经初步分析后认为有意义,做建库处理也可以这样理解:蜘蛛会把优质的文章做一个排名,(优质的文章是蜘蛛的储存库里没有这些内容,这个文章有很高的可读性,文章质量高,用户点开后展现时间久,百度就会为他做建库处理存处。)哪么收录和索引有什么区别呢?我们看懂这个图就明白了,也可以去百度站长平台(http://zhanzhang.baidu.com/college/articleinfo?id=806)

搜索引擎工作原理

3、什么是排序?
排序就是我们的网站页面让百度收录后展现出来,页面在百度的排名。当用户通过关键词搜索问题时,你的文章被搜索到,展现出来的排名。

本文地址:http://www.qinghaiseo.cn/?p=31
版权声明:本文为原创文章,版权归 海中金 所有,欢迎分享本文,转载请保留出处!
PREVIOUS:已经是最后一篇了

发表评论


表情