搜索引擎的基本原理是怎样的 二维码
1
搜索引擎的基本原理是怎样的 互联网信息爆发式增长时代,要想做好SEO,必须要简单的了解搜索引擎基本工作原理以及自然排名机制。 搜索引擎工作过程是非常复杂,本章介绍的内容相对于真正的搜索引擎技术来说仅仅是皮毛,不过对新手SEO已经足够用了,冬镜尽量以容易理解的方式来讲解。 、搜索引擎蜘蛛 搜索引擎蜘蛛又称网页爬虫。目的:抓取高质量的网页内容。下面讲几个常见的搜索引擎蜘蛛分类: 1.1Baiduspider(百度蜘蛛) 百度公司还有其它几个蜘蛛:Baiduspider-news(新闻)、Baiduspider-mobile(wap)、Baiduspider-image(图片)、Baiduspider-video(视频),站长经常见到的是Baiduspider和Baiduspider-image。 1.2Googlebot(谷歌蜘蛛) 还发现个Googlebot-Mobile,看名字应该是抓取wap内容的。 1.3360Spider(360蜘蛛) 它是个很“勤奋抓爬”的蜘蛛。 1.4SogouNewsSpider(搜狗蜘蛛) 还包括如下这些:Sogouwebspider、Sogouinstspider、Sogouspider2、Sogoublog、SogouNewsSpider、SogouOrionspider,看权威的百度的robotshttp://www.baidu.com/robots为Sogou搜狗蜘蛛费了不少字节,占了大块领地。 其它还有很多蜘蛛不过多介绍,SEO优化主要针对这四个可以,有兴趣可阅读搜索引擎蜘蛛大全这篇文章。 二、搜索引擎的工作原理 搜索引擎的基本工作原理 小编认为搜索引擎的工作原理大致上可以分成3个阶段:1.爬行和抓取;2.预处理(建立索引);3.输出结果。 2.1爬行和抓取 搜索引擎蜘蛛通过链接发现链接的方式去访问网页,从而获得页面HTML代码存入数据库。 那么搜索引擎蜘蛛又是怎样抓取网页的呢? 答:发现某个链接→下载这个网页→加入到临时库→提取网页中的链接→在下载网页→循环。 搜索引擎蜘蛛爬取原理图 2.2预处理(建立索引) 蜘蛛(专业术语:索引程序)对抓取来的网页内容要进行关键词提取、生成倒排索引、页面PageRank值及TrustRank值计算、页面关键词相关性等处理,以备排名程序调用,这也是搜索引擎能在极短时间内返回搜索结果的关键,其中我们关心的是PR值和相关性。 2.3输出结果 用户输入关键词后,排名程序调用索引库数据,程序自动匹配关键词,然后按定规则生成搜索结果展示页面,这是因为前面的预处理,搜索引擎才能够在很短的时间内返回输出结果,这里特别要提醒下,自然搜索排名和竞价推广排名是有区别的额。
文章分类:
搜索引擎营销
|