品艺网络

SEO优化原理快速掌握排名主动性

发表时间:2018-03-22 11:54

  本文并不是科普文,也不是什么技术探讨文。仅仅是为了那些和我一样,因为对“程序”、“代码”的望而却步,不敢或没有信心研究SEO的“小白”们,能快速简单有趣地了解搜索引擎背后的原理和逻辑,以便建立对互联网营销的基本认识,海瑶SEO工程师为您详细的解答。


  作为营销人员,你会发现SEO离你很远也离你很近。工作中明明有个别同事专门做SEO,你却完全摸不懂他具体做一些什么?

  然而当我们开始把职业规划往上提的时候,当我们开始找工作的时候,发现很多公司对营销人员、运营人员的要求是“懂SEO/SEM”。

  是指在了解搜索引擎自然排名机制的基础之上,对网站进行内部及外部的调整优化,改进网站在搜索引擎中关键词的自然排名,获得更多的展现量,吸引更多目标客户点击访问网站,从而达到互联网营销及品牌建设的目标。

  1、研究算法:百度这类网站不是凭感觉对搜索结果进行排序的,它有一套复杂的规则,以用户能搜到他想要的内容。海瑶SEO发包技术联系Q:63820

  2、网站优化:研究清楚(或者大致清楚)百度这类搜索引擎的算法后,根据其喜欢或者讨厌的内容,调整我们自己的网站内容。包括关键词、内外链接、网站结构等等。

  我们在百度的搜索框里面输入词,按下enter键就能出来这么多页的结果,而且似乎大部分都是我们想要的。

  搜索引擎它是怎么做到的,是背后有小小的兵工厂在不断整理和输送我们想要的文件吗?或者是像汽车一样后面有整套的动力系统吗?

  如果说程序、代码等,可能大家会觉得太抽象,无法想象它的样子。接下来我们用几个相对具象的事物举例,来说明搜索引擎背后的原理和逻辑。

  蜘蛛顺着蜘蛛网,从一条线爬到另一条线(从一个网页爬到另一个网页)。还顺便把爬到的数据丢进一个箱子存储起来。这就是搜索引擎的第一步“搜罗”。

  那网页之间是怎么联系起来的呢?就是蜘蛛网的这条线与那条线之间有个节点一样,网页与网页之间也有链接,相当于蜘蛛网的节点,让蜘蛛从一个网跳转到另一个网。


  前面我们说过,蜘蛛会把爬到的数据放在一个箱子里,但这些原始数据没法直接用,就像你去图书馆找一本书,结果图书管理员说书堆在房间里,自己去一个个翻。你觉得你找到自己想要的书的概率有多大?要花多长时间?

  所以这个时候就要对原始数据进行预处理,也就是索引。就像图书馆将图书分门别类一样。这里就是搜索引擎的“分析和整理”。

  (1) 提取文字:把每个网页看成一个文件夹,里面可能有文字、图片、视频。但搜索引擎会提取其中的文字。

  (3)把非关键词去掉。如“的”“地”“得”等助词、“啊”“哦”“呀”等感叹词、“从而”“以”却等副词或介词去掉。

  另外还有消除噪声如栏、分类广告等对页面主题没有什么作用的去掉,以及去重后,后将每个网页(也就是文件夹)变成一个个的关键词,如下图。

  但是,解析到的正向索引还不能直接用于排名。为什么呢?如果用户搜索关键词2,程序就要扫描所有的文件来找出哪些文件有关键词2,耗时又耗力。怎么办呢?

  用户是根据关键词来搜索的,那我们完全可以通过关键词进行索引排序呀。这就倒排索引:即根据关键词排列文件夹,具体如下图:

  现在我们再次回到搜索引擎的原理:按下enter键后,出来的网页是按照与你搜索词相关的顺序排序的(相关性),同时也要你搜索的是你想要的(可信度)。那么如何确定?

  举个例子,马上你碰到一个陌生人,你怎么确定你和他的关系,以及他的人品如何?如果他是你大姨夫的同学的邻居的同事,这就是通过“链接关系”确定相关性。而你对你大姨夫、大姨夫同学、大姨夫同学的邻居的人品和说辞来判断这个人的人品,这就是通过“PR值”确定可信度。

  所以,既然程序把网页编程了关键词对应文件夹的组合,那么用户搜索时,也要提取关键词才能匹配相应的文件。

  (2)文件匹配:提取出关键词后,就可以根据前面所说的倒排索引找出对应的“文件夹”,其实也就是网页。


  (3)初始子集选择:一般来讲,一个关键词对应的网页(文件夹)可能有上千万个,但用户可能只需要1000个。所以,搜索引擎会只选择一部分匹配的子集再进行后续的相关性计算以便排序。(至于怎么选取子集,文章里没有讲,可能属于算法的高级机密,一般人也不知道。)

  (4)相关性计算:绝对情况下,以“冥王星”为例,如果一个网页上,“冥王星”这个次出现的频率越多、出现的越重要(如标题)、外部因为“冥王星”导入到这个网页的链接越多,则搜索引擎会觉得这个页面与“冥王星”越相关,越能排在前面。(其实搜索引擎的相关性排序非常复杂,这里方便大家理解,只能绝对化讲。)

  通过前面的一步步,后台各种数据已经准备完成,现在只剩下给“图书馆的书贴标签”了。所以搜索引擎后只用调用原始页面的标签标标签、说明标签、快照日期等显示再页面上。就形成了我们终搜索结果。

  本文仅讲述了搜索引擎的原理,如果大家有兴趣,后续可能会整理SEO人员针对这些原理如何对网页进行优化的相关内容。

网站优化推荐
2018-08-24
2019-07-14
2019-03-22
2019-02-23
2018-12-30
2018-12-30
2018-12-30
2018-11-04
2018-11-04
2018-08-16
2015-01-30
2015-01-29
2015-01-29
2015-01-28
2015-01-28
2015-01-27
2015-01-27
2015-01-26
联系地址 广东省东莞市莞城区可园路10号
联系电话 18024682589
联系邮箱 463450176@qq.com