SEO的贝叶斯算法与伪命题
大学时候学离散数学,啥都没学好,但是还有一个东西触动了我。比如一个事物,我们常说真的、假的事物(真命题、假命题),但是还有一个东西,有些事物对与错是有概率性,不一定对也不一定错,这样我们只能把概率融入到选择中来进行选择,这就是贝叶斯算法。
2011年学了seo之后,没料到这个算法影响了很多方面。在seo的很多方面都是这样的,呈现了很多的两面性,而且在一定概率之后,影响的因素会发生了很多的变化。seo实质是追求平稳态的一个动态过程,例如图上的就说明白了很多问题。所以你了解seo后,你发现现在所谓的seo培训都是不行的,因为他们的都是告诉你哪些因素的影响了那些权重,其实任何的一个因素和其它因素之间,一个因素自身对网站影响都是具有着非线性、相对性、阶段性的影响,下面我就慢慢解释一下:
比如百度切词,粒度越小,召回就越多,建立倒排索引时,索引的长度就越长;粒度的层次越多,索引的数量就越多。一个多,一个长形成了不同的用户体验,搜索引擎一般采用性价比的方式来进行选择。例如搜索排序算法里存在着这里的例子,网页排序与查询的匹配程度,和网页本身的好坏都有关系,如过两者存在一定的差异,就只好采用贝叶斯算法进行匹配……(本段节选百度博客)
在链接方面也存在着相同的东西。在网站权重理解上,我一般分成了三种,其中2个链接因素两个内容因素,两个内容因素是相反的,两个链接因素也是相反的。这其实是出乎我的意料之外的。
以上所说的解释了一个东西,那就是seo的影响因素是相对性的,真假命题很多时候是贝叶斯算法在起着作用,下面的一个感想对我感触非常大,也是这篇博客所要说的:
昨晚第N次读了夜息的金字塔链接模型,思考一下,在以前我曾经读了这篇文章后狠狠地研究了下链接模型和拓扑连接模型,例如我这篇博客的头型就是最好的拓扑连接模型,但是我昨晚却忽然觉得有些地方错误了,就在2012年钟声敲响的时候,我忽然想也许夜息和我们都错了……
如果您已经读了那篇博客,其中有两个概念不得不说,一个是链轮一个是站群,这两个都是目前非常流行的seo策略,被很多人所推崇,前一段经常看到这方面的研究,都在说明网站权重传递是怎么的好,其中的原理就是链接之间的相互迭代传递,或者在图论逻辑上是向量空间模型。
说道向量空间模型,这里有一个问题必须说明的是,在数据结构里搜索是如何存储数据的。一般情况下我们认为是单一节点存储的,但是大量的链接关系的话,需要的存储空间是非常巨大的,如何节省存储呢,最简单就是把相同方向指向的放在一起,这样一来一个问题就产生了,如果采用链轮或者站群在第一层迭代和第二层迭代里数据是相同的(或者第二层迭代小于第一层迭代),如果搜索采用数据统计来研究网站链接的话,这么简单的数据蜘蛛不明白是什么神马吗……我吓死差点……(本人认为搜索会进行此数据统计,而且会采用二叉树节点计算来做链接的迭代计算。)
其实,更加深究这些问题,比如外链要不要做模型。我们可以这么一个设想,加入一个网站有101个页面(1个首页和100个内页),假设两种特别情况,每个页面都连向首页,但是相互之间不连接,首页连向每个页面;另一个条件是每个网页都连向其他100个链接,那么对于一个网站来说,这两种情况下网站权重一样吗?(这是在理想情况下,没有任何外链情况下,切记首页只是一个网页)
对于这个问题我曾经一度非常的纠结,后来借助三权(页权、位权和域权)分立研究,发现了很多有趣的问题,假如我们把上面的问题改为另外一个问题,加入一个人拥有一个公司100%的股份,价值是100W,或者一个人拥有100个公司每个公司1%股份,价值也是100W,请问这个人的财富影响力变化了没有?
其实结果是或许是这样的,如果这个人比较强势,那么其影响力辐射到100个公司,其财富影响力最大可以到100个100W,如果一个人比较弱势,那么其影响力从100w到了0.这非常类似于谷歌的随机冲浪模型,如何用户体验很好,或许会点很多,也许只点击进入页就走了……
就现实来说,其实还存在一个问题,就是公司股权问题,以上两种之外还存在一个黄金点35.9W控制一个公司的股权(具体大家可以参考金融),那么这个很稳定的控制影响力,可以控制200W和其他的一点,这个我可以称之为稳定态,而最初的两种被称为初始态和最终态,而35.9是最好的比例点,这点也可以解释每个网页最稳定的最好的链接比例是多少,一个网页有36个主题html链接有最稳定的随机冲浪点击链接(大家可以测试下)。
这个问题其实我是想说的是伪命题,因为每个网站内容不同,用户体验不同,其连接位置、链接关键词不同等,同一个网站任何一个网页权重产生了差异性。但是任何链接模型都是在降低域权来提高位权的一个过程,两者的权重和是没有改变的,有改变的是其中的“现实过程”或随机冲浪者可以达到的UV数量,而这个最终和页权改变有关系。而页权就是和你劳动力有关系的一个权重,所以做了一圈总的能量是守恒的,而变化的是您的力气化作了能量。(页权、位权和域权是三种不同的权重计算方式,任何一个网页都是由此三种权重传递而来,看清楚了是三种不是三个……)
看到这里,连我这个解释者都觉得很多人难以理解,其实这个意思简单就是说无论站群或者链轮并没有从本质上改变网站权重,和连不连接模型一点关系都没有,因为链轮和站群并没有增加二度迭代的链接数量,所以说搜索引擎不会K掉链轮和站群的,因为是您的“花费的时间”转化为了页权,而您在这段时间里也可以通过提高其他权重达到相同的效果。
PS:头晕如麻,昨晚看了一晚的seo博客,今天大年初一睡了一天的觉,本来想写篇文章探讨下一个网站多少条外链效果最大,以后会逐次递减的,可是写着写着自己都不知道写了神马东东,大家随意看看吧,很多地方写错了也不想改了,本来还有很长的探讨现在也没心情写了,如果对此篇文章不懂的可以PM。
1,36个是相对稳定态,不是绝对值,不要追究为何不是35;
2,一些说法都是相对说法,都不是绝对的,所以你要站在相对论的前提下阅读本篇文章;
3,本人研究seo时间很短,很惭愧地说也没有接受神马培训,不过看了很多免费资料,自己造的一套seo理论是依据三权、五构、七标、十三点(核心是自然的平稳态),里面内容比较驳杂,以后慢慢通过写博客分享出来,其中这篇文章当中很多细节都需要解释的,会在以后慢慢解释;
4,本人觉得国平seo适合对网站进行数据分析,而我的理论主要是对网站进行seo架构设计,我正逐步分析大量网站来对理论进行验证和修正,写这么多仅供参考,您可以鄙视我的无知,回复着请不要打击我的热心……