我花了十年时间,才意识到自己根本不会用Google。
每天搜索七八次,自以为轻车熟路。直到某天想找一份2018年见过的PDF报告,翻了几十页,愣是找不到。那一刻,我盯着搜索框发呆——这个每天用的工具,我了解它什么?
什么都不了解。
于是我用三个月时间,像解剖标本一样拆解Google的运作方式。结果发现,大多数人和我一样,对搜索的理解停留在“关键词+回车”的原始阶段。
更残酷的是,Google早已不是你以为的那个Google。
01. 你看到的搜索结果,是被“修剪”过的
2019年之后,Google开始隐藏大量网页的完整URL。不是技术限制,是有意为之。
为什么?
因为完整URL会暴露网站结构,普通用户看了会困惑。Google的产品经理认为,大多数人不需要知道内容来自哪个子目录,只需要知道“这个页面有没有我想要的”。
听起来贴心。但副作用是,你失去了判断信息来源可靠性的重要线索。
比如“site:nytimes.com”和“site:nytimes.com/opinion”是两回事。前者是整站搜索,后者只搜观点专栏。没有URL结构,你根本不知道自己在看什么。
Google替你做了这个判断。你同意吗?你根本没得选。
02. “前十条”是个精心设计的陷阱
SEO行业有个笑话:最好的藏尸地点,是Google搜索结果的第二页。
第一页的十个链接,占据了91%的点击量。但你知道这十个位置是怎么来的吗?
不是单纯的“最相关”,而是“最相关”+“最会讨好Google算法”。
每秒钟,Google处理超过4万次搜索。它的爬虫不可能爬遍所有网页,所以它用算法预测:哪个页面最值得给你看。
这个预测机制叫RankBrain。它会学习你点击了哪个结果,停留了多久,有没有返回重新点别的。你的每一次点击,都在帮Google训练下一批结果。
讽刺的是,你越依赖前十条,就越强化这个循环。你永远看不到那些被算法筛掉的、但可能更适合你的内容。
03. 精确匹配是个伪命题
很多人喜欢用引号把关键词括起来,以为这样能精确匹配。
2015年之前确实可以。现在不行了。
Google的索引系统做了大量模糊处理。它会自动纠正拼写,自动扩展同义词,甚至自动补全你没想到的词。你搜“如何学习编程”,Google会自动包含“编程入门教程”“编程学习路线”等内容。
听起来很智能。问题是,你没法关闭这个功能。
当我想找一篇2013年发表、标题里有特定术语的论文时,Google总给我推荐更新、更“热门”的内容。那些老文章,就像沉入海底的沉船,明明还在那里,却永远打捞不上来。
04. 时间排序是最大的谎言
Google搜索结果页有个“工具”按钮,可以按时间排序结果。
但你知道这个时间是什么意思吗?
不是内容的发布时间,是Google“发现”这个内容的时间。这两个时间可能相差几年。
一篇2015年的文章,如果被某个网站2023年转载,Google会认为它是2023年的新内容。用时间筛选,筛出来的是“被Google收录的时间”,不是“写出来的时间”。
想找真正老内容?只能用“archive.org”配合Google搜索,或者寄希望于某个网站保留了原始发布日期。
05. 你的搜索历史,正在变成你的信息牢笼
Google会记住你的每一次搜索、每一个点击、每一次停留。
它会根据这些数据建立你的兴趣画像。你搜过“健身”,下次搜“蛋白粉”时,健身相关的结果会优先展示。你搜过“育儿”,下次搜“教育”时,儿童教育内容会排在前面。
听起来很贴心。但如果你某天想跳出自己的兴趣圈层,想了解一个完全陌生的领域,Google还是会用你的历史数据来“优化”结果。
你看到的世界,是你过去想看的世界,不是现在需要的世界。
有个简单办法:用无痕模式搜索。但很少有人这么做。
06. 知识图谱正在取代网页本身
Google越来越不想给你链接,它想直接给你答案。
搜索“法国人口”,顶部直接显示数字。搜索“苹果公司CEO”,直接显示库克的照片和简介。这些信息来自Google的知识图谱——一个庞大的结构化数据库,从维基百科、CIA世界概况等来源抓取数据。
对简单问题,这很方便。但对复杂问题,这是灾难。
当你搜索一个有争议的话题,知识图谱只会呈现一个“标准答案”。那些不同观点、边缘论述、学术争论,全被折叠进了“更多结果”里。大部分人不会点进去。
Google就这样,悄悄替你决定了“什么是事实”。
07. 移动端搜索正在杀死深度内容
手机上搜索,前三页全是AMP页面、视频和精选摘要。
AMP是Google推出的加速页面技术,加载快,但信息量被极度压缩。视频对Google有利(YouTube是它的),但很多问题用视频解答效率极低。精选摘要直接从网页摘取一段话,用户看完就走,不会点进原网站。
这套机制的结果是:深度内容生存空间被压缩。那些需要5000字才能讲清楚的话题,越来越难被看到。因为制作深度内容的网站,无法在移动端竞争中胜出。
你不是不想看深度内容,你是根本看不到了。
08. 地区限制比你想象的更隐蔽
Google会根据你的IP地址自动调整搜索结果。
在美国搜“气候变化”,和在中国搜完全不一样。不是搜索结果数量不同,是整个信息生态不同——哪些网站出现、哪些被压制、哪些压根搜不到,都经过精细调整。
更隐蔽的是,即使在同一国家,不同地区的结果也不同。一线城市和三线城市,搜同一个词,前几条结果往往不一样。Google认为,城市用户需要“高端”内容,小城市用户需要“实用”内容。
这种地域歧视,从未写在任何官方文档里。
09. 真正的高手在用“Google系”工具
大多数人只用google.com,但Google内部有几十个垂直搜索工具。
Google Scholar搜学术文献,Google Patents搜专利,Google Books搜全文图书内容,Google Dataset Search搜开放数据集。这些工具的索引方式和主搜索完全不同,能挖到主搜索永远搜不到的东西。
举个例子,想找某本书里的一句话,主搜索大概率搜不到。但Google Books可以全文检索,直接定位到具体页码。
这些工具都免费,但99%的人不知道它们存在。
10. 搜索的未来,是你不需要搜索
Google的终极目标不是让你搜得更好,是让你不用搜。
Gemini(原Bard)已经能直接生成答案,不用点链接。多模态搜索可以拍照识别物体,语音搜索越来越精准,实时搜索通过Google Discover直接推送到你手机。
搜索正在变成一种被动服务,而不是主动行为。
这很可怕。因为当信息不需要被“寻找”就能出现时,你连质疑的机会都没有。你不知道信息从哪来,为什么出现,还有没有其他观点。
你只能接受。
最后
写这篇文章不是为了批判Google,是为了提醒一件事:工具越智能,人越容易变懒。
Google确实改变了人类获取信息的方式,但这种改变不全是好的。它帮我们过滤噪音,也帮我们屏蔽了异见;它让信息获取变快,也让深度阅读变少;它了解我们的一切,却让我们越来越不了解它。
下次搜索时,不妨多往下翻几页,多用几个关键词组合,多试试不同时段的搜索。
你会发现,那个你以为熟悉的Google,其实很陌生。
而这份陌生感,恰恰是找回信息自主权的开始。
