周一上午,陈醒对着电脑屏幕,遭遇了一个让他血压微微升高的古典困境——他想不起一本书的名字了。
只记得是本科幻小说,蓝色封面,讲时间旅行,作者名好像带个“斯基”或“斯坦”。去年在朋友家厕所里顺手翻过几页,现在突然想买。
这要放在十年前,他会去市图书馆,在“文学—科幻—外国”那排落灰的卡片柜里,用手指一行行划拉,靠运气和眼力碰。五年前,他会在搜索框里敲“蓝色封面时间旅行科幻”,然后耐着性子翻三五页结果。
现在,他在手机里输入了同样的关键词。
结果页面弹出来:
第一位:电商广告,蓝色封面的《时间简史》(霍金,科普,不是科幻),旁边挂着“限时折扣”。
第二位:读书社区提问,“求推荐时间旅行题材神作!”(底下357条回答)。
第三位:新闻通稿,“知名科幻作家某某某新作震撼上市”。
他往下滑了十屏,指尖都划热了,那本该死的书还是没影。不是算法找不到,是算法判定,一个想买书的中年男人,此刻“更需要”一个点击广告的机会,或者一个能让他沉浸半小时的社区链接。
陈醒盯着屏幕,感觉不是自己在搜索,而是像个傻子在对着一台自动售货机喃喃自语,而售货机坚持认为他“应该”买它主推的薯片,而不是他想要的那瓶水。
他删掉所有词,试着用算法的逻辑,重组自己的问题:
“时间旅行祖父悖论小说 1980年代出版”
页面刷新。第三条结果,赫然就是他要找的:《你们这些还魂尸——》,罗伯特·海因莱因,深蓝色封面。
书找到了。但陈醒后脖颈有点发凉。
他刚刚,为了让机器听懂,亲手把自己的疑问,翻译成了另一套语言。
“看,这就是现代人知识便秘的经典案例。”数据诊所里,少林猿指着屏幕对学徒说。屏幕上并排放着两张图:左边是古老的木制卡片目录柜,右边是谷歌早期数据中心那让人密恐发作的服务器阵列。
“看起来一个像古董,一个像科幻,对吧?”少林猿敲敲键盘,“但内核一样:建索引,搞匹配。”
他用手划过左边虚拟卡片柜的投影:“人类管理员花几个月,把一本书压榨成‘书名、作者、分类’几个干巴巴的标签。这叫人工降维,粗暴但有效。”手指又转向右边闪烁的服务器群:“网络爬虫昼夜不停,把万亿网页嚼碎成关键词和链接的破布。这叫自动化、工业化的大规模降维。”
“区别是……量级?”学徒问。
“不,是权力的游戏规则变了。”少林猿调出几行核心代码,“卡片时代,权重是死的:书名最大,作者次之,分类垫底。但PageRank这玩意儿,玩的是动态权重——一个网页重不重要,不看它自己吹,看有多少‘重要’的网页链接它。”
屏幕上浮现一个由点和线构成的网络。“传统想法,谁被提得多谁牛逼。PageRank说:被一个诺贝尔奖得主引用,比被一百个大学生引用,份量重得多。它把学术圈那套‘引用即权力’的游戏,搬到了整个互联网。”
“所以搜索不再是找关键词,是计算……江湖地位?”
“是计算‘在当下,大多数人会认为谁说话算数’。”少林猿纠正道,“但这就埋了个雷:我们用搜索寻找未知,它却优先给我们已知的、公认的、已经成功商业化的答案。它是个卓越的考古学家,却是个蹩脚的探险向导。”
陈醒把这事儿当笑话讲给正在批作业的林芳听。
林芳头也没抬,笔尖唰唰划着:“这不就是‘知识越狱未遂’嘛。你想找的东西在墙外,但所有看起来像门的地方,都通向他们自家的购物广场。”
“比那还憋屈。”陈醒一屁股坐下,“它不是锁死出口,是把出口藏在一堆‘特惠通道’和‘VIP休息室’后面,让你找得筋疲力尽,最后觉得留在它安排好的大厅里也挺舒服。”
他想起少林猿画的“游牧地图”。搜索框,大概就是数字草原上最显眼、也最坑人的那个路标,指向的往往不是你想去的地方,而是立标的人希望你去的集市。
下午,他闲着也是闲着,做了个实验。在三个App里,输入同一个词:“碳中和”。
主流搜索引擎:首页全是政策解读、行业白皮书、巨头企业战略。一副“国家级新闻发布会”的派头。
某知识社区:首页飘着科普漫画、争议互怼帖、个人减碳打卡日记。像一群人在茶馆里吵吵嚷嚷。
短视频平台:首页滚动着专家一分钟快讲、动画小剧场、以及“碳中和概念股盘点”和“环保理财产品推荐”。简单直接,还带着钩子。
同一个词,三副面孔,三个平行宇宙。
算法根据平台用户的整体画像(这里是“求知”,那里是“找乐”,另一个是“搞钱”),和平台自身的商业目标(卖广告?攒流量?促交易?),为他现场搭建了三个版本的“现实”。
搜索,早就不只是寻找答案了。
搜索,是在选择进入哪一个算法为你搭建的叙事片场。
晚上,手机一震。少林猿的消息,没头没尾:
“试试搜你心里真正的问题,而不是你觉得‘能搜’的问题。”
陈醒想了想,手指在屏幕上悬了一会儿,敲下一行他绝不会在白天、用自己账号搜索的话:
“中年男人,觉得跟不上技术,要废了,怎么办?”
他以为会迎面砸来一堆“重塑第二春”的成功学课程,或者“男人必补”的保健品广告。
结果页第一条,是一个冷门技术论坛里,七年前的老帖。发帖人ID已注销,内容只有寥寥几行:
“不是技术跑太快,是你被设定在了‘追逐模式’。技术迭代的节奏是资本定的,但感受时间的节奏是你自己的。找到一件技术无法加速的事去做。比如,看懂一首诗需要的三天,等一株番茄变红的一个月。在那里,你才是时间的主人。”
没有赞,没有收藏,没有“加精”。像一块被遗忘在河床底的石头。
它为什么能排在第一位?陈醒点开搜索设置,发现昨晚清理手机时,无意中勾选了“按时间排序(从旧到新)”。
就这么一个简单的、近乎原始的筛选动作,居然绕过了复杂的PageRank权重体系,让一个早已沉没的、毫无“权威”可言的声音,浮到了他眼前。
陈醒默默截了图。他忽然有点明白,少林猿说的“游牧”,在搜索里是什么意思了。
不是去寻找一个更仁慈的算法国王,而是学会在不同算法的领土间穿梭,甚至,偶尔自己拿起筛子。
临睡前,陈默抱着平板溜进客厅。“爸,考你一下,‘第一个编程语言是啥?’”
“FORTRAN啊,1957年,IBM搞的,算科学计算老祖宗。”陈醒答得很快,这是他知识库里的标准答案。
“错——也不全对。”陈默把平板转过来,“机器码才是真祖宗。要说高级语言,1940年代德国就有个叫‘Plankalkül’的设计,只是没实现。所以FORTRAN算是第一个‘活下来并 widespread’的。但同期还有个LISP,思想截然不同。所以答案取决于你问的是‘出生证明’还是‘江湖影响力’。”
他展示的证据不是百科,而是几个小众论坛的考古讨论帖,甚至有一张泛黄的笔记手稿照片。
“你……从哪儿刨出这些的?”
“谁像你,只蹲一棵树。”陈默一脸“这都不懂”的表情,“每个地方的人都只能拼出一块碎片。搜索引擎给你的是打磨好的‘标准答案’,但如果你想知道‘这标准答案是怎么来的’,就得去那些还在吵架、还没定论的地方。”
那一刻,陈醒清楚地看到了自己和儿子之间的信息鸿沟:
他这代人,寻找的是问题的标准终点。
儿子这代人,追寻的是答案的生成网络。
而算法,正不遗余力地把这道鸿沟,挖成天堑。
【系统夜话·碎片】
图书馆时代,知识有它的地理坐标。
你知道它在哪一排,哪一架。寻找的路上,你可能会被邻座一本不相干的书吸引。“迷路”本身,就是收获的一部分。
搜索时代,知识被做成“营养膏”投喂。
你输入模糊的饥渴,得到精确的饱足。效率至高无上,但你因此失去了在信息旷野中“迷路”的权利,以及所有不期而遇的可能。
PageRank是天才之作,它用链接投票挖掘权威。
但它也在无形中筑起高墙,把那些冷门的、非主流的、尚未被链接认可的微弱声音,沉入深不见底的数据暗海。
所以,记得偶尔:
关掉智能排序,按“时间”看看过去的人在焦虑什么。
筛选“仅学术”,暂时逃离营销的喧嚣。
甚至,主动去那些爬虫都懒得索引的角落:无名论坛、独立博客、三五人的线上书友会。
真正的搜索,不是谦卑地问算法:“请您告诉我,我该知道什么?”
而是平静地通知它:
“这次,我自己选滤镜,看世界的哪一面。”
