Skip to content

也许来一场信息革命?

AI 真的带来了信息革命吗?🤔

基于看到的信息做一个最直觉的判断,我们会认为说大模型的出现,进一步打破了信息壁垒,让信息的检索变得更加简单了,我们迎来了新一轮的信息革命🤯

但似乎,剧情的实际走向却并非如此😕。。。

诚然我自己其实也高频的使用着各个 AI 工具,但我依旧觉的其还是拥有着很大的局限性🤨

归根而言当前的大模型更像是一个没有肉身的“灵体”存在,它没有办法自己去认识这个世界🫤

他所有的认识都来自于人类对其的数据投喂,让我想起了苏轼写的一则寓言《日喻说》一个盲人向其他人请教太阳的样子,别人告诉他太阳像铜盘像蜡烛。但不论别人描述如何细致,他最终得到的依旧是一个抽象的认知😵‍💫

因为 AI 无法通过自己产生“有用”的新知,依旧离不开人类本身对其的信息输入😶

为了更好阐述原因,首先我来介绍一下我用以判断的核心逻辑🧐

就目前大模型而言,其存在着一个致命的问题“幻觉”,例如 GPT 在生成内容时总是会一本正经的讲述一个错误的信息,对完全不知道的内容无法做到“知之为知之,不知为不知”🤥

这种信息的不确定性,使我们对大模型无法报以百分百的信任,也就很难将大模型提供的信息作为权威的数据来源或是学习资料🤐

要减少这种幻觉就需要,让大模型能够学习到更多高质量的信息,或是安排一个监督模型通过实际可以搜索到的信息对结果进行纠错,亦或是像很多国产模型当前做的这样,干脆就是对搜索到的信息进行总结提炼🤯

因此可以看到,最终还是绕回到了现有的信息之上,本质对于人类创作者也是一样的,说话要讲证据,信息要讲信源,才能确保内容的可靠🧐

那长期来看大模型是否可以通过自我训练进行持续的提高,乃至超过人类呢🫤?

我们知道当前的 AI 可以进行自监督学习,模型生成回复,监督模型再对生成的回复进行质量评分,并以此不断改进自己的输出🤖

但可以看到这套模式的瓶颈在于,监督模型需要先能知道答案的对错,但所有的对与错都不是凭空出现的,他们是基于经验的,基于实验的,基于共识的,围棋有清晰的目标和评判标准,因此通过自我对弈可以获得持续的提高👾

但通用大模型显然无法进行完整世界环境的模拟,他也没有肉体或是人类的感受,就像著名的那个成语“读万卷书,行万里路”AI 拥有丰富的知识,但是其却无法亲身的进行验证,也就缺乏了如同人类一样成长的条件🫥

当然随着发展,例如 AI 获取自己的肉体和感知器官了以后,他可能可以梦见自己的“电子羊”👾

但这是一个基于人类为核心的社会,在情感方面其可能依旧无法代替人类自身的感受,例如产品的评测,影视艺术品的鉴赏,也就是真正“人文”的部分。一个影视作品服化道可以进行客观的比较,但其带来的触动却只关乎于人类内心的感受🥹

因此通过思维实验可以推论,至少就目前而言人类依旧是信息生产的核心角色"AI 不生产信息,AI 只是信息的搬运工"因此从这个角度来说,当前的 AI 能够提高信息搜索的效率,但无法将其称之为一场真正的信息革命🤨

当然以上的论述,并不是为了证明 AI 不重要,或是看衰 AI 的发展。而是试图以一个更全面的角度来看待 AI 与人类的关系🫨

人类自诩最为杰出的特征便是“智慧”,AI 的全称 artificial intelligence 人工智能或是说人造智能,最为核心的特征也在于“智能”这个部分🤓

智能背后的基石,或是往大了说真正构成整个人类文明本身的东西,信息,才是我真正想要探讨的部分,不论是 AI 还是人类的学习,所能获取到的信息质量本身才是最为重要的核心,而作为如今人类文明最为重要的信息载体,互联网,又为我们提供了怎样的信息环境呢?🤔

我将在下一个章节中继续进行讨论🤯

互联网没有记忆:随时遗忘的过去

上一个章节我们聊到了,AI 虽然能够提高我们的信息获取效率,但是最重要的依旧是数据本身,或是说 AI 依旧需要互联网中那些可以被获取到的信息,来为我们提供相对准确的答案📖

只是互联网的记性似乎也并没有我们所想象的那样好,其上的数据也有着随时被"遗忘"或是“埋没”的风险🫧

例如隐约记得当初有一个非常标志性的事件,百度贴吧在一夜之间,删除了 2017 年之前的所有帖子,并且在这之前没有任何的通知,当然后续迫于舆论的压力进行了部分的恢复,只是我们依旧可以看到,互联网之上信息存续的脆弱性☄️[1][2]

且我在搜索相关事件的时候,真正可以称得上强相关的内容只有区区两页,当我去知乎搜索当初的问题“如何看待百度贴吧 2017 年前的帖子全部被删?”时发现,这个问题本身也早已消失,留下的几个相关提问也只有零散的十几个回答🤐

其实扩展而言,不仅仅是百度贴吧,互联网早期的大部分内容都已经被埋没在了历史之中📉

当然他们有着各种各样的原因了,例如另一个比较著名的事件,2023 年天涯论坛的关闭🙁[3]

2023 年 4 月 1 号天涯发布公告称,近期将进行技术升级和数据重构,期间平台将无法访问,到了同年 4 月 27 号,天涯社区的官网已无法正常打开⛓️‍💥

曾经的天涯在 2003 年,注册用户达 300 万,日访问量 2000 万左右,而当时中国互联网网民只有 7950 万人🚀

众多超级 IP 如《鬼吹灯》《盗墓笔记》《明朝那些事》最早也都是在天涯上开始连载的📝

只是最终的天涯因为资金链断裂,无力支付机房和网络费用,导致网站服务被迫中断,天涯上的所有内容也随着网站的关闭,一起被扫入了历史的尘埃🛞

曾经我天真的觉的,像是书籍报纸都是应该淘汰在历史滚滚尘埃之中的产物了,没想到到了今天,或许他们还是最聚合,最高质,最得以延续的信息媒介🗞️

其实我们总是会听到一个词“互联网没有记忆”,它用来形容网民总是会忘记之前发生过的事情,被新的内容吸引,一样的骗局,一样的问题,一而再再而三的上演乐此不疲🤡

当然还有着一句更大的话“人类从历史中学到的唯一的教训,就是没有从历史中吸取到任何教训”🤪

其实从某种角度来说,真的不是说网民没有记忆,而是互联网本身正在抹去记忆,例如我们搜索宝马,可以看到几乎全是近期宝马提价之后拒绝交付的新闻,而在那再之前闹得沸沸扬扬的”宝马冰激凌“就已经被时间所埋没了,只找到一个视频,但那个问题已经消失了,如果你不知道或忘记那件事,不使用更准确的关键词去搜索,对于你来说,这件事就被历史掩盖了,变的就和从来都没有发生过一样👀

我向来不以最坏的恶意来揣测人或是平台🙂,根据当前的热度,或根据时间久远的程度来进行排序本身只是一种算法策略,亦或只是一种迫不得已,我不评判其绝对的正确与否,只是确实在这样的模式下互联网的记忆就是会很短暂😶

当然可能又有小伙伴说,活在当下不也挺好的,反正每天都有那么多的新东西可以关注,忘记了就忘记了呗,也没什么大不了的,再说了和我月薪三千又有什么关系呢,又不关我的事,关我的事我也解决不了😶‍🌫️

但你仔细想一下,会发现,确实🫠——————

不过,不过其实还是会有那么一点关系的,我们每个人都会进行消费,而消费时往往会离不开一个概念,那就是品牌🏷️

而品牌的作用是什么呢?说白了就像是实名制上网,说啥话干啥事敢作敢当,于是大家伙对其才能抱有信任。但如果一个品牌变得不需要为过去的行为买单了,反正出啥事装死就好了,热度一过大家也就忘了,新的消费者也不会知道这个品牌过去做了什么事,能看到的只有花了钱的正面宣传,那对品牌的行为约束力就丧失了很大的一部分🦀

同时对于那些有自己坚守,和真正在乎长期产品力的品牌来说,这样的环境下也很难真正展现出自己的优势,如果用心做产品和口碑的性价比远远比不上广告和竞价排名来的,那又会催生出怎样的选择呢🤨?

这是个越来越被动的时代,到处都是推送算法,信息流,我们的信息接收逐渐的被平台所左右,我们更是无法分辨自己的信息获取是否受到了摆布,信息又进一步影响认知,认知又进一步影响决策🫤

如何才能夺回信息的主动权,找回失去的记忆,是我们接下来,需要面对的问题🤔

难以寻觅的真相

前一阵子发生了一件有些离谱的事情,游戏圈的小伙伴可能知道,一家著名的游戏公司育碧制作了一款游戏《刺客信条:影》,其中的主角弥助是一个日本战国时代的黑人,且在最初的媒体宣传中还特别的提到了这位弥助是一个真实的历史人物👺[4][5]

事情如果至此停止,那么大家可能就会在心理埋下一个印象,原来日本古代还存在过一个黑人武士👹

不过这款游戏的设定引发了大量日本玩家的不满,在 YouTube 甚至实现了日韩人民的大团结,直至声讨的强度越来越高,突然有网友发现,几乎所有和弥助有关文章资料都引用自一本于 2017 年出版的书籍,其名为《信长与弥助:本能寺幸存的黑武士》,并且书籍的作者还编辑修改了各个百科弥助相关的词条✍️[6][7][8]

而真正与弥助相关的历史史料只有寥寥几句的记载,其中也并没有有明确的说明弥助的身份就是武士,本质而言这件事本身更像是一种意识形态的操弄,虽然一切在最后得到了理清,但也越发值得我们警醒,很多时候可怕的反而不是那些纯粹的谎言,而是真相与谎言的相互掺杂😵‍💫

对于历史事件,我们唯一可以信赖的“真相“无疑是那些最原始的史料,同理对于其它的各种事件我们真正可以相信的因该是最终的信源,就像是知乎中常常被人提及的那条准则”先问是不是,再问为什么“🤔

而互联网上的大部分信息经过层层消化,信源早就被模糊化了,对于用户而言显然我们也没有这么多的精力去对每一条的信息进行彻底的溯源,这也是我觉的”弥助“事件比较可怕的地方,即使你进行初步的印证,你查阅了百科,乃至查看了内容是否存在一个可以追溯的信源,依旧无法保证内容百分百的正确😕

那对于其他的内容呢?对于未被在意的角落又埋藏着多少错误的认知呢?也许是一个短视频,一篇营销号文章,乃至一个评论,都可能产生有意或无意的错误引导🕰️

不过这里值得提及的是 Twitter 或是说 X 上的一个功能,在 X 平台上部分内容卡片的下面有时会插入一张背景信息的卡片,有时是通过 AI 对评论的总结,有时是用户自发进行的补充,起到的主要功能是提供一些提示或额外的信息,用以帮助更多人辨别内容的真伪或是性质🫤[9]

例如这个帖子展示了一个视频,内容是一个母亲把孩子推上列车后因为打电话不小心走下了列车,结果列车带着她的孩子开走了,不过好在遇到了一个好心酒鬼帮助她看护了孩子,内容是以一个黑白且类似监控的视角拍摄的,很容易让人们以为这是真实发生的事情,同时通过评论也可以看到,确实有狠多的网友信以为真了🪬

不过在我看到这个帖子的时候,其上就已经出现了背景信息的提示,告诉我这是一个摆拍的视频,我相信这对于后续看到这个帖子的人会是一个很大的帮助,至少我认为这是一个非常值得推广的功能🌠

而且很有趣的是,这则补充信息还附带了一个链接,点开之后发现是来自一个名为 FULL FACT 组织的网页,上面更详细的写了,为什么判断这是一个摆拍视频的原因。继续翻阅网站的主页和信息页面可以得知这是一家来自英国的非盈利组织,他们致力于发现、揭露和打击虚假信息,例如他们通过核实政客、机构和记者的说法,以及网上的热门内容,来纠正和阻止不良信息的传播👁️[10]

虽然我觉得相比整个互联网的信息来说,他们能起到的影响非常有限,不过从情感上来说看到这样的组织还是会觉像是在黑暗之中看到了一些火苗,至少有人在尝试将一切变得更好🔥

当然他们也开发了自己的 AI 工具,以让整个真相验证的过程变得更加高效,但我对其能够起到的影响报以悲观的态度,倒不是说我质疑他们开发的 AI 工具是不是真的好用,而是最终的话语权始终掌握在平台的手中🫴

而对于大部分的平台来说可能真相真的没有那么重要,重要的是如何更好的讨好观众,亦或是如何通过信息控制来达成自己的目的🐤

当然了哪怕是特朗普给自己的平台也会起名 Truth Social 真相社交,但是事实上嘛,对于懂王懂得都懂了👐

前一阵看到马斯克老是在推特上喷谷歌,虽然政治目的很明显,但是我们依旧可以通过这些例子感受一下作为搜索引擎可能会起到的信息引导作用🧐

例如这两个例子就展示了,如何通过操控搜索时的关键词联想来产生信息上的引导,对于不希望用户搜索的内容可以进行相关关键词的屏蔽隐藏,从而只展示一些其他的内容,例如在马斯克发的这个帖子中,他搜索总统唐纳德,给出的结果联想推荐的却是唐老鸭,确实人家也叫唐纳德,而且美国如今政坛的样子,唐老鸭来当总统看着也不是不行。但显然这不是一个正常的联想排序,当然这样的手段来的还是太过于保守了🪿

再过分一点呢,我们还可以进行注意力的吸引,例如你搜索总统唐纳德,跳出来的联想直接来个“唐老鸭总统因为布鲁托不小心踩到扳机枪击身亡”就说看到这个标题谁能不点对吧,等看完这边的内容,刚才想搜啥早就忘了😶

当然这还不够对吧,除了对目标关键词的屏蔽,我还可以进行反过来的信息引导,假设你搜索目标非常明确且打字非常快,我还来不及进行前面的关联干扰,你已经完整的打完了“总统唐纳德特朗普”前面两招都被你防出去了👿

但我还可以进行关联,例如在“总统唐纳德特朗普”后面跟的联想全是性丑闻、国会山、判刑136 年,就算你不点开,大脑中的印章也被强行摁下了🦠

ok,这时的你假设还是没受到干扰,终于打开了搜索页面,你杜绝了前面的一切干扰,但也许真正的引导才刚刚开始,所谓的搜索引擎就是帮助你在海量的信息中进行内容的筛选,但这事实上也是一个相对被动的过程,对于搜索的结果,同样可以进行关联内容的操控,来造成潜移默化的引导,例如在马斯克发的这个帖子中,搜索特朗普时结果会插入一些关于哈里斯的内容推荐,但是搜索哈里斯时却没有特朗普的内容推荐🦑

当然在我的实际测试时并没有发现这样的内容倾斜,不过评论区却有人点出了另外一种可能,即谷歌进行的是更针对性的内容投放。的确作为世界上最大的广告公司 ,精准的信息投放也是谷歌最为擅长的事情之一。针对性的手脚不仅更为高效,同时也显的更为隐秘,不由得想起某些购物平台的价格策略,不同画像的用户可能会被“私人定制”不同的价格☕

当然了,说到底也并没有实锤的证据,而且谷歌即使真的进行了美国选举的操弄,离我们也很远,只是我不知道还有多少人记得当初的魏则西,大二的时候他患上了癌症,他的父母拼了命的寻找治疗的方法,结果通过搜索引擎进行搜索时,在竞价排名的引导下找到了一家医院,这家医院宣称自己提供的是斯坦福的生物免疫疗法,于是魏则西的父母仿佛看到了救命稻草一般,不仅筹集了家里剩余所有的积蓄还找亲戚借了钱才凑齐了治疗的二十万花费,结果,不仅是没有任何的效果,还耽误了重要的治疗的时间📆

在魏则西死后该搜索引擎公司发布了声明,表示该医院给予的资质齐全,仅向魏则西的离去表示沉痛的哀悼🌫️[11]


  1. https://www.huxiu.com/article/299817.html ↩︎

  2. https://www.zhihu.com/question/324211119 ↩︎

  3. https://36kr.com/p/2238736766087048 ↩︎

  4. https://www.ign.com.cn/assassins-creed-codename-red/49299/feature/ci-ke-xin-tiao-ying-zou-jin-yu-bi-xiong-xin-bo-bo-de-kai-fang-shi-jie-ri-ben-ign-du-jia ↩︎

  5. https://www.ign.com.cn/assassins-creed-codename-red/49269/feature/ci-ke-xin-tiao-ying-40-tiao-ni-xu-yao-zhi-dao-de-xi-jie ↩︎

  6. https://www.youtube.com/watch?v=i4qxeouJGB0 ↩︎

  7. https://www.youtube.com/watch?v=vovkzbtYBC8 ↩︎

  8. https://www.yystv.cn/p/11930 ↩︎

  9. https://x.com/InternetH0F/status/1822537538495484309 ↩︎

  10. https://fullfact.org/online/cctv-mother-baby-paris-metro-staged/ ↩︎

  11. https://www.zhihu.com/question/26792975/answer/88170767 ↩︎

Tuclink - Old Page