当前位置: 首页 > news >正文

AI 已经在污染互联网了。。赛博喂屎成为现实

大家好,我是程序员鱼皮。这两年 AI 发展势头迅猛,更好的性能、更低的成本、更优的效果,让 AI 这一曾经高高在上的技术也走入大众的视野,能够被我们大多数普通人轻松使用,无需理解复杂的技术和原理。

其中,AI 有一个很重要的应用,就是 搜索

搜索技术经历了几个主要阶段的发展:

1)1.0 时代:以关键词匹配为主,搜索引擎根据用户输入的关键词在索引数据库中查找匹配的网页。但容易受到垃圾信息的影响,我可以疯狂制作同时包含垃圾信息和关键词的网站。

2)2.0 时代:引入了链接分析算法,基于网页之间的链接关系来评估网页的重要性。如果一个网站被更多网站引用,那么这个网站的权重就更高,更容易被搜索到。这种改进提高了搜索结果的质量,减少了垃圾信息的影响。

3)3.0 时代:结合语义分析和人工智能技术,理解用户的意图和查询的上下文。说简单点就是用 AI 来帮助用户搜索和总结回答,就好像是有一个聪明的助手帮你搜索内容,然后把所有答案整理好汇总给你。可以进一步提高搜索的效率。

现在的搜索技术是否已正式进入 3.0 时代?我不是专家,就不下这个定义了。但有一点毫无疑问,AI 正在改变人们搜索内容的方式。

比如在某度搜索 “程序员鱼皮”,第一个结果不再是广告、也不再是某某官网,而是 AI 总结的回答。

看了一下,竟然还挺靠谱的,没把我本名给暴露出来。

但是问题来了:AI 是从哪儿找到这些信息,再把答案推送给用户的呢?

我们本能的想到,AI 也是把网络上的数据 “喂” 到了自己的大脑里,跟我们人类一样,如果遇到了没见过的知识,AI 当然也可以打开某个搜索引擎,查到结果后再总结并返回答案给用户。

就像下面这样,AI 的答案可能来源于某些网站:

AI 给出的答案真的正确么?其实很难保证。如果连信息源本身都是错误的,AI 给出的答案大概率也是错的。就像你考试的时候带了一份错误的小抄,直接完犊子了。

还有一个更有意思的事情,现在的某些 AI,引用的信息来源竟然是另一个 AI 搜索?!

引用一张我看到的网图,是某博主在一个 AI 工具提问时,引用来源中竟然出现了另一个 AI 助手 doubao。

可以简单的理解为,当你在谷哥搜索内容时,搜到的竟然是某度的内容。

为什么会出现这种情况呢?学过编程的同学应该更好理解,既然 AI 引用的信息来源于网络,那 AI 生成的信息当然也可以发布到网络上,并被其他的 AI 引用。

恐怖的事情就来了,如果某个 AI 故意持续不断地将生成的内容发到网上 ,其他的 AI 也持续引用 AI 生成的内容,互联网会变成怎么样?

想象一下,以后你搜索的内容,可能是源于 AI 的 AI 的回答,就跟图片水印一样支持无限套娃,根本不知道真实的、原始的信息来自于何处。

这样一来,AI 到底是增加了搜索成本、还是减少了搜索成本?用户还能够在网络上看到真实纯净的信息么?

你别说,你还真别说,这件事已经有很多人做了,就连某些互联网巨头也不例外。比如将所有用户提问和 AI 工具的回复制作成一个独立的网页,利用 SEO 搜索引擎优化技术,让这些网页能够被各大搜索引擎收录,从而提升自己网站的流量。也就是说,只要有用户使用了他们的 AI 工具,互联网上就会出现一条来自于 AI 生成的内容。

我把这个过程总结为 “赛博喂屎”。

大多数人只会相信自己搜到的、看到的信息(甚至是只相信自己愿意相信的信息),不会去验证信息的真伪。所以未来的互联网,怕是 “真真假假,假假真真,假作真时真亦假,真作假时假亦真”。

很多朋友利用 AI 来编程,但 AI 给出的答案可能是错误的、过时的,有的时候反而不如在网上搜索来的直接。所以 AI 目前也替代不了程序员,更多的是效率工具。咱们还是要努力提升自己的知识水平,提升对网上的内容以及 AI 生成内容的判断力。


可访问我的 Github:https://github.com/liyupi ,了解更多技术和项目内容。

相关文章:

  • Canonical Juju 的一个奇怪编排部署
  • 哈喽GPT-4o——对GPT-4o 编程的思考与看法
  • 2024人工智能指数报告(二):技术性能
  • Linux 中断实验
  • 20240619火车头采集器GPT改写插件介绍文档
  • 速盾:使用 CDN 可以隐藏 IP 吗?该怎样应对防御?
  • 【PyTorch 新手基础】Regularization -- 减轻过拟合 overfitting
  • Talk|香港科技大学冯宸:高效自主的大尺度场景空中覆盖与重建
  • unity 打包PC安装包中常见文件的功能
  • MFC基础学习应用
  • STM32多功能交通灯系统:从原理到实现
  • 从boost库到时间戳
  • HTML5 WebSocket:实时通信的新篇章
  • 群晖虚拟化创建存储池失败问题解决
  • IIS配置網站登錄驗證,禁止匿名登陸
  • JS中 map, filter, some, every, forEach, for in, for of 用法总结
  • centos安装java运行环境jdk+tomcat
  • learning koa2.x
  • Redis中的lru算法实现
  • SpringCloud集成分布式事务LCN (一)
  • 从tcpdump抓包看TCP/IP协议
  • 仿天猫超市收藏抛物线动画工具库
  • 基于游标的分页接口实现
  • 融云开发漫谈:你是否了解Go语言并发编程的第一要义?
  • 删除表内多余的重复数据
  • 设计模式走一遍---观察者模式
  • 数据结构java版之冒泡排序及优化
  • 学习HTTP相关知识笔记
  • 在Docker Swarm上部署Apache Storm:第1部分
  • 在Unity中实现一个简单的消息管理器
  • #mysql 8.0 踩坑日记
  • #VERDI# 关于如何查看FSM状态机的方法
  • (13)Hive调优——动态分区导致的小文件问题
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (Demo分享)利用原生JavaScript-随机数-实现做一个烟花案例
  • (DFS + 剪枝)【洛谷P1731】 [NOI1999] 生日蛋糕
  • (PHP)设置修改 Apache 文件根目录 (Document Root)(转帖)
  • (附源码)spring boot基于小程序酒店疫情系统 毕业设计 091931
  • (函数)颠倒字符串顺序(C语言)
  • (精确度,召回率,真阳性,假阳性)ACC、敏感性、特异性等 ROC指标
  • (力扣)1314.矩阵区域和
  • (欧拉)openEuler系统添加网卡文件配置流程、(欧拉)openEuler系统手动配置ipv6地址流程、(欧拉)openEuler系统网络管理说明
  • (十六)一篇文章学会Java的常用API
  • (四)事件系统
  • (一)Kafka 安全之使用 SASL 进行身份验证 —— JAAS 配置、SASL 配置
  • (转)LINQ之路
  • .mat 文件的加载与创建 矩阵变图像? ∈ Matlab 使用笔记
  • .NET : 在VS2008中计算代码度量值
  • .Net Core 中间件与过滤器
  • .net6 core Worker Service项目,使用Exchange Web Services (EWS) 分页获取电子邮件收件箱列表,邮件信息字段
  • .netcore 获取appsettings
  • .NET中的Exception处理(C#)
  • .sh文件怎么运行_创建优化的Go镜像文件以及踩过的坑
  • /3GB和/USERVA开关
  • /etc/sudoer文件配置简析