当前位置：首页 > news >正文

搜索进入AI蓝海时代：谁在成为新玩家？

news 来源：原创 2024/9/28 3:27:36

有新人入场，也有老人退场。这个原本只有百度、360、谷歌、夸克等传统搜索企业的战场上，一众新的玩家正在踊跃出现，在AI的加持下，他们看到了另一种搜索业务发展且变现的可能，看到了另一个蓝海市场。

作者|思杭

编辑|皮爷

出品|产业家

我们一直使用的搜索，到底是什么样子的？

根据一份微软的调查数据显示，人们每天使用搜索的频次近乎超过百亿，问题覆盖方方面面，从天文到地理，从人文到赛博朋克等等。但在这些问题中，大约有一半问题都没有答案。

激发人们去感受探索的快乐和创造的力量，并驾驭世界知识，这是过去很长一段时间里搜索引擎被赋予的使命。更直白地说，搜索引擎和浏览器就是我们探索世界的最大入口。

但如今，这个模式正在发生微妙的变化。

在搜索引擎发展的数十载里，尽管一部分问题已经得到解决，比如搜索技术和商业模式，但有一个问题却始终困扰着海内外的搜索引擎巨头——“并不是所有问题都有答案”。

至于其中的原因，在他们看来是，人们所问的问题，并非是在搜索引擎设计过程中“定制”的那些问题，也就是说技术人员不会把所有人们要问的问题都想到，再输入给搜索引擎。

搜索引擎只可以用来回答一些简单的问题，比如2+2=4；再或者找网页也是它的强项。但对于复杂问题的回答，和复杂任务的处理，却力不从心。

而在今天，AI大模型的出现，对搜索引擎而言，则是出现一种新的想象力。这也是为什么微软、谷歌都在竞相推出AI搜索的主要原因。实际上，在搜索引擎领域，对于自然语言的探索，早在21世纪初期就开始了。只是受限于当时的人工智能发展，还未出现一个平台或一种技术，能对自然语言的理解达到有所突破。

那么，站在当下大模型以及AIGC应用爆发的风口下，AI又能赋予搜索引擎怎样的想象力？在国内，对百度、360、天工以及其它玩家，新的搜索形态到底意味着什么？而从商业模式而言，传统搜索固有的广告形态是否又在受到冲击？

这些变化正在发生。从某种程度来看，它不仅是搜索本身形态的变化，更是一面镜子，是一场其背后对应的商业模式、入场玩家的新排位战。

一、从“弄潮儿”到“破冰者”，是两波人

“在未来，基于语音识别技术的发展，搜索体验可以完全脱离搜索框。”早在2018年，原百度副总裁吴海锋就在媒体上发表文章，并站在“无框、无界和无极”三个角度阐释了AI搜索的未来。

语音识别技术也恰好是在这一年有所突破。那一年，百度推出了有语音识别和交互功能的小度智能音箱；也是在那一年的世界人工智能大会上，开始尝试用机器完成同声传译，提供该技术的厂商分别是腾讯和科大讯飞。

此后，各种智能设备层出不穷，其种类和功能也不断推陈出新。大家都在研究如何让自家的智能设备更能听得懂人话，而在这过程中，国内的语音识别技术就更是突飞猛进。

这也正应了吴海锋当年的观点——“无界强调无边界，任何智能设备都可以通过‘搜索入口’调用”。而站在当时的时代下，它所对应的则是一个更大的AI搜索的未来，即通过自然语言就可以完成传统搜索引擎的输入和输出。

听起来，这正是像如今文心一言、通义千问和kimi等AIGC应用所做的事。不同的是，AIGC重在“创作”，或者说“创意”；而搜索则需要绝对的精准。

从2018年到今天，过去六年的时间里，已经有无数的智能设备尝试了用自然语言来完成搜索这件事，它们也都实现了在各种场景下的应用和落地，比如汽车驾驶舱内的各种AI小助理，再比如智能家居甚至全屋智能的AI家电们。

站在助推语音识别技术发展的角度，它们都可以算作是AI搜索的“弄潮儿”。

可以说，两者是相互促进的。智能设备在推动语音识别技术的发展，反过来，自然语言处理、语言识别技术的进步，也在推动着智能设备的发展。比如在前不久的百度开发者大会，李彦宏现场演示小度，从其智能水平就可以看出，如今的小度已不同于之前的小度。这是用大模型重构之后的小度。

与此同时，它也是百度在AI搜索方面的尝试。而在软件侧，互联网厂商则几乎是在每一个移动端都嵌入了AI搜索，通过改变人们使用搜索的习惯，来试图重构搜索引擎。其中最为典型的尝试是，几乎可以代替搜索引擎的微信，和可以称得上第二个“百科全书”的百度文库。

然而就在AI到来之后，被认为“早已成定局”的搜索市场在2024年初发生了一些小变化。

多年以来，在全球搜索引擎市场，谷歌一直都居于霸主位置上，其市场占有率也稳居90%左右，留下剩余的10%给微软Bing等其他搜索引擎分割。然而，到了2024年初，据StatCounter的最新数据，微软在美国市场份额上涨了1.52%；谷歌则下降了1.5%。

这份数据统计时间为2023年2月到2024年1月。而就在一年前的2023年2月，微软CEO宣布其搜索引擎Bing正式接入ChatGPT。

一个问题被随之摆到桌面上：大模型时代，AI是否会改变搜索引擎的市场格局？如果是，又会如何改变？

2023年，海外一家以AI搜索起家的初创公司，在成立仅一年的时间里，就拿到了两笔巨额融资，且估值达5亿美元，甚至差点儿撼动谷歌搜索引擎巨头的位置。

据Similarweb数据，截至2023年10月25日，该搜索引擎的网页端周度访问量由275万增加至1,113万，增长3倍；而到了今年2月，其用户数甚至达到5000万。

这就是去年火爆一时的Perplexity，创始团队不仅有前OpenAI研究员，还有Meta研究科学家，以及Perplexity首席技术官等。

那么，一个纯技术出身的初创公司，还没有任何搜索相关的背景，Perplexity是如何做到这个成绩的？

首先，对于毫无搜索相关背景这一点，Perplexity则非常聪明地选择直接调用谷歌和微软必应等搜索引擎的API，可谓是站在巨人的肩膀上“看”世界，这同时也保证了搜索的实时性。

另一方面，这也是AI搜索需要克服的一大问题，即幻觉问题。对此，Perplexity的做法是通过RAG技术（检索增强生成），让AI搜索可以根据特定的问题在指定的“知识库”里寻找答案，这也保证了它的准确性。

2024年初，一款中国版Perplexity也横空出世。其火爆程度不亚于Perplexity，推出不到两个月的时间里，就有数百万访问量。据Similarweb数据，截至2024年3月24日，该搜索网站访问量达779.3万次。

这就是前猎豹移动首席科学家闵可锐于2018年成立的秘塔科技。只是与Perplexity不同的是，秘塔的创始团队既有来自谷歌的人才，也有来自微软的人才。

然而，在国内，“破冰者”并非是仿照Perplexity的秘塔科技，而是早在2023年8月就推出天工AI搜索的昆仑万维。

另外，2024年初，昔日与百度抗衡的搜素引擎巨头360也推出AI搜索，并在应用商店上线了其移动端App。而国内最大的搜索巨头百度则是将AI搜索这一功能嵌入到百度搜索、百度文库，以及包括小度在内的所有产品当中。

而不同的入局方式，又会产生怎样的“连锁反应”？

二、从浏览器到交互框：

搜索的惊喜与短板

如今，在国内搜索市场上，出现了两大阵营。一方是以360和昆仑万维为首，推出独立的“AI搜索”应用；另一方阵营则是以百度为首，将自身的GPT能力嵌入进去。

以目前已推出“AI搜索”应用的360和昆仑万维为例。

注：天工AI（左）、360AI搜索（右）

可以看到，无论是360AI搜索还是天工AI，在输入关键词后，都有完整且系统性的文字回答。而总结归纳也正是大模型的强项。另外，加持了大模型技术的AI搜索，还有效克服了过去很长一段时间传统搜索的弊病，即生成网页太多，总是让人眼花缭乱。

在过去传统搜索中，当用户输入关键词进行搜索之后，便会跳出成千上万个答案，更繁琐的是，这些答案来自于几百个网页。用户需要一一打开网页才能找到答案，一不小心就会掉进“信息茧房”当中。

注：天工AI（左）、360AI搜索（右）

而从目前推出的AI搜索来看，天工AI和360AI搜索都是以“参考资料”或“参考链接”的方式呈现出相关网页。

如果说，传统的搜索引擎都是基于“查询（Query）”逻辑去海量互联网内容中给用户匹配答案，其底层架构均是“爬虫+索引+查询”。那么，AI搜索则添加了生成式搜索和多模态搜索，即利用大模型的归纳和推理能力来生成答案。

对于AI搜索，360创始人周鸿祎在其社交账号微信视频号中还提到了AI搜索需要突破的一点：如今的大模型对于prompt的精准性要求很高，但如果放在AI搜索中，这种精准的要求就会变得非常反人性。如何让prompt提示词从准确的一句话变成几个概括的关键词，则正是“AI搜索”要解决的问题。

从上述天工AI和360AI搜索的表现来看，很显然，实现这一突破对“AI搜索”而言并非难题。

但如果从搜索的本质出发，“激发人们去感受探索的快乐和创造的力量，并驾驭世界知识，”这是过去很长一段时间里搜索引擎被赋予的使命。

而仅仅16-17个相关网页既限制了想象空间，也并未起到“激发”人们探索欲的作用。如果仅仅从AI搜索生成的答案来看，它们所提供的“标准答案”也许并非是用户想得到的答案。一些曾经传统搜索无法回答的复杂问题，当前的AI搜索也未必能够回答。

而如果从商业模式的角度，仅提供十几个网页链接，也让“AI搜索”无法再延续过去传统搜索引擎的商业模式。

种种技术问题和商业模式等难题都预示着AI搜索并未成熟。

这也是为什么目前的搜索巨头谷歌、微软和百度选择的方式都是以嵌入式的方式入局，入口则并未发生变化。在前不久刚过去谷歌I/O大会上，谷歌宣布向美国用户推出AI Overviews服务，这是一个AI搜索服务，用户可以自行选择是否让AI来生成答案。

但在AI搜索的成熟度方面，谷歌CEO桑达尔·皮查伊也公开表示：“搜索的作用是给用户提供更多的上下文信息，可以让人们更深入地探索，而答案不准确或者有错误，这些都是我们需要不断改进的地方。”

如果抛开AI搜索目前存在的问题不谈，大模型赋予“搜索”更大的想象力则是，通过完成一个个的数据闭环，来补齐传统搜索引擎的最大短板——场景。

海内外传统的搜索引擎谷歌和百度并不缺算法、算力和数据，但对于发展AI，以及再进一步商业化落地而言，场景则是与前三者同样重要的存在。

在前Google亚洲区CMO王怀南与腾讯科技的访谈中，王怀南反思道，谷歌也存在很多问题。比如缺少数据闭环，谷歌知道用户点了什么网页，但并不知道具体做了什么。换句话说，谷歌无法追踪到一个完整的线路。但大模型可以做到。

用户向大模型问问题的过程，也是大模型在自我学习的过程。这样一来，用户在AIGC应用和AI搜索上做的每一件事，大模型都可以追踪到。这种商业闭环反过来，带给大模型的则是越来越快的成长速度。

而如果说大模型可以反哺给AI搜索更多的场景，那么对于本身已经聚齐了算法、算力、数据和场景的中型公司而言，则面临着更大的商业机会。

值得一提的是，除了中型公司，目前正在崛起的AI创业公司更是一股不可忽视的力量。以OpenAI为例，作为一个创业公司，其本身并没有足够的数据。但OpenAI背后的微软有，同样地，国内的智谱科技和百川智能，背后也站着国内的一众互联网大厂。

与此同时，这意味着，未来的AI搜索“明星公司”也许未必出现在如今的传统搜索巨头中，而是新的AI初创企业。

但一个值得思考的问题，届时，传统的搜索巨头是否会允许类似情况发生？

三、搜索，变化背后的新排位战

“现在大部分AI的应用主要是在搜索。”腾讯元宝相关负责人表示，“甚至从比例来看，这个功能的占比几乎超过70%。”

这个数据在和字节豆包、kimi、阿里通义千问、智谱清语等相关企业的沟通交流中更是得到证实。

从某种层面来看，搜索是如今AI大模型在C端的主要形态，尽管有层出不穷的智能体应用和新玩法，但基于主交互框的搜索仍然是C端用户的主要选择。相较于人们之前一问一答的形式，人们基于大模型更多能得到的是一个具备逻辑性和完整性的回答，这种回答是过去的搜索引擎所不具备的。

但从不同家的模式来看，这种搜索又带有一定程度的特殊性和企业性。比如腾讯元宝的搜索更多是把公众号文章作为信息的引用来源，而文心一言、天工等则是基于百度公开数据进行整理，对于豆包而言，其更大的数据底池来自字节产品体系的文字和视频语料，这些数据来源的不确定性也恰构成了人们在基于AI搜索提问时的不同。

也或者可以说，搜索这个功能背后，也更像是一个中国企业过去产品矩阵和底层积累的镜子，其中的展现形态、对问题回答的逻辑方式以及引用来源，恰对应的是企业过去多年的底盘。

而如果从更深层次来看，尽管如今基于AI的搜索仍然未成为主流，包括传统的如百度、360等企业也对应产出自身的copilot嵌入到自身的产品中，但能感知到的是，搜索这个功能仍然在平民化和普惠化。

如果说过去二三十年里，搜索的入场券必须是浏览器（PC或者移动），那么如今，这个入场券不再被局限形态，在交互框对应的模式背后，它未来的形态会是机器人、车机、智能家居，乃至一切可以被智能化的组件。

有新人入场，也有老人退场。这个原本只有百度、360、谷歌、夸克等等传统搜索企业的战场上，一众新的玩家已经出现，在AI的加持下，它们看到了另一种搜索业务发展且变现的可能。

虽然AI搜索实现的时间尚早，但故事的大幕已被悄然拉开。

小程序项目业务逻辑回忆1

赶紧收藏！2024 年最常见 20道设计模式面试题（九）

【机器学习300问】129、RNN如何在情感分析任务中起作用的？

信息技术课如何禁止学生玩游戏

【Gradio】Custom Components | Gradio组件关键概念后端

9.2JavaEE——JDBCTemplate的常用方法（一）excute()方法

GenICam标准（三）

【全开源】沃德会务会议管理系统（FastAdmin+ThinkPHP+Uniapp）

自然语言NLP的基础处理

VBA学习(13):获取多层文件夹内文件名并建立超链接

Rabbit MQ和Kafka的区别

docker入门配置

绝望的C#：TreeView为什么双击自动展开、折叠？双击事件的参数根本不是双击位置

深入理解Vue3.js响应式系统设计之调度执行

FlinkCDC介绍及使用

《网管员必读——网络组建》（第2版）电子课件下载

【108天】Java——《Head First Java》笔记（第1-4章）

【跃迁之路】【699天】程序员高效学习方法论探索系列（实验阶段456-2019.1.19）...

CSS盒模型深入

D - 粉碎叛乱F - 其他起义

HTML中设置input等文本框为不可操作

Java的Interrupt与线程中断

Mac 鼠须管 Rime 输入法安装五笔输入法教程

Making An Indicator With Pure CSS

mysql常用命令汇总

OpenStack安装流程（juno版）- 添加网络服务（neutron）- controller节点

Redis的resp协议

tab.js分享及浏览器兼容性问题汇总

use Google search engine

vue：响应原理

Web Storage相关

zookeeper系列（七）实战分布式命名服务

从零开始的无人驾驶 1

基于阿里云移动推送的移动应用推送模式最佳实践

可能是历史上最全的CC0版权可以免费商用的图片网站

理解 C# 泛型接口中的协变与逆变（抗变）

如何编写一个可升级的智能合约

深入体验bash on windows，在windows上搭建原生的linux开发环境，酷！

微服务框架lagom

用Node EJS写一个爬虫脚本每天定时给心爱的她发一封暖心邮件

走向全栈之MongoDB的使用

elasticsearch-head插件安装

Spark2.4.0源码分析之WorldCount 默认shuffling并行度为200(九) ...

一帧图像的Android之旅 :应用的首个绘制请求

直流电和交流电有什么区别为什么这个时候又要变成直流电呢？交流转换到直流（整流器）直流变交流（逆变器）

#NOIP 2014#day.2 T1 无限网络发射器选址

（12）目标检测_SSD基于pytorch搭建代码

(2024)docker-compose实战 (9)部署多项目环境(LAMP+react+vue+redis+mysql+nginx)

（4）logging（日志模块）

（不用互三）AI绘画：科技赋能艺术的崭新时代

（力扣题库）跳跃游戏II(c++)

（六）激光线扫描-三维重建

（十）【Jmeter】线程（Threads(Users)）之jp@gc - Stepping Thread Group (deprecated)

（万字长文）Spring的核心知识尽揽其中

(转)使用VMware vSphere标准交换机设置网络连接

一、从“弄潮儿”到“破冰者”，是两波人

二、从浏览器到交互框：

搜索的惊喜与短板

三、搜索，变化背后的新排位战

相关文章：