当前位置: 首页 > news >正文

Z Product | AI教母李飞飞AI创业,4 个月估值达 10 亿美金,目标是使AI能够像人类一样理解和推理三维物理世界

图片

Z Highlights

  • 李飞飞是斯坦福大学计算机科学教授,人工智能和计算机视觉领域的领军人物,以创建 ImageNet 数据集和推动深度学习在视觉识别中的应用而闻名于世,可谓是 AI 界的华人之光

  • 据外媒信息,李飞飞已经创建了一家名为 World Labs 的初创企业,创业方向为空间智能,创立不到 4 个月,公司估值已经达到 10 亿美金。

  • World Labs 的目标是赋予 AI 类似人类处理视觉数据的能力,使 AI 能够像人类一样理解和推理三维物理世界

01 创业仅 4 个月,估值达到 10 亿美金

李飞飞,被称为“人工智能教母”的计算机科学家,于今年 4 月份创建了一家名为 World Labs 的初创企业。这是一家专注于开发“空间智能”技术的人工智能公司。World Labs 的目标是使 AI 能够像人类一样理解和推理三维物理世界,从而在视觉数据处理方面实现突破。

World Labs 在成立后的短短几个月内,已经完成了两轮融资,估值迅速突破 10 亿美元。主要投资者包括知名风投公司 Andreessen Horowitz(a16z)和 AI 基金 Radical Ventures。最新一轮融资筹集了约 1 亿美元,显示出投资者对李飞飞创业项目的强烈兴趣

02 空间智能,AI 发展的关键一环

李飞飞的创业方向是「空间智能(Spatial Intelligence)」。她在 4 月份的一场 TED 演讲中提出了这个说法,她认为人工智能系统不应仅限于视觉识别和语言交互,还需要具备与环境互动的能力。

例如一只猫推动玻璃瓶,生物脑可以在瞬间评估物体的几何形状、空间位置及其与周围物体的关系,并预测接下来可能发生的事情。空间智能正是试图让 AI 具备这种能力,从而在三维世界中有效行动。

图片

(图源:Fei-Fei Li X 推文)

她正在和团队正在研发,能够合理推断图像和文本在三维环境中表现的算法。这些算法不仅可以理解和分析二维的信息,还可以想象和预测这些信息在三维空间中的表现形式。更进一步,这些算法可以基于这些预测采取行动。这种能力类似于人类在复杂环境中导航和交互的能力,是人工智能领域一个重要的发展方向。

World Labs 的主要目标是创造出具有这种'空间智慧'的 AI 模型,使其不仅能感知环境,还能在其中进行有意义的互动。这种技术进步预计将为自主机器人、沉浸式虚拟体验以及增强现实应用等领域带来前所未有的可能性。

03 应用前景和挑战同样巨大

在应用前景方面,李飞飞提出空间智能有望在多个行业中得到应用

医疗方面,可以通过提供实时的三维可视化来辅助外科手术,提高手术的精确度和结果。

制造业方面,空间智能通过理解组件之间的空间关系来优化生产线,提高效率并减少错误。

机器人方面,空间智能有望推动机器人在三维环境中更好地感知和行动

从视觉识别到复杂环境理解和交互的过程中,空间智能也面临不少挑战

真实世界的模糊性和不确定性:真实世界的环境中存在许多不确定因素,例如光线变化、物体外观的多样性以及遮挡等。这些因素会导致数据中的错误、不一致和缺失,给空间智能的实现带来困难

动态性:世界是不断变化的,要求 AI 模型能够实时适应这些变化。例如,自驾车或无人机导航等应用需要快速且准确地处理空间数据

计算复杂性:处理三维数据需要高计算能力,尤其是在实时应用中。这对硬件和算法的效率提出了更高的要求

多模态数据的复杂性:空间理解通常需要整合来自图像、深度传感器和地图等多种来源的信息。这些数据集通常非常庞大且复杂,给存储、处理和分析带来了挑战

Reference:

https://www.reuters.com/technology/stanford-ai-leader-fei-fei-li-building-spatial-intelligence-startup-2024-05-03/

https://www.theverge.com/2024/7/17/24200496/ai-fei-fei-li-world-labs-andreessen-horowitz-radical-ventures

https://www.ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world?subtitle=en&trigger=0s

https://x.com/drfeifei/status/1790811274684584257

来源 | Z Potentials

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 口语笔记——定语
  • 进程管理中的三态模型
  • 828华为云征文 | Flexus X实例与华为云EulerOS的Tomcat安装指南
  • 智能监测,守护未来:QY-19 GNSS位移监测站
  • 揭秘IP地址与SSL证书:构建数字世界的信任桥梁
  • LabVIEW如何自学成为专业开发者
  • yocto传递宏(bitbake传递宏)
  • 联盟营销案例:策略与成功故事
  • 【Linux】gcc/g++ 、make/Makefile、git、gdb 的使用
  • LiveQing视频点播流媒体RTMP推流服务功能-支持大疆等无人机RTMP推流支持OBS推流一步一步搭建RTMP视频流媒体服务示例
  • 日志系统前置知识
  • C++第四十六弹---解锁多线程编程的奥秘:<thread>库深入探索
  • Django+Vue3前后端分离学习(四)(登录功能实现)
  • 景联文科技:提供高质量多模态数据标注,推动智能化转型
  • Google数字车钥匙:引领汽车互动新纪元
  • “大数据应用场景”之隔壁老王(连载四)
  • AngularJS指令开发(1)——参数详解
  • docker-consul
  • java概述
  • MYSQL 的 IF 函数
  • nodejs实现webservice问题总结
  • Shell编程
  • Spring核心 Bean的高级装配
  • vue-router的history模式发布配置
  • 工作踩坑系列——https访问遇到“已阻止载入混合活动内容”
  • 解决jsp引用其他项目时出现的 cannot be resolved to a type错误
  • 小程序 setData 学问多
  • 云大使推广中的常见热门问题
  • 函数计算新功能-----支持C#函数
  • 进程与线程(三)——进程/线程间通信
  • ​io --- 处理流的核心工具​
  • ​埃文科技受邀出席2024 “数据要素×”生态大会​
  • ​软考-高级-信息系统项目管理师教程 第四版【第23章-组织通用管理-思维导图】​
  • ​用户画像从0到100的构建思路
  • #stm32驱动外设模块总结w5500模块
  • #大学#套接字
  • (03)光刻——半导体电路的绘制
  • (10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
  • (2)Java 简介
  • (2021|NIPS,扩散,无条件分数估计,条件分数估计)无分类器引导扩散
  • (day18) leetcode 204.计数质数
  • (Redis使用系列) Springboot 实现Redis消息的订阅与分布 四
  • (十)【Jmeter】线程(Threads(Users))之jp@gc - Stepping Thread Group (deprecated)
  • (十八)三元表达式和列表解析
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (转)详解PHP处理密码的几种方式
  • (转载)hibernate缓存
  • .env.development、.env.production、.env.staging
  • .MSSQLSERVER 导入导出 命令集--堪称经典,值得借鉴!
  • .net core 6 使用注解自动注入实例,无需构造注入 autowrite4net
  • .net core 控制台应用程序读取配置文件app.config
  • .Net Core 中间件与过滤器
  • .NET MAUI学习笔记——2.构建第一个程序_初级篇
  • .net 后台导出excel ,word
  • .net解析传过来的xml_DOM4J解析XML文件