当前位置: 首页 > news >正文

面壁智能发布端侧 AI 应用开发平台;快手推出肖像动画技术 LivePortrait丨 RTE 开发者日报

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、快手科技团队推出 AI 肖像动画技术 LivePortrait

快手科技团队推出 LivePortrait,这是一种基于隐式关键点框架的高效肖像动画技术。它能从单张源图像和驱动视频生成生动的视频,展现出优秀的泛化能力、可控性和效率。

研究者通过扩大训练数据集、采用混合训练策略、升级网络架构等方法提升了生成质量。LivePortrait 在 RTX 4090 GPU 上每帧仅需 12.8 毫秒,效果媲美扩散模型方法。该项目的推理代码和模型已开源。(@AI 科技评论)

2、面壁智能发布端侧 AI 应用开发平台 MobileCPM

借助阿里云在 WAIC 2024 期间举办的论坛,面壁智能发布了一个叫 MobileCPM 的套件平台,开发者可以通过这一平台提供的 SDK 套件「一键开发基于端侧大模型的 App」,面壁智能首席科学家刘知远在发布会中称,该平台接入了「非常多端侧通用模型」。

面壁智能此前已发布多款适用于小型智能设备的端侧小模型。6 月 11 日的苹果开发者大会上,苹果提出 Apple Intelligence 概念,将未来用户在端侧体验到的 AI 解决方案划分为端侧和云端两层,其中云端接入 GPT 等第三方模型,端侧主要使用苹果自研的小模型。

面壁智能 CEO 李大海对「新皮层」称,未来端侧模型是外部厂商提供还是设备厂商自己做是个开放性问题,目前「大家还在探索」,而作出高品质的端侧模型并不是简单的事,如果设备厂商选择自研,意味着他们也要像国内第一梯队的基础大模型初创公司那样配备「100 人起,核心至少也得大几十人」的 AI 团队。(@新皮层 NewNewThing)

3、支付宝推出「碰一下」支付新方式,无需展示付款码即可完成支付

在支付宝开放日上,支付宝宣布升级条码支付体验,推出「支付宝碰一下」,用户无需展示付款码,解锁手机碰一下商家收款设备,最快一步完成支付。

官方表示,相比已有的支付宝「扫一下」,「碰一下」更加简单直接。「碰一下」和「扫一下」都属于条码支付,区别在于「扫一下」使用了手机上的显示屏和摄像头,「碰一下」使用了手机上的近场通信技术,在使用上述传感器完成交互后,支付在网络端完成,两者具有同等安全性。同时支付宝依旧承诺「你敢付我敢赔」。(@爱范儿)

4、腾讯智影小程序上线 AI 视频功能,日漫风格功能限时免费

腾讯智影小程序上线了智影 AI 视频功能,可以一键生成风格化视频,目前有日漫风格可选,此功能限时免费(未公布收费价格)。视频风格化就是在原视频的基础上进行风格化处理,官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。只需导入视频并一键「变身」,就能快速生成风格化视频(支持 10s 视频),智影 AI 提供了多种模板,让视频更加多样化。

据 IT 之家此前报道,腾讯智影上线于 2023 年 3 月,是一款集成了 AI 创作能力的智能创作工具,提供虚拟数字人、文本配音、智能去水印、文章转视频、模板创作、在线视频剪辑等功能。(@IT 之家)

5、苹果首款支持 Apple Intelligence 的智能家居设备将是一款桌面机器人

7 月 8 日消息,苹果备受期待的「Apple Intelligence」功能今年晚些时候将首先登陆 iPhone、iPad 和 Mac 设备,而包括 HomePod 智能音箱、Apple Watch 手表和 Vision Pro 头显等产品将暂时无缘这个功能,其中也包括备受关注的新版 Siri 语音助手。

现据彭博社记者马克・古尔曼 (Mark Gurman) 透露,苹果首款搭载 Apple Intelligence 功能的智能家居设备将是一款全新的桌面机器人。

古尔曼表示,期待在现有苹果智能家居设备上使用 Apple Intelligence 功能的用户可能要失望了,他们需要等待苹果推出 AI 驱动的桌面机器人产品。早在今年 4 月,古尔曼就首次曝光了苹果的机器人项目,其中桌面机器人是开发进度最快的项目之一,但仍处于早期阶段。(@IT 之家)

02 有态度的观点

1、红杉美国合伙人:AI 不会取代软件,而是带来新的商业模式和机会

AI 技术正处于转折点,将创造新商业模式和机会,特别是在服务行业,如法律和会计等领域,这些行业的文本处理工作流程非常适合 AI 技术应用。稳定的基础 AI 模型对整个 AI 生态系统发展至关重要,这种稳定性支持企业更有效地预测和构建应用程序,推动工程化优化和认知架构设计。尽管 AI 将带来新的服务模式,人际关系和实际执行任务将继续依赖人工,不会被 AI 完全取代。(@有新 Newin)

2、Anthropic 首席执行官:未来三年内,AI 大模型训练成本将上升至百亿甚至千亿美元

7 月 8 日消息,据外媒报道,AI 初创公司 Anthropic 的首席执行官 Dario Amodei 近期接受播客节目采访时表示,目前像 GPT-4o 这样的模型训练成本约为 1 亿美元,而目前正在开发的 AI 大模型训练成本可能高达 10 亿美元(约 72.94 亿元人民币)。当然,10 亿美元还不是「终点」。Dario Amodei 作出预测,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元(约 7294.28 亿元人民币)。Dario Amodei 还谈到了对通用人工智能(AGI)的看法:AGI「不会突然实现」,而是一个渐进的发展过程。新的模型建立在过去的模型的发展之上,就像人类孩童不断学习新知识。

报道称,若 AI 模型算力每年增长 10 倍,那么也可以据此推测训练模型所需的硬件也至少强大 10 倍。因此,硬件很可能是训练 AI 模型中最大的成本驱动因素。早在 2023 年,ChatGPT 就需要超过 30000 个 GPU,而 OpenAI 首席执行官阿尔特曼也曾证实,训练 GPT-4 的成本为 1 亿美元。(@凤凰科技)

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【C++中resize和reserve的区别】
  • qt 线程举例
  • 基层医院、专科医院云HIS系统,支持电子病历四级,全套源码交付
  • MeEdu网校系统搜索功能问题处理
  • 【网络安全】Host碰撞漏洞原理+工具+脚本
  • codeforces round 956 div2
  • 使用 mongo2neo4j 和 SemSpect 通过各种方式进行图探索
  • 超市收银系统源码
  • 通过 Parallels Desktop 虚拟机安装运行 macOS 15 Sequoia
  • 通用后台管理(二)——项目搭建
  • go mod 依赖管理补充2
  • 手写MyBatis
  • 20W+喜爱的Pathview网页版 | 整合表达谱数据KEGG通路可视化
  • 大模型备案全网最详细流程说明【附附件】
  • SpringBootV12和mybatis全部知识点
  • 【挥舞JS】JS实现继承,封装一个extends方法
  • 【刷算法】求1+2+3+...+n
  • 2018天猫双11|这就是阿里云!不止有新技术,更有温暖的社会力量
  • CSS 提示工具(Tooltip)
  • Debian下无root权限使用Python访问Oracle
  • github从入门到放弃(1)
  • Linux编程学习笔记 | Linux IO学习[1] - 文件IO
  • Linux后台研发超实用命令总结
  • Odoo domain写法及运用
  • Swift 中的尾递归和蹦床
  • vue从入门到进阶:计算属性computed与侦听器watch(三)
  • 阿里云ubuntu14.04 Nginx反向代理Nodejs
  • 产品三维模型在线预览
  • 关于Flux,Vuex,Redux的思考
  • 基于MaxCompute打造轻盈的人人车移动端数据平台
  • 前端自动化解决方案
  • 数据科学 第 3 章 11 字符串处理
  • 腾讯大梁:DevOps最后一棒,有效构建海量运营的持续反馈能力
  • 提升用户体验的利器——使用Vue-Occupy实现占位效果
  • 我的面试准备过程--容器(更新中)
  • 写给高年级小学生看的《Bash 指南》
  • 用 vue 组件自定义 v-model, 实现一个 Tab 组件。
  • 从如何停掉 Promise 链说起
  • 继 XDL 之后,阿里妈妈开源大规模分布式图表征学习框架 Euler ...
  • ​猴子吃桃问题:每天都吃了前一天剩下的一半多一个。
  • # Redis 入门到精通(七)-- redis 删除策略
  • # windows 运行框输入mrt提示错误:Windows 找不到文件‘mrt‘。请确定文件名是否正确后,再试一次
  • #gStore-weekly | gStore最新版本1.0之三角形计数函数的使用
  • #ubuntu# #git# repository git config --global --add safe.directory
  • (003)SlickEdit Unity的补全
  • (02)Unity使用在线AI大模型(调用Python)
  • (4)Elastix图像配准:3D图像
  • (篇九)MySQL常用内置函数
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (全注解开发)学习Spring-MVC的第三天
  • (十八)SpringBoot之发送QQ邮件
  • (转)Android中使用ormlite实现持久化(一)--HelloOrmLite
  • .bat批处理(一):@echo off
  • .NET MVC、 WebAPI、 WebService【ws】、NVVM、WCF、Remoting
  • .NET 中选择合适的文件打开模式(CreateNew, Create, Open, OpenOrCreate, Truncate, Append)