当前位置: 首页 > news >正文

20240809 每日AI必读资讯

乒乓球AI机器人赢了人类!正反手灵活转换,擦网球高球都能接 

- 谷歌发布首个达到人类竞技水平的机器人Agent,挑战乒乓球赛场。

- 机器人通过学习大量乒乓球状态数据,掌握了正手上旋球、反手瞄准等技能,展现出高速运动和实时精确性。

- 机器人在与不同技能水平选手的比赛中取得一定成绩,展现出与人类对手直接竞争的能力。

🔗 https://sites.google.com/view/competitive-robot-table-tennis/home

🔗 详情:https://blog.csdn.net/m0_46163918/article/details/141068947

 通义千问推出专门的数学语言模型:Qwen2-Math 

- 性能超越GPT-4o、Claude-3.5等

- Qwen2-Math 包括 1.5B、7B 和 72B 。 是基于 Qwen2 LLM 构建的专门针对数学解题的模型。

- 在多个数学基准测试中数学能力显著超越了开源模型包括Llama-3.1-405B,甚至超过了闭源模型 (包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro )。

苹果发布一种新的图像和视频生成方法:Matryoshka Diffusion Models (MDM)

- 可以理解为“套娃扩散模型”。名字来源于俄罗斯套娃,因为它像套娃一样,把小的结构嵌套在大的结构里。

- MDM 能够在不同清晰度下同时处理图像,比如它可以同时生成低清晰度的草图和高清晰度的细节部分。 这种方法让整个过程更快,而且生成的图像质量更高。

- 用于生成高质量图像和视频的模型面临很大的计算和优化难题。大多数方法要么在图像的像素层面上逐步生成,要么通过先训练一个压缩图像的模型,再在低分辨率的图像上进行处理。

- MDM 的创新在于它能同时处理不同分辨率的图像。就像你在画一幅画,先画小的细节,然后再画大的背景,MDM 就是这样同时处理不同层次的内容。

- 训练过程是从低分辨率到高分辨率逐步进行的,这让生成高分辨率图像和视频变得更加高效。

- MDM 不仅限于静态图像生成,还可以扩展到视频生成领域,生成符合文本描述的动态视频序列。

- 研究表明,这种方法可以生成分辨率高达 1024x1024 像素的图像,并且即使使用相对较少的数据,它也能很好地生成出符合要求的图像。

🔗GitHub:https://github.com/apple/ml-mdm

🔗论文:https://arxiv.org/pdf/2310.15111

 字节跳动AI助手豆包app、电脑版上线音乐生成功能

- 用户可在豆包app或电脑版中生成独特歌曲,选择曲风、氛围和人声,歌词限制在200字以内。

- 提供11种不同音乐风格和多种情绪状态选择,包括民谣、嘻哈、R&B,用户可选择男声或女声演唱。

- 用户可一键生成完整歌词,下载并分享生成的歌曲和封面。音乐生成功能仍在不断完善中,豆包鼓励用户用音乐分享故事,激发创造力。

LSLM:一种新的语音模型 

- 由上海交通大学X-LANCE人工智能实验室和字节跳动联合开发的一种新的语言模型

- 能够在说话的同时也能听到外界的声音,从而支持实时的语音交互。

- 而且还可以随时打断它,即时是在嘈杂的环境中也能工作。

🔗项目地址:https://ziyang.tech/LSLM/

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 大模型快速部署,以浪潮源2.0为例
  • linux中的库的概念、动态库与静态库
  • 如何在 Windows 11/10/8/7 中恢复已删除和未保存的记事本文本文件
  • 爬虫解析代码结构
  • 培训第二十一天(mysql用户创建与授权、角色创建)
  • 【踩坑】TypeScript 中使用 sass 动态设置样式
  • 李宏毅老师机器学习常见英语词汇
  • 数值分析【3】
  • 数学建模--蒙特卡洛算法之电子管更换刀片寿命问题
  • 国产芯上运行TinyMaxi轻量级的神经网络推理库-米尔基于芯驰D9国产商显板
  • 【Qt】多种控件实现“hello world“
  • 从今天开始深入学习 SQL 优化
  • 搭建 Web 群集Haproxy
  • 安装pointnet踩坑记录(情绪篇)
  • 学习c语言第24天(练习)
  • LeetCode18.四数之和 JavaScript
  • npx命令介绍
  • open-falcon 开发笔记(一):从零开始搭建虚拟服务器和监测环境
  • web标准化(下)
  • 回顾 Swift 多平台移植进度 #2
  • 基于游标的分页接口实现
  • 聊聊hikari连接池的leakDetectionThreshold
  • 使用Swoole加速Laravel(正式环境中)
  • 使用权重正则化较少模型过拟合
  • 我从编程教室毕业
  • 我与Jetbrains的这些年
  • 【云吞铺子】性能抖动剖析(二)
  • python最赚钱的4个方向,你最心动的是哪个?
  • ​​​​​​​sokit v1.3抓手机应用socket数据包: Socket是传输控制层协议,WebSocket是应用层协议。
  • ​io --- 处理流的核心工具​
  • ​猴子吃桃问题:每天都吃了前一天剩下的一半多一个。
  • # Redis 入门到精通(七)-- redis 删除策略
  • #include<初见C语言之指针(5)>
  • #绘制圆心_R语言——绘制一个诚意满满的圆 祝你2021圆圆满满
  • (20)目标检测算法之YOLOv5计算预选框、详解anchor计算
  • (2024)docker-compose实战 (8)部署LAMP项目(最终版)
  • (BAT向)Java岗常问高频面试汇总:MyBatis 微服务 Spring 分布式 MySQL等(1)
  • (TOJ2804)Even? Odd?
  • (附源码)spring boot基于Java的电影院售票与管理系统毕业设计 011449
  • (十二)springboot实战——SSE服务推送事件案例实现
  • (四)js前端开发中设计模式之工厂方法模式
  • (图)IntelliTrace Tools 跟踪云端程序
  • (原)记一次CentOS7 磁盘空间大小异常的解决过程
  • (转)Linux整合apache和tomcat构建Web服务器
  • **PHP分步表单提交思路(分页表单提交)
  • .babyk勒索病毒解析:恶意更新如何威胁您的数据安全
  • .NET Core 版本不支持的问题
  • .NET Framework 和 .NET Core 在默认情况下垃圾回收(GC)机制的不同(局部变量部分)
  • .NET 反射 Reflect
  • .net 验证控件和javaScript的冲突问题
  • .NET8.0 AOT 经验分享 FreeSql/FreeRedis/FreeScheduler 均已通过测试
  • .netcore 6.0/7.0项目迁移至.netcore 8.0 注意事项
  • .Net调用Java编写的WebServices返回值为Null的解决方法(SoapUI工具测试有返回值)
  • .net中应用SQL缓存(实例使用)
  • @data注解_SpringBoot 使用WebSocket打造在线聊天室(基于注解)