当前位置: 首页 > news >正文

快讯 | 阿里开源Qwen2-VL视觉大模型:刷新多模态AI性能

图片

硅纪元快讯栏目,每日追踪AI领域的最新动态,快速汇总最新科技新闻,助您时刻紧跟行业趋势。简明扼要的呈现资讯概要,让您快速了解前沿资讯。

1分钟速览新闻

  • 阿里开源Qwen2-VL视觉大模型:刷新多模态AI性能

  • AI搜索工具Perplexity内测支付系统

  • 谷歌Gemini AI升级:文件类型解析能力大幅提升

  • 腾讯文库上线,数亿文档资源助力内容创作

  • 美国警方采用AI工具Draft One,8秒生成犯罪报告

  • Perplexity AI 推出 PPLX 支付系统,简化网购流程只需两步

  • 港大百度联合发布OpenCity模型:零样本交通预测新突破

  • 谷歌Gemini AI技能升级:支持更多文件格式,提升文档分析能力

全球AI新闻

一、阿里开源Qwen2-VL视觉大模型:刷新多模态AI性能

图片

阿里通义千问团队开源新一代视觉语言模型Qwen2-VL,其72B版本在多个视觉理解基准测试中刷新最佳表现,性能超越GPT-4o。该模型支持不同分辨率和长宽比的图片理解,能处理20分钟以上长视频,支持多语言文本理解,并可集成到手机、机器人等设备。开源模型Qwen2-VL-2B和Qwen2-VL-7B已发布,集成到Hugging Face Transformers等框架,推动多模态AI应用发展。

二、AI搜索工具Perplexity内测支付系统

图片

AI搜索网站Perplexity近日测试内部支付系统PPLX,用户可在Discover信息流中查看产品卡片并一键购买,无需跳转。Perplexity不自研大模型,而是采用GPT-3.5等进行微调,旨在打造无广告的AI搜索工具。著名企业家黄仁勋公开表示每天使用Perplexity,提升了其技术实力的认可度。

三、谷歌Gemini AI升级:文件类型解析能力大幅提升

图片

谷歌宣布其Gemini AI平台新增功能,支持更多文件类型解析。更新后,Google Workspace用户可上传多种格式文件,包括电子表格、演示文稿、图像、音频和视频,以进行数据分析、内容提取和要点总结。Gemini AI还能根据用户提示进行针对性分析,增强理解与写作能力。

四、腾讯文库上线,数亿文档资源助力内容创作

图片

腾讯文库近日正式上线,提供数亿专业文档资源,覆盖考试真题、法律合同和求职简历等。用户可快速检索所需资料,享受便捷的编辑体验。平台还整合了AI智能助手,支持深度创作、一键总结和思维导图生成,提升内容管理效率。此外,参与AMD商用电脑调查问卷,有机会获得AMD定制背包奖品。

五、美国警方采用AI工具Draft One,8秒生成犯罪报告

图片

美国警察开始运用AI工具Draft One辅助文书工作,能快速生成犯罪报告,提高报告准确性。Draft One由GPT-4支持,转录执法记录仪音频并自动生成报告。科罗拉多州柯林斯堡警察局测试显示,使用该工具后,撰写报告时间减少82%。尽管AI工具受到欢迎,但也有担忧其准确性、偏见和法律责任等问题。Axon公司表示,Draft One基于GPT-4 Turbo模型配置,进行了偏见测试,结果显示不同种族间无显著差异。目前,AI工具主要被用于轻罪报告,但一些警察局也开始尝试用于更重大案件。

六、Perplexity AI 推出 PPLX 支付系统,简化网购流程只需两步

图片

科技媒体testingcatalog报道,AI搜索网站Perplexity正在测试内部支付系统PPLX,旨在通过简化的购物流程增加用户购买率。该系统在Discover信息流中展示产品卡片,用户可以轻松查看产品评论和提示,选择数量并通过点击两下完成购买。Perplexity通过引导购买赚取佣金,首次使用时需填写支付信息,之后购物无需离开页面即可快速完成。Perplexity成立于2022年8月,专注于打造无广告的搜索体验,并获得OpenAI、Meta等支持。

七、港大百度联合发布OpenCity模型:零样本交通预测新突破

图片

香港大学与百度合作开发的OpenCity模型在零样本交通预测领域取得了显著成果。该模型融合了Transformer架构和图神经网络,有效模拟交通数据的时空依赖关系。在大规模异质性数据集上预训练后,OpenCity展现出卓越的零样本预测能力,快速适应不同交通环境,同时具备良好的可扩展性。测试结果显示,OpenCity在多个交通数据集上的性能超越了传统全样本模型,为城市交通管理和规划提供了新的技术支撑。

八、谷歌Gemini AI技能升级:支持更多文件格式,提升文档分析能力

图片

谷歌宣布对旗下Gemini AI进行技能升级,新增支持多种文件格式,包括电子表格、演示文稿、图像、音频和视频,以提供更全面的AI服务。此次升级旨在通过分析和摘录文档内容,提高用户对上传文件的理解、研究和写作能力。Gemini AI能够根据用户输入的提示词进行有针对性的分析,总结复杂主题、识别趋势,并提出改进写作和文档组织的建议。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【华为】轻松get!eNSP登录无线AC Web界面的新姿势
  • 反向迭代器:reverse_iterator的实现
  • 嵌入式Linux C应用编程指南-高级I/O(速记版)
  • 科研绘图系列:R语言组合图形绘图
  • unity游戏开放:标记物体 一目了然
  • Bean 的生命周期
  • gpt开发
  • vue如何引入element-ui
  • 有了它 一键掌握Vue新版本!
  • 【学习笔记】卫星通信NTN 3GPP标准化进展分析(六)- 参考标准
  • 基于Java的基础简单网络编程
  • Redis从入门再到入门(中)
  • 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch12 随机森林(Random Forest)
  • 算法的学习笔记—把数字翻译成字符串
  • 23. 如何使用Collections.synchronizedList()方法来创建线程安全的集合?有哪些注意事项?
  • [微信小程序] 使用ES6特性Class后出现编译异常
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • Hexo+码云+git快速搭建免费的静态Blog
  • IndexedDB
  • js数组之filter
  • Mysql数据库的条件查询语句
  • Promise面试题,控制异步流程
  • Redis的resp协议
  • Spring核心 Bean的高级装配
  • supervisor 永不挂掉的进程 安装以及使用
  • 关于Android中设置闹钟的相对比较完善的解决方案
  • 技术胖1-4季视频复习— (看视频笔记)
  • 排序算法学习笔记
  • 区块链分支循环
  • 扫描识别控件Dynamic Web TWAIN v12.2发布,改进SSL证书
  • 使用Envoy 作Sidecar Proxy的微服务模式-4.Prometheus的指标收集
  • elasticsearch-head插件安装
  • 新年再起“裁员潮”,“钢铁侠”马斯克要一举裁掉SpaceX 600余名员工 ...
  • # Redis 入门到精通(一)数据类型(4)
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #微信小程序:微信小程序常见的配置传值
  • $L^p$ 调和函数恒为零
  • (+4)2.2UML建模图
  • (12)目标检测_SSD基于pytorch搭建代码
  • (17)Hive ——MR任务的map与reduce个数由什么决定?
  • (echarts)echarts使用时重新加载数据之前的数据存留在图上的问题
  • (ISPRS,2021)具有遥感知识图谱的鲁棒深度对齐网络用于零样本和广义零样本遥感图像场景分类
  • (Redis使用系列) Springboot 在redis中使用BloomFilter布隆过滤器机制 六
  • (编程语言界的丐帮 C#).NET MD5 HASH 哈希 加密 与JAVA 互通
  • (创新)基于VMD-CNN-BiLSTM的电力负荷预测—代码+数据
  • (二)Eureka服务搭建,服务注册,服务发现
  • (附源码)springboot码头作业管理系统 毕业设计 341654
  • (简单) HDU 2612 Find a way,BFS。
  • (七)glDrawArry绘制
  • (三)docker:Dockerfile构建容器运行jar包
  • (转载)Google Chrome调试JS
  • (转载)VS2010/MFC编程入门之三十四(菜单:VS2010菜单资源详解)
  • .NET MAUI Sqlite程序应用-数据库配置(一)
  • .NET/C# 使用反射注册事件
  • .NET/C# 在代码中测量代码执行耗时的建议(比较系统性能计数器和系统时间)...