当前位置: 首页 > news >正文

参会记录|2024 中国多媒体大会

前言:2024年7月24日-26日,前往宁夏银川参加今年的中国多媒体大会,切实感受AI在各行各业的全面开花🌼,现对本次会议的收获进行总结记录。

中国多媒体大会 ChinaMM (csig.org.cn)

主要收听的专题的报告如下:

1: 智能艺术与设计Al Art & Design
2: AIGC与媒体内容安全
3: AI4Food:食品和健康计算

此外,还收听了一些零散的学术报告,以及快手、华为等企业的讲座。


在这里插入图片描述

通过本次大会,可谓收获满满,拓宽了认知边界, 以下是我本人结合以往研究经历总结的AI赋能各大场景的现状,可以看到在各行各业,AI都在散发着自己的光芒,未来,AI将会深入我们的生活,让我们的生活更加便捷。

在这里插入图片描述

记不清是哪位老师说的,场景化是AI应用的关键,在会场时,这种感觉尤其强烈,AI正在改变我们的生活,也希望我们正在进行的研究能够使得AI变得更加美好!

在这里插入图片描述


额外收获

  • 通用图像分割模型:Meta 发布的 Segment Anything Model(SAM)
  • 视频生成模型:Sora、Pika、Runway

中科深健:融合前沿食品视觉识别技术理念, 围绕食堂多场景智慧营养餐厅应用,研发了菜品识别结算系统、餐盘识别结算系统、 深健智慧食堂管理系统、用户健康管理app等多个软硬件系统。PS:体验了一下他们的菜品识别营养评估系统,由于我国菜品丰富,在识别准确率方面该系统还有很大的提升空间。

在这里插入图片描述

在这里插入图片描述

参考资料

  1. Food Recommendation: Framework, Existing Solutions, and Challenges. TMM, 2020.
  2. “健康+AI”生态创新大赛启幕 让全球看见“数智伊利”新力量-新华网 (xinhuanet.com)
  3. [2308.14346] DISC-MedLLM: Bridging General Large Language Models and Real-World Medical Consultation (arxiv.org)
  4. [2309.17421] The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision) (arxiv.org)
  5. [2312.04461] PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding (arxiv.org)
  6. [2401.07519] InstantID: Zero-shot Identity-Preserving Generation in Seconds (arxiv.org)
  7. [2406.10261] FoodSky: A Food-oriented Large Language Model that Passes the Chef and Dietetic Examination (arxiv.org)
  8. [2407.05161] A Survey of Datasets for Information Diffusion Tasks (arxiv.org)
  9. HalluciDoctor: Mitigating Hallucinatory Toxicity in Visual Instruction Data. CVPR, 2024

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • leetcode-vector
  • django如何更新数据库字段并与数据库保持同步?
  • Redis 单机和集群环境部署教程
  • React前端面试基础(一)
  • LeetCode:2110. 股票平滑下跌阶段的数目(数学 Java)
  • 【Rust光年纪】构建高效终端用户界面:Rust库全面解析
  • 【ARM】应用ArmDS移植最小FreeRTOS系统
  • Visual Studio 调试时加载符号慢
  • Web-server日志分析命令
  • Qt自定义TreeWidget,实现展开折叠按钮在右侧,且一条竖直线上对齐
  • 通过指令深入了解Linux 3
  • 基于深度学习的工业系统仿真
  • 网络安全测试工具Burp Suite基本使用
  • AWS Lambda 十年回顾:功能总览、更新记录与入门指南
  • 【微信小程序开发】——奶茶点餐小程序的制作(二)
  • 收藏网友的 源程序下载网
  • 【React系列】如何构建React应用程序
  • 2017年终总结、随想
  • Dubbo 整合 Pinpoint 做分布式服务请求跟踪
  • javascript面向对象之创建对象
  • Vim Clutch | 面向脚踏板编程……
  • Vue官网教程学习过程中值得记录的一些事情
  • 编写符合Python风格的对象
  • 关于extract.autodesk.io的一些说明
  • 看图轻松理解数据结构与算法系列(基于数组的栈)
  • 前嗅ForeSpider中数据浏览界面介绍
  • 一、python与pycharm的安装
  • 优秀架构师必须掌握的架构思维
  • 在GitHub多个账号上使用不同的SSH的配置方法
  • PostgreSQL之连接数修改
  • #C++ 智能指针 std::unique_ptr 、std::shared_ptr 和 std::weak_ptr
  • $refs 、$nextTic、动态组件、name的使用
  • (27)4.8 习题课
  • (9)YOLO-Pose:使用对象关键点相似性损失增强多人姿态估计的增强版YOLO
  • (9)目标检测_SSD的原理
  • (苍穹外卖)day03菜品管理
  • (太强大了) - Linux 性能监控、测试、优化工具
  • (转)JAVA中的堆栈
  • (转)scrum常见工具列表
  • **登录+JWT+异常处理+拦截器+ThreadLocal-开发思想与代码实现**
  • .\OBJ\test1.axf: Error: L6230W: Ignoring --entry command. Cannot find argumen 'Reset_Handler'
  • .NET 4.0中使用内存映射文件实现进程通讯
  • .NET 5种线程安全集合
  • .NET 服务 ServiceController
  • .NET 自定义中间件 判断是否存在 AllowAnonymousAttribute 特性 来判断是否需要身份验证
  • .NET学习教程二——.net基础定义+VS常用设置
  • .net中生成excel后调整宽度
  • .pyc文件是什么?
  • @transaction 提交事务_【读源码】剖析TCCTransaction事务提交实现细节
  • [ CTF ] WriteUp-2022年春秋杯网络安全联赛-冬季赛
  • [AI 大模型] 百度 文心一言
  • [APIO2012] 派遣 dispatching
  • [C++]C++基础知识概述
  • [Codeforces] combinatorics (R1600) Part.2
  • [EULAR文摘] 脊柱放射学持续进展是否显著影响关节功能