当前位置: 首页 > news >正文

智能媒体管理(IMM)视频分析中明星识别介绍

一、导语

        智能媒体管理已经支持了视频分析功能,用户可以方便的使用该功能对存储在oss上的视频进行全面的分析。本文主要介绍利用智能媒体管理的视频分析功能来提取视频中的明星信息。

二、功能介绍

        智能媒体管理的视频分析包含了明星识别功能,可以帮助用户抽取出视频中出现的明星信息。包括明星出现的时间戳,明星脸出现的位置,以及明星的名字及可信度。视频中明星识别不仅仅是对每一张图片中的明星进行识别,还进行了后续的分析处理,提高识别的准确率。

三、 功能实现

        基于智能媒体管理的视频功能,可以方便的对存储在oss上的视频进行分析、提取元信息。视频分析功能可以通过配置不同的分析器进行不同内容的分析。下面详细介绍如何利用智能媒体管理的视频分析功能来抽取视频中的明星信息。

        首先需要有阿里云的账号,并且开通IMM(智能媒体管理)功能,关于账号和开通IMM的功能请参考相关文章。

        创建一个 AllMedia 类型的 project,可以使用SDK或者在控制台创建。通过工单提出需要分析的类型,我们会配置好需要的功能。

        然后需要为改 Project 的使用的 ServiceRole 添加 AliyunIMMFullAccess 权限,添加方法请参考 RAM 相关文档。完成之后就可以提交视频进行分析。具体提交请参考 IMM 相关文档。等待视频分析完成就可以拿到明星的结果了。

四、效果展示

        如果使用了task模式分析视频,视频结果会记录在用户提供的oss目录内,是json格式的结构化数据,用户可以根据需要选取需要的信息。为了方便展示,IMM提供了一套展示功能,用户可以直接点击该链接浏览。效果如下:

        这里是一个应用展示,左侧是视频播放,右侧的人物是识别出的明星,点击某个明星的图像,在上面的时间条里面显示了该明星出现的时间戳信息,根据不同的置信度显示不同的颜色,绿色分值最高,将鼠标放在时间条上会显示时间戳和置信度信息。

        分析结果的主要结构如下:

{
  "Frames": [
    {
      "SourcePosition": "00000024.000",
      "ImageUri": "oss://drive-site/demo/hkdemo/data/Gongshoudao/imgs/24.000.jpg",
      "Celebritys": [
        {
          "CelebrityName": "马云",
          "CelebrityLibraryName": "Stars",
          "CelebrityConfidence": 0.9184891,
          "CelebrityBoundary": {
            "Width": 173,
            "Height": 222,
            "Left": 512,
            "Top": 440
          }
        }
      ]
    }
  ],
  "Meta": {
    "Width": 1280,
    "Height": 720,
    "Duration": 1343.042167,
    "Size": 167386498,
    "Frames": 32233
  }
}

        这里只显示了一帧的信息,除了明星还是可以识别政治人物和敏感人物等信息。

        明星信息可以在多种领域应用,视频分割、精彩剪辑、广告植入、推荐服务、隐私保护以及其他一些领域。

五、说明

       目前还是在公测阶段,AllMedia 类型的 project暂时无法创建出来,可以先创建一个其他类型的 Project,然后通过我们修改成 AllMedia 类型,后面正式上线之后会放开。

相关文章:

  • 云大使推广中的常见热门问题
  • mysql5.6备份mysqldump提示错误
  • Canal 源码走读
  • 爬虫进阶 -- 神级程序员:让你的爬虫就像人类的用户行为!
  • Redis提升并发能力 | 从0开始构建SpringCloud微服务(2)
  • HTTP 简介
  • 学习正则表达式
  • Go test 命令工作原理
  • 监控Linux系统状态、手动增加swap空间
  • React16时代,该用什么姿势写 React ?
  • 今年的LC3大会没了?
  • 戴姆勒与宝马抱团开发自动驾驶 新旧车企大战在即
  • TableStore多元索路由探微
  • JPress v2.0-rc.4 发布,修复插件安装卸载的若干问题
  • 002_python基础语录
  • 【译】JS基础算法脚本:字符串结尾
  • 【399天】跃迁之路——程序员高效学习方法论探索系列(实验阶段156-2018.03.11)...
  • 【笔记】你不知道的JS读书笔记——Promise
  • Angular Elements 及其运作原理
  • ESLint简单操作
  • Java编程基础24——递归练习
  • magento 货币换算
  • Python - 闭包Closure
  • Spark学习笔记之相关记录
  • Terraform入门 - 3. 变更基础设施
  • 当SetTimeout遇到了字符串
  • 力扣(LeetCode)965
  • 使用API自动生成工具优化前端工作流
  • 一个JAVA程序员成长之路分享
  • - 转 Ext2.0 form使用实例
  • Java总结 - String - 这篇请使劲喷我
  • # Apache SeaTunnel 究竟是什么?
  • # 安徽锐锋科技IDMS系统简介
  • #define与typedef区别
  • #数学建模# 线性规划问题的Matlab求解
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • $.proxy和$.extend
  • (动手学习深度学习)第13章 计算机视觉---微调
  • (二)构建dubbo分布式平台-平台功能导图
  • (已解决)vue+element-ui实现个人中心,仿照原神
  • (转)ABI是什么
  • (转)mysql使用Navicat 导出和导入数据库
  • ***微信公众号支付+微信H5支付+微信扫码支付+小程序支付+APP微信支付解决方案总结...
  • .NET 8 中引入新的 IHostedLifecycleService 接口 实现定时任务
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .Net 代码性能 - (1)
  • .NET/C# 利用 Walterlv.WeakEvents 高性能地中转一个自定义的弱事件(可让任意 CLR 事件成为弱事件)
  • .NET开发不可不知、不可不用的辅助类(一)
  • /bin/bash^M: bad interpreter: No such file ordirectory
  • /etc/shadow字段详解
  • /var/spool/postfix/maildrop 下有大量文件
  • :“Failed to access IIS metabase”解决方法
  • ?php echo ?,?php echo Hello world!;?
  • @CacheInvalidate(name = “xxx“, key = “#results.![a+b]“,multi = true)是什么意思
  • []利用定点式具实现:文件读取,完成不同进制之间的