当前位置: 首页 > news >正文

参加2018之江杯全球人工智能大赛 :视频识别问答(三)

  今天处理一下问答部分。首先将文本处理一下,代码如下:

 1 import os
 2 import io
 3 import numpy as np
 4 
 5 def dealline(line):
 6     lineArr = line.split(',')
 7     name = lineArr[0]
 8     questionslist = []
 9     for index in range(1,len(lineArr)-2,3):
10         questiondic = {}
11         questionlist = []
12         question = lineArr[index]
13         answer1 = lineArr[index+1]
14         answer2 = lineArr[index+2]
15         answer3 = lineArr[index+3]
16         questionlist.append(answer1)
17         questionlist.append(answer2)
18         questionlist.append(answer3)
19         questiondic[question] = questionlist
20         questionslist.append(questiondic)
21     return name,questionslist
22         
23 videodic = {}
24 rootdir = r"D:\ai\AIE04\VQADatasetA_20180815\train.txt"
25 f = open(rootdir,'r',encoding="utf-8")
26 for line in f:
27     name,questionlist = dealline(line)
28     videodic[name] = questionlist
29     print(name)
30 np.savez("npz/question.npz",question=videodic)
31 print('finish')

处理成结构化数据之后,后边要对问题切分,例如:what is是一组,in front of是一组,the person是一组,in video是一组。分组的思路是从高到底逐步加词统计出现的次数,次数比较多的为一组词;或者已经有成熟的英文分组算法,也要查资料看看。

转载于:https://www.cnblogs.com/supperstar/p/videoanswer3.html

相关文章:

  • 解决加载模型预测数据时报错的问题
  • java 颠倒整数
  • 【火炉炼AI】机器学习022-使用均值漂移聚类算法构建模型
  • Python从菜鸟到高手(5):数字
  • python中的None
  • eclipse 执行自带的maven命令无效
  • 【转载三】Grafana系列教程–Grafana的配置及运行
  • mysql 通过备份和binlog恢复数据
  • java类加载时机与过程
  • 设计模式走一遍---观察者模式
  • 我发起了一个 .Net 平台上的 产生式编程 开源项目 GP.Net
  • windows远程连接报:身份错误,函数不支持的解决办法
  • Docker 笔记(2):Dockerfile
  • promise原理就是这么简单
  • EXE文件执行过程中发生了什么?
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • iOS 系统授权开发
  • Python学习笔记 字符串拼接
  • React-Native - 收藏集 - 掘金
  • Service Worker
  • Spark VS Hadoop:两大大数据分析系统深度解读
  • SpiderData 2019年2月25日 DApp数据排行榜
  • vue中实现单选
  • 成为一名优秀的Developer的书单
  • 基于Javascript, Springboot的管理系统报表查询页面代码设计
  • 解析 Webpack中import、require、按需加载的执行过程
  • 解析带emoji和链接的聊天系统消息
  • 理解在java “”i=i++;”所发生的事情
  • 判断客户端类型,Android,iOS,PC
  • 前端相关框架总和
  • SAP CRM里Lead通过工作流自动创建Opportunity的原理讲解 ...
  • $con= MySQL有关填空题_2015年计算机二级考试《MySQL》提高练习题(10)
  • (10)ATF MMU转换表
  • (DenseNet)Densely Connected Convolutional Networks--Gao Huang
  • (pt可视化)利用torch的make_grid进行张量可视化
  • (二)构建dubbo分布式平台-平台功能导图
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (三维重建学习)已有位姿放入colmap和3D Gaussian Splatting训练
  • (四)搭建容器云管理平台笔记—安装ETCD(不使用证书)
  • (万字长文)Spring的核心知识尽揽其中
  • (一)Neo4j下载安装以及初次使用
  • .[hudsonL@cock.li].mkp勒索病毒数据怎么处理|数据解密恢复
  • .htaccess 强制https 单独排除某个目录
  • .locked1、locked勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .Mobi域名介绍
  • .net mvc部分视图
  • .NET/C# 利用 Walterlv.WeakEvents 高性能地中转一个自定义的弱事件(可让任意 CLR 事件成为弱事件)
  • .Net语言中的StringBuilder:入门到精通
  • @angular/cli项目构建--Dynamic.Form
  • @javax.ws.rs Webservice注解
  • @JSONField或@JsonProperty注解使用
  • [ vulhub漏洞复现篇 ] Jetty WEB-INF 文件读取复现CVE-2021-34429
  • [BUUCTF]-PWN:wustctf2020_number_game解析(补码,整数漏洞)
  • [CTO札记]盛大文学公司名称对联
  • [Flutter]设置应用包名、名称、版本号、最低支持版本、Icon、启动页以及环境判断、平台判断和打包