当前位置：首页 > news >正文

参加2018之江杯全球人工智能大赛：视频识别问答（三）

news 来源：原创 2024/5/6 9:45:47

　　今天处理一下问答部分。首先将文本处理一下，代码如下：

 1 import os
 2 import io
 3 import numpy as np
 4 
 5 def dealline(line):
 6     lineArr = line.split(',')
 7     name = lineArr[0]
 8     questionslist = []
 9     for index in range(1,len(lineArr)-2,3):
10         questiondic = {}
11         questionlist = []
12         question = lineArr[index]
13         answer1 = lineArr[index+1]
14         answer2 = lineArr[index+2]
15         answer3 = lineArr[index+3]
16         questionlist.append(answer1)
17         questionlist.append(answer2)
18         questionlist.append(answer3)
19         questiondic[question] = questionlist
20         questionslist.append(questiondic)
21     return name,questionslist
22         
23 videodic = {}
24 rootdir = r"D:\ai\AIE04\VQADatasetA_20180815\train.txt"
25 f = open(rootdir,'r',encoding="utf-8")
26 for line in f:
27     name,questionlist = dealline(line)
28     videodic[name] = questionlist
29     print(name)
30 np.savez("npz/question.npz",question=videodic)
31 print('finish')

处理成结构化数据之后，后边要对问题切分，例如：what is是一组，in front of是一组，the person是一组，in video是一组。分组的思路是从高到底逐步加词统计出现的次数，次数比较多的为一组词；或者已经有成熟的英文分组算法，也要查资料看看。

转载于:https://www.cnblogs.com/supperstar/p/videoanswer3.html

相关文章：

解决加载模型预测数据时报错的问题

java 颠倒整数

【火炉炼AI】机器学习022-使用均值漂移聚类算法构建模型

Python从菜鸟到高手（5）：数字

python中的None

eclipse 执行自带的maven命令无效

【转载三】Grafana系列教程–Grafana的配置及运行

mysql 通过备份和binlog恢复数据

java类加载时机与过程

设计模式走一遍---观察者模式

我发起了一个 .Net 平台上的产生式编程开源项目 GP.Net

windows远程连接报：身份错误，函数不支持的解决办法

Docker 笔记（2）：Dockerfile

promise原理就是这么简单

EXE文件执行过程中发生了什么？

【腾讯Bugly干货分享】从0到1打造直播 App

iOS 系统授权开发

Python学习笔记字符串拼接

React-Native - 收藏集 - 掘金

Service Worker

Spark VS Hadoop：两大大数据分析系统深度解读

SpiderData 2019年2月25日 DApp数据排行榜

vue中实现单选

成为一名优秀的Developer的书单

基于Javascript， Springboot的管理系统报表查询页面代码设计

解析 Webpack中import、require、按需加载的执行过程

解析带emoji和链接的聊天系统消息

理解在java “”i=i++;”所发生的事情

判断客户端类型，Android，iOS，PC

前端相关框架总和

SAP CRM里Lead通过工作流自动创建Opportunity的原理讲解 ...

$con= MySQL有关填空题_2015年计算机二级考试《MySQL》提高练习题(10)

（10）ATF MMU转换表

（DenseNet）Densely Connected Convolutional Networks--Gao Huang

（pt可视化）利用torch的make_grid进行张量可视化

（二）构建dubbo分布式平台-平台功能导图

（免费领源码）python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐

（三维重建学习）已有位姿放入colmap和3D Gaussian Splatting训练

（四）搭建容器云管理平台笔记—安装ETCD(不使用证书)

（万字长文）Spring的核心知识尽揽其中

(一)Neo4j下载安装以及初次使用

.[hudsonL@cock.li].mkp勒索病毒数据怎么处理|数据解密恢复

.htaccess 强制https 单独排除某个目录

.locked1、locked勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复

.Mobi域名介绍

.net mvc部分视图

.NET/C# 利用 Walterlv.WeakEvents 高性能地中转一个自定义的弱事件（可让任意 CLR 事件成为弱事件）

.Net语言中的StringBuilder：入门到精通

@angular/cli项目构建--Dynamic.Form

@javax.ws.rs Webservice注解

@JSONField或@JsonProperty注解使用

[ vulhub漏洞复现篇 ] Jetty WEB-INF 文件读取复现CVE-2021-34429

[BUUCTF]-PWN:wustctf2020_number_game解析（补码，整数漏洞）

[CTO札记]盛大文学公司名称对联

[Flutter]设置应用包名、名称、版本号、最低支持版本、Icon、启动页以及环境判断、平台判断和打包