当前位置: 首页 > news >正文

简单手撸代码进入SMP2018中文人机对话技术评测任务一前三甲

如果你对自然语言处理和深度学习感兴趣,一定要看看本文,怎么从原始文本数据处理到训练模型到构建应用。过程很重要!总有一点你会有收获。

SMP2018中文人机对话技术评测由中国中文信息学会社会媒体处理专委会主办,哈尔滨工业大学、科大讯飞股份有限公司承办,讯飞公司提供数据,华为公司提供奖金。

这是刚刚出炉的排行榜:

最近刚好在做人机对话的研究,马上把这个任务手撸了,简简单单进入前三(最基础的模型的 F1 值在82左右),并把资源放在了 GitHub SMP2018 上(呜呜呜,可惜以前没去参赛),欢迎大家在我的基础模型上做的更好!

根据训练的模型,我还做了个简单的人机对话应用,也放在GitHub SMP2018 上,如果没有兴趣玩模型,就来玩这个应用吧!

比如这个应用可以对你说的话进行分大类:

 今天东莞天气如何
----------
predict label:	 datetime
----------

 怎么治疗感冒?
----------
predict label:	 health
----------

 你好?
----------
predict label:	 chat
----------
复制代码

评测任务概述

  • 本届人机对话技术评测主要包括两个任务,参赛者可以选择参加任意一个任务或全部任务。

任务1:用户意图领域分类

在人机对话系统的应用过程中,用户可能会有多种意图,相应地会触发人机对话系统中的多个领域(domain) ,其中包括任务型垂直领域(如查询机票、酒店、公交车等)、知识型问答以及闲聊等。因而,人机对话系统的一个关键任务就是正确地将用户的输入分类到相应的领域(domain)中,从而才能返回正确的回复结果。

【用户意图领域分类示例】

1) 你好啊,很高兴见到你! — 闲聊类

2) 我想订一张去北京的机票。 — 任务型垂类(订机票)

3) 我想找一家五道口附近便宜干净的快捷酒店 — 任务型垂类(订酒店)

【评测说明】

评测任务1包含闲聊和垂类两大类,其中垂类又细分为30个垂直领域。本次评测任务1中,仅考虑针对单轮对话用户意图的领域分类,多轮对话整体意图的领域分类不在此次评测范围之内。

本比赛的相关连接
CodaLab评测主页
数据下载
CodaLab 评测教程
评测排行榜
SMP2018-ECDT评测主页
SMP2018-ECDT评测成绩公告链接

我的解决办法

就这个简单的模型,真的就冲进了前三名。

我觉得前期的原始文本处理和后面的构建应用也许更有趣!

如果你对深度学习感兴趣,可以来我的博客交流喔!

相关文章:

  • 小程序开发之插件功能的有效实现方法
  • 数据库 Oracle12c (三):安装与启动
  • elasticsearch实战---中文拼音A-Z排序(完美解决)
  • NOIP2018 游记
  • Python 的经典设计格言,格言来源于 Python 但不限于 Python
  • 关于微信小程序登录,后端如何生成3rd_session?(后端为c#)
  • hadoop和spark的区别
  • 解决Composer 使用时要求输入授权用户名密码问题
  • Java实现视频网站的视频上传、视频转码、视频关键帧抽图, 及视频播放功能
  • gitlab 502问题解决
  • CEF与代理
  • VS2010安装与启动
  • jQuery快速入门
  • 线下比特币现金交易的区块链创企CoinText.io完成60万美元种子轮融资
  • SCOI2008着色方案(记忆化搜索)
  • #Java异常处理
  • 《剑指offer》分解让复杂问题更简单
  • Docker入门(二) - Dockerfile
  • ERLANG 网工修炼笔记 ---- UDP
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • iOS 颜色设置看我就够了
  • Java方法详解
  • Linux编程学习笔记 | Linux IO学习[1] - 文件IO
  • Lucene解析 - 基本概念
  • react-native 安卓真机环境搭建
  • XML已死 ?
  • 关于 Cirru Editor 存储格式
  • 聊聊redis的数据结构的应用
  • 你不可错过的前端面试题(一)
  • 扑朔迷离的属性和特性【彻底弄清】
  • 使用Swoole加速Laravel(正式环境中)
  • 微信公众号开发小记——5.python微信红包
  • 微信小程序开发问题汇总
  • 关于Kubernetes Dashboard漏洞CVE-2018-18264的修复公告
  • 进程与线程(三)——进程/线程间通信
  • ​Java并发新构件之Exchanger
  • ​LeetCode解法汇总307. 区域和检索 - 数组可修改
  • #LLM入门|Prompt#2.3_对查询任务进行分类|意图分析_Classification
  • #我与Java虚拟机的故事#连载17:我的Java技术水平有了一个本质的提升
  • (11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (Redis使用系列) SpirngBoot中关于Redis的值的各种方式的存储与取出 三
  • (动手学习深度学习)第13章 计算机视觉---微调
  • (附源码)SSM环卫人员管理平台 计算机毕设36412
  • (六)软件测试分工
  • (十八)devops持续集成开发——使用docker安装部署jenkins流水线服务
  • (十七)devops持续集成开发——使用jenkins流水线pipeline方式发布一个微服务项目
  • .NET Core WebAPI中使用Log4net 日志级别分类并记录到数据库
  • .NET Core、DNX、DNU、DNVM、MVC6学习资料
  • [ C++ ] STL---string类的使用指南
  • [ 攻防演练演示篇 ] 利用通达OA 文件上传漏洞上传webshell获取主机权限
  • [ 隧道技术 ] 反弹shell的集中常见方式(四)python反弹shell
  • [Android]RecyclerView添加HeaderView出现宽度问题
  • [AutoSAR系列] 1.3 AutoSar 架构
  • [C#]无法获取源 https://api.nuge t.org/v3-index存储签名信息解决方法