当前位置: 首页 > news >正文

深度学习在携程攻略社区的应用

编者:本文来自携程攻略社区开发总监李健在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了深度学习在攻略社区领域的主要应用。关注携程技术中心微信公号ctriptech,可获知更多技术分享信息。文末可下载演讲PPT。

图片描述

携程攻略社区是携程旗下的旅游攻略类社区,致力于为旅行者提供出行指南和资讯服务。依托携程2.5亿用户总量,社区日活跃用户超过500万,并汇集3000万条真实用户的旅行和酒店点评,并有40万篇旅行游记,2000位知名旅行达人。面对数据库中浩如烟海的信息,我们如何能去其糟粕,留其精华?

一、攻略社区的主要需求

攻略社区的数据比较复杂,包括了多语种,不同篇幅的自然语言处理,如用户评论,长短篇幅的游记,景点官网页面数据;图像数据处理,如用户上传的景点照片等多种应用场景。模型需要在极短的时间内对海量的这些信息进行正确分类。

图片描述

二、深度学习及一些经典模型简介

介绍浅层机器学习模型和深度学习模型的异同。从传统的支持向量机(SVM)起始,循序渐进,引出了在今天的分享中扮演了非常重要角色的卷积神经网络模型(CNN)。

从最基本算法角度简单明了地指出了CNN的特点,优势和应用场景。除CNN之外,还有词向量模型(WORD2VEC),循环神经网络(RNN),长短期记忆人工神经网络(LSTM),循环卷积神经网络(RCNN)。

图片描述

三、DL在攻略社区应用

在介绍了攻略社区的特殊需求和主流深度学习模型之后,下一步便是如何根据实际情况和模型特点高效满足现有的需求。根据数据类型,应用场景又可分为以下若干部分:

1、在自然语言处理方面,主要运用CNN模型进行语义情感分析,LSTM模型进行地址质量打分,CNN+Highway+LSTM+Attention模型完成指定景点开放时间的抓取和判断。

图片描述

2、在图像处理方面,运用CNN进行图像分类,识别广告图片,侵权图片和非法图片。以及CNN+LSTM+Attention进行图像中物体检测以及自动生成图片对应的带情感文字描述。

图片描述

3、在视频领域中,使用RCNN和LSTM模型对视频数据进行自动审核并生成对应文字描述。

图片描述

4、在数据内容领域中,用模糊神经网络进行目的地和POI信息的多元信息匹配。

图片描述

四、未来趋势和关注点

对于携程攻略社区而言,之后的工作目标除了优化现有模型外,还将从自动纠错,知识图谱,虚拟现实和更多更广泛的深度学习模型入手,进一步提高计算效率和准确率,为用户带来更多样化更好的体验。

图片描述

(本文由携程技术中心李赫整理)

演讲PPT下载:

深度学习在携程攻略社区的应用-李健

​说明:本文由携程技术中心原创,如需转载请邮件niuq#ctrip.com(#改为@)。

深度学习Meetup系列:

深度学习在携程攻略社区的应用

深度学习在搜狗无线搜索广告中的应用

知识库上的问答系统:实体、文本及系统观点

用户在线广告点击行为预测的深度学习模型

知识图谱中的推理技术及其在高考机器人中的应用

相关文章:

  • maven项目添加resources目录*
  • ChemDraw绘制DNA结构的技巧
  • DOCTYPE 很重要!!!
  • python中的数组list和字典dic
  • 并发编程入门
  • 云时代服务器端工程师必备 CDN 技能包
  • centos6.5生产环境编译安装nginx-1.11.3并增加第三方模块ngx_cache_purge、nginx_upstream_check、ngx_devel_kit、lua-nginx...
  • DOMContentLoaded事件
  • iOS开发UITextField设置
  • 静态,抽象类、接口、类库
  • leetcode-188 买卖股票4
  • [转]理解I/O Completion Port
  • canvas实际项目操作,包含:线条,圆形,扇形,图片绘制,图片圆角遮罩,矩形,弧形文字...
  • 【iOS第三方框架】FMDB刚刚好
  • C#框架及概念
  • 网络传输文件的问题
  • 【React系列】如何构建React应用程序
  • 【刷算法】求1+2+3+...+n
  • Angular Elements 及其运作原理
  • CSS居中完全指南——构建CSS居中决策树
  • k8s如何管理Pod
  • PHP 程序员也能做的 Java 开发 30分钟使用 netty 轻松打造一个高性能 websocket 服务...
  • Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)
  • Redis中的lru算法实现
  • vue脚手架vue-cli
  • Vultr 教程目录
  • 关于 Linux 进程的 UID、EUID、GID 和 EGID
  • 官方新出的 Kotlin 扩展库 KTX,到底帮你干了什么?
  • 汉诺塔算法
  • 基于Mobx的多页面小程序的全局共享状态管理实践
  • 解析带emoji和链接的聊天系统消息
  • 排序算法学习笔记
  • 人脸识别最新开发经验demo
  • 在 Chrome DevTools 中调试 JavaScript 入门
  • LIGO、Virgo第三轮探测告捷,同时探测到一对黑洞合并产生的引力波事件 ...
  • Play Store发现SimBad恶意软件,1.5亿Android用户成受害者 ...
  • 我们雇佣了一只大猴子...
  • ​Kaggle X光肺炎检测比赛第二名方案解析 | CVPR 2020 Workshop
  • ​七周四次课(5月9日)iptables filter表案例、iptables nat表应用
  • # 手柄编程_北通阿修罗3动手评:一款兼具功能、操控性的电竞手柄
  • #HarmonyOS:Web组件的使用
  • #Linux(帮助手册)
  • #我与Java虚拟机的故事#连载18:JAVA成长之路
  • $(selector).each()和$.each()的区别
  • (DenseNet)Densely Connected Convolutional Networks--Gao Huang
  • (二)【Jmeter】专栏实战项目靶场drupal部署
  • (二)fiber的基本认识
  • (二十五)admin-boot项目之集成消息队列Rabbitmq
  • (附源码)springboot太原学院贫困生申请管理系统 毕业设计 101517
  • (附源码)计算机毕业设计SSM智慧停车系统
  • (附源码)小程序儿童艺术培训机构教育管理小程序 毕业设计 201740
  • (免费领源码)Java#Springboot#mysql农产品销售管理系统47627-计算机毕业设计项目选题推荐
  • (免费领源码)Java#ssm#MySQL 创意商城03663-计算机毕业设计项目选题推荐
  • (牛客腾讯思维编程题)编码编码分组打印下标题目分析
  • (转) 深度模型优化性能 调参