当前位置: 首页 > news >正文

《昇思25天学习打卡营第20天|onereal》

应用实践/LLM原理和实践/基于MindSpore的GPT2文本摘要

基于MindSpore的GPT2文本摘要¶

数据集加载与处理

  1. 数据集加载

    本次实验使用的是nlpcc2017摘要数据,内容为新闻正文及其摘要,总计50000个样本。

  2. 数据预处理

    原始数据格式:

    article: [CLS] article_context [SEP]
    summary: [CLS] summary_context [SEP]
    

    预处理后的数据格式:

    模型构建

  3. 构建GPT2ForSummarization模型,注意shift right的操作。

    模型推理¶

    数据处理,将向量数据变为中文数据

  4. ---------------------训练结果因为算力不足,暂未成功

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 计算机视觉之Vision Transformer图像分类
  • 无法解析主机:mirrorlist.centos.org Centos 7
  • 车载视频监控管理方案:无人驾驶出租车安全出行的保障
  • UniVue@v1.4.0版本发布:运行时调试器RuntimeDebuger
  • 交换机和路由器的工作流程
  • 百度智能云将大模型引入网络故障定位的智能运维实践
  • Leetcode3200. 三角形的最大高度
  • T113-i系统启动速度优化方案
  • R语言数据分析案例42-结婚意愿问卷数据统计分析
  • 2024 Q1:AVP时代下全球XR头显市场动态与展望
  • (算法)硬币问题
  • 脚本练习-每5分钟执行一次获取当前服务器的基本情况
  • MyBatisPlus实现增删改查
  • 删除矩阵中0所在行 matlab
  • 如何用Streamlit构建病毒式数据科学应用:快速入门指南
  • 收藏网友的 源程序下载网
  • ES2017异步函数现已正式可用
  • JavaScript 基础知识 - 入门篇(一)
  • JavaWeb(学习笔记二)
  • Linux CTF 逆向入门
  • NLPIR语义挖掘平台推动行业大数据应用服务
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • 从tcpdump抓包看TCP/IP协议
  • 什么是Javascript函数节流?
  • 使用putty远程连接linux
  • gunicorn工作原理
  • 数据库巡检项
  • ​七周四次课(5月9日)iptables filter表案例、iptables nat表应用
  • #nginx配置案例
  • $GOPATH/go.mod exists but should not goland
  • (21)起落架/可伸缩相机支架
  • (day6) 319. 灯泡开关
  • (八)c52学习之旅-中断实验
  • (顶刊)一个基于分类代理模型的超多目标优化算法
  • (黑马C++)L06 重载与继承
  • (回溯) LeetCode 78. 子集
  • (三)mysql_MYSQL(三)
  • (十七)Flink 容错机制
  • (数位dp) 算法竞赛入门到进阶 书本题集
  • (四)事件系统
  • (一)Thymeleaf用法——Thymeleaf简介
  • (已解决)vue+element-ui实现个人中心,仿照原神
  • (转)eclipse内存溢出设置 -Xms212m -Xmx804m -XX:PermSize=250M -XX:MaxPermSize=356m
  • (转)视频码率,帧率和分辨率的联系与区别
  • ***php进行支付宝开发中return_url和notify_url的区别分析
  • .net 4.0 A potentially dangerous Request.Form value was detected from the client 的解决方案
  • .NET Framework 3.5中序列化成JSON数据及JSON数据的反序列化,以及jQuery的调用JSON
  • .Net mvc总结
  • []Telit UC864E 拨号上网
  • [APIO2015]巴厘岛的雕塑
  • [Bada开发]初步入口函数介绍
  • [C++]类和对象(中)
  • [C++]类和对象【下】
  • [CERC2017]Cumulative Code
  • [codevs1288] 埃及分数