当前位置: 首页 > news >正文

python-windows10普通笔记本跑bert mrpc数据样例0.1.001

python-windows10普通笔记本跑bert mrpc数据样例0.1.000

    • 背景
    • 参考章节
    • 获取数据
    • 下载bert模型
    • 下载bert代码
    • windows10的cpu执行结果
    • 注意事项
    • TODOLIST

背景

看了介绍说可以在gpu或者tpu上去微调,当前没环境,所以先在windows10上跑一跑,看是否能顺利进行,目标就是训练的过程中没有报错就行

参考章节

参考这个链接https://github.com/google-research/bert/tree/master?tab=readme-ov-file,其中的这个章节Sentence (and sentence-pair) classification tasks

获取数据

文章提高的使用 GLUE data by running this script,但是我使用这个脚本下载不了,因为是内网,没有办法只能手动下载了,方法如下

  1. 下载download_glue_data.py这个脚本后
  2. 找到第39和40行,将里面的链接打开保存文件就可以获得msr_paraphrase_train.txt和sr_paraphrase_test.txt文件了
MRPC_TRAIN = 'https://dl.fbaipublicfiles.com/senteval/senteval_data/msr_paraphrase_train.txt'
MRPC_TEST = 'https://dl.fbaipublicfiles.com/senteval/senteval_data/msr_paraphrase_test.txt'
  1. 数据不大,我直接修改的文本格式为tsv,最后得到test.tsv和train.tsv文件

下载bert模型

下载bert-base-uncased模型,如下图
在这里插入图片描述

下载bert代码

将这个链接https://github.com/google-research/bert/tree/master?tab=readme-ov-file的代码clone下来到本地,进入到这个文件夹里,执行如下命令即可:

python run_classifier.py --task_name=MRPC --do_train=true --do_eval=true --data_dir=D:\jpdir\bert\glue_data\MRPC --vocab_file=D:\jp

相关文章:

  • 《深入浅出C语言:从基础到指针的全面指南》
  • C++中的if constexpr
  • 探索HTML5 Geolocation:精准定位网页的新纪元
  • 一个训练好的神经网络的模型文件的内容主要是什么信息呢?请用大白话举例说明( 百度 API 回答 )
  • Flutter与iOS原生混合开发 iOS项目集成Flutter
  • (杂交版)植物大战僵尸
  • 流批一体计算引擎-10-[Flink]中的常用算子和DataStream转换
  • OpenCV的核心数据结构
  • codereview时通常需要关注哪些
  • Mongodb---java篇
  • 简述React 和 Vue 的 diff 时间复杂度从 O(n^3) 优化 到 O(n) ,那么 O(n^3) 和 O(n) 是如何计算出来的 ?
  • 特征提取(Feature Extraction)特征评估(五)
  • 【Linux】The server quit without updating PID file的几种解决方案
  • ubuntu20.04设置文件开机自启动
  • 持续总结中!2024年面试必问 20 道分布式、微服务面试题(二)
  • 分享一款快速APP功能测试工具
  • 11111111
  • C++入门教程(10):for 语句
  • CSS 三角实现
  • echarts花样作死的坑
  • ES6--对象的扩展
  • LeetCode541. Reverse String II -- 按步长反转字符串
  • Material Design
  • pdf文件如何在线转换为jpg图片
  • PyCharm搭建GO开发环境(GO语言学习第1课)
  • Python3爬取英雄联盟英雄皮肤大图
  • Python代码面试必读 - Data Structures and Algorithms in Python
  • socket.io+express实现聊天室的思考(三)
  • 分布式熔断降级平台aegis
  • 分享自己折腾多时的一套 vue 组件 --we-vue
  • 更好理解的面向对象的Javascript 1 —— 动态类型和多态
  • 工作中总结前端开发流程--vue项目
  • 前端每日实战:61# 视频演示如何用纯 CSS 创作一只咖啡壶
  • 如何在GitHub上创建个人博客
  • 视频flv转mp4最快的几种方法(就是不用格式工厂)
  • 微信开源mars源码分析1—上层samples分析
  • 一道面试题引发的“血案”
  • 原创:新手布局福音!微信小程序使用flex的一些基础样式属性(一)
  • 第二十章:异步和文件I/O.(二十三)
  • ‌分布式计算技术与复杂算法优化:‌现代数据处理的基石
  • ###项目技术发展史
  • #QT(智能家居界面-界面切换)
  • $ is not function   和JQUERY 命名 冲突的解说 Jquer问题 (
  • (4)事件处理——(2)在页面加载的时候执行任务(Performing tasks on page load)...
  • (6)STL算法之转换
  • (附源码)计算机毕业设计SSM基于健身房管理系统
  • (图)IntelliTrace Tools 跟踪云端程序
  • (一)Spring Cloud 直击微服务作用、架构应用、hystrix降级
  • (原創) 是否该学PetShop将Model和BLL分开? (.NET) (N-Tier) (PetShop) (OO)
  • (转)【Hibernate总结系列】使用举例
  • (转)linux 命令大全
  • (转)项目管理杂谈-我所期望的新人
  • (自用)learnOpenGL学习总结-高级OpenGL-抗锯齿
  • ***利用Ms05002溢出找“肉鸡
  • .equals()到底是什么意思?