当前位置: 首页 > news >正文

reader-lm:小模型 html转markdown

参考:
https://huggingface.co/jinaai/reader-lm-0.5b

在线demo:
https://colab.research.google.com/drive/1wXWyj5hOxEHY6WeHbOwEzYAC0WB1I5uA#scrollTo=0mG9ISzHOuKK

输入网址:https://www.galaxy-geely.com/E5
结果:
在这里插入图片描述
在这里插入图片描述

代码:

# pip install transformers
from transformers import AutoModelForCausalLM, AutoTokenizer
checkpoint = "jinaai/reader-lm-0.5b"device = "cuda" # for GPU usage or "cpu" for CPU usage
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint).to(device)# example html content
html_content = "<html><body><h1>Hello, world!</h1></body></html>"messages = [{"role": "user", "content": html_content}]
input_text=tokenizer.apply_chat_template(messages, tokenize=False)print(input_text)inputs = tokenizer.encode(input_text, return_tensors="pt").to(device)
outputs = model.generate(inputs, max_new_tokens=1024, temperature=0, do_sample=False, repetition_penalty=1.08)print(tokenizer.decode(outputs[0]))

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • SQL进阶技巧:如何将字符串数组清洗为简单map结构? | translate + regexp_replace方法
  • Kafka日志索引详解与常见问题分析
  • 用 nextjs 创建 Node+React Demo
  • C/C++语言基础--从C到C++的不同(下),15个部分说明C与C++的不同
  • 裸土检测算法实际应用、裸土检测算法样本、裸土检测算法精准检测
  • Python 解析 JSON 数据
  • 开源模型应用落地-qwen模型小试-调用Qwen2-VL-7B-Instruct-更清晰地看世界(一)
  • 配置与变更管理考点提要
  • TeamTalk梳理概括
  • 带你走进vue3
  • Porcupine - 语音关键词唤醒引擎
  • Vue 3有哪些新特性
  • Linux5-echo,>,tail
  • 站群服务器适用于哪些场景当中?
  • 算法入门-贪心1
  • bearychat的java client
  • CentOS7 安装JDK
  • ECMAScript 6 学习之路 ( 四 ) String 字符串扩展
  • js递归,无限分级树形折叠菜单
  • Python打包系统简单入门
  • rc-form之最单纯情况
  • Redux 中间件分析
  • spring + angular 实现导出excel
  • WePY 在小程序性能调优上做出的探究
  • windows下使用nginx调试简介
  • 对象管理器(defineProperty)学习笔记
  • 买一台 iPhone X,还是创建一家未来的独角兽?
  • 区块链将重新定义世界
  • 全栈开发——Linux
  • 如何使用Mybatis第三方插件--PageHelper实现分页操作
  • 文本多行溢出显示...之最后一行不到行尾的解决
  • 因为阿里,他们成了“杭漂”
  • 测评:对于写作的人来说,Markdown是你最好的朋友 ...
  • ​埃文科技受邀出席2024 “数据要素×”生态大会​
  • ​一帧图像的Android之旅 :应用的首个绘制请求
  • # include “ “ 和 # include < >两者的区别
  • ###51单片机学习(2)-----如何通过C语言运用延时函数设计LED流水灯
  • #NOIP 2014# day.2 T2 寻找道路
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • (Bean工厂的后处理器入门)学习Spring的第七天
  • (Mirage系列之二)VMware Horizon Mirage的经典用户用例及真实案例分析
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (二)windows配置JDK环境
  • (四)进入MySQL 【事务】
  • (学习日记)2024.03.25:UCOSIII第二十二节:系统启动流程详解
  • (自用)仿写程序
  • .\OBJ\test1.axf: Error: L6230W: Ignoring --entry command. Cannot find argumen 'Reset_Handler'
  • .“空心村”成因分析及解决对策122344
  • .bat批处理(十一):替换字符串中包含百分号%的子串
  • .htaccess配置常用技巧
  • .NET Standard / dotnet-core / net472 —— .NET 究竟应该如何大小写?
  • .NET 服务 ServiceController
  • .net遍历html中全部的中文,ASP.NET中遍历页面的所有button控件
  • .Net程序猿乐Android发展---(10)框架布局FrameLayout
  • .vue文件怎么使用_vue调试工具vue-devtools的安装