当前位置：首页 > news >正文

揭秘LLM计算数字的障碍的底层原理

news 来源：原创 2024/9/18 12:25:43

LLM的 Tokenizer与数字切分

大语言模型在处理语言时，通常依赖Tokenization技术来将文本切分为可操作的单元。早期版本的Tokenizer对数字处理不够精确，常常将多个连续数字合并为一个Token。比如“13579”可能被切分为“13”、“57”和“9”。在这种情况下，LLM难以准确理解数字的本质及其相互关系。因此，处理多位数加法时，LLM会遭遇极大的挑战。随着技术进步，后来的模型逐渐改进了这一点，能将每个数字单独切分。这项技术虽必要，却不足以解决所有问题。

数字序列的输入顺序

在进行数字运算时，通常会将数字正序输入模型。然而，LLM的运算机制更适合于逆序输入。输入“13579+24680”这样的算式时，建议将其转为“97531+08642”。这个方法与人类处理数学问题的方式相似，通常会从低位到高位进行计算。逆序输入减少了模型在推算时的复杂度，大幅提升了运算的准确性。LLM需逐个生成Token，若高位在前，模型必须在第一次输出时就算出正确的结果，这无形中增加了难度。

数字对齐的重要性

即使将数字逆序输入，LLM还是难以做到完美计算。这是因为数字在输入时可能未能精确对齐。以“13579+24680”为例，模型可能把相应位置的数字对错。这是因为在运算过程中，数据的相对位置变得模糊，而这部分偏差会直接导致计算错误。最有效的解决办法是通过引入位置信息，确保每个相同位置的数字都有提示字符。采用新的位置编码技术，能够提高LLM的数字对齐能力，从而提升计算的准确度。

外推能力的局限性

LLM在训练过程中，若未接触过长长度的数字串，在实际应用中容易出现错误。这种外推能力的不足往往源于位置编码的设计不够成熟。模型在处理超出训练范围的输入时，可能机制失灵。通过引入新型位置编码技术及随机位置编码，可以在训练期间解决这个问题，使得模型能够应对更长的数字串，提升其运算能力。

大模型的幻觉问题

大语言模型在生成内容时，可能会产生虚假的信息。这一现象在数字运算中尤为明显，模型可能声称其计算结果是正确的，但实际上却是基于错误的推测。这一现象不仅影响用户的信任感，也在实际应用中可能造成严重后果。可以通过更加严谨的训练技巧与策略来缓解这一问题。

结论

大语言模型在数字运算中表现不佳，主要是由多种因素导致的，包括Tokenizer对数字的处理、输入顺序、数字对齐、长度外推能力以及模型幻觉等。然而，随着研究的深入，已有部分层面得到了有效改善。未来，随着技术的发展，期待大语言模型能够在数字运算上取得更好表现。

相关文章：

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

图论篇--代码随想录算法训练营第五十八天打卡|拓扑排序，dijkstra（朴素版），dijkstra（堆优化版）精讲

洛谷9.16

【C++】入门基础（下）

Java 流 (Stream) 详解

电气自动化入门01：电工基础

整型提升整型提升练习题

用于稀疏自适应深度细化的掩码空间传播网络 CVPR2024

前端基础知识+算法（一）

Java 入门指南：JVM（Java虚拟机）垃圾回收机制 —— 死亡对象判断方法

pytorch快速入门（一）—— 基本工具及平台介绍

WebGL系列教程八（GLSL着色器基础语法）

采用qt做一个命令行终端

面向对象程序设计之继承(C++)

ai 回答HFS是什么 HTTP的文件服务器是什么

Leetcode3282. 到达数组末尾的最大得分

《Javascript数据结构和算法》笔记-「字典和散列表」

android 一些 utils

express.js的介绍及使用

HTTP 简介

JavaScript设计模式与开发实践系列之策略模式

Java反射-动态类加载和重新加载

Mac转Windows的拯救指南

Python打包系统简单入门

python学习笔记－类对象的信息

Shell编程

Transformer-XL: Unleashing the Potential of Attention Models

vuex 学习笔记 01

Vue小说阅读器（仿追书神器）

简析gRPC client 连接管理

码农张的Bug人生 - 见面之礼

通过git安装npm私有模块

责任链模式的两种实现

MiKTeX could not find the script engine ‘perl.exe‘ which is required to execute ‘latexmk‘.

zabbix3.2监控linux磁盘IO

测评：对于写作的人来说，Markdown是你最好的朋友 ...

‌‌雅诗兰黛、‌‌兰蔻等美妆大品牌的营销策略是什么？

# AI产品经理的自我修养：既懂用户，更懂技术！

(2009.11版)《网络管理员考试考前冲刺预测卷及考点解析》复习重点

(AngularJS)Angular 控制器之间通信初探

(cos^2 X）的定积分,求积分 ∫sin^2(x) dx

(CPU/GPU)粒子继承贴图颜色发射

(Python第六天)文件处理

（二开）Flink 修改源码拓展 SQL 语法

（九）c52学习之旅-定时器

(切换多语言)vantUI+vue-i18n进行国际化配置及新增没有的语言包

(十三)MipMap

（一） springboot详细介绍

（一）C语言之入门：使用Visual Studio Community 2022运行hello world

(转) RFS+AutoItLibrary测试web对话框

(转)VC++中ondraw在什么时候调用的

(转)如何上传第三方jar包至Maven私服让maven项目可以使用第三方jar包

（转载）PyTorch代码规范最佳实践和样式指南

./configure、make、make install 命令

.Net 8.0 新的变化

.Net Core中的内存缓存实现——Redis及MemoryCache（2个可选）方案的实现