当前位置: 首页 > news >正文

AGI思考探究的意义、价值与乐趣Ⅳ

探究in context或Prompt对于LLM来说其根本意义,in context & Prompt Learning带给我们更深一层的提示是什么?

文章里的探索希望能够将in context或Prompt置身于一个更全局的视角来看待:将其视为在真实世界中时空认知流形所映射为数据流形表征分布中的前置部分,即可以将其看待为任何物理与概念时空下的前置流形分布条件,需要关注于这种“前置”作为整体数据流形或认知流形的组成与影响,其控制或引导着全局流形的分布与轨迹。

另外一方面,从模型推理的全局视角来看,对于Xn+M→Yn来说,Xn∪Yn可作为整体广义层面的认知数据流形分布来看待,其中M作为中间模型节点,用于对齐并衔接Xn与Yn的广义流形分布(在现实中人们在认知行为中总是自然的通过Xn+M对Yn进行着推理到决策)。在以往的探索中我们之前将目光更多聚焦在M之后的Yn,并探索Yn在生成的内容上所体现出不论在system1与system2间不同流形分布在复杂推理模式上的差异和本质上的等价(当然探索初衷是希望能够合理、平滑的构建出其中的M,并延展到探寻system1与system2间数据/信号变换模式上的本质),而反观对于Xn确很少讨论。

然而随着逐步的探索,发现其Xn本身应与Yn有着同等的研究探索价值,如在当下热度比较高的长文本处理,对应延展出的transformer/manba/TTT不同模型结构对Xn的表征与压缩的平衡。

而我想未来的探索也不仅仅局限于文本的长度上,而应更深入的全局探索M对Xn→Yn所蕴含的复杂信息结构对齐及表征分布。包括考虑Xn与Yn之间相互作用于不同时空或不同模态间鬼魅般的纠缠(如Prompt思想,以stepbystep为代表的泛xot的延伸),两者与M间一定存在着更深邃而复杂的内涵联系 - 如现在表面上看起来M中的transformer/manba/ttt等实现对Xn的刻画与表征,并通过mlp或kan等模拟逼近了Xn→Yn世界的分布。而我相信随着继续对其进行深入的研究与探索,在未来将不光局限于模型算法(M)本身在网络结构或数学方法的革新,还将包括针对不同模态、时空结构、推理决策空间表征下更深刻的思想运用,如从llm的AR到cv的diffusion思想延展,找到平衡探索与利用的MCTS或所谓的Q*s方法...以及M在Xn∪Yn的→下的动态动态对齐衔接。

a3ef5f1232684518b3696506094c0e8f.jpg

 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 36k Star的开源大模型应用开发平台,太强了!
  • cdlinux虚拟机iso文件
  • Leetcode梦开始的地方--两数相加
  • 聊聊跨境电商平台与固定IP的那些事
  • ECMAScript 12 (ES12, ES2021) 新特性
  • C:关于static 和 extern 关键字的介绍-学习笔记
  • electron-updater实现electron全量更新和增量更新——渲染进程UI部分
  • 设计模式 之 —— 抽象工厂模式
  • C++生化危机1.5源码
  • C# Unity 面向对象补全计划 之 初识继承方法与多态
  • CC++内存魔术:掌控无形资源
  • 知识见闻 - 什么样的人值得结交
  • Prometheus 监控 Nginx
  • 【C++高阶】:C++11的深度解析下
  • Redis结合Lua脚本的简单使用
  • [NodeJS] 关于Buffer
  • 【Redis学习笔记】2018-06-28 redis命令源码学习1
  • 0基础学习移动端适配
  • Android Studio:GIT提交项目到远程仓库
  • es6
  • Git 使用集
  • JavaScript 无符号位移运算符 三个大于号 的使用方法
  • vue2.0开发聊天程序(四) 完整体验一次Vue开发(下)
  • 不发不行!Netty集成文字图片聊天室外加TCP/IP软硬件通信
  • 代理模式
  • 来,膜拜下android roadmap,强大的执行力
  • 离散点最小(凸)包围边界查找
  • 判断客户端类型,Android,iOS,PC
  • 七牛云 DV OV EV SSL 证书上线,限时折扣低至 6.75 折!
  • 使用权重正则化较少模型过拟合
  • ​Java并发新构件之Exchanger
  • # linux 中使用 visudo 命令,怎么保存退出?
  • #调用传感器数据_Flink使用函数之监控传感器温度上升提醒
  • #经典论文 异质山坡的物理模型 2 有效导水率
  • $Django python中使用redis, django中使用(封装了),redis开启事务(管道)
  • $var=htmlencode(“‘);alert(‘2“); 的个人理解
  • (十三)Java springcloud B2B2C o2o多用户商城 springcloud架构 - SSO单点登录之OAuth2.0 根据token获取用户信息(4)...
  • (一)Dubbo快速入门、介绍、使用
  • *算法训练(leetcode)第四十五天 | 101. 孤岛的总面积、102. 沉没孤岛、103. 水流问题、104. 建造最大岛屿
  • .NET Core日志内容详解,详解不同日志级别的区别和有关日志记录的实用工具和第三方库详解与示例
  • .NET 漏洞分析 | 某ERP系统存在SQL注入
  • .NET/C# 编译期间能确定的相同字符串,在运行期间是相同的实例
  • .NET/C# 中设置当发生某个特定异常时进入断点(不借助 Visual Studio 的纯代码实现)
  • [ vulhub漏洞复现篇 ] Apache APISIX 默认密钥漏洞 CVE-2020-13945
  • [20150904]exp slow.txt
  • [Arduino学习] ESP8266读取DHT11数字温湿度传感器数据
  • [ASP.NET 控件实作 Day7] 设定工具箱的控件图标
  • [BFS广搜]迷阵
  • [bzoj2957]楼房重建
  • [C#]C# winform实现imagecaption图像生成描述图文描述生成
  • [ccc3.0][数字钥匙] UWB配置和使用(二)
  • [CSAWQual 2019]Web_Unagi ---不会编程的崽
  • [DNS网络] 网页无法打开、显示不全、加载卡顿缓慢 | 解决方案
  • [error] 17755#0: *58522 readv() failed (104: Connection reset by peer) while reading upstream
  • [ESP32 IDF]web server