当前位置：首页 > news >正文

因果推断会是下一个AI热潮吗？朱迪亚•珀尔新作《因果论》重磅上市！

news 来源：原创 2024/5/5 20:42:09

从“大数据时代和机器学习热潮”到“第二次因果革命”，从以数据为中心到数据理解的转变不仅涉及技术上的转变，还意味着更加深刻的范式转换。

因果关系理论与现有机器学习系统的结合，已经开拓了机器学习领域的新思想和新途径。第二次因果革命即将到来？因果推断会是下一个AI热潮吗？一场席卷各个研究领域的“因果革命”正在发生，涉及领域：统计学、基因学、社会科学、经济学、人口学、医疗健康科学、心理学、计算机科学、人工智能科学……

在大数据时代中需要突破“所有知识都来自数据关联”这一框架，亟需因果关系范式融合领域知识、常识约束的问题研究，本书就描述了这样一种体系，介绍了因果关系分析和推断的思想和方法，其中包括do-操作、反事实、原因的充分性与必要性、特异原因、实际原因等内容。“因果性的研究经历了一次重要的转变：从一个被神秘面纱笼罩的概念转变为一个具有明确语义和逻辑基础的数学对象。”在下一个十年里，这个框架将与现有的机器学习系统相结合，从而可能引发“第二次因果革命”。本书第1版曾获2001年拉卡托斯奖，作者朱迪亚·珀尔是2011年图灵奖得主。本书的出版将有利于中国的广大学者、学生和各领域研究人员了解和掌握因果模型、推理和推断相关的内容，在相关领域做出优异的成果。

本书内容

本书全面阐述了现代因果关系分析，展示了因果关系如何从一个模糊的概念发展成为一套数学理论，并广泛用于统计学、人工智能、经济学、哲学、认知科学、卫生科学和社会学等领域。本书提出了一个全面的因果关系理论，它统一了因果关系的概率、操作、反事实和结构方法，并提供了简单的数学工具来研究因果关系和统计关联之间的关系。本书通过融合领域知识、常识约束、文化传承的概念等来补充数据信息，为基于统计的机器学习中遇到的基本问题提供了科学的解决方案。

本书作者

朱迪亚·珀尔(Judea Pearl) 美国国家科学院院士，美国国家工程院院士，美国人工智能协会创始会士，加州大学洛杉矶分校计算机科学和统计学教授，IEEE智能系统名人堂第一批十位入选者之一，被誉为“贝叶斯网络之父”。2011年，Pearl因其在人工智能领域的基础性贡献荣获图灵奖。他提出的概率和因果性推理演算法，彻底改变了人工智能最初基于规则和逻辑的方向。Pearl曾获多项顶级科学荣誉，包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。

本书译者

刘礼重庆大学教授，博士生导师。获巴黎十一大学博士学位，重庆市高层次人才，一直致力于从事因果学习及其应用研究，主持项目20余项，发表论文100余篇，授权专利近10项，获省部级二等奖1项，入选2022年度AI2000人工智能最具影响力学者。

杨矫云 合肥工业大学副教授，兼任中国计算机学会理论计算机科学专业委员会委员。研究方向包括因果学习、健康数据分析等，主持国家自然科学基金面上项目和青年项目、安徽省重点研究与开发计划等项目10余项，以第一发明人授权中国发明专利4项，美国发明专利2项，出版译著1部，获安徽省教学成果奖二等奖一项（排名1）。

廖军重庆大学讲师，主要研究方向为因果知识发现、大数据分析技术及其在各领域的应用，主研国家自然基金项目、国家重点研发项目、重庆市重点基金项目近10项，发表SCI期刊及CCF会议论文20余篇，获得华夏（省部级）二等奖一项，主编《大数据基础教程》教材1本。

李廉合肥工业大学教授，2013-2018年任教育部高等学校大学计算机课程教学指导委员会主任，2014-2019任中国计算机学会理论计算机科学专业委员会主任。获中国计算机学会2020年度“杰出教育奖”。主要从事大数据分析、机器学习、计算智能等领域的研究。获安徽省教学成果一等奖两项，国家教学成果二等奖一项。

大咖推荐

朱迪亚·珀尔的书在没有超出基本概论的前提下，提供了关于因果模型和因果推断的引人入胜的导览，这些新的研究工作是以他为核心的。由于他与其他一些人的努力，因果概念思想和应用的“文艺复兴”已经开始。
——Patrick Suppes 斯坦福大学语言与信息研究中心教授，美国国家科学院院士曾任美国哲学学会主席

朱迪亚·珀尔对统计学和因果关系的研究充满热情和创造力。他的作品总是发人深省，值得仔细研究。这本书也不例外……一次又一次，我发现自己既不同意他的假设，也不同意他的结论，但我也对自己认为已经很了解的问题有了新的见识，这让我着迷。这本书说明了珀尔对于统计文献以及对于因果推断模型的共同理解所做出的巨大贡献。
——Stephen Fienber 卡内基·梅隆大学统计学和社会科学系Maurice Falk教授美国国家科学院院士，曾任国际数理统计学会主席

朱迪亚·珀尔的这本书对于人工智能、统计学、经济学、流行病学、哲学的研究者，以及所有对于因果性基本概念感兴趣的人来说都是十分珍贵的，它将会被证明是未来十年最具影响力的书之一。
——Joseph Halper 康奈尔大学计算机科学系教授，美国国家工程院院士

知其然且知其所以然是人类智能重要体现，本书从模型、算法和推理等方面讲解因果，是一本不可多得的好书。
——吴飞浙江大学教授，浙江大学人工智能研究所所长国家杰出青年科学基金获得者

该书是图灵奖获得者朱迪亚·珀尔教授关于因果网络模型的开创性著作，它影响了人工智能、统计学乃至哲学等自然科学和社会科学的各个领域。刘礼教授等精心翻译了这本因果推断的巨著，相信将对我国因果推断的研究起到重要的推动作用。
——耿直北京大学教授，北京生物医学统计与数据管理研究会理事长国家杰出青年科学基金获得者

这是一本超重量级的研究著作，即便是对于专门从事人工智能、数据科学方面的研究学者、技术人员或者学生而言，如果以前从未接触过因果模型、推理与推断，那么该书会激起他们对当前人工智能发展现状的反思和对未来人工智能发展方向的探索。
——蔡瑞初广东工业大学教授，国家优秀青年科学基金获得者

上拉下滑查看目录 ↓

中文版序

推荐者序

译者序

我为什么写这本书：回顾与期望

第2版前言

第1版前言

第1章　概率、图及因果模型1

1.1　概率论概述1

1.1.1　为什么学习概率1

1.1.2　概率论的基本概念2

1.1.3　预测支持与诊断支持结合7

1.1.4　随机变量与期望8

1.1.5　条件独立与图11

1.2　图与概率12

1.2.1　图的符号与术语12

1.2.2　贝叶斯网络13

1.2.3　d-分离准则17

1.2.4　贝叶斯网络推断20

1.3　因果贝叶斯网络22

1.3.1　用于干预谕言的因果网络23

1.3.2　因果关系及其稳定性25

1.4　函数因果模型27

1.4.1　结构方程28

1.4.2　因果模型中的概率预测31

1.4.3　函数模型中的干预与因果效应33

1.4.4　函数模型中的反事实34

1.5　因果与统计术语40

第2章　因果关系推断理论43

2.1　简介：基本直觉44

2.2　因果发现框架46

2.3　模型偏好（奥卡姆剃刀原则）47

2.4　稳定分布51

2.5　获取DAG结构52

2.6　重建潜在结构54

2.7　因果关系推断的局部准则57

2.8　非时间因果与统计时间61

2.9　结论63

2.9.1　关于极小性、马尔可夫性和稳定性64

第3章　因果图与因果效应识别69

3.1　简介70

3.2　马尔可夫模型中的干预72

3.2.1　作为干预模型的图72

3.2.2　干预作为变量75

3.2.3　计算干预效应76

3.2.4　因果量值的识别81

3.3　控制混杂偏差83

3.3.1　后门准则83

3.3.2　前门准则86

3.3.3　实例：吸烟与基因型理论88

3.4　干预的计算90

3.4.1　符号预备90

3.4.2　推断规则90

3.4.3　因果效应的符号推导：一个实例92

3.4.4　基于替代试验的因果推断94

3.5　可识别性的图模型检验95

3.5.1　识别模型97

3.5.2　非识别模型99

3.6　讨论100

3.6.1　要求与扩展100

3.6.2　图作为一种数学语言102

3.6.3　从图转换到潜在结果104

3.6.4　与Robins的G-估计的关系108

第4章　行动、计划和直接效应114

4.1　简介115

4.1.1　行动、动作和概率115

4.1.2　决策分析中的行动118

4.1.3　行动和反事实120

4.2　条件行动与随机策略121

4.3　什么时候行动的结果是可识别的122

4.3.1　基于图的识别条件122

4.3.2　识别效率124

4.3.3　对控制问题解析解的推导126

4.3.4　总结126

4.4　动态计划的可识别性127

4.4.1　动机127

4.4.2　识别计划：符号和假设129

4.4.3　识别计划：序贯后门准则130

4.4.4　识别计划：计算流程133

4.5　直接效应和间接效应136

4.5.1　直接效应与总效应136

4.5.2　直接效应、定义和识别137

4.5.3　案例:大学录取中的性别歧视问题138

4.5.4　自然直接效应141

4.5.5　间接效应与中介公式142

第5章　社会学和经济学中的因果关系与结构模型144

5.1　简介145

5.1.1　寻找因果语言145

5.1.2　SEM：它的意义怎么变模糊了146

5.1.3　图作为一种数学语言150

5.2　图与模型检验151

5.2.1　结构模型的可检验性含义152

5.2.2　检验可检验性156

5.2.3　模型等价性157

5.3　图与可识别性161

5.3.1　线性模型中的参数识别161

5.3.2　与非参数识别的比较167

5.3.3　因果效应：SEM的干预解释169

5.4　部分概念基础172

5.4.1　结构参数真实意味着什么172

5.4.2　效应分解的解释177

5.4.3　外生性、超外生性及其他话题178

5.5　结论183

5.6　第2版附言184

5.6.1　计量经济学的觉醒184

5.6.2　线性模型的识别问题185

5.6.3　因果论断的鲁棒性185

第6章　辛普森悖论、混杂与可压缩性187

6.1　剖析辛普森悖论188

6.1.1　一个有关悖论的示例188

6.1.2　统计学中苦恼的事情190

6.1.3　因果关系与可交换性192

6.1.4　悖论已解决（或者，人是什么类型的机器）195

6.2　为什么没有关于混杂的统计检验，为什么许多人认为应该有，为什么他们是正确的197

6.2.1　简介197

6.2.2　因果定义和关联定义199

6.3　关联性准则如何失效200

6.3.1　凭借边缘化使充分性失效200

6.3.2　凭借封闭世界假定使充分性失效201

6.3.3　凭借无益代理使必要性失效201

6.3.4　凭借偶然抵消使必要性失效203

6.4　稳定无偏与偶然无偏204

6.4.1　动机204

6.4.2　形式化定义206

6.4.3　稳定无混杂的运算检验207

6.5　混杂、可压缩性和可交换性208

6.5.1　混杂与可压缩性208

6.5.2　混杂与混杂因子210

6.5.3　可交换性与混杂结构分析212

6.6　结论215

第7章　结构化反事实的逻辑217

7.1　结构模型语义学218

7.1.1　定义：因果模型、行动与反事实219

7.1.2　评估反事实：确定性分析223

7.1.3　评估反事实：概率分析228

7.1.4　孪生网络法230

7.2　结构模型的应用与解释231

7.2.1　线性经济计量模型政策分析：示例231

7.2.2　反事实的实证性内容 234

7.2.3　因果解释、表达及其理解238

7.2.4　从机制到行动再到因果240

7.2.5　Simon因果顺序243

7.3　公理刻画246

7.3.1　结构反事实的公理246

7.3.2　反事实逻辑中的因果效应：示例249

7.3.3　因果相关性公理252

7.4　基于结构化和相似性的反事实256

7.4.1　与Lewis反事实的关系256

7.4.2　公理系统的比较258

7.4.3　成像与条件260

7.4.4　与Neyman-Rubin框架的关系262

7.4.5　外生性和工具变量：反事实定义和图模型定义264

7.5　结构因果与概率因果267

7.5.1　对时序的依赖性268

7.5.2　死循环风险269

7.5.3　与孩子们一起挑战封闭世界假定271

7.5.4　特例因果与一般因果272

7.5.5　总结275

第8章　不完美实验：边界效应和反事实277

8.1　简介278

8.1.1　不完美与间接实验278

8.1.2　不依从性与治疗意愿279

8.2　利用工具变量界定因果效应的范围280

8.2.1　问题的形式化表述：约束优化280

8.2.2　正则划分：有限响应变量的演化282

8.2.3　线性规划公式284

8.2.4　自然边界286

8.2.5　对于处理（治疗）者的处理效应（ETT）287

8.2.6　示例：消胆胺的作用288

8.3　反事实和法律责任289

8.4　工具变量测试291

8.5　解决不依从性的一种贝叶斯方法293

8.5.1　贝叶斯方法和吉布斯采样293

8.5.2　样本量和先验分布的效应295

8.5.3　从不完全依从的临床数据中估计因果效应296

8.5.4　特例事件因果关系的贝叶斯估计298

8.6　结论299

第9章　因果关系概率：解释和识别300

9.1　简介301

9.2　充分必要原因：识别条件303

9.2.1　定义、符号和基本关系303

9.2.2　外生性下的界限与基本关系306

9.2.3　单调性和外生性下的可识别性309

9.2.4　单调性和非外生性下的可识别性311

9.3　实例与应用314

9.3.1　实例1：公平硬币下注314

9.3.2　实例2：刑法执行316

9.3.3　实例3：辐射对白血病的影响317

9.3.4　实例4：来自实验数据和非实验数据的法律责任320

9.3.5　结果总结321

9.4　非单调模型的可识别性322

9.5　结论325

第10章　实际原因327

10.1　引言：必要因果关系的不充分性328

10.1.1　重新探讨特例原因 328

10.1.2　抢占和结构信息的作用329

10.1.3　过度确定和准依赖性331

10.1.4　Mackie的INUS条件332

10.2　产生、依赖和维持334

10.3　因果束和基于维持的因果关系337

10.3.1　因果束：定义及其含义337

10.3.2　实例：从析取式到通用公式340

10.3.3　束、抢占以及特例事件因果关系的概率342

10.3.4　路径切换因果关系344

10.3.5　时序抢占345

10.4　结论347

第11章　对读者的回应、阐述和讨论351

11.1　因果、统计和图的术语351

11.1.1　区分因果和统计是必要的吗351

11.1.2　无须担心的d-分离（第1章）355

11.2　逆转统计时间（第2章）358

11.3　估计因果效应359

11.3.1　后门准则背后的直观理解（第3章）359

11.3.2　揭开神秘的“强可忽略性”362

11.3.3　后门准则的另一种证明365

11.3.4　协变量选择中的数据与知识368

11.3.5　理解倾向得分370

11.3.6　do-算子背后的直观性374

11.3.7　G-估计的有效性374

11.4　策略评估与do-操作376

11.4.1　识别附条件计划（4.2节）376

11.4.2　间接效应的意义378

11.4.3　do(x)能够表示实际实验吗380

11.4.4　do(x)操作是通用的吗381

11.4.5　没有操纵的因果关系384

11.4.6　与Cartwright一起追猎原因385

11.4.7　非模块化的错觉387

11.5　线性结构模型中的因果分析389

11.5.1　参数识别的一般准则（第5章）389

11.5.2　结构系数的因果解释390

11.5.3　为SEM（或者SEM救生包）的因果解释辩护392

11.5.4　今天的经济学模型在哪里—与Heckman一起追求原因398

11.5.5　外部变化与外科手术401

11.6　决策与混杂（第6章）405

11.6.1　辛普森悖论与决策树405

11.6.2　时间信息对于决策树是充分的吗407

11.6.3　Lindley关于因果性、决策树和贝叶斯主义的理解409

11.6.4　为什么混杂不是一个统计学概念412

11.7　反事实的演算414

11.7.1　线性系统中的反事实414

11.7.2　反事实的意义417

11.7.3　反事实的d-分离420

11.8　工具变量与不依从性421

11.9　更多关于因果关系的概率422

11.9.1　“有罪的概率为1”有可能吗422

11.9.2　收紧因果关系的概率界限424

后记：因果的艺术与科学427

参考文献462

索引488

扫码关注【华章计算机】视频号

每天来听华章哥讲书

更多精彩回顾

书讯 | 5月书讯（上）| 元宇宙、因果推断、薛定谔方程...你关注的都在这

书讯 | 5月书讯（下）|设计致物系列+少儿编程好书推荐

资讯 | 分布式系统一致性的本质，看这篇秒懂

书单 | 知乎高赞：有哪些你看了以后大呼过瘾的数据分析书？

干货 | Go语言精进之路：你知道什么是Go语言编程思维吗？

收藏 | 终于有人把Scrapy爬虫框架讲明白了

上新 | Verilog HDL与FPGA数字系统设计第2版

赠书 | 【第102期】传统企业如何应对数字化转型？这些书给你答案

干货 | 为什么每一名程序员都应该学习 C++？

干货 | 如果机器翻译始终存在缺陷和错误，那它还有什么用处？

点击阅读全文购买

为企业数字人才建粮仓：专访极客邦科技双数研究院院长付晓岩

2022美国科学院院士名单公布：图灵奖得主、龙书作者Alfred V. Aho当选！

客户留存的4个产品策略

5种常用格式的数据输出，手把手教你用Pandas实现

漫画：什么是IaaS、PaaS、SaaS？

Java核心技术：日期和时间新旧API对比

JavaScript框架发展的四个时代，你经历过其中几个阶段?

C#代码整洁之道：代码重构与性能提升

详解边缘计算系统逻辑架构：云、边、端协同

人工智能技术的演进和发展

终于有人把工业数据采集讲明白了

揭秘华为数字化转型框架：1套方法、4类场景、3个平台能力

【第104期】7本适合设计师提升交互设计能力的书

Go语言精进之路：绞尽脑汁，帮你理解方法本质并选择正确的receiver类型

盘点知识图谱在 5 大智能领域的应用

[LeetCode] Wiggle Sort

[原]深入对比数据科学工具箱：Python和R 非结构化数据的结构化

axios 和 cookie 的那些事

Brief introduction of how to 'Call, Apply and Bind'

Git的一些常用操作

Git同步原始仓库到Fork仓库中

Java方法详解

Linux gpio口使用方法

阿里云购买磁盘后挂载

编写符合Python风格的对象

猫头鹰的深夜翻译：JDK9 NotNullOrElse方法

赢得Docker挑战最佳实践

【运维趟坑回忆录】vpc迁移 - 吃螃蟹之路

阿里云服务器购买完整流程

阿里云移动端播放器高级功能介绍

从如何停掉 Promise 链说起

大数据全解：定义、价值及挑战

翻译 | The Principles of OOD 面向对象设计原则

（4）logging（日志模块）

(42)STM32——LCD显示屏实验笔记

（Redis使用系列） Springboot 实现Redis 同数据源动态切换db 八

(十三)Maven插件解析运行机制

(转)Java socket中关闭IO流后，发生什么事？（以关闭输出流为例） .

（转）Unity3DUnity3D在android下调试

*_zh_CN.properties 国际化资源文件 struts 防乱码等

./mysql.server: 没有那个文件或目录_Linux下安装MySQL出现“ls: /var/lib/mysql/*.pid: 没有那个文件或目录”...

.Net Core缓存组件(MemoryCache)源码解析

.Net IOC框架入门之一 Unity

.NET Standard 支持的 .NET Framework 和 .NET Core

.net 简单实现MD5

.NET 中小心嵌套等待的 Task，它可能会耗尽你线程池的现有资源，出现类似死锁的情况

.NET6实现破解Modbus poll点表配置文件

.NET单元测试

.net反编译工具

.NET学习全景图

:O)修改linux硬件时间

@converter 只能用mysql吗_python-MySQLConverter对象没有mysql-connector属性’...

@NoArgsConstructor和@AllArgsConstructor,@Builder

@value 静态变量_Python彻底搞懂：变量、对象、赋值、引用、拷贝

[ 代码审计篇 ] 代码审计案例详解(一) SQL注入代码审计案例

相关文章：