基于Python的因果推断
基于Python的因果推断
Matheus Facure
刘继红, 谢艳玲, 于恺 译
出版时间:2025年03月
页数:407
“Matheus撰写了这本教你如何摆脱玩具模型,掌握处理现实数据和解决重要实际问题最新方法的最好的书。”
——Sean J. Taylor
数据分析公司Motif Analytics首席科学家
“本书是因果推断的入门书,重点介绍了Python数据分析社区非常熟悉的工具和环境。”
——Nick Huntington-Klein
经济学教授,The Effect: An Introduction to Research Design and Causality作者

多花一美元的在线营销能吸引多少买家?哪些顾客有了折扣优惠券才会购物?如何确定最优定价策略?因果推断是确定您手中拥有的杠杆如何影响您想要追求的业务指标的最好办法。这只需要几行Python代码而已。
本书作者阐述了因果推断在估计影响和效应方面尚未开发的巨大潜力。管理者、数据科学家,以及业务分析人员将学习到A/B测试、线性回归、倾向性评分、合成控制、双重差分等经典因果推断方法和基于机器学习的异质效应估计等新进展。每种方法都用行业应用示例加以说明。
本书将帮助读者:
● 学习如何理解因果推断的基本概念。
● 将业务问题定义为因果推断问题。
● 理解偏差如何干扰因果推断。
● 学习因果效应如何能够因人而异。
● 将相同客户不同时间的观测用于因果推断。
● 在随机化不可行的时候利用地理和回溯实验。
● 检验非遵从性偏差和效应稀释
  1. 前言
  2. 第一部分 基础知识
  3. 第1章 因果推断导论
  4. 1.1 什么是因果推断
  5. 1.2 为什么要做因果推断
  6. 1.3 机器学习与因果推断
  7. 1.4 关联关系与因果关系
  8. 1.4.1 处理和结果
  9. 1.4.2 因果推断的基本问题
  10. 1.4.3 因果模型
  11. 1.4.4 干预
  12. 1.4.5 个体处理效应
  13. 1.4.6 潜在结果
  14. 1.4.7 一致性假设与稳定单元处理值假设
  15. 1.4.8 关注的因果量
  16. 1.4.9 因果量示例
  17. 1.5 偏差
  18. 1.5.1 偏差方程
  19. 1.5.2 偏差可视化
  20. 1.6 识别处理效应
  21. 1.6.1 独立性假设
  22. 1.6.2 基于随机化的识别
  23. 1.7 本章小结
  24. 第2章 随机试验与统计学
  25. 2.1 随机化的强制独立性
  26. 2.2 A/B测试示例
  27. 2.3 理想试验
  28. 2.4 最危险的方程
  29. 2.5 估计的标准误差
  30. 2.6 置信区间
  31. 2.7 假设检验
  32. 2.7.1 零假设
  33. 2.7.2 检验统计量
  34. 2.8 p值
  35. 2.9 功效
  36. 2.10 样本量计算
  37. 2.11 本章小结
  38. 第3章 图形化因果模型
  39. 3.1 关于因果关系的思考
  40. 3.1.1 因果关系的可视化
  41. 3.1.2 咨询顾问聘用示例
  42. 3.2 图形化因果模型的速成课
  43. 3.2.1 因果链
  44. 3.2.2 因果分叉
  45. 3.2.3 因果失范或因果对撞
  46. 3.2.4 关联流备忘单
  47. 3.2.5 因果图查询
  48. 3.3 识别的再认识
  49. 3.4 CIA与调整公式
  50. 3.5 正值假设
  51. 3.6 利用数据的因果识别示例
  52. 3.7 混淆偏差
  53. 3.7.1 替代混淆
  54. 3.7.2 再论随机化
  55. 3.8 选择偏差
  56. 3.8.1 限定对撞因子
  57. 3.8.2 调整选择偏差
  58. 3.8.3 限定中介变量
  59. 3.9 本章小结
  60. 第二部分 偏差调整
  61. 第4章 线性回归的不合理有效性
  62. 4.1 线性回归
  63. 4.1.1 为什么需要模型
  64. 4.1.2 A/B测试中的回归
  65. 4.1.3 回归调整
  66. 4.2 回归理论
  67. 4.2.1 单变量线性回归
  68. 4.2.2 多变量线性回归
  69. 4.3 弗里希-沃-洛弗尔定理和正交化
  70. 4.3.1 去偏步骤
  71. 4.3.2 去噪步骤
  72. 4.3.3 回归估计的标准误差
  73. 4.3.4 最终结果模型
  74. 4.3.5 FWL总结
  75. 4.4 作为结果模型的回归
  76. 4.5 正值性和外推
  77. 4.6 线性回归的非线性
  78. 4.6.1 处理的线性化
  79. 4.6.2 非线性FWL和去偏
  80. 4.7 虚拟变量的回归
  81. 4.7.1 条件随机实验
  82. 4.7.2 虚拟变量
  83. 4.7.3 饱和回归模型
  84. 4.7.4 方差加权平均回归
  85. 4.7.5 去义和固定效应
  86. 4.8 遗漏变量偏差:回归视角下的混杂因子
  87. 4.9 中性控制
  88. 4.9.1 噪声诱导控制
  89. 4.9.2 特征选择:偏差与方差的权衡
  90. 4.10 本章小结
  91. 第5章 倾向性评分
  92. 5.1 管理培训的影响
  93. 5.2 基于回归的调整
  94. 5.3 倾向性评分基础
  95. 5.3.1 倾向性得分估计
  96. 5.3.2 倾向性得分和正交化
  97. 5.3.3 倾向性得分匹配
  98. 5.3.4 逆倾向性加权法
  99. 5.3.5 IPW的方差
  100. 5.3.6 倾向性权重的稳定化
  101. 5.3.7 伪群体
  102. 5.3.8 选择偏差
  103. 5.3.9 偏差-方差权衡
  104. 5.3.10 正值性
  105. 5.4 基于设计的识别与基于模型的识别
  106. 5.5 双重稳健估计
  107. 5.5.1 处理容易建模的示例
  108. 5.5.2 结果容易建模的示例
  109. 5.6 面向连续处理的广义倾向性得分
  110. 5.7 本章小结
  111. 第三部分 效应异质性与个性化
  112. 第6章 效应异质性
  113. 6.1 从ATE到CATE
  114. 6.2 为什么预测结果不是答案
  115. 6.3 利用回归估计CATE
  116. 6.4 评估CATE预测结果
  117. 6.5 按模型分位数划分的效应
  118. 6.6 累积效应
  119. 6.7 累计增益
  120. 6.8 目标转换
  121. 6.9 预测模型适用于效应排序
  122. 6.9.1 边际递减收益
  123. 6.9.2 二元结果
  124. 6.10 用于决策的CATE
  125. 6.11 本章小结
  126. 第7章 元学习器
  127. 7.1 用于离散性处理的元学习器
  128. 7.1.1 T学习器
  129. 7.1.2 X学习器
  130. 7.2 用于连续性处理的元学习器
  131. 7.2.1 S学习器
  132. 7.2.2 双重/去偏机器学习
  133. 7.3 本章小结
  134. 第四部分 面板数据
  135. 第8章 双重差分法
  136. 8.1 面板数据
  137. 8.2 经典双重差分法
  138. 8.2.1 带有结果增长的双重差分法
  139. 8.2.2 带最小二乘法的双重差分法
  140. 8.2.3 带有固定效应的双重差分法
  141. 8.2.4 多时间段
  142. 8.2.5 推断分析
  143. 8.3 识别假设
  144. 8.3.1 平行趋势
  145. 8.3.2 无预期假设和稳定单元处理效应假设
  146. 8.3.3 严格外生性假设
  147. 8.3.4 无时间变化混杂因子
  148. 8.3.5 无反馈
  149. 8.3.6 无结转效应和无滞后因变量
  150. 8.3.7 效应时变性
  151. 8.3.8 带有协变量的双重差分法
  152. 8.4 双重稳健的双重差分法
  153. 8.4.1 倾向性评分模型
  154. 8.4.2 结果增量模型
  155. 8.4.3 整合所有要素
  156. 8.5 交错采用
  157. 8.5.1 时变的效应
  158. 8.5.2 协变量
  159. 8.6 本章小结
  160. 第9章 合成控制
  161. 9.1 在线营销数据集
  162. 9.2 矩阵表示
  163. 9.3 作为水平回归的合成控制
  164. 9.4 标准合成控制
  165. 9.5 带有协变量的合成控制
  166. 9.6 去偏合成控制
  167. 9.7 推断分析
  168. 9.8 合成双重差分法
  169. 9.8.1 双重差分法回顾
  170. 9.8.2 合成控制回顾
  171. 9.8.3 估计时间权重
  172. 9.8.4 合成控制与双重差分法
  173. 9.9 本章小结
  174. 第五部分 替代实验设计
  175. 第10章 地理与回溯实验
  176. 10.1 地理实验
  177. 10.2 合成控制设计
  178. 10.2.1 处理单元的随机集合
  179. 10.2.2 随机搜索
  180. 10.3 回溯实验
  181. 10.3.1 序列的潜在结果
  182. 10.3.2 估计延滞效应的阶
  183. 10.3.3 基于设计的估计
  184. 10.3.4 最优回溯设计
  185. 10.3.5 稳健方差
  186. 10.4 本章小结
  187. 第11章 非遵从性和工具变量
  188. 11.1 非遵从性
  189. 11.2 扩展潜在结果
  190. 11.3 工具变量识别假设
  191. 11.4 第一阶段
  192. 11.5 简化形式
  193. 11.6 两阶段最小二乘法
  194. 11.7 标准误差
  195. 11.8 额外的控制变量和工具变量
  196. 11.8.1 手工实现两阶段最小二乘法
  197. 11.8.2 矩阵实现
  198. 11.9 断点设计
  199. 11.9.1 断点设计假设
  200. 11.9.2 意向处理效应
  201. 11.9.3 工具变量估计
  202. 11.9.4 簇聚
  203. 11.10 本章小结
  204. 第12章 展望
  205. 12.1 因果发现
  206. 12.2 连续决策
  207. 12.3 因果强化学习
  208. 12.4 因果预测
  209. 12.5 域自适应
  210. 12.6 结束语
书名:基于Python的因果推断
作者:Matheus Facure
译者:刘继红, 谢艳玲, 于恺 译
国内出版社:中国电力出版社
出版时间:2025年03月
页数:407
书号:978-7-5198-9740-6
原版书书名:Causal Inference in Python
原版书出版商:O'Reilly Media
Matheus Facure
 
Matheus Facure是Nubank(亚洲以外最大财经科技公司)的经济学家和高级数据科学家。他在很多商务场景成功应用了因果推断技术,从自动实时信用卡决策到交叉邮件与营销预算优化。他也是《Causal Inference for the Brave and True》一书的著者。
这本畅销书旨在以一种轻松但严谨的方式推动因果推断成为主流研究与应用技术。
 
 
本书封面上的动物是绿树蜥(学名:green forest lizard)。拉丁名源自希腊语kalos,意思是精致或纤细优美。树蜥属的特征是在某些条件下能够变色。例如,雄绿树蜥的头部和喉咙在繁殖季节呈鲜红色。平时,它们往往呈淡黄或棕绿色,而整个背部出现白色或深绿色条纹。
绿树蜥属于中到大体型的蜥蜴,平均身长19.5~25.5英寸。该长度包括其特别细长的尾巴。
绿树蜥仅生存于斯里兰卡、印度西高止山脉和舍瓦罗伊丘陵地区的生物多样性森林里。部分栖息地是保护区,它们成千上万的邻近物种则受到威胁。绿树蜥种群是稳定的。O’Reilly书籍封面上的很多动物都是濒危动物,都是世界宝贵动物。
购买选项
定价:128.00元
书号:978-7-5198-9740-6
出版社:中国电力出版社