基于R和Python的行为数据分析
基于R和Python的行为数据分析
Florent Buisson
林琪, 张学阳 等译
出版时间:2025年09月
页数:360
“这本书别具一格地从问题出发,充分利用技术和编程语言作为实用工具。读者将从中学会如何解释重要而棘手的问题。买下这本书,花时间好好读一读,这本书绝对值得你投入的时间和金钱。”
——Eric Weber
实验部首席, Yelp

利用专门为行为数据分析设计的学习工具充分发挥企业行为数据的强大作用。常用的数据科学算法和预测分析工具总是将客户行为数据(如网站点击量或超市购买量)与其他数据等同对待。与此不同,这本实用指南介绍了专门为行为数据分析量身定做的强大方法。
高级实验设计可以帮助我们最大程度利用A/B检验,因果图则允许我们提取行为原因,即使无法运行实验。这本书面向数据科学家、业务分析师和行为科学家,简明实用,提供了丰富的R和Python示例帮助你一目了然地从数据中获取更多信息。
● 理解行为数据的特征。
● 探讨测量与预测之间的区别。
● 学习如何清理和准备行为数据。
● 设计和分析实验,从而做出最优商业决策。
● 使用行为数据理解和度量原因和结果。
● 以一种透明且周全的方式细分顾客。
  1. 前言
  2. 第一部分 理解行为
  3. 第1章 数据分析因果–行为框架
  4. 1.1 为什么需要因果分析解释人类行为
  5. 1.1.1 不同分析类型
  6. 1.1.2 人是复杂的
  7. 1.2 混淆!用回归解决问题的潜在危险
  8. 1.2.1 数据
  9. 1.2.2 为什么相关关系不是因果关系:混杂因素的作用
  10. 1.2.3 太多变量可能坏事
  11. 1.3 小结
  12. 第2章 理解行为数据
  13. 2.1 人类行为基本模型
  14. 2.1.1 个人特征
  15. 2.1.2 认知和情感
  16. 2.1.3 意图
  17. 2.1.4 行动
  18. 2.1.5 业务行为
  19. 2.2 如何连接行为和数据
  20. 2.2.1 建立一种行为完整性思维模式
  21. 2.2.2 不信任与验证
  22. 2.2.3 识别类别
  23. 2.2.4 细化行为变量
  24. 2.2.5 了解上下文
  25. 2.3 小结
  26. 第二部分 因果图和去混杂
  27. 第3章 因果图介绍
  28. 3.1 因果图和因果–行为框架
  29. 3.1.1 因果图表示行为
  30. 3.1.2 因果图表示数据
  31. 3.2 因果图的基本结构
  32. 3.2.1 链式结构
  33. 3.2.2 分叉结构
  34. 3.2.3 对撞结构
  35. 3.3 因果图的常见转换
  36. 3.3.1 划分/拆解变量
  37. 3.3.2 聚合变量
  38. 3.3.3 关于环
  39. 3.3.4 路径
  40. 3.4 小结
  41. 第4章 从头构建因果图
  42. 4.1 业务问题和数据准备
  43. 4.1.1 数据和包
  44. 4.1.2 理解感兴趣的关系
  45. 4.2 识别要包含的候选变量
  46. 4.2.1 行动
  47. 4.2.2 意图
  48. 4.2.3 认知和情感
  49. 4.2.4 个人特征
  50. 4.2.5 业务行为
  51. 4.2.6 时间趋势
  52. 4.3 根据数据确认要包含的可观察变量
  53. 4.3.1 数值变量间的关系
  54. 4.3.2 分类变量间的关系
  55. 4.3.3 数值与分类变量间的关系
  56. 4.4 交互扩展因果图
  57. 4.4.1 明确未观察变量的代理
  58. 4.4.2 明确进一步原因
  59. 4.4.3 迭代
  60. 4.5 简化因果图
  61. 4.6 小结
  62. 第5章 数据分析中使用因果图去混杂
  63. 5.1 业务问题:冰淇淋和瓶装水销售
  64. 5.2 析取原因规则
  65. 5.2.1 定义
  66. 5.2.2 第一个模块
  67. 5.2.3 第二个模块
  68. 5.3 后门规则
  69. 5.3.1 定义
  70. 5.3.2 第一个模块
  71. 5.3.3 第二个模块
  72. 5.4 小结
  73. 第三部分 鲁棒数据分析
  74. 第6章 处理缺失数据
  75. 6.1 数据和包
  76. 6.2 缺失数据可视化
  77. 6.2.1 缺失数据量
  78. 6.2.2 缺失的相关性
  79. 6.3 诊断缺失数据
  80. 6.3.1 缺失的原因:Rubin分类
  81. 6.3.2 诊断MCAR变量
  82. 6.3.3 诊断MAR变量
  83. 6.3.4 诊断MNAR变量
  84. 6.3.5 缺失性范围
  85. 6.4 处理缺失数据
  86. 6.4.1 多重插补(MI)简介
  87. 6.4.2 默认插补方法:预测均值匹配
  88. 6.4.3 从PMM到正态插补(仅R)
  89. 6.4.4 增加辅助变量
  90. 6.4.5 增加插补数据集数量
  91. 6.5 小结
  92. 第7章 使用Bootstrap测量不确定性
  93. 7.1 Bootstrap简介:自“引导”
  94. 7.1.1 包
  95. 7.1.2 业务问题:有一个异常值的小数据
  96. 7.1.3 样本均值的Bootstrap置信区间
  97. 7.1.4 Bootstrap置信区间用于自定义统计分析
  98. 7.2 Bootstrap用于回归分析
  99. 7.3 何时使用Bootstrap
  100. 7.3.1 传统中心估计的充分条件
  101. 7.3.2 传统CI的充分条件
  102. 7.3.3 确定Bootstrap样本数
  103. 7.4 R和Python中优化Bootstrap
  104. 7.4.1 R:boot包
  105. 7.4.2 Python优化
  106. 7.5 小结
  107. 第四部分 设计和分析实验
  108. 第8章 实验设计:基础
  109. 8.1 计划实验:改变理论
  110. 8.1.1 业务目标和目标指标
  111. 8.1.2 干预
  112. 8.1.3 行为逻辑
  113. 8.2 数据和包
  114. 8.3 确定随机分配和样本量/功效
  115. 8.3.1 随机分配
  116. 8.3.2 样本量和功效分析
  117. 8.4 分析和解释实验结果
  118. 8.5 小结
  119. 第9章 分层随机化
  120. 9.1 计划实验
  121. 9.1.1 业务目标和目标指标
  122. 9.1.2 干预定义
  123. 9.1.3 行为逻辑
  124. 9.1.4 数据和包
  125. 9.2 确定随机分配和样本量/功效
  126. 9.2.1 随机分配
  127. 9.2.2 使用Bootstrap模拟的功效分析
  128. 9.3 分析和解释实验结果
  129. 9.3.1 鼓励干预的意向性估计
  130. 9.3.2 强制干预的CACE
  131. 9.4 小结
  132. 第10章 聚类随机与层次建模
  133. 10.1 计划实验
  134. 10.1.1 业务目标和目标指标
  135. 10.1.2 干预定义
  136. 10.1.3 行为逻辑
  137. 10.2 数据和包
  138. 10.3 分层建模介绍
  139. 10.3.1 R代码
  140. 10.3.2 Python代码
  141. 10.4 确定随机分配和样本量/功效
  142. 10.4.1 随机分配
  143. 10.4.2 功效分析
  144. 10.5 分析实验
  145. 10.6 小结
  146. 第五部分 行为数据分析高级工具
  147. 第11章 调节
  148. 11.1 数据和包
  149. 11.2 调节的各种行为
  150. 11.2.1 细分
  151. 11.2.2 相互作用
  152. 11.2.3 非线性
  153. 11.3 如何应用调节
  154. 11.3.1 何时需要调节
  155. 11.3.2 多调节量
  156. 11.3.3 用Bootstrap验证调节
  157. 11.3.4 解释单个系数
  158. 11.4 小结
  159. 第12章 中介和工具变量
  160. 12.1 中介
  161. 12.1.1 理解因果机制
  162. 12.1.2 因果偏差
  163. 12.1.3 识别中介
  164. 12.1.4 度量中介
  165. 12.2 工具变量
  166. 12.2.1 数据
  167. 12.2.2 包
  168. 12.2.3 理解和分析IV
  169. 12.2.4 度量
  170. 12.2.5 应用IV:常见问题
  171. 12.3 小结
  172. 参考文献
书名:基于R和Python的行为数据分析
作者:Florent Buisson
译者:林琪, 张学阳 等译
国内出版社:中国电力出版社
出版时间:2025年09月
页数:360
书号:978-7-5239-0158-8
原版书书名:Behavioral Data Analysis with R and Python
原版书出版商:O'Reilly Media
Florent Buisson
 
Florent Buisson是一位行为经济学家,在商业、分析和行为科学领域有10余年的经验。近年来他在Allstate保险公司创建并领导了四年的行为科学团队。Florent在一些期刊上发表了多篇学术文章,如同行评议的《房地产研究杂志》(Journal of Real Estate Research)。他拥有巴黎Sorbonne大学计量经济学硕士学位和行为经济学博士学位。
 
 
本书的封面动物是一只南美洲响尾蛇。这种剧毒的蝮蛇栖息在南美洲除了安第斯山脉和遥远南部的大部分地区。在一些加勒比海岛上也能找到它。
这些响尾蛇外观多样,通常有苍白的底面,背部在苍白的背景上有深棕色的钻石形状或条纹。它们以啮齿动物和蜥蜴为食。成年响尾蛇可以长到6英尺长,人工饲养可以活到20年。它们的繁殖是季节性的,雌性一次能产下多达14条小蛇。
据估计,美洲每年约有400人死于蛇咬,被南美洲响尾蛇咬伤尤其致命。它的毒液有四种主要毒素:响尾蛇毒素、惊厥毒素、回旋毒素和响尾蛇胺,响尾蛇用这些毒素捕获和消化猎物。
响尾蛇经常用它们的神秘伪装作为第一道防线,在大型动物接近时保持静止;这种策略可能会导致人类被咬,因为他们离蛇太近,甚至踩到蛇。另一道防线正是它们名字的由来:尾巴上的“响铃”是它们独特的警告特征。这些响铃由多层松散的角质鳞片构成,响尾蛇使用一组独有的尾部肌肉振动尾巴时,干燥的角质层相互撞击,发出众所周知的声音。每当响尾蛇蜕皮时,就会增加一组响铃,所以鳞片的数量(连同响尾蛇的大小和长度)可以作为其年龄的一个潜在指标。
南美洲响尾蛇被世界自然保护联盟列为最不受关注的物种。O’Reilly封面上的很多动物都濒临灭绝;它们对世界都很重要。
购买选项
定价:128.00元
书号:978-7-5239-0158-8
出版社:中国电力出版社