R语言核心技术手册(第2版)
Joseph Adler
刘思喆, 李舰, 陈钢, 邓一硕 译
出版时间:2014年07月
页数:633
“R是一种免费且功能强大的语言,但不易入门。本书是学习R语言的不二之选,是每个数据科学家必备的案头参考书。”
—— DJ Patil,Greylock公司房产领域
数据科学家
“R迅速蹿红为数据分析的通用语言,本书堪称是学习R语言的最佳入门书籍。它涵盖了包括数据可视化、时间序列分析等在内数据科学能包罗的所有领域。”
—— Anthony Goldbloom,Kaggle公司创始人兼CEO

如果你打算用R进行统计计算和数据可视化,本书就是关于使用开源R语言(软件环境)快速解决上述问题的实用指导教程。通过本书,你将学会如何编写R函数以及借助R包进行数据预处理、可视化以及数据分析。作者用取自医学、商业和体育领域的丰富案例对上述问题进行了讲解。
第2版的内容依据R 2.14和R 2.15进行了更新,并新增了R高性能计算、基于ggplot2的数据可视化和利用Hadoop做并行运算等章节。

· 多达数百个实例的R教程,快速入门R语言
· 探索R语言的语法、对象和其他语言细节
· 在网站上可找到包括Bioconductor在内的数千个用户共享的R包
· 学习如何用R完成数据分析预处理
· 基于R graphics、lattice和ggplot2包进行数据可视化
· 使用R语言计算概率分布、统计检验以及拟合模型
· 基于Hadoop并行编程提升大规模运算的效率
· 学习R语言的完整参考手册
  1. 前言
  2. i基础篇
  3. 第1章获取和安装r
  4. r版本
  5. r的安装
  6. windows
  7. mac os x
  8. linux和unix系统
  9. 第2章 r的用户界面
  10. r的图形用户界面
  11. windows
  12. mac os x
  13. linux和unix程序
  14. r控制台
  15. 命令行编辑
  16. 批处理模式
  17. 在excel中使用r
  18. rstudio
  19. 其他运行r的方式
  20. 第3章 简短的示例
  21. 基本操作
  22. 函数
  23. 变量
  24. 数据结构简介
  25. 对象和类
  26. 模型和公式
  27. 图表
  28. 获得帮助
  29. 第4章 r包
  30. r包概览
  31. 列示本地库中的r包
  32. 加载r包
  33. 在windows和linux系统下加载r包
  34. 在mac os x系统下加载r包
  35. 搜索r包资源库
  36. 搜索网络上的r包资源库
  37. 基于r界面搜寻和安装包
  38. 从其他资源库安装r包
  39. 定制r包
  40. 创建包目录
  41. 创建r包
  42. ii语言篇
  43. 第5章 r语言概览
  44. 表达式
  45. 对象
  46. 符号
  47. 函数
  48. 在赋值语句中,对象会被复制
  49. r中一切皆为对象
  50. 特殊值
  51. na
  52. inf和-inf
  53. nan
  54. null
  55. 强制转换
  56. r解释器
  57. 观察r是如何工作的
  58. 第6章 r语法
  59. 常量
  60. 数值向量
  61. 字符向量
  62. 符号
  63. 运算符
  64. 运算顺序
  65. 赋值操作
  66. 表达式
  67. 分离型表达式
  68. 括号
  69. 花括号
  70. 控制结构
  71. 条件语句
  72. 循环
  73. 访问数据结构
  74. 数据结构操作符
  75. 通过整数向量引用
  76. 通过逻辑向量引用
  77. 通过名字进行引用
  78. r编程标准
  79. 第7章 r对象
  80. 基本对象类型
  81. 向量
  82. 列表
  83. 其他对象
  84. 矩阵
  85. 数组
  86. 因子
  87. 数据框
  88. 公式
  89. 时间序列
  90. shingle对象
  91. 日期和时间对象
  92. 连接对象
  93. 属性
  94. 第8章 符号和环境
  95. 符号
  96. 环境
  97. 全局环境
  98. 环境和函数
  99. 调用堆栈
  100. 在不同的环境中对函数求值
  101. 向环境中添加对象
  102. 异常
  103. 提示错误
  104. 捕获错误
  105. 第9章 函数
  106. 函数的关键字
  107. 参数
  108. 返回值
  109. 函数参数
  110. 匿名函数
  111. 函数的属性
  112. 参数顺序和具名实参
  113. 副作用
  114. 改变其他环境
  115. 输入/输出
  116. 图形
  117. 第10章 面向对象编程
  118. r的面向对象编程概览
  119. 核心概念
  120. 实现的例子
  121. r的面向对象编程:s4
  122. 类的定义
  123. 对象的新建
  124. 槽的存取
  125. 对象的操作
  126. 创建强制转换方法
  127. 方法
  128. 方法的管理
  129. 基本类型
  130. 更多的帮助
  131. 守旧派的oop:s3
  132. s3的类
  133. s3方法
  134. 在s4的类中使用s3的类
  135. 查找隐藏的s3方法
  136. iii 数据篇
  137. 第11章 数据的存取和编辑
  138. 在r中输入数据
  139. 用r命令输入数据
  140. 用图形界面输入数据
  141. 保存和读入r对象
  142. 用save保存对象
  143. 从外部文件导入数据
  144. 文本文件
  145. 其他软件
  146. 导出数据
  147. 从数据库获取数据
  148. 导出然后导入
  149. 数据库连接包
  150. rodbc
  151. dbi
  152. tsdbi
  153. 从hadoop中获取数据
  154. 第12章 准备数据
  155. 合并数据集
  156. 粘贴数据结构
  157. 通过共同字段合并数据
  158. 数据转换
  159. 变量重新赋值
  160. 转换函数
  161. 对对象的每个元素进行函数运算
  162. 数据分段
  163. shingle
  164. cut
  165. 利用分组变量合并对象
  166. 子集
  167. 中括号索引的方式
  168. subset函数
  169. 随机抽样
  170. 汇总函数
  171. tapply与aggregate
  172. 用rowsum聚合表格
  173. 计数
  174. 数据修整
  175. 数据清洗
  176. 查找和删除重复数据
  177. 排序
  178. iv可视化篇
  179. 第13章 图形
  180. r graphics概述
  181. 散点图
  182. 时间序列
  183. 柱状图
  184. 饼图
  185. 分类数据绘图
  186. 三维数据
  187. 绘制分布图
  188. 箱线图
  189. 画图设备
  190. 自定义图形
  191. 绘图函数常见参数
  192. 图形参数
  193. 基本图形函数
  194. 第14章 lattice绘图
  195. 历史
  196. lattice包概述
  197. lattice的工作原理
  198. 例子
  199. 使用lattice函数
  200. 定制面板函数
  201. 高级lattice函数
  202. 单一的网格作图
  203. 二元网格作图
  204. 三元图
  205. 其他图形
  206. 定制lattice图
  207. lattice函数的常用参数
  208. trellis.skeleton
  209. 指定如何绘制坐标轴
  210. 参数
  211. plot.trellis
  212. strip.default
  213. simplekey
  214. 低级函数
  215. 低级绘图函数
  216. 面板函数
  217. 第15章 ggplot2
  218. 一个简短的介绍
  219. 图形语法
  220. 一个更复杂的例子:医保数据
  221. 快速绘图
  222. 用ggplot2绘图
  223. 更多信息
  224. v统计篇
  225. 第16章 数据分析
  226. 描述性统计
  227. 相关系数和协方差
  228. 主成分分析
  229. 因子分析
  230. bootstrap重抽样
  231. 第17章 概率分布
  232. 正态分布
  233. 常见分布的参数
  234. 分布函数族
  235. 第18章 统计检验
  236. 连续型数据
  237. 基于正态分布的检验
  238. 不依赖分布的检验
  239. 离散数据
  240. 比例检验
  241. 二项式检验
  242. 列联表检验
  243. 列联表非参数检验
  244. 第19章 功效检验
  245. 实验设计示例
  246. t检验实验设计
  247. 比例实验设计
  248. 方差分析设计
  249. 第20章 回归模型
  250. 简单的线性模型示例
  251. 拟合模型
  252. 指定模型的工具函数
  253. 获取模型信息
  254. 更新模型
  255. lm函数的详述
  256. 最小二乘回归的假设
  257. 稳健回归和阻力回归
  258. 子集选取和shrinkage回归
  259. 变量的逐步选取
  260. 岭回归
  261. lasso和最小角回归
  262. 弹性网络
  263. 主成分回归和偏最小二乘回归
  264. 非线性模型
  265. 广义线性模型
  266. glmnet包
  267. 非线性最小二乘
  268. 生存模型
  269. 平滑
  270. 样条线
  271. 拟合多项式曲面
  272. 核平滑
  273. 回归的机器学习算法
  274. 回归树模型
  275. mars算法
  276. 神经网络
  277. 投影寻踪回归
  278. 广义可加模型
  279. 支持向量机
  280. 第21章 分类模型
  281. 线性分类模型
  282. logistic回归
  283. 线性判别分析
  284. 对数线性模型
  285. 机器学习分类模型
  286. k近邻
  287. 分类树模型
  288. 神经网络
  289. 支持向量机
  290. 随机森林
  291. 第22章 机器学习
  292. 购物篮分析
  293. 聚类
  294. 距离度量
  295. 聚类算法
  296. 第23章 时间序列分析
  297. 自相关函数
  298. 时间序列模型
  299. vi其他主题
  300. 第24章 优化r程序性能
  301. r程序性能的测量
  302. 时间测定
  303. 性能分析
  304. 监控内存的使用
  305. 内存性能分析
  306. 优化你的r 代码
  307. 使用向量操作
  308. r中查找的性能
  309. 使用数据库查询大数据集
  310. 内存预分配
  311. 清理内存
  312. 大数据集的函数
  313. 加速r的其他方法
  314. r字节码编译器
  315. 高性能的r版本
  316. 第25章 bioconductor
  317. 例子
  318. 加载原始的表达数据
  319. 从geo读取数据
  320. 匹配表型数据
  321. 分析表达数据
  322. 关键的bioconductor包
  323. 数据结构
  324. eset
  325. assaydata
  326. annotateddataframe
  327. miame
  328. bioconductor包使用的其他类
  329. 如何进一步学习
  330. bioconductor之外的资源
  331. 教程
  332. 课程
  333. 相关图书
  334. 第26章 r和hadoop
  335. r和hadoop
  336. hadoop简介
  337. rhadoop
  338. hadoop streaming
  339. 了解更多
  340. 一些其他的用r做并行计算的包
  341. segue
  342. domc
  343. 从哪里我们可以了解更多
  344. 参考文献
  345. 索引
书名:R语言核心技术手册(第2版)
作者:Joseph Adler
译者:刘思喆, 李舰, 陈钢, 邓一硕 译
国内出版社:电子工业出版社
出版时间:2014年07月
页数:633
书号:978-7-121-23786-7
原版书书名:R in a Nutshell, 2nd Edition
原版书出版商:O'Reilly Media
Joseph Adler
 
约瑟夫·阿德勒(Joseph Adler)拥有多年数据挖掘和数据分析经验,曾就职于DoubleClick、美国运通和VeriSign公司。约瑟夫毕业于麻省理工学院,期间取得了计算机科学和电子工程的学士及硕士学位。他拥有多项计算机安全和密码学领域的专利,并且是《棒球技巧》(Baseball Hacks)的作者。目前,他在LinkedIn公司任高级数据科学家。