数据压缩入门
Colt McAnlis, Aleks Haecky
王凌云 译
出版时间:2021年04月
页数:188
要在5G时代成功获取用户并提升转化率,离不开数据压缩的专业技能。本书从理论和实践两方面入手,面向开发人员讲解数据压缩算法,并帮助开发人员选择合适的数据压缩工具。书中通过讲解清晰、步骤详细的示例,将数据压缩算法化繁为简,帮助开发人员做出正确的有关数据压缩的商业决策,从而实现客户更多、事业更兴、利润更高。
● 了解5类数据压缩算法:变长编码、统计压缩、字典编码、上下文模型、多上下文模型
● 了解数据、场景和算法,以选择匹配的数据压缩工具
● 选择合适的图像压缩算法,权衡图像质量与文件大小
● 学习如何压缩客户端和服务器生成的数据
● 了解与数据压缩算法有关的名人及其趣事
  1. 前言 
  2. 第1章 并非无趣的一章 
  3. 1.1 5类数据压缩算法 
  4. 1.2 惹人“愤怒”的克劳德 香农 
  5. 1.3 关于数据压缩,你必须知道的 
  6. 第2章 不容错过的一章 
  7. 2.1 理解二进制 
  8. 2.1.1 十进制计数系统 
  9. 2.1.2 二进制计数系统 
  10. 2.2 信息论 
  11. 2.2.1 二分查找 
  12. 2.2.2 熵:表示一个数所需要的最少二进制位数 
  13. 2.2.3 标准的数字长度 
  14. 第3章 突破熵 
  15. 3.1 理解熵 
  16. 3.2 熵有什么用处呢 
  17. 3.3 理解概率 
  18. 3.4 突破熵 
  19. 3.4.1 示例1:增量编码 
  20. 3.4.2 示例2:符号分组 
  21. 3.4.3 示例3:排列 
  22. 3.5 信息论与数据压缩 
  23. 第4章 VLC 
  24. 4.1 摩尔斯码 
  25. 4.2 概率、熵与码字长度 
  26. 4.3 VLC 
  27. 4.3.1 运用VLC 
  28. 4.3.2 创建VLC 
  29. 4.3.3 几个VLC示例 
  30. 4.3.4 为数据集找到最适合的编码方法 
  31. 第5章 统计编码 
  32. 5.1 利用统计使数据压缩接近熵 
  33. 5.2 哈夫曼编码 
  34. 5.2.1 构造哈夫曼树 
  35. 5.2.2 生成码字 
  36. 5.2.3 编码和解码 
  37. 5.2.4 实际的实现方法 
  38. 5.3 算术编码 
  39. 5.3.1 找出正确的数 
  40. 5.3.2 编码 
  41. 5.3.3 选择正确的输出值 
  42. 5.3.4 解码 
  43. 5.3.5 具体实现 
  44. 5.4 ANS 
  45. 5.4.1 通过转换表来编码和解码 
  46. 5.4.2 创建备查表 
  47. 5.4.3 使用ANS压缩数据 
  48. 5.4.4 解码示例 
  49. 5.4.5 压缩是从哪里来的 
  50. 5.5 在实际压缩中,选择哪一种统计压缩算法 
  51. 第6章 自适应统计编码 
  52. 6.1 位置对熵的重要性 
  53. 6.2 自适应VLC编码 
  54. 6.2.1 动态创建VLC表 
  55. 6.2.2 字面值 
  56. 6.2.3 重置 
  57. 6.2.4 知道何时重置 
  58. 6.2.5 实际中的应用 
  59. 6.3 自适应算术编码 
  60. 6.4 自适应哈夫曼编码 
  61. 6.5 现代的选择 
  62. 第7章 字典转换 
  63. 7.1 基本字典转换 
  64. 7.2 LZ算法 
  65. 7.2.1 LZ算法的工作原理 
  66. 7.2.2 编码 
  67. 7.2.3 解码 
  68. 7.2.4 压缩LZ算法的输出 
  69. 7.2.5 LZ算法的变体 
  70. 7.3 尽可能多地收集数据 
  71. 第8章 上下文数据转换 
  72. 8.1 RLE 
  73. 8.1.1 处理短行程问题 
  74. 8.1.2 压缩 
  75. 8.2 增量编码 
  76. 8.2.1 XOR增量编码 
  77. 8.2.2 参照系增量编码 
  78. 8.2.3 修正的参照系增量编码 
  79. 8.2.4 压缩增量编码后的数据 
  80. 8.2.5 那么它对文本有效吗 
  81. 8.3 MTF 
  82. 8.3.1 消除捣乱符号的影响 
  83. 8.3.2 压缩MTF 
  84. 8.4 BWT 
  85. 8.4.1 顺序很重要 
  86. 8.4.2 BWT的工作原理 
  87. 8.4.3 BWT的逆操作 
  88. 8.4.4 具体的实现 
  89. 8.4.5 压缩BWT后的数据 
  90. 第9章 数据建模 
  91. 9.1 马尔可夫链 
  92. 9.1.1 马尔可夫链与压缩 
  93. 9.1.2 实际的实现 
  94. 9.2 部分匹配预测算法 
  95. 9.2.1 单词查找树 
  96. 9.2.2 字符的压缩 
  97. 9.2.3 选择一个合理的N值 130
  98. 9.2.4 处理未知的符号 
  99. 9.3 上下文混合算法 
  100. 9.3.1 模型的类型 
  101. 9.3.2 混合的类型 
  102. 9.4 下一代技术 
  103. 第10章 换个话题 
  104. 10.1 多媒体数据压缩 
  105. 10.2 通用压缩 
  106. 10.3 实践中的数据压缩 
  107. 第11章 评价数据压缩 
  108. 11.1 数据压缩的使用场景 
  109. 11.1.1 线下压缩,客户端解压 
  110. 11.1.2 客户端压缩,云端解压 
  111. 11.1.3 云端压缩,客户端解压 
  112. 11.1.4 客户端压缩,客户端解压 
  113. 11.2 数据压缩的需求 
  114. 11.3 压缩率 
  115. 11.4 压缩性能 
  116. 11.5 解压性能 
  117. 11.6 解码流的能力 
  118. 11.7 比较压缩算法 
  119. 第12章 压缩图像数据 
  120. 12.1 理解图像质量与文件大小 
  121. 12.1.1 是什么降低了图像的质量 
  122. 12.1.2 度量图像质量 
  123. 12.1.3 让想法真正工作 
  124. 12.2 图像的尺寸很重要 
  125. 12.3 选择正确的图像格式 
  126. 12.3.1 PNG 
  127. 12.3.2 JPG 
  128. 12.3.3 GIF 
  129. 12.3.4 WebP 
  130. 12.3.5 现在,到了选择的时刻 
  131. 12.4 GPU纹理格式 
  132. 12.5 矢量格式 
  133. 12.6 收获的捷径 
  134. 第13章 序列化数据 
  135. 13.1 了解常见的使用场景 
  136. 13.1.1 服务器动态生成的数据 
  137. 13.1.2 服务器拥有的静态数据 
  138. 13.1.3 客户端动态生成的数据 
  139. 13.1.4 客户端拥有的静态数据 
  140. 13.2 序列化格式的问题 
  141. 13.2.1 可读文本 
  142. 13.2.2 解码时间长 
  143. 13.3 更小的序列化数据 
  144. 13.3.1 使用二进制序列化格式 
  145. 13.3.2 重构列表以获得更好的压缩 
  146. 13.3.3 组织数据以便高效获取 
  147. 13.3.4 将数据切分为适当的压缩格式 
  148. 第14章 有损数据压缩 
  149. 第15章 让世界变得更小 
  150. 15.1 数据压缩与你 
  151. 15.2 数据压缩与盈利 
  152. 15.2.1 用户获取与保持 
  153. 15.2.2 运行成本 
  154. 15.2.3 提前规划 
  155. 15.3 让用户的生活更美好更便宜 
  156. 15.4 对下一步技术的思考 
  157. 15.4.1 未来的50亿用户 
  158. 15.4.2 移动网络 
  159. 15.5 开始行动 
  160. 数据压缩术语表 
书名:数据压缩入门
译者:王凌云 译
国内出版社:人民邮电出版社
出版时间:2021年04月
页数:188
书号:978-7-115-53417-0
原版书书名:Understanding Compression
原版书出版商:O'Reilly Media
Colt McAnlis
 
柯尔特·麦克安利斯 (Colt McAnlis)
谷歌开发倡导者,专注于游戏开发、压缩技术和性能提升。担任南卫理公会大学Guildhall学院的兼职教授,加州大学洛杉矶分校继续教育学院讲师,以及优达学城(Udacity)的讲师。

 
 
Aleks Haecky
 
亚历克斯·海奇 (Aleks Haecky)
谷歌开发倡导者、培训开发人员,从事性能提升、文档编写等幕后工作,在优达学城、谷歌开发者频道也从事一些幕后工作。
 
 
购买选项
定价:69.00元
书号:978-7-115-53417-0
出版社:人民邮电出版社