当前位置: 首页 > news >正文

怎样成为一名真正的数据科学家?这10本书就是答案

导读:社交、出行、办公、购物、娱乐……一个生活在2020年的人,每天要产生多少数据?这些数据将怎样改变我们的生活、工作和思维方式?将创造哪些价值?这些价值又该怎样挖掘?

数据科学家被《哈佛商业评论》称为“21世纪最性感的职业”,那么怎样成为一名真正的数据科学家?今天推荐的10本书,一定能让你变得更“性感”。

1

Python机器学习

(原书第2版)

作者:塞巴斯蒂安·拉施卡 瓦希德·米尔贾利利

推荐语:本书将带领你进入预测分析的世界,并展示为什么Python会成为数据科学领域首屈一指的计算机语言。如果你想更好地从数据中得到问题的答案,或者想要提升并扩展现有机器学习系统的性能,那么这本基于数据科学实践的书籍非常值得一读。

本书自第1版出版以来,备受广大读者欢迎。与同类书相比,本书除了介绍如何用Python和基于Python的机器学习软件库进行实践外,还对机器学习概念的必要细节进行讨论,同时对机器学习算法的工作原理、使用方法以及如何避免掉入常见的陷阱提供直观且翔实的解释,是Python机器学习入门必读之作。

2

数据中心一体化最佳实践

设计仓储级计算机

(原书第3版)

作者:路易斯·安德烈·巴罗索 等

推荐语:本书由谷歌3位资深专家亲笔撰写,利用多个真实案例,探讨新型系统如何在将数据中心本身当作超大规模仓储级计算机使用的同时,又能使软硬件充分协同以提供高性能的互联网服务。

3

文本数据管理与分析

信息检索与文本挖掘的实用导论

作者:翟成祥 肖恩·马森

推荐语:信息检索与数据挖掘领域世界知名学者、ACM Fellow、美国伊利诺伊大学香槟分校(UIUC)翟成祥教授厚积薄发之作,基于UIUC数据管理与分析相关课程多年的积累,覆盖作者两门在线课程“文本检索与搜索引擎”和“文本挖掘与分析”的主要内容。

4

计算机时代的统计推断

算法、演化和数据科学

作者:布拉德利·埃夫隆 特雷福·黑斯蒂

推荐语:统计推断入门经典,斯坦福大学知名教授、《The Elements of Statistical Learning》作者Trevor Hastie全新力作。汇集重要统计思想,系统阐释统计推断近60年的演化史,深入剖析各种经典算法及应用。

5

数据挖掘:概念与技术

(原书第3版)

作者:Jiawei Han, Micheline Kamber 等

推荐语:数据挖掘领域最具里程碑意义的经典著作,完整全面阐述该领域的重要知识和技术创新。

本书完整全面地讲述数据挖掘的概念、方法、技术和研究进展。本书对前两版做了全面修订,加强和重新组织了全书的技术内容,重点论述了数据预处理、频繁模式挖掘、分类和聚类等的内容,还全面讲述了OLAP和离群点检测,并研讨了挖掘网络、复杂数据类型以及重要应用领域。

6

统计学习导论

基于R应用

作者:加雷斯·詹姆斯 丹妮拉·威滕 等 

推荐语:统计学习是一套以复杂数据建模和数据理解为目的的工具集,是近期才发展起来的统计学的一个新领域。本书出自统计学习领域声名显赫的几位专家,结合R语言介绍了分析大数据必不可少的工具,提供一些最重要的建模和预测技术,并借助丰富的实验来解释如何用R语言实现统计学习方法。

本书不仅是优秀的“统计学习”或“机器学习”课程的教材,也是数据挖掘、数据分析等相关从业者不可或缺的参考书。

7

数据科学与大数据技术导论

作者:奥弗·曼德勒维奇 凯西·斯特拉 等

推荐语:使用Hadoop和Spark解决实际数据科学问题的专业人士,如今越来越缺乏。本书就是帮助读者提升为这种奇缺人士的完全指南。借鉴在Hadoop和大数据方面的丰富经验,三大顶尖专家在本书中汇集了读者所需要的一切:高层次的概念、深潜的技术、现实的用例、实际的应用和易上手的教程。

8

社交媒体数据挖掘与分析

作者:加博尔·萨博 格尔·波拉特坎 等

推荐语:社交媒体是大数据的丰富来源。了解社交媒体数据最有效的挖掘方法能够帮助你获得产生惊人业绩的信息。

由任职社交网络公司的业界专家所撰写的本书提供了一个实践教程,教授你如何使用最新的工具和专门针对社交媒体的复杂数据挖掘技术。本书深入剖析了收集和应用社交媒体数据的机制,以理解用户、定义趋势并做出预测,从而改善对增长和销售的分析。

9

统计反思:用R和Stan例解贝叶斯方法

作者:理查德·麦克尔里思

推荐语:本书能增加你对统计模型的理解和信心。现在,基于模型的统计对编程有基本的要求,本书能促使你一步一步地计算原本自动的过程。书中独特的计算过程可确保你了解足够的细节,以便你在建模工作中合理地选择和解释模型。

本书从贝叶斯的角度介绍了广义线性分层模型,通过贝叶斯概率和最大熵的基础逻辑解释模型,涵盖从基础的回归分析到分层模型的内容。作者还讨论了测量误差、缺失数据,以及处理空间和网络自相关的高斯过程模型。

10

利用Python进行数据分析

(原书第2版)

作者:韦斯·麦金尼

推荐语:Python数据分析经典畅销书全新升级。Python pandas创始人亲自执笔,Python语言的核心开发人员鼎立推荐。针对Python 3.6进行全面修订和更新。

数据科学与大数据技术图书

当当每满100减50活动进行中

长按二维码发现更多好书

 点击阅读原文,直达专场

相关文章:

  • 4月书讯 | 一大波好书来袭,最美华章四月天
  • 玩转数据库技术,看这几本书就够了
  • 用户画像的核心技术盘点
  • 为什么建议你要迁移到MySQL 8.0?
  • “计算机伦理学”——计算机科学专业的必修课
  • 字节跳动为什么选用Flutter:并非跨平台终极之选,但它可能是不一样的未来
  • 带你了解增强现实的基础理论、核心技术、系统架构以及激动人心的应用和未来...
  • 深入理解XGBoost:分布式实现
  • 为什么我们应该使用 Flutter
  • 【收藏】机器学习入门的常见问题集
  • 为什么想进大厂,一定要掌握Java异步编程技术
  • 【第1期】MySQL为什么叫MySQL
  • 刘慈欣推荐!这本“疯狂的书”预言9年后人类将永生?
  • 4月6日 | Java异步编程在企业中的应用
  • 零基础掌握Istio on Kubernetes开发与运维
  • 08.Android之View事件问题
  • Codepen 每日精选(2018-3-25)
  • ES6简单总结(搭配简单的讲解和小案例)
  • JS函数式编程 数组部分风格 ES6版
  • KMP算法及优化
  • LeetCode刷题——29. Divide Two Integers(Part 1靠自己)
  • maven工程打包jar以及java jar命令的classpath使用
  • Service Worker
  • VUE es6技巧写法(持续更新中~~~)
  • 安卓应用性能调试和优化经验分享
  • 百度小程序遇到的问题
  • 和 || 运算
  • 机器学习学习笔记一
  • 配置 PM2 实现代码自动发布
  • 通过获取异步加载JS文件进度实现一个canvas环形loading图
  • 一个JAVA程序员成长之路分享
  • 用 Swift 编写面向协议的视图
  • 优化 Vue 项目编译文件大小
  • 正则表达式
  • 如何在 Intellij IDEA 更高效地将应用部署到容器服务 Kubernetes ...
  • #define与typedef区别
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • (1)(1.11) SiK Radio v2(一)
  • (13)Hive调优——动态分区导致的小文件问题
  • (C#)一个最简单的链表类
  • (delphi11最新学习资料) Object Pascal 学习笔记---第7章第3节(封装和窗体)
  • (vue)el-checkbox 实现展示区分 label 和 value(展示值与选中获取值需不同)
  • (补)B+树一些思想
  • (动手学习深度学习)第13章 计算机视觉---微调
  • (介绍与使用)物联网NodeMCUESP8266(ESP-12F)连接新版onenet mqtt协议实现上传数据(温湿度)和下发指令(控制LED灯)
  • (最完美)小米手机6X的Usb调试模式在哪里打开的流程
  • .NET Framework与.NET Framework SDK有什么不同?
  • .NET委托:一个关于C#的睡前故事
  • @EnableWebMvc介绍和使用详细demo
  • [ 攻防演练演示篇 ] 利用通达OA 文件上传漏洞上传webshell获取主机权限
  • [04] Android逐帧动画(一)
  • [APUE]进程关系(下)
  • [Assignment] C++1
  • [DAU-FI Net开源 | Dual Attention UNet+特征融合+Sobel和Canny等算子解决语义分割痛点]
  • [go 反射] 进阶