《数据科学实战》试读
O’Reilly Media, Inc.介绍
O’Reilly Media 通过图书、杂志、在线服务、调查研究和会议等方式传播创新知识。自1978 年开始,O’Reilly 一直都是前沿发展的见证者和推动者。超级极客们正在开创着未来,而我们关注真正重要的技术趋势——通过放大那些“细微的信号”来刺激社会对新科技的应用。作为技术社区中活跃的参与者,O’Reilly 的发展充满了对创新的倡导、创造和发扬光大。 O’Reilly 为软件开发人员带来革命.. (更多)
作者介绍
Rachel Schutt 是美国新闻集团旗下数据科学部门的高级副总裁。她从哥伦比亚大学取得博士学位后,加入谷歌研究院工作了数年。她是哥伦比亚大学统计系的兼职教授,同时也是哥伦比亚大学数据科学及工程研究所的教育委员会发起者之一。她有几个专利正在申请之中,这些专利基于她在谷歌的工作,在那里她设计了算法原型,并且通过建模来理解用户的行为,这些最终都反映在了直接面向用户的产品中... (更多)
关于封面图
本书封面上的动物是九带犰狳(Dasypus novemcinctus),是一种广泛分布于中北美及南美洲的哺乳动物。在拉丁文中,novemcinctus 的字面意思是“九条带子”(位于腹部可伸缩甲壳后方),实际上九带犰狳身上的“带子”数量通常为7~11 条。产自南美洲的三带犰狳是唯一一种在遇到危险时可将身体团成球状来保护自身的犰狳,其他种类的犰狳则由于甲壳太多无法做到这点。 犰狳的皮肤最为惹人注目... (更多)
前言
Rachel Schutt 2012 年秋天,我在哥伦比亚大学开设了一门新课:数据科学导论。作为一个新兴领域,数据科学在学术界尚未划分为一个独立学科。那么数据科学到底是什么呢?我将这门课的讲义集结成书,试图回答这一问题。 为了帮助读者理解本书及其缘起,我觉得有必要简单介绍一下我自己,和我设计并讲授这门课的初衷。 初衷 简单地说,我期望在我上大学时就有这样的课。但那是20 世纪90 ... (更多)
第1章 简介:什么是数据科学
过去几年,“数据科学”和“大数据”的概念被媒体炒得热火朝天。对于这种现象,人们 一开始难免疑惑,甚至怀疑。事实上,这就是 Cathy 和我当时的反应。 对于这些概念,Cathy 和我在很长一段时间里都感到迷茫,直到我们俩相识。我们一般会 在星期三共进早餐,每当谈起这种现象,都有一种不安的感觉,总觉得在这喧嚣背后确然 有一股新潮流在涌现,这股潮流或许是意义深远的,代表着我们..