当前位置:首页>正文

敏捷数据科学 kindle 下载 网盘 pdf azw3 极速 rtf umd

免费下载书籍地址:PDF下载地址

精美图片

敏捷数据科学书籍详细信息

  • ISBN:9787121236198
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2014-7
  • 页数:184
  • 价格:49.00元
  • 纸张:暂无纸张
  • 装帧:暂无装帧
  • 开本:暂无开本
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分

内容简介:

《敏捷数据科学:用Hadoop创建数据分析应用》面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据-价值金字塔进阶模式中,你将学到:一整套实用工具及其方法论,可快速实现在Hadoop 上构建数据分析应用;用Python、Apache Pig 及D3.js等轻量级工具创建用于探索数据的敏捷环境;一种可根据数据中信息快速切换,进行不同类型数据分析的迭代式开发方法。

《敏捷数据科学:用Hadoop创建数据分析应用》适合所有与数据工作相关的从业者,同时也适合有志成为数据科学工作者的广大读者作为入门读物。

书籍目录:

第1 部分 起步 ............................................................... 1

第1 章 理论 .................................................................. 3

敏捷大数据 ............................................................................................................3

Big Words 定义 ......................................................................................................4

敏捷大数据团队 .....................................................................................................5

认识机遇和问题 ..............................................................................................6

敏捷大数据流程 ................................................................................................... 11

代码检查和结对编程 ...........................................................................................12

敏捷的场所:开发的效率 ....................................................................................13

协作空间 .......................................................................................................14

私人空间 .......................................................................................................14

个人空间 .......................................................................................................14

用大幅打印件明确表达想法 ................................................................................15

第2 章 数据 ............................................................... 17

电子邮件 ..............................................................................................................17

处理原始数据 ......................................................................................................18

原始的电子邮件 ............................................................................................18

结构化与半结构化数据 .................................................................................18

SQL ......................................................................................................................20

NoSQL .................................................................................................................24

序列化 ...........................................................................................................24

从演变的模式中抽取和展示特征 ..................................................................25

数据流水线 ...................................................................................................26

数据透视 ..............................................................................................................27

社交网络 .......................................................................................................28

时间序列 .......................................................................................................30

自然语言 .......................................................................................................31

概率 ...............................................................................................................33

小结 .....................................................................................................................35

第3 章 敏捷开发工具 ................................................... 37

可扩展性= 简洁...................................................................................................37

敏捷大数据处理 ...................................................................................................38

设置运行Python 的虚拟环境 ...............................................................................39

使用Avro 对事件进行序列化 ..............................................................................40

在Python 中使用Avro ..................................................................................40

收集数据 ..............................................................................................................42

使用Pig 处理数据................................................................................................44

安装Pig .........................................................................................................45

使用MongoDB 发布数据 ....................................................................................49

安装MongoDB ..............................................................................................49

安装MongoDB 的Java 驱动程序 .................................................................50

安装mongo-hadoop .......................................................................................50

用Pig 向MongoDB 推送数据 .......................................................................50

使用ElasticSearch 搜索数据 ................................................................................52

安装 ...............................................................................................................52

使用Wonderdog 整合ElasticSearch 和Pig ...................................................53

对工作流程的反思 ...............................................................................................55

轻量级的Web 应用 ..............................................................................................56

Python 和 Flask .............................................................................................56

展示数据 ..............................................................................................................58

安装Bootstrap ...............................................................................................58

启用Bootstrap ...............................................................................................59

使用d3.js 和nvd3.js 可视化数据 ..................................................................63

小结 .....................................................................................................................64

第4 章 在云端 ............................................................. 65

引言 .....................................................................................................................65

GitHub .................................................................................................................67

dotCloud ...............................................................................................................67

dotCloud Echo 服务 .......................................................................................68

Python 工作者服务 ........................................................................................71

Amazon Web Services ..........................................................................................71

Simple Storage Service ..................................................................................71

Elastic MapReduce ........................................................................................72

MongoDB 即服务 ..........................................................................................79

辅助工具(Instrumentation) ................................................................................81

Google Analytics ...........................................................................................81

Mortar Data ...................................................................................................82

第2 部分 登上金字塔 ................................................... 85

第5 章 收集和展示数据 ............................................... 89

整合软件栈 ..........................................................................................................90

收集并序列化收件箱 ...........................................................................................90

处理和发布邮件数据 ...........................................................................................91

在浏览器中显示邮件 ...........................................................................................93

用Flask 和pymongo 处理邮件数据 ..............................................................94

使用Jinja2 渲染HTML5 页面 ......................................................................94

敏捷检查点 ..........................................................................................................98

生成电子邮件清单 ...............................................................................................99

用MongoDB 显示邮件 .................................................................................99

对数据展示的分析 ...................................................................................... 101

搜索邮件 ............................................................................................................ 106

使用Pig,ElasticSearch 和Wonderdog 构建索引 ....................................... 106

在网页中搜索邮件数据 ............................................................................... 107

结论 ................................................................................................................... 108

第6 章 使用图表可视化数据 ....................................... 111

优秀的图表 ........................................................................................................ 112

抽取实体:邮件地址 ......................................................................................... 112

抽取邮件 ..................................................................................................... 112

对时间进行可视化 ............................................................................................. 116

结论 ................................................................................................................... 122

第7 章 利用报表探索数据 .......................................... 123

为数据添加联系 ................................................................................................. 126

用TF-IDF 从邮件中提取关键字 ........................................................................ 133

小结 ................................................................................................................... 138

第8 章 预测 .............................................................. 141

预测电子邮件的回复率 ...................................................................................... 142

个性化 ................................................................................................................ 147

小结 ................................................................................................................... 148

第9 章 驱动行动 ........................................................ 149

好邮件的属性 .................................................................................................... 150

使用朴素贝叶斯方法进行更好的预测 ............................................................... 150

P(Reply | From ∩ To) ........................................................................................ 150

P(Reply | Token) ................................................................................................. 151

实时预测 ............................................................................................................ 153

记录事件日志 .................................................................................................... 157

小结 ................................................................................................................... 157

索引 ........................................................................... 159

作者介绍:

作者介绍:Russsel Jurney 在美国和墨西哥的赌场开始他的数据分析生涯。他开发了一个 Web 应用来分析老虎机的性能。在经历了创业、交互式媒体和新闻业以后,他到了硅谷,在 Ning 和LinkedIn 开始构建可扩展的数据分析应用。

译者介绍:朱洪波 阿里巴巴数据挖掘专家,机器学习团队负责人,司职于解决商业客户对数据的深层需求。纸质书爱好者,相信理性与逻辑的力量。

出版社信息:

暂无出版社相关信息,正在全力查找中!

书籍摘录:

暂无相关书籍摘录,正在全力查找中!

在线阅读/听书/购买/PDF下载地址:

在线阅读地址:敏捷数据科学在线阅读

在线听书地址:敏捷数据科学在线收听

在线购买地址:敏捷数据科学在线购买

原文赏析:

总结一下,当数据模式定义严谨,且SQL是唯一的工具时,我们就不会从挖掘数据的角度看待数据,因为视角会被优化过的数据处理工具所支配。严谨的数据格式抑制了我们在数据与直觉之间建立起联系的能力。另一方面,半结构化的数据可以让我们专注于数据本身,通过迭代地操作数据来抽取价值,并转化为产品。在敏捷大数据中选择NoSQL,是因为它让我们具备了上述能力。

其它内容:

书籍介绍

《敏捷数据科学:用Hadoop创建数据分析应用》面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据-价值金字塔进阶模式中,你将学到:一整套实用工具及其方法论,可快速实现在Hadoop 上构建数据分析应用;用Python、Apache Pig 及D3.js等轻量级工具创建用于探索数据的敏捷环境;一种可根据数据中信息快速切换,进行不同类型数据分析的迭代式开发方法。

《敏捷数据科学:用Hadoop创建数据分析应用》适合所有与数据工作相关的从业者,同时也适合有志成为数据科学工作者的广大读者作为入门读物。

书籍真实打分

故事情节:9分

人物塑造:7分

主题深度:4分

文字风格:4分

语言运用:9分

文笔流畅:8分

思想传递:5分

知识深度:5分

知识广度:3分

实用性:8分

章节划分:4分

结构布局:5分

新颖与独特:8分

情感共鸣:6分

引人入胜:9分

现实相关:7分

沉浸感:3分

事实准确性:9分

文化贡献:9分

网站评分

书籍多样性:8分

书籍信息完全性:4分

网站更新速度:6分

使用便利性:4分

书籍清晰度:6分

书籍格式兼容性:3分

是否包含广告:3分

加载速度:8分

安全性:4分

稳定性:5分

搜索功能:6分

下载便捷性:8分

下载点评

  • 字体合适(100+)
  • 实惠(120+)
  • 体验差(205+)
  • 好评(253+)
  • 还行吧(236+)
  • 简单(287+)
  • 傻瓜式服务(585+)
  • 章节完整(414+)
  • 四星好评(182+)
  • pdf(268+)
  • 盗版少(395+)
  • 全格式(454+)
  • 排版满分(69+)

下载评价

网友 孔***旋:很好。顶一个希望越来越好,一直支持。

网友 温***欣:可以可以可以

网友 晏***媛:够人性化!

网友 沈***松:挺好的,不错

网友 蓬***之:好棒good

网友 曾***文:五星好评哦

网友 丁***菱:好好好好好好好好好好好好好好好好好好好好好好好好好

网友 师***怡:说的好不如用的好,真心很好。越来越完美

网友 国***芳:五星好评

网友 潘***丽:这里能在线转化,直接选择一款就可以了,用他这个转很方便的

网友 冯***丽:卡的不行啊

网友 寿***芳:可以在线转化哦

网友 仰***兰:喜欢!很棒!!超级推荐!

网友 权***颜:下载地址、格式选择、下载方式都还挺多的

版权声明

1本文:敏捷数据科学转载请注明出处。
2本站内容除签约编辑原创以外,部分来源网络由互联网用户自发投稿仅供学习参考。
3文章观点仅代表原作者本人不代表本站立场,并不完全代表本站赞同其观点和对其真实性负责。
4文章版权归原作者所有,部分转载文章仅为传播更多信息服务用户,如信息标记有误请联系管理员。
5本站一律禁止以任何方式发布或转载任何违法违规的相关信息,如发现本站上有涉嫌侵权/违规及任何不妥的内容,请第一时间联系我们申诉反馈,经核实立即修正或删除。


本站仅提供信息存储空间服务,部分内容不拥有所有权,不承担相关法律责任。

相关文章:

  • 危害国家安全罪法律实务 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 成本会计学--全国高等教育自学考试同步训练·同步过关(最新版) kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 我的奋斗(1~4) 共4册 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 材料力学同步辅导与题解 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 9787513706667 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 名家建筑细部详解9787503883972 正版新书希望阶梯图书专营店 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 9787512617551 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • “十四五”普通高等教育系列教材 大学物理实验 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 中国扬子陆块中、西部奥陶系宝塔组三叶虫动物群 kindle 下载 网盘 pdf azw3 极速 rtf umd
  • 理解孩子 kindle 下载 网盘 pdf azw3 极速 rtf umd