在线网盘资源搜索下载资源搜

图解Spark 核心技术与案例实战

资源名称：图解Spark 核心技术与案例实战内容简介：《图解Spark：核心技术与案例实战》以Spark 2.0 版本为基础进行编写，全面介绍了Spark 核心及其生态圈组件技术。主要内容包括Spark 生态圈、实战环境搭建、编程模型和内部重要模块的分析，重点介绍了消息通信框架、作业调度、容错执行、监控管理、存储管理以及运行框架，同时还介绍了Spark 生态圈相关组件，包括Spark SQL 的即席查询、Spark Streaming 的实时流处理应用、MLbase/MLlib 的机器学习、GraphX 的图处理、SparkR 的数学计算和Alluxio 的分布式内存文件系统等。《图解Spark：核心技术与案例实战》从Spark 核心技术进行深入分析，重要章节会结合源代码解读其实现原理，围绕着技术原理介绍了相关典型实例，读者通过这些实例可以更加深入地理解Spark 的运行机制。另外《图解Spark：核心技术与案例实战》还应用了大量的图表进行说明，让读者能够更加直观地理解Spark 相关原理。通过《图解Spark：核心技术与案例实战》，读者将能够很快地熟悉和掌握Spark 大数据分析计算的利器，在生产中解决实际问题。资源目录：第一篇基础篇第1章 Spark及其生态圈概述 1.1 Spark简介 1.1.1 什么是Spark 1.1.2 Spark与MapReduce比较 1.1.3 Spark的演进路线图 1.2 Spark生态系统 1.2.1 Spark Core 1.2.2 Spark Streaming 1.2.3 Spark SQL 1.2.4 BlinkDB 1.2.5 MLBase/MLlib 1.2.6 GraphX 1.2.7 SparkR 1.2.8 Alluxio 1.3 小结第2章搭建Spark实战环境 2.1 基础环境搭建 2.1.1 搭建集群样板机 2.1.2 配置集群环境 2.2 编译Spark源代码 2.2.1 配置Spark编译环境 2.2.2 使用Maven编译Spark 2.2.3 使用SBT编译Spark 2.2.4 生成Spark部署包 2.3 搭建Spark运行集群 2.3.1 修改配置文件 2.3.2 启动Spark 2.3.3 验证启动 2.3.4 第一个实例 2.4 搭建Spark实战开发环境 2.4.1 CentOS中部署IDEA 2.4.2 使用IDEA开发程序 2.4.3 使用IDEA阅读源代码 2.5 小结第二篇核心篇第3章 Spark编程模型 3.1 RDD概述 3.1.1 背景 3.1.2 RDD简介 3.1.3 RDD的类型 3.2 RDD的实现 3.2.1 作业调度 3.2.2 解析器集成 3.2.3 内存管理 3.2.4 检查点支持 3.2.5 多用户管理 3.3 编程接口 3.3.1 RDD分区（Partitions） 3.3.2 RDD首选位置（PreferredLocations） 3.3.3 RDD依赖关系（Dependencies） 3.3.4 RDD分区计算（Iterator） 3.3.5 RDD分区函数（Partitioner） 3.4 创建操作 3.4.1 并行化集合创建操作 3.4.2 外部存储创建操作 3.5 转换操作 3.5.1 基础转换操作 3.5.2 键值转换操作 3.6 控制操作 3.7 行动操作 3.7.1 集合标量行动操作 3.7.2 存储行动操作 3.8 小结第4章 Spark核心原理 4.1 消息通信原理 4.1.1 Spark消息通信架构 4.1.2 Spark启动消息通信 4.1.3 Spark运行时消息通信 4.2 作业执行原理 4.2.1 概述 4.2.2 提交作业 4.2.3 划分调度阶段 4.2.4 提交调度阶段 4.2.5 提交任务 4.2.6 执行任务 4.2.7 获取执行结果 4.3 调度算法 4.3.1 应用程序之间 4.3.2 作业及调度阶段之间 4.3.3 任务之间 4.4 容错及HA 4.4.1 Executor异常 4.4.2 Worker异常 4.4.3 Master异常 4.5 监控管理 4.5.1 UI监控 4.5.2 Metrics 4.5.3 REST 4.6 实例演示 4.6.1 计算年降水实例 4.6.2 HA配置实例 4.7 小结第5章 Spark存储原理 5.1 存储分析 5.1.1 整体架构 5.1.2 存储级别 5.1.3 RDD存储调用 5.1.4 读数据过程 5.1.5 写数据过程 5.2 Shuffle分析 5.2.1 Shuffle简介 5.2.2 Shuffle的写操作 5.2.3 Shuffle的读操作 5.3 序列化和压缩 5.3.1 序列化 5.3.2 压缩 5.4 共享变量 5.4.1 广播变量 5.4.2 累加器 5.5 实例演示 5.6 小结第6章 Spark运行架构 6.1 运行架构总体介绍 6.1.1 总体介绍 6.1.2 重要类介绍 6.2 本地（Local）运行模式 6.2.1 运行模式介绍 6.2.2 实现原理 6.3 伪分布（Local-Cluster）运行模式 6.3.1 运行模式介绍 6.3.2 实现原理 6.4 独立（Standalone）运行模式 6.4.1 运行模式介绍 6.4.2 实现原理 6.5 YARN运行模式 6.5.1 YARN运行框架 6.5.2 YARN-Client运行模式介绍 6.5.3 YARN-Client 运行模式实现原理 6.5.4 YARN-Cluster运行模式介绍 6.5.5 YARN-Cluster 运行模式实现原理 6.5.6 YARN-Client与YARN-Cluster对比 6.6 Mesos运行模式 6.6.1 Mesos介绍 6.6.2 粗粒度运行模式介绍 6.6.3 粗粒度实现原理 6.6.4 细粒度运行模式介绍 6.6.5 细粒度实现原理 6.6.6 Mesos粗粒度和Mesos细粒度对比 6.7 实例演示 6.7.1 独立运行模式实例 6.7.2 YARN-Client实例 6.7.3 YARN-Cluster实例 6.8 小结第三篇组件篇第7章 Spark SQL 7.1 Spark SQL简介 7.1.1 Spark SQL发展历史 7.1.2 DataFrame/Dataset介绍 7.2 Spark SQL运行原理 7.2.1 通用SQL执行原理 7.2.2 SparkSQL运行架构 7.2.3 SQLContext运行原理分析 7.2.4 HiveContext介绍 7.3 使用Hive-Console 7.3.1 编译Hive-Console 7.3.2 查看执行计划 7.3.3 应用Hive-Console 7.4 使用SQLConsole 7.4.1 启动HDFS和Spark Shell 7.4.2 与RDD交互操作 7.4.3 读取JSON格式数据 7.4.4 读取Parquet格式数据 7.4.5 缓存演示 7.4.6 DSL演示 7.5 使用Spark SQL CLI 7.5.1 配置并启动Spark SQL CLI 7.5.2 实战Spark SQL CLI 7.6 使用Thrift Server 7.6.1 配置并启动Thrift Server 7.6.2 基本操作 7.6.3 交易数据实例 7.6.4 使用IDEA开发实例 7.7 实例演示 7.7.1 销售数据分类实例 7.7.2 网店销售数据统计 7.8 小结第8章 Spark Streaming 8.1 Spark Streaming简介 8.1.1 术语定义 8.1.2 Spark Streaming特点 8.2 Spark Streaming编程模型 8.2.1 DStream的输入源 8.2.2 DStream的操作 8.3 Spark Streaming运行架构 8.3.1 运行架构 8.3.2 消息通信 8.3.3 Receiver分发 8.3.4 容错性 8.4 Spark Streaming运行原理 8.4.1 启动流处理引擎 8.4.2 接收及存储流数据 8.4.3 数据处理 8.5 实例演示 8.5.1 流数据模拟器 8.5.2 销售数据统计实例 8.5.3 Spark Streaming+Kafka实例 8.6 小结第9章 Spark MLlib 9.1 Spark MLlib简介 9.1.1 Spark MLlib介绍 9.1.2 Spark MLlib数据类型 9.1.3 Spark MLlib基本统计方法 9.1.4 预言模型标记语言 9.2 线性模型 9.2.1 数学公式 9.2.2 线性回归 9.2.3 线性支持向量机 9.2.4 逻辑回归 9.2.5 线性最小二乘法、Lasso和岭回归 9.2.6 流式线性回归 9.3 决策树 9.4 决策模型组合 9.4.1 随机森林 9.4.2 梯度提升决策树 9.5 朴素贝叶斯 9.6 协同过滤 9.7 聚类 9.7.1 K-means 9.7.2 高斯混合 9.7.3 快速迭代聚类 9.7.4 LDA 9.7.5 二分K-means 9.7.6 流式K-means 9.8 降维 9.8.1 奇异值分解降维 9.8.2 主成分分析降维 9.9 特征提取和变换 9.9.1 词频—逆文档频率 9.9.2 词向量化工具 9.9.3 标准化 9.9.4 范数化 9.10 频繁模式挖掘 9.10.1 频繁模式增长 9.10.2 关联规则挖掘 9.10.3 PrefixSpan 9.11 实例演示 9.11.1 K-means聚类算法实例 9.11.2 手机短信分类实例 9.12 小结第10章 Spark GraphX 10.1 GraphX介绍 10.1.1 图计算 10.1.2 GraphX介绍 10.1.3 发展历程 10.2 GraphX实现分析 10.2.1 GraphX图数据模型 10.2.2 GraphX图数据存储 10.2.3 GraphX图切分策略 10.2.4 GraphX图操作 10.3 实例演示 10.3.1 图例演示 10.3.2 社区发现演示 10.4 小结第11章 SparkR 11.1 概述 11.1.1 R语言介绍 11.1.2 SparkR介绍 11.2 SparkR与DataFrame 11.2.1 DataFrames介绍 11.2.2 与DataFrame的相关操作 11.3 编译安装SparkR 11.3.1 编译安装R语言 11.3.2 安装SparkR运行环境 11.3.3 安装SparkR 11.3.4 启动并验证安装 11.4 实例演示 11.5 小结第12章 Alluxio 12.1 Alluxio简介 12.1.1 Alluxio介绍 12.1.2 Alluxio系统架构 12.1.3 HDFS与Alluxio 12.2 Alluxio编译部署 12.2.1 编译Alluxio 12.2.2 单机部署Alluxio 12.2.3 集群模式部署Alluxio 12.3 Alluxio命令行使用 12.3.1 接口说明 12.3.2 接口操作示例 12.4 实例演示 12.4.1 启动环境 12.4.2 Alluxio上运行Spark 12.4.3 Alluxio上运行MapReduce 12.5 小结资源截图：

陌佑

百度云

CloudStack入门指南

资源名称：CloudStack入门指南内容简介：本书是国内第一本系统介绍CloudStack的专业书籍。　　本书从历史发展、架构设计、安装配置、基本功能、开发入门等角度对CloudStack进行了全面的介绍。作为云计算IaaS平台，尽管CloudStack的安装非常简单，但其规划和安装对保证CloudStack系统稳定运行而言至关重要，很多用户正是在此部分遇到了大量问题，所以本书在安装部分下了较大笔墨，规划了一个简单、通用的场景，并对实际配置过程进行了详细介绍。　　本书以深入浅出的方式介绍了CloudStack，能够为计划使用IaaS将现有IT设施迁移到云上的公司、数据中心及系统集成行业的相关人员进行系统选型和对比提供帮助。对于那些对CloudStack没有深入了解及在安装和使用上遇到困难的技术工程师、售前及售后支持工程师、学生等人员，本书能够为他们学习正确的CloudStack的安装和使用步骤，以及对CloudStack进行全面、系统的认识提供帮助。　　本书是国内第一本系统介绍CloudStack的专业书籍。　　本书从历史发展、架构设计、安装配置、基本功能、发门等角度对CloudStack行了全面的介绍。作为云计算IaaS平台，尽管CloudStack的安装非常简单，但其规划和安装对保证CloudStack系统稳定运行而言至关重要，很多用户正是在此部分遇到了大量问题，所以本书在安装部分下了较大笔墨，规划了一个简单、通用的场景，并对实际配置过程行了详细介绍。　　本书以深浅出的方式介绍了CloudStack，能够为计划使用IaaS将现有IT设施迁移到云上的公司、数据中心及系统集成行业的相关人员行系统选型和对比提供帮助。对于那些对CloudStack没有深了解及在安装和使用上遇到困难的技术工程师、售前及售后支持工程师、学生等人员，本书能够为他们学习正确的CloudStack的安装和使用步骤，以及对CloudStack行全面、系统的认识提供帮助。资源目录：第1章　CloudStack简介............................................................................. 1 1.1　CloudStack的历史与发展...........................................................................................2 1.1.1　CloudStack的历史...........................................................................................2 1.1.2　CloudStack生态圈...........................................................................................3 1.1.3　CloudStack的路线规划...................................................................................4 1.2　如何加入CloudStack社区...........................................................................................5 1.2.1　CloudStack社区有哪些资源...........................................................................5 1.2.2　如何使用邮件列表.........................................................................................6 1.2.3　如何成为Commitor......................................................................................10 1.2.4　使用Transifex翻译Apache CloudStack文档..................................................12 1.2.5　小结...............................................................................................................19 1.3　CloudStack中国用户组.............................................................................................20 1.4　Apache基金会与Apache 2.0协议..............................................................................22 第2章　CloudStack架构........................................................................... 31 2.1　CloudStack的功能与特点.........................................................................................32 2.2　CloudStack系统的主要组成部分.............................................................................36 2.3　CloudStack的架构.....................................................................................................44 第3章　CloudStack的网络功能............................................................... 49 3.1　网络即服务...............................................................................................................50 3.2　网络类型...................................................................................................................51 3.2.1　公共网络.......................................................................................................51 3.2.2　来宾网络.......................................................................................................52 3.2.3　管理网络.......................................................................................................52 3.2.4　存储网络.......................................................................................................52 3.2.5　本地链路网络...............................................................................................53 3.3　虚拟路由器...............................................................................................................53 3.4　基础网络...................................................................................................................55 3.4.1　基础网络概述...............................................................................................55 3.4.2　安全组...........................................................................................................55 3.4.3　参考架构.......................................................................................................58 3.5　高级网络...................................................................................................................59 3.5.1　高级网络概述...............................................................................................59 3.5.2　高级网络服务...............................................................................................60 3.5.3　参考架构.......................................................................................................63 3.5.4　共享型来宾网络...........................................................................................64 3.5.5　VPC简介.......................................................................................................66 第4章　CloudStack的安装与配置........................................................... 71 4.1　CloudStack系统的安装与规划.................................................................................72 4.1.1　基本网络架构的配置信息............................................................................72 4.1.2　高级网络架构的配置信息............................................................................75 4.1.3　交换机的规划与配置...................................................................................78 4.1.4　安装时需要的其他信息................................................................................80 4.2　CloudStack管理节点的安装.....................................................................................80 4.2.1　CentOS下管理节点的安装方法...................................................................81 4.2.2　Ubuntu下管理节点的安装......................................................................... 102 4.2.3　检查并设置全局变量参数.......................................................................... 114 4.2.4　小结.............................................................................................................119 4.3　配置存储节点.........................................................................................................119 4.3.1　操作系统的配置.........................................................................................120 4.3.2　安装和配置NFS服务..................................................................................126 4.3.3　上传系统虚拟机模板.................................................................................130 4.4　安装和配置XenServer计算节点............................................................................. 131 4.4.1　XenServer计算节点的安装与配置............................................................. 132 4.4.2　安装支持CloudStack的软件包................................................................... 137 4.4.3　申请及激活XenServer许可证..................................................................... 138 4.4.4　小结.............................................................................................................140 4.5　安装和配置KVM计算节点.................................................................................... 140 4.5.1　安装KVM前的准备工作............................................................................141 4.5.2　CentOS下KVM的安装和配置方法............................................................ 142 4.5.3　在Ubuntu环境下安装和配置KVM............................................................ 160 4.5.4　小结.............................................................................................................166 4.6　安装和配置vSphere计算节点................................................................................. 166 4.6.1　安装vSphere套件........................................................................................167 4.6.2　配置ESXi网络.............................................................................................168 4.6.3　在vCenter中创建数据中心和群集............................................................. 173 4.6.4　小结.............................................................................................................176 第5章　CloudStack区域的创建与配置................................................. 177 第6章　CloudStack的基本使用............................................................. 265 第7章　CloudStack开发者入门............................................................. 395 资源截图：

陌佑

百度云

资源搜

图解Spark 核心技术与案例实战

深度剖析Hadoop HDFS

大数据存储MongoDB实战指南

Spark MLlib机器学习:算法、源码及实战详解

大数据分析：方法与应用

大數據分析Excel Power BI全方位應用

Hadoop 2.X HDFS源码剖析

spark graphX实战

让云落地云计算服务模式（SAAS、PAAS和IAAS）设计决策

CloudStack入门指南

资源搜

图解Spark 核心技术与案例实战

深度剖析Hadoop HDFS

大数据存储MongoDB实战指南

Spark MLlib机器学习:算法、源码及实战详解

大数据分析：方法与应用

大數據分析Excel Power BI全方位應用

Hadoop 2.X HDFS源码剖析

spark graphX实战

让云落地 云计算服务模式（SAAS、PAAS和IAAS）设计决策

CloudStack入门指南

让云落地云计算服务模式（SAAS、PAAS和IAAS）设计决策