资源名称:Spark大数据分析实战 高彦杰 完整pdf 第1章 Spark简介 11.1 初识Spark 11.2 Spark生态系统BDAS 31.3 Spark架构与运行逻辑 41.4 弹性分布式数据集 61.4.1 RDD简介 61.4.2 RDD算子分类 81.5 本章小结 17第2章 Spark开发与环境配置 182.1 Spark应用开发环境配置 182.1.1 使用Intellij开发Spark程序 182.1.2 使用SparkShell进行交互式数据分析 232.2 远程调试Spark程序 242.3 Spark编译 262.4 配置Spark源码阅读环境 292.5 本章小结 29第3章 BDAS简介 303.1 SQL on Spark 303.1.1 为什么使用Spark SQL 313.1.2 Spark SQL架构分析 323.2 Spark Streaming 353.2.1 Spark Streaming简介 353.2.2 Spark Streaming架构 383.2.3 Spark Streaming原理剖析 383.3 GraphX 453.3.1 GraphX简介 453.3.2 GraphX的使用简介 453.3.3 GraphX体系结构 483.4 MLlib 503.4.1 MLlib简介 503.4.2 MLlib中的聚类和分类 523.5 本章小结 57第4章 Lamda架构日志分析流水线 584.1 日志分析概述 584.2 日志分析指标 614.3 Lamda架构 624.4 构建日志分析数据流水线 644.4.1 用Flume进行日志采集 644.4.2 用Kafka将日志汇总 684.4.3 用Spark Streaming进行实时日志分析 704.4.4 Spark SQL离线日志分析 754.4.5 用Flask将日志KPI可视化 784.5 本章小结 81第5章 基于云平台和用户日志的推荐系统 825.1 Azure云平台简介 825.1.1 Azure网站模型 835.1.2 Azure数据存储 845.1.3 Azure Queue消息传递 845.2 系统架构 855.3 构建Node.js应用 865.3.1 创建Azure Web应用 875.3.2 构建本地Node.js网站 905.3.3 发布应用到云平台 905.4 数据收集与预处理 915.4.1 通过JS收集用户行为日志 925.4.2 用户实时行为回传到Azure Queue 945.5 Spark Streaming实时分析用户日志 965.5.1 构建Azure Queue的Spark Streaming Receiver 965.5.2 Spark Streaming实时处理Azure Queue日志 975.5.3 Spark Streaming数据存储于Azure Table 985.6 MLlib离线训练模型 995.6.1 加载训练数据 995.6.2 使用rating RDD训练ALS模型 1005.6.3 使用ALS模型进行电影推荐 1015.6.4 评估模型的均方差 1015.7 本章小结 102第6章 Twitter情感分析 1036.1 系统架构 1036.2 Twitter数据收集 104 ...... 资源截图:
资源名称:Spark大数据分析实战 高彦杰 完整pdf 第1章 Spark简介 11.1 初识Spark 11.2 Spark生态系统BDAS 31.3 Spark架构与运行逻辑 41.4 弹性分布式数据集 61.4.1 RDD简介 61.4.2 RDD算子分类 81.5 本章小结 17第2章 Spark开发与环境配置 182.1 Spark应用开发环境配置 182.1.1 使用Intellij开发Spark程序 182.1.2 使用SparkShell进行交互式数据分析 232.2 远程调试Spark程序 242.3 Spark编译 262.4 配置Spark源码阅读环境 292.5 本章小结 29第3章 BDAS简介 303.1 SQL on Spark 303.1.1 为什么使用Spark SQL 313.1.2 Spark SQL架构分析 323.2 Spark Streaming 353.2.1 Spark Streaming简介 353.2.2 Spark Streaming架构 383.2.3 Spark Streaming原理剖析 383.3 GraphX 453.3.1 GraphX简介 453.3.2 GraphX的使用简介 453.3.3 GraphX体系结构 483.4 MLlib 503.4.1 MLlib简介 503.4.2 MLlib中的聚类和分类 523.5 本章小结 57第4章 Lamda架构日志分析流水线 584.1 日志分析概述 584.2 日志分析指标 614.3 Lamda架构 624.4 构建日志分析数据流水线 644.4.1 用Flume进行日志采集 644.4.2 用Kafka将日志汇总 684.4.3 用Spark Streaming进行实时日志分析 704.4.4 Spark SQL离线日志分析 754.4.5 用Flask将日志KPI可视化 784.5 本章小结 81第5章 基于云平台和用户日志的推荐系统 825.1 Azure云平台简介 825.1.1 Azure网站模型 835.1.2 Azure数据存储 845.1.3 Azure Queue消息传递 845.2 系统架构 855.3 构建Node.js应用 865.3.1 创建Azure Web应用 875.3.2 构建本地Node.js网站 905.3.3 发布应用到云平台 905.4 数据收集与预处理 915.4.1 通过JS收集用户行为日志 925.4.2 用户实时行为回传到Azure Queue 945.5 Spark Streaming实时分析用户日志 965.5.1 构建Azure Queue的Spark Streaming Receiver 965.5.2 Spark Streaming实时处理Azure Queue日志 975.5.3 Spark Streaming数据存储于Azure Table 985.6 MLlib离线训练模型 995.6.1 加载训练数据 995.6.2 使用rating RDD训练ALS模型 1005.6.3 使用ALS模型进行电影推荐 1015.6.4 评估模型的均方差 1015.7 本章小结 102第6章 Twitter情感分析 1036.1 系统架构 1036.2 Twitter数据收集 104 ...... 资源截图:
历史检测记录
同类资源
FFmpeg声音音频视频高级开发实战视频教程
粉笔网C语言基础课程fenbyC语言免费下载 百度云在线学习下载
教你如何用Python Flask 构建微电影视频网站视频教程
Spark Streaming学习实时流处理项目实战
facebook营销教程,脸书营销视频课程(附赠品单页教程)
Kafka原理剖析及实战演练 Kafka理论+实战视频教程 Kafka完美入门视频教程
92kaifa仿《ucbug软件站》源码 电脑手机应用软件游戏下载站模板带手机站+同步生成移动端 帝国CMS7.5内核
多配色城市门户D6 商业版 UTF8+GBK DiscuzX3.4模板
女神模特网站源码_套图下载 GBK+UTF Discuz模板
零基础入门Flink到上手企业开发视频教程
添加微信,反馈问题
微信及时反馈问题,方便沟通,请备注 ❤️