瑞客论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1911|回复: 20

《Flink大数据分析实战》带书签PDF

[复制链接]

2

主题

104

帖子

1213

积分

金牌会员

Rank: 6Rank: 6

威望
229
贡献
254
热心值
0
金币
730
注册时间
2019-11-26
发表于 2022-3-16 11:27 | 显示全部楼层 |阅读模式
本帖最后由 Niclas 于 2022-5-1 16:49 编辑

简介
书名:Flink大数据分析实战[size=10.2047pt]作者:张伟洋
[size=10.2047pt]出版社:清华大学出版社
[size=10.2047pt]出版日期:2022-02-01
ISBN:9787302598183

目录
  • 封面
  • 版权信息
  • 作者简介
  • 内容简介
  • 前言
  • 第1章 初识Flink
  • 1.1 大数据开发总体架构
  • 1.2 什么是Flink
  • 1.3 Flink的应用场景
  • 1.4 流计算框架对比
  • 1.5 Flink的主要组件
  • 1.6 Flink编程模型
  • 1.6.1 数据集
  • 1.6.2 编程接口
  • 1.6.3 程序结构
  • 1.7 快速体验Flink程序
  • 1.7.1 IntelliJ IDEA安装Scala插件
  • 1.7.2 IntelliJ IDEA创建Flink项目
  • 1.7.3 示例:批处理单词计数
  • 1.7.4 示例:流处理单词计数
  • 第2章 Flink运行架构及原理
  • 2.1 Flink运行时架构
  • 2.1.1 YARN集群架构
  • 2.1.2 Flink Standalone架构
  • 2.1.3 Flink On YARN的架构
  • 2.2 Flink任务调度原理
  • 2.2.1 任务链
  • 2.2.2 并行度
  • 2.2.3 共享Task Slot
  • 2.2.4 数据流
  • 2.2.5 执行图
  • 2.2.6 执行计划
  • 2.3 Flink数据分区
  • 2.3.1 分区数量
  • 2.3.2 分区策略
  • 第3章 Flink安装及部署
  • 3.1 Flink集群搭建
  • 3.1.1 Flink本地模式搭建
  • 3.1.2 Flink Standalone搭建
  • 3.1.3 Flink On YARN搭建
  • 3.2 Flink HA模式
  • 3.2.1 Flink Standalone模式的HA架构
  • 3.2.2 Flink Standalone模式HA集群搭建
  • 3.2.3 Flink On YARN模式HA集群搭建
  • 3.3 Flink命令行界面
  • 3.4 Flink应用提交
  • 3.5 Flink Shell的使用
  • 第4章 Flink DataStream API
  • 4.1 基本概念
  • 4.2 执行模式
  • 4.3 作业流程
  • 4.4 程序结构
  • 4.5 Source数据源
  • 4.5.1 基本数据源
  • 4.5.2 高级数据源
  • 4.5.3 自定义数据源
  • 4.6 Transformation数据转换
  • 4.7 Sink数据输出
  • 4.8 数据类型与序列化
  • 4.9 分区策略
  • 4.9.1 内置分区策略
  • 4.9.2 自定义分区策略
  • 4.10 窗口计算
  • 4.10.1 事件时间
  • 4.10.2 窗口分类
  • 4.10.3 窗口函数
  • 4.10.4 触发器
  • 4.10.5 清除器
  • 4.11 水印
  • 4.11.1 计算规则
  • 4.11.2 允许延迟与侧道输出
  • 4.11.3 生成策略
  • 4.12 状态管理
  • 4.12.1 Keyed State
  • 4.12.2 Operator State
  • 4.13 容错机制
  • 4.13.1 Checkpoint
  • 4.13.2 Barrier
  • 4.13.3 重启与故障恢复策略
  • 4.13.4 Savepoint
  • 4.14 案例分析:计算5秒内输入的单词数量
  • 4.15 案例分析:统计5分钟内每个用户产生的日志数量
  • 4.16 案例分析:统计24小时内每个用户的订单平均消费额
  • 4.17 案例分析:计算5秒内每个信号灯通过的汽车数量
  • 4.18 案例分析:Flink整合Kafka计算实时单词数量
  • 4.19 案例分析:天猫双十一实时交易额统计
  • 4.19.1 创建自定义数据源
  • 4.19.2 计算各个分类的订单总额
  • 4.19.3 计算全网销售总额与分类Top3
  • 第5章 Flink Table API&SQL
  • 5.1 基本概念
  • 5.1.1 计划器
  • 5.1.2 API架构
  • 5.1.3 程序结构
  • 5.2 动态表
  • 5.2.1 流映射为动态表
  • 5.2.2 连续查询
  • 5.2.3 动态表转换为流
  • 5.3 TableEnvironment API
  • 5.3.1 基本概念
  • 5.3.2 创建TableEnvironment
  • 5.3.3 示例:简单订单统计
  • 5.4 Table API
  • 5.4.1 基本概念
  • 5.4.2 示例:订单分组计数
  • 5.4.3 示例:每小时订单分组求平均值
  • 5.4.4 关系操作
  • 5.5 SQL API
  • 5.5.1 DDL操作
  • 5.5.2 DML操作
  • 5.5.3 DQL操作
  • 5.5.4 窗口函数
  • 5.5.5 窗口聚合
  • 5.5.6 分组聚合
  • 5.5.7 OVER聚合
  • 5.5.8 连接查询
  • 5.6 TopN查询
  • 5.6.1 OVER子句
  • 5.6.2 示例:计算产品类别销售额TopN
  • 5.6.3 示例:搜索词热度统计
  • 5.6.4 窗口TopN
  • 5.7 Catalog元数据管理
  • 5.8 Flink SQL整合Kafka
  • 5.8.1 基本概念
  • 5.8.2 示例:Flink SQL整合Kafka实现实时ETL
  • 5.9 Flink SQL CLI
  • 5.9.1 启动SQL CLI
  • 5.9.2 执行SQL查询
  • 5.9.3 可视化结果模式
  • 5.10 Flink SQL整合Hive
  • 5.10.1 整合步骤
  • 5.10.2 Table API操作Hive
  • 5.10.3 示例:Flink SQL整合Hive分析搜狗用户搜索日志
  • 5.11 案例分析:Flink SQL实时单词计数
  • 5.12 案例分析:Flink SQL实时计算5秒内用户订单总金额
  • 5.13 案例分析:微博用户行为分析
  • 5.13.1 离线与实时计算业务架构
  • 5.13.2 Flume数据采集架构
  • 5.13.3 Kafka消息队列架构
  • 5.14 案例分析:Flink SQL智慧交通数据分析
  • 5.14.1 项目介绍
  • 5.14.2 数据准备
  • 5.14.3 统计正常卡口数量
  • 5.14.4 统计车流量排名前3的卡口号
  • 5.14.5 统计每个卡口通过速度最快的前3辆车
  • 5.14.6 车辆轨迹分析
  • 第6章 Flink内核源码
  • 6.1 流图
  • 6.1.1 StreamGraph核心对象
  • 6.1.2 StreamGraph生成过程
  • 6.2 作业图
  • 6.2.1 JobGraph的核心对象
  • 6.2.2 JobGraph的生成过程
  • 6.3 执行图
  • 6.3.1 ExecutionGraph的核心对象
  • 6.3.2 ExecutionGraph的生成过程
  • 第7章 Gelly图计算
  • 7.1 什么是Gelly
  • 7.2 第一个Gelly程序
  • 7.3 Gelly数据结构
  • 7.4 如何使用Gelly
  • 7.5 图操作
  • 7.5.1 基本操作
  • 7.5.2 属性操作
  • 7.5.3 结构操作
  • 7.5.4 连接操作
  • 7.6 图常用API
  • 7.6.1 创建图
  • 7.6.2 图的转换
  • 7.6.3 图的添加与移除
  • 7.6.4 图的邻域方法
  • 7.7 案例分析:Gelly计算社交网络中粉丝的平均年龄


游客,本付费内容需要支付 25金币 才能浏览, 赞助VIP全站免费下载支付




本帖被以下淘专辑推荐:

回复

使用道具 举报

1

主题

240

帖子

795

积分

高级会员

Rank: 4

威望
394
贡献
356
热心值
0
金币
45
注册时间
2019-12-15
发表于 2023-10-12 15:33 | 显示全部楼层
看到这帖子真是高兴!
回复

使用道具 举报

0

主题

18

帖子

78

积分

注册会员

Rank: 2

威望
38
贡献
39
热心值
0
金币
1
注册时间
2023-10-5
发表于 2023-10-12 12:06 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

0

主题

1036

帖子

7600

积分

论坛元老

Rank: 8Rank: 8

威望
3316
贡献
2664
热心值
0
金币
1620
注册时间
2022-7-25
发表于 2023-10-10 09:17 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

0

主题

38

帖子

471

积分

中级会员

Rank: 3Rank: 3

威望
181
贡献
220
热心值
0
金币
70
注册时间
2023-3-26
发表于 2023-3-26 22:00 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

0

主题

2248

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

威望
5595
贡献
3630
热心值
0
金币
4909
注册时间
2022-9-15
发表于 2023-3-5 01:00 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

0

主题

4

帖子

28

积分

新手上路

Rank: 1

威望
9
贡献
11
热心值
0
金币
8
注册时间
2022-12-27
发表于 2022-12-27 11:14 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

0

主题

4

帖子

28

积分

新手上路

Rank: 1

威望
9
贡献
11
热心值
0
金币
8
注册时间
2022-12-27
发表于 2022-12-27 11:14 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

0

主题

4

帖子

28

积分

新手上路

Rank: 1

威望
9
贡献
11
热心值
0
金币
8
注册时间
2022-12-27
发表于 2022-12-27 11:13 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

0

主题

13

帖子

79

积分

注册会员

Rank: 2

威望
20
贡献
18
热心值
0
金币
41
注册时间
2022-11-5
发表于 2022-11-5 11:30 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2024-5-12 20:51

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表