目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景https://www.6aiq.com/article/1635205226188 我们认为数据中台是企业级大数据通过系统化的方式实现统一、标 ...
运维大数据平台建设总结
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景https://www.infoq.cn/article/jqr7zoiucoqi0skgiagb https://www.6aiq.com/a ...
Yarn集群资源调度策略总结
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景对于分布式大数据资源管理器,必然要运行大量的大数据处理任务。在面对多租户,任务服务水平优先级差异、集群资源有限的复杂业务场景下,就需要处理好:多 ...
数据湖系列-Iceberg实践总结
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景数据湖技术实现上,有开源三剑客(Hudi,Delta Lake,Iceberg),本篇文章主要介绍其中一员:Iceberg。Iceberg官网产 ...
Elasticsearch 8.0正式版发布介绍
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景2022年2月11日Elasticsearch官方正式发布了Elasticsearch 8.0.0版本。官网博客也对新版本进行了功能介绍。本文作 ...
大数据工程师技术自测题库
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景第一部分https://book.itheima.net/study/1269935677353533441/12702540185720668 ...
Hadoop HDFS高可用机制
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景先从一个生产线上问题说起。生产线上我们使用的华为封装的Hadoop大数据平台,使用开源版本Flink 1.11作为Flink客户端提交任务到平台 ...
数据库架构设计模式总结
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景数据库构架设计中主要有Shared Everything、Shared Disk、Share Memory和Shared Nothing等。 第 ...
Spark中类型推断
目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景请注意,会自动推断分区列的数据类型。目前,支持数字数据类型和字符串类型。有些用户可能不想自动推断分区列的数据类型。对于这些用例,自动类型推断可以 ...