Fork me on GitHub

Apache Kudu综述

发表于 2022-01-20 | 更新于 2022-10-25 | 分类于 Hadoop | | 阅读次数：

本文字数： 779 | 阅读时长 ≈ 1 分钟

目录

背景
第一部分 Spark内存管理详解
第二部分 Spark参数说明
第三部分 Spark内存优化
第四部分常见线上问题解决
参考文献及资料

背景

第一部分

现在提起大数据存储，我们能想到的技术有很多，比如HDFS，以及在HDFS上的列式存储技术Apache Parquet，Apache ORC，还有以KV形式存储半结构化数据的Apache HBase和Apache Cassandra等等。既然有了如此多的存储技术，Cloudera公司为什么要开发出一款全新的存储引擎Kudu呢？

参考文献及资料

1、数据治理对运维数据体系的思考与启发，链接：http://blog.itpub.net/69994525/viewspace-2762789/

本文标题:Apache Kudu综述

文章作者:rong xiang

发布时间:2022年01月20日 - 13:01

最后更新:2022年10月25日 - 23:10

原始链接:https://zjrongxiang.github.io/posts/a72d0de8/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际转载请保留原文链接及作者。

0%