Fork me on GitHub
RongXiang

我的烂笔头


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 日程表

  • 搜索

揭开HDFS存储的面纱

发表于 2021-05-15 | 更新于 2022-10-25 | 分类于 HDFS |
本文字数: 1.9k | 阅读时长 ≈ 2 分钟

目录 背景 第一部分 回本溯源 第二部分 HDFS大量小文件的危害 第三部分 小文件治理方案总结 第四部分 总结 参考文献及资料 背景https://blog.csdn.net/m0_37613244/article/details/109920466?utm_medium=distrib ...

阅读全文 »

Yarn资源调度的

发表于 2021-05-15 | 更新于 2022-10-25 | 分类于 HDFS |
本文字数: 2.6k | 阅读时长 ≈ 2 分钟

目录 背景 第一部分 回本溯源 第二部分 HDFS大量小文件的危害 第三部分 小文件治理方案总结 第四部分 总结 参考文献及资料 背景yarn.resourcemanager.store.class : 有三种StateStore,分别是基于zookeeper, HDFS, leveldb ...

阅读全文 »

Pyspark实现原理和源码分析

发表于 2021-05-06 | 更新于 2022-10-25 | 分类于 spark |
本文字数: 23k | 阅读时长 ≈ 21 分钟

目录 背景 第一部分 常用快捷键 参考文献及资料 背景https://mikolaje.github.io/2019/pyspark_slower.html https://blog.csdn.net/oTengYue/article/details/105379628 https://www. ...

阅读全文 »

Spark on Yarn任务动态伸缩机制介绍

发表于 2021-05-02 | 更新于 2022-10-25 | 分类于 spark |
本文字数: 35k | 阅读时长 ≈ 32 分钟

目录 背景 第一部分 配置实现 第二部分 动态配置原理和源码分析 第三部分 总结 参考文献及资料 背景Spark默认使用的是资源预分配的模式。即在任务运行之前,需要提前指定任务运行需要的资源量。但是在实际线上生产环境使用过程就存在资源浪费和不足的问题,特别是Spark Streaming类型的任 ...

阅读全文 »

Spark中的动态伸缩和反压机制

发表于 2021-05-02 | 更新于 2022-10-25 | 分类于 spark |
本文字数: 1.5k | 阅读时长 ≈ 1 分钟

目录 背景 第一部分 常用快捷键 参考文献及资料 背景https://fares.codes/posts/dynamic-scaling-and-backpressure/ 第一部分 建议采用以下做法以实现更好的自动缩放比例: 最好从相当大的集群和数量的执行程序开始,并在必要时进行缩减。(执行程 ...

阅读全文 »

orange网关原理和源码分析

发表于 2021-04-15 | 更新于 2022-10-25 | 分类于 orange |
本文字数: 21k | 阅读时长 ≈ 19 分钟

背景Orange 属于流量网关(Api Geteway),项目托管在Github(https://github.com/orlabs/orange)上,目前活跃度较弱(2年未更新)。通常将`orange`和另一个流行的网关项目`Kong`进行比较,其实`orange`大部分组件都是参考`Kong`实 ...

阅读全文 »

Nginx常见使用场景总结

发表于 2021-04-15 | 更新于 2022-10-25 | 分类于 Nginx |
本文字数: 16k | 阅读时长 ≈ 15 分钟

背景 HTTP服务器(含动静分离) 负载均衡 反向代理 正向代理 跨域请求 第一部分 HTTP服务器(含动静分离)Nginx本身是一个静态资源的服务器,当只有静态资源的时候,就可以使用Nginx来做服务器,如下,我们使用Nginx来部署一个打包好的vue项目 #vue项目server{ ...

阅读全文 »

Kafka中序列化和反序列化总结

发表于 2021-04-15 | 更新于 2022-10-25 | 分类于 Kafka |
本文字数: 1.8k | 阅读时长 ≈ 2 分钟

背景https://www.vijaykonnackal.com/protobuf-kafka-message/ https://blog.csdn.net/weixin_26717681/article/details/108499713#t6 https://codingharbour.com/ ...

阅读全文 »

使用spark streaming将Kafka汇入Mysql实践

发表于 2021-04-15 | 更新于 2022-10-25 | 分类于 spark |
本文字数: 302 | 阅读时长 ≈ 1 分钟

背景http://www.biancheng666.com/article_147327.html 参考文献及资料

阅读全文 »

orange网关原理的源码分析

发表于 2021-04-15 | 更新于 2022-10-25 | 分类于 orange |
本文字数: 8.2k | 阅读时长 ≈ 7 分钟

背景Orange v0.6.0版本是一个重构版本, 着重为了解决之前版本在有大量规则配置时性能损耗的问题。 基本的设计思路是将原来的规则细分成两层, 第一层叫做selector, 用于将流量进行第一步划分, 在进入某个selector后才按照之前的设计进行规则匹配, 匹配到后进行相关处理。 http ...

阅读全文 »
1…121314…32
rong xiang

rong xiang

Keep a Pure Curiosity

311 日志
80 分类
21 标签
RSS
GitHub E-Mail Weibo
Link
  • 爱生活爱可可
© 2014 – 2022 rong xiang | 940k | 14:15
|
0%