目录 背景 第一部分 回本溯源 第二部分 HDFS大量小文件的危害 第三部分 小文件治理方案总结 第四部分 总结 参考文献及资料 背景https://blog.csdn.net/m0_37613244/article/details/109920466?utm_medium=distrib ...
Pyspark实现原理和源码分析
目录 背景 第一部分 常用快捷键 参考文献及资料 背景https://mikolaje.github.io/2019/pyspark_slower.html https://blog.csdn.net/oTengYue/article/details/105379628 https://www. ...
Spark on Yarn任务动态伸缩机制介绍
目录 背景 第一部分 配置实现 第二部分 动态配置原理和源码分析 第三部分 总结 参考文献及资料 背景Spark默认使用的是资源预分配的模式。即在任务运行之前,需要提前指定任务运行需要的资源量。但是在实际线上生产环境使用过程就存在资源浪费和不足的问题,特别是Spark Streaming类型的任 ...
Spark中的动态伸缩和反压机制
目录 背景 第一部分 常用快捷键 参考文献及资料 背景https://fares.codes/posts/dynamic-scaling-and-backpressure/ 第一部分 建议采用以下做法以实现更好的自动缩放比例: 最好从相当大的集群和数量的执行程序开始,并在必要时进行缩减。(执行程 ...
orange网关原理和源码分析
背景Orange 属于流量网关(Api Geteway),项目托管在Github(https://github.com/orlabs/orange)上,目前活跃度较弱(2年未更新)。通常将`orange`和另一个流行的网关项目`Kong`进行比较,其实`orange`大部分组件都是参考`Kong`实 ...
Nginx常见使用场景总结
背景 HTTP服务器(含动静分离) 负载均衡 反向代理 正向代理 跨域请求 第一部分 HTTP服务器(含动静分离)Nginx本身是一个静态资源的服务器,当只有静态资源的时候,就可以使用Nginx来做服务器,如下,我们使用Nginx来部署一个打包好的vue项目 #vue项目server{ ...
Kafka中序列化和反序列化总结
背景https://www.vijaykonnackal.com/protobuf-kafka-message/ https://blog.csdn.net/weixin_26717681/article/details/108499713#t6 https://codingharbour.com/ ...
orange网关原理的源码分析
背景Orange v0.6.0版本是一个重构版本, 着重为了解决之前版本在有大量规则配置时性能损耗的问题。 基本的设计思路是将原来的规则细分成两层, 第一层叫做selector, 用于将流量进行第一步划分, 在进入某个selector后才按照之前的设计进行规则匹配, 匹配到后进行相关处理。 http ...