目录
- 背景
- 第一部分 Spark内存管理详解
- 第二部分 Spark参数说明
- 第三部分 Spark内存优化
- 第四部分 常见线上问题解决
- 参考文献及资料
背景
传统的关系型数据库中数据通常是通过库(表的集合)、表(字段的集合)、字段(数据的集合)进行组织的。在使用过程中,人们逐渐对各种最佳实践进行总结归纳,就形成了技术规范。
其中影响最大的就是:数据库3范式(简称3NF,其中NF是英文Normal Form的缩写,是英国人 E.F.Codd(关系数据库理论的奠基人)在上个世纪70年代提出关系数据库模型后总结出来的)。
我们先放出定义:
第一范式(1NF):要求数据库表的每一列都是不可分割的原子数据项;
第二范式(2NF):在1NF的基础上,非码属性必须完全依赖于候选码(在1NF基础上消除非主属性对主码的部分函数依赖);
第三范式(3NF):在2NF基础上,任何非主属性不依赖于其它非主属性(在2NF基础上消除传递依赖);
定义通常是归纳抽象的我们下文将详细讲解。范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。
在这之后又出现了巴斯-科德范式(BCNF)、 第四范式(4NF)和 第五范式(5NF,又称完美范式)。
- 巴斯-科德范式(BCNF)
- 第四范式(4NF)
- 第五范式(5NF)
在设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,各种范式呈递次规范,越高的范式数据库冗余越小。
第一部分 第一范式(1NF)
第二部分 第二范式(2NF)
第三部分 第三范式(3NF)
参考文献及资料
1、数据治理对运维数据体系的思考与启发,链接:http://blog.itpub.net/69994525/viewspace-2762789/