Fork me on GitHub
RongXiang

我的烂笔头


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 日程表

  • 搜索

机器学习系列文章-GPU开发环境部署总结

发表于 2022-03-20 | 更新于 2022-10-25 | 分类于 deep learning |
本文字数: 15k | 阅读时长 ≈ 14 分钟

目录 背景 第一部分 GPU环境 第二部分 Tensorflow-GPU环境部署 第三部分 Pytorch-GPU环境部署 参考文献及资料 背景本文环境:Ubuntu 16.04 GPU:Nvidia GTX 1080 第一部分 GPU环境1.1 种类目前市场上商用GPU主要是N卡(Nvidia ...

阅读全文 »

机器学习系列文章-异常检测算法(VAE)

发表于 2022-03-19 | 更新于 2022-10-25 | 分类于 deep learning |
本文字数: 2.4k | 阅读时长 ≈ 2 分钟

目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景对于学习一个知识,例如画画临摹,如何顶一个度量来检验学习效果呢?现实中我们会让学习者去实际画一幅相同的画作,然后和原画进行对比。其中的哲学原理就 ...

阅读全文 »

Spark中RDD的宽窄依赖

发表于 2022-03-16 | 更新于 2022-10-25 | 分类于 Spring |
本文字数: 5.2k | 阅读时长 ≈ 5 分钟

目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景我们知道Spark计算框架中RDD(Resilient Distributed Dataset)是他的核心概念,RDD是一个只读数据模型,计算中 ...

阅读全文 »

Github中黑话总结

发表于 2022-03-15 | 更新于 2022-10-25 | 分类于 github |
本文字数: 833 | 阅读时长 ≈ 1 分钟

目录 背景 参考文献及资料 背景初入Github这个坑,发现交流中有大量缩写,简称码农之间的黑话。收集并长期更新如下: PR: Pull Request的缩写,把自己分支的代码合并到主项目的请求。 LGTM: Looks Good To Me SGTM: Sounds Good To Me ...

阅读全文 »

如何共享开源(github)学习

发表于 2022-03-15 | 更新于 2022-10-25 | 分类于 github |
本文字数: 6.9k | 阅读时长 ≈ 6 分钟

目录 背景 第一部分 环境准备 第二部分 具体步骤 参考文献及资料 背景GitHub 上就有一个现成的教程项目 first-contributions,为初学者带来一个简单的方法来学习及参与开源项目。项目地址: https://github.com/firstcontributions/fi ...

阅读全文 »

Python系列文章-Python中语法知识积存

发表于 2022-03-14 | 更新于 2022-10-25 | 分类于 python |
本文字数: 5.9k | 阅读时长 ≈ 5 分钟

目录 背景 第一部分 Python中的__all__ 第二部分 第三部分 第四部分 第五部分 参考文献及资料 背景第一部分 Python中的__all__1.1 介绍Python语言没有Java语言中有public,private关键字控制可见性,所以可见性需要制定统一的约定 ...

阅读全文 »

数据仓库学习系列-大数据数仓综述

发表于 2022-02-26 | 更新于 2022-10-25 | 分类于 Data Warehouse |
本文字数: 11k | 阅读时长 ≈ 10 分钟

目录 背景 第一部分 数据仓库缘起 第二部分 数据仓库概述 第三部分 数据仓库技术实现 第四部分 常见数据仓库产品 第五部分 数据仓库的架构设计 第六部分 建模方法 第七部分 最佳实践 参考文献及资料 背景第一部分 数据仓库缘起1.1 历史数据的积存历史数据使用频率低,堆积在业务库中,导致性能降低 ...

阅读全文 »

大数据调度产品对比(海豚调度和天融信神灯)

发表于 2022-02-25 | 更新于 2022-10-25 | 分类于 大数据调度 |
本文字数: 6.6k | 阅读时长 ≈ 6 分钟

目录 背景 第一部分 环境依赖 第二部分 交互接口 第三部分 任务提交 参考文献及资料 背景随着数字化转型的趋势,各行业都在建设自身的大数据中台,实现数字化运营。在大数据中台建设中,必然涉及到大量大数据任务、机器学习任务以及各类脚本任务的运行。随着业务量的增长就会自然需要建设一个集中式的任务调度 ...

阅读全文 »

数据仓库学习系列--主题

发表于 2022-02-20 | 更新于 2022-10-25 | 分类于 Hadoop |
本文字数: 8.2k | 阅读时长 ≈ 7 分钟

目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景从上面的引言里面,我们其实可以知道主题在数仓建设里面绝对是很重要的一环,这的确是的。数仓在建设过程中,对数据的组织管理上,不仅仅要进行横向的分层 ...

阅读全文 »

运维大数据仓库建设主题设计规划

发表于 2022-02-20 | 更新于 2022-10-25 | 分类于 Hadoop |
本文字数: 3.4k | 阅读时长 ≈ 3 分钟

目录 背景 第一部分 Spark内存管理详解 第二部分 Spark参数说明 第三部分 Spark内存优化 第四部分 常见线上问题解决 参考文献及资料 背景运维类大数据仓库中通常有两类数据: 1、设备运行产生的数据。主要有:服务器(服务器、网络设备、安全防护设备等)产生的性能容量数据、日志数据(系统 ...

阅读全文 »
1…678…32
rong xiang

rong xiang

Keep a Pure Curiosity

311 日志
80 分类
21 标签
RSS
GitHub E-Mail Weibo
Link
  • 爱生活爱可可
© 2014 – 2022 rong xiang | 940k | 14:15
|
0%