Fork me on GitHub

机器学习系列文章-不平衡数据集的采样技术

在数据处理中,经常需要对给定随机变量(一维或多维)及其概率分布函数,需要生成随机变量的采样(sampling)数据集(随机变量的随机采样样本点)。

采样的方法有很多:

1、MCMC方法(Mento Carlo Markov Chain,即:蒙特卡洛-马尔科夫链)。主要的算法有:

  • Metroplis-Hasting 算法
  • Gibbs Sampling 算法
0%