更新时间:2024-11-01 GMT+08:00
分享

采样方式有几种?

蒙特卡洛采样

蒙特卡洛采样是一种简单的随机抽样,根据概率分布进行采样,如对样本服从µ=0,δ=1的正态分布,通过通过蒙特卡洛采样进行采样,采样得到的点能满足正态分布要求,但如下图所示,采样得到的点会集中µ=0附近,要想采样得到更边界的点,需要进行大量采样。

图1 蒙特卡洛采样

拉丁超立方采样

拉丁超立方采样的目的是用较少的采样次数,来达到与多次蒙特卡洛采样相同的结果,并且涵盖更全面的边界点。

如下图所示,同样对于µ=0,δ=1的正态分布,可以利用更少的采样点得到相同的分布,并且不会产生明显的聚集现象,边界值也能更容易获取到。

图2 拉丁超立方采样

联合概率分布采样

联合概率分布采样假设连续型参数符合正态分布,支持录入连续型参数之间的相关系数(值为1时,表示变量完全正相关。值为0时,表示变量间独立。值为-1时,表示变量完全负相关。),并根据参数分布和相关系数进行联合概率分布采样。而离散型参数根据给定的取值列表进行随机采样。

重要型采样

重要性采样是在优化目标边界附近进行采样,利用上一次泛化场景仿真后得到的评测分数进行训练拟合,找到边界后不断在边界附近进行采样。

图3 重要型采样

采样结果

如下图1和图2所示,对于某个逻辑场景进行拉丁超立方和蒙特卡洛采样,参数都是符合随机特性,但采样得到的值不相同。

对于同样的采样点数,拉丁超立方采样的结果会更加分散,并且边界值会更多。

图4 蒙特卡洛采样结果
图5 拉丁超立方采样结果

对于离散型参数,联合概率分布采样会根据给定的取值列表进行随机采样。

图6 离散型参数-联合概率分布采样结果

对于连续型参数,联合概率分布采样会根据参数分布和相关系数进行采样。

图7 连续型参数-联合概率分布采样结果

对于重要性采样,联合概率分布采样会在边界附近进行采样。

图8 重要性采样结果

相关文档