關閉→
當前位置:知科普>IT科技>bootstrap數據是什麼意思

bootstrap數據是什麼意思

知科普 人氣:3.11W

bootstrap數據指的是:有放回地從總共N個樣本中抽樣n個樣本。

bootstrap數據是什麼意思

統計學中,bootstrap即自助法,是一種從給定訓練集中有放回的均勻抽樣,也就是説,每當選中一個樣本,它等可能地被再次選中並被再次添加到訓練集中。自助法由Bradley Efron於1979年在“Annals of Statistics”上發表。當樣本來自總體,能以正態分佈來描述,其抽樣分佈為正態分佈。

Bootstrap的思想,是生成一系列bootstrap偽樣本,每個樣本是初始數據有放回抽樣。通過對偽樣本的計算,獲得統計量的分佈。例如,要進行1000次bootstrap,求平均值的置信區間,可以對每個偽樣本計算平均值。這樣就獲得了1000個平均值。對着1000個平均值的分位數進行計算, 即可獲得置信區間。

TAG標籤:#bootstrap #