樣本數(shù)的決定取決于需要預(yù)測的精度。預(yù)測精度簡單理解就是能夠容忍的差是多少,可以表現(xiàn)為標(biāo)準(zhǔn)偏差的差,也可以表現(xiàn)為百分比的差。也就是 ▏μ-M ▏允許差多少。μ為總體的均值,M為抽樣得到的均值。差越小,抽樣數(shù)就越需要多。如果允許10%的預(yù)測誤差的話, 就是 ▏μ-M ▏/μ<10%,這通常被認(rèn)為是一種穩(wěn)定的狀態(tài)。那么也就是最大誤差不能超過0.1倍總體的偏差??偲畹膶挾仁?個標(biāo)準(zhǔn)偏差,那么允許的誤差就應(yīng)該是五分之三標(biāo)準(zhǔn)偏差。按照這樣的精度要求計算,樣本數(shù)是30。所以,30個樣本數(shù)就是這樣產(chǎn)生的。在計算技術(shù)不發(fā)達(dá)的初期,為了能夠讓普通人都能運(yùn)用統(tǒng)計手法,統(tǒng)計學(xué)家制定了這樣的一個方案
關(guān)于如何計算樣本數(shù),有以下公式計算得到,α=0.05、β=0.1。有興趣的可以計算一下。
在實際當(dāng)中需要多少樣本數(shù)才能反映總體呢?比如:拋硬幣,有人曾問過這樣的問題,就是拋了10次都是正面,那么第11次是正面的概率是多少。。。拋硬幣時候確實會有連續(xù)是某一面的情況存在,但這并不是它本質(zhì)的概率。如果獲得準(zhǔn)確的本質(zhì)概率需要拋多少次才能反映呢?拋11次,得到某一面出現(xiàn)為50%的結(jié)論的概率只有70%。如果要達(dá)到99%準(zhǔn)確的話,則需要試驗9604次試驗。因此樣本需要多少,完全取決于需要達(dá)到多少預(yù)測的精度。
上表就是樣本數(shù)量的一個計算表,E代表的是我們可以忍受的誤差。拋硬幣試驗,歷史上有好多人都做過試驗,結(jié)果證實了以上的計算結(jié)果。
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。
在網(wǎng)上找到了一篇文章貼上,供參考:如何確定樣本量,基本方法很多,但是公式檢驗表明,當(dāng)誤差和置信區(qū)間一定時,不同的樣本量計算公式計算出來的樣本量是十分相近的,所以,我們完全可以使用簡單隨機(jī)抽樣計算樣本量的公式去近似估計其他抽樣方法的樣本量,這樣可以更加快捷方便,然后將樣本量根據(jù)一定方法分配到各個子域中去.所以,區(qū)域二相抽樣不能計算樣本量的說法是不科學(xué)的. 1.簡單隨機(jī)抽樣確定樣本量主要有兩種類型: ?。?)對于平均數(shù)類型的變量 對于已知數(shù)據(jù)為絕對數(shù),我們一般根據(jù)下列步驟來計算所需要的樣本量.已知期望調(diào)查結(jié)果的精度(E), 期望調(diào)查結(jié)果的置信度(L),以及總體的標(biāo)準(zhǔn)差估計值σ的具體數(shù)據(jù),總體單位數(shù)N. 計算公式為:n=σ2/(e2/Z2 σ2/N) 特殊情況下,如果是很大總體,計算公式變?yōu)?n= Z2σ2/e2 例如希望平均收入的誤差在正負(fù)人民幣30元之間,調(diào)查結(jié)果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計量為1.96.根據(jù)估計總體的標(biāo)準(zhǔn)差為150元,總體單位數(shù)為1000. 樣本量:n=150*150/(30*30/(1.96*1.96)) 150*150/1000)=88 (2)于百分比類型的變量 對于已知數(shù)據(jù)為百分比,一般根據(jù)下列步驟計算樣本量.已知調(diào)查結(jié)果的精度值百分比(E),以及置信度(L),比例估計(P)的精度,即樣本變異程度,總體數(shù)為N. 則計算公式為:n=P(1-P)/(e2/Z2 P(1-P)/N) 同樣,特殊情況下如果不考慮總體,公式為:n= Z2P(1-P)/e2 一般情況下,我們不知道P的取值,取其樣本變異程度最大時的值為0.5. 例如:希望平均收入的誤差在正負(fù)0.05之間,調(diào)查結(jié)果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計量為1.96,估計P為0.5,總體單位數(shù)為1000.樣本量為:n=0.5*0.5/(0.05*0.05/(1.96*1.96) 0.5*0.5/1000)=278 2.樣本量分配方法 以上分析我們獲得了采用簡單隨機(jī)抽樣公式計算得到的樣本量,總的樣本量需要在此基礎(chǔ)上乘以設(shè)計效應(yīng)的值得到.由于樣本總量已經(jīng)確定,我們采用總樣本量固定方法分配樣本,這種方法包括按照比例分配和不按照比例分配兩類.實際工作中首先計算取得區(qū)縣總的樣本量,然后逐級將其分配到各階分層中,如果不清楚各階分層的規(guī)模和方差等,一般采取比例分配或者比例平方根分配法.如果有一定輔助變量可以使用,可以采用按照規(guī)模分配法分配樣本量. 3.樣本量和總體大小的關(guān)系: 在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總體的大小而變化.但是,總體越大,其變化越不明顯;總體較小時,變化明顯. 二者之間的變化并非是線性關(guān)系.所以,樣本量并不是越大越好,應(yīng)該綜合考慮,實際工作中只要達(dá)到要求就可以了.結(jié)論:樣本大小與我們期望的預(yù)測精度以及總體大小有關(guān),預(yù)測精度越高,樣本量就越大。。。直至百分百的調(diào)查。為保證95%的置信度,我們通常認(rèn)為至少30組數(shù)據(jù)為抽樣調(diào)查的樣本數(shù)。如果一組是5個數(shù)據(jù)的話,那么一般就按照125執(zhí)行??傮w數(shù)小于3000的情況下,我們基本上就可以按照125樣本數(shù)實施。
--
祝工作愉快!如需要智天下顧問服務(wù)的,請隨時與我聯(lián)系!