樣本數(shù)的決定取決于需要預測的精度。預測精度簡單理解就是能夠容忍的差是多少,可以表現(xiàn)為標準偏差的差,也可以表現(xiàn)為百分比的差。也就是 ▏μ-M ▏允許差多少。μ為總體的均值,M為抽樣得到的均值。差越小,抽樣數(shù)就越需要多。如果允許10%的預測誤差的話, 就是 ▏μ-M ▏/μ<10%,這通常被認為是一種穩(wěn)定的狀態(tài)。那么也就是最大誤差不能超過0.1倍總體的偏差??偲畹膶挾仁?個標準偏差,那么允許的誤差就應該是五分之三標準偏差。按照這樣的精度要求計算,樣本數(shù)是30。所以,30個樣本數(shù)就是這樣產(chǎn)生的。在計算技術不發(fā)達的初期,為了能夠讓普通人都能運用統(tǒng)計手法,統(tǒng)計學家制定了這樣的一個方案
關于如何計算樣本數(shù),有以下公式計算得到,α=0.05、β=0.1。有興趣的可以計算一下。
在實際當中需要多少樣本數(shù)才能反映總體呢?比如:拋硬幣,有人曾問過這樣的問題,就是拋了10次都是正面,那么第11次是正面的概率是多少。。。拋硬幣時候確實會有連續(xù)是某一面的情況存在,但這并不是它本質的概率。如果獲得準確的本質概率需要拋多少次才能反映呢?拋11次,得到某一面出現(xiàn)為50%的結論的概率只有70%。如果要達到99%準確的話,則需要試驗9604次試驗。因此樣本需要多少,完全取決于需要達到多少預測的精度。
上表就是樣本數(shù)量的一個計算表,E代表的是我們可以忍受的誤差。拋硬幣試驗,歷史上有好多人都做過試驗,結果證實了以上的計算結果。
著作權歸作者所有。商業(yè)轉載請聯(lián)系作者獲得授權,非商業(yè)轉載請注明出處。
在網(wǎng)上找到了一篇文章貼上,供參考:如何確定樣本量,基本方法很多,但是公式檢驗表明,當誤差和置信區(qū)間一定時,不同的樣本量計算公式計算出來的樣本量是十分相近的,所以,我們完全可以使用簡單隨機抽樣計算樣本量的公式去近似估計其他抽樣方法的樣本量,這樣可以更加快捷方便,然后將樣本量根據(jù)一定方法分配到各個子域中去.所以,區(qū)域二相抽樣不能計算樣本量的說法是不科學的. 1.簡單隨機抽樣確定樣本量主要有兩種類型: ?。?)對于平均數(shù)類型的變量 對于已知數(shù)據(jù)為絕對數(shù),我們一般根據(jù)下列步驟來計算所需要的樣本量.已知期望調查結果的精度(E), 期望調查結果的置信度(L),以及總體的標準差估計值σ的具體數(shù)據(jù),總體單位數(shù)N. 計算公式為:n=σ2/(e2/Z2 σ2/N) 特殊情況下,如果是很大總體,計算公式變?yōu)?n= Z2σ2/e2 例如希望平均收入的誤差在正負人民幣30元之間,調查結果在95%的置信范圍以內,其95%的置信度要求Z的統(tǒng)計量為1.96.根據(jù)估計總體的標準差為150元,總體單位數(shù)為1000. 樣本量:n=150*150/(30*30/(1.96*1.96)) 150*150/1000)=88 (2)于百分比類型的變量 對于已知數(shù)據(jù)為百分比,一般根據(jù)下列步驟計算樣本量.已知調查結果的精度值百分比(E),以及置信度(L),比例估計(P)的精度,即樣本變異程度,總體數(shù)為N. 則計算公式為:n=P(1-P)/(e2/Z2 P(1-P)/N) 同樣,特殊情況下如果不考慮總體,公式為:n= Z2P(1-P)/e2 一般情況下,我們不知道P的取值,取其樣本變異程度最大時的值為0.5. 例如:希望平均收入的誤差在正負0.05之間,調查結果在95%的置信范圍以內,其95%的置信度要求Z的統(tǒng)計量為1.96,估計P為0.5,總體單位數(shù)為1000.樣本量為:n=0.5*0.5/(0.05*0.05/(1.96*1.96) 0.5*0.5/1000)=278 2.樣本量分配方法 以上分析我們獲得了采用簡單隨機抽樣公式計算得到的樣本量,總的樣本量需要在此基礎上乘以設計效應的值得到.由于樣本總量已經(jīng)確定,我們采用總樣本量固定方法分配樣本,這種方法包括按照比例分配和不按照比例分配兩類.實際工作中首先計算取得區(qū)縣總的樣本量,然后逐級將其分配到各階分層中,如果不清楚各階分層的規(guī)模和方差等,一般采取比例分配或者比例平方根分配法.如果有一定輔助變量可以使用,可以采用按照規(guī)模分配法分配樣本量. 3.樣本量和總體大小的關系: 在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總體的大小而變化.但是,總體越大,其變化越不明顯;總體較小時,變化明顯. 二者之間的變化并非是線性關系.所以,樣本量并不是越大越好,應該綜合考慮,實際工作中只要達到要求就可以了.結論:樣本大小與我們期望的預測精度以及總體大小有關,預測精度越高,樣本量就越大。。。直至百分百的調查。為保證95%的置信度,我們通常認為至少30組數(shù)據(jù)為抽樣調查的樣本數(shù)。如果一組是5個數(shù)據(jù)的話,那么一般就按照125執(zhí)行。總體數(shù)小于3000的情況下,我們基本上就可以按照125樣本數(shù)實施。
--
祝工作愉快!如需要智天下顧問服務的,請隨時與我聯(lián)系!