第四部分 統(tǒng)計
一、統(tǒng)計與統(tǒng)計數(shù)據(jù)
。ㄒ唬 統(tǒng)計的含義
統(tǒng)計一詞包含三種含義:統(tǒng)計工作;統(tǒng)計數(shù)據(jù);統(tǒng)計學(xué)
。ǘ 統(tǒng)計數(shù)據(jù)的計量尺度
定類尺度(最粗略、計量層次最低)、定序尺度(反映等級差、順序差)、定距尺度(確切的數(shù)據(jù)反映量的差異)、定比尺度(相對數(shù)或平均數(shù))。
。ㄈ 類型
1.統(tǒng)計數(shù)據(jù)的類型:分類數(shù)據(jù);順序數(shù)據(jù);數(shù)值型數(shù)據(jù)(通常我們處理的大多為數(shù)值型數(shù)據(jù)),其中分類數(shù)據(jù)和順序數(shù)據(jù)是定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);數(shù)值型數(shù)據(jù)是定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。
對不同類型的數(shù)據(jù)應(yīng)采用不同的統(tǒng)計方法來處理和分析。品質(zhì)數(shù)據(jù)可計算各組的頻數(shù)或頻率,而數(shù)值型數(shù)據(jù)可以采取更多計算方法。
2.變量及其類型:統(tǒng)計中把說明現(xiàn)象某種特征的概念稱為變量,變量的具體表現(xiàn)為變量值,統(tǒng)計數(shù)據(jù)就是統(tǒng)計變量的具體表現(xiàn)。
可分為:分類變量、順序變量、數(shù)值型變量。
數(shù)值型變量又分為:離散變量和連續(xù)變量。
。ㄋ模 統(tǒng)計指標及其類型
分類:總量指標(絕對數(shù)形式)、相對指標和平均指標
總量指標按其所反映的時間狀況不同可分為時期指標和時點指標。
相對數(shù)的形式有比例和比率兩種。
。ㄎ澹 統(tǒng)計數(shù)據(jù)的來源
主要來源于兩種渠道:直接來源,稱第一手或直接的統(tǒng)計數(shù)據(jù);間接來源,稱第二手或間接的統(tǒng)計數(shù)據(jù)。
1.直接來源
方式:普查、抽樣調(diào)查、統(tǒng)計報表
(1)普查:為某一特定目的而專門組織的一次性全面調(diào)查。
普查的特點:通常是一次性的或周期性的;一般需要規(guī)定統(tǒng)一的標準調(diào)查時間;數(shù)據(jù)一般比較準確,規(guī)范化程度也較高;使用范圍比較狹窄。
普查的適用范圍:它主要用于收集處于某一時點狀態(tài)上的社會經(jīng)濟現(xiàn)象的數(shù)量。
(2)抽樣調(diào)查(實際中應(yīng)用最廣泛的一種調(diào)查方式和方法)
特點:經(jīng)濟性;實效性強;適應(yīng)面廣;準確性高
(3)統(tǒng)計報表
統(tǒng)計報表是按照國家有關(guān)法規(guī)的規(guī)定,自上而下的統(tǒng)一布置、自下而上的逐級提供基本統(tǒng)計數(shù)據(jù)的一種調(diào)查方式。統(tǒng)計報表要以一定的原始數(shù)據(jù)為基礎(chǔ),按照統(tǒng)一的表式、統(tǒng)一的指標、統(tǒng)一的報送時間和報送程序進行填報。
類型:全面報表和非全面報表
其他方式:重點調(diào)查和典型調(diào)查。
重點調(diào)查是從調(diào)查對象的全部單位中選擇少數(shù)重點單位進行調(diào)查。其中重點單位是指在所要調(diào)查的數(shù)量特征上占有較大比重的單位。
典型調(diào)查是從調(diào)查對象的全部單位中選擇一個或幾個有代表性的單位進行全面深入的調(diào)查。
2.間接來源:公開的出版物、未公開的內(nèi)部調(diào)查等。
。 統(tǒng)計數(shù)據(jù)的質(zhì)量
1. 統(tǒng)計數(shù)據(jù)的誤差、誤差的來源
誤差來源主要有:登記性誤差(從理論上講可以消除)和代表性誤差(通常無法消除,但可以事先進行控制或計算)。
2. 統(tǒng)計數(shù)據(jù)的質(zhì)量要求及檢查
精度、準確性、關(guān)聯(lián)性、及時性、一致性、最低成本
二、統(tǒng)計數(shù)據(jù)的整理和顯示
。ㄒ唬 品質(zhì)數(shù)據(jù)的整理與顯示
1. 分類數(shù)據(jù)的整理與顯示
。1)頻數(shù)與頻數(shù)分布(頻數(shù)分布表),比例(一個總體中各個部分的數(shù)量占總體數(shù)量的比重),百分比(比例乘以100),比率(各個不同類別的數(shù)量的比值)
把數(shù)據(jù)的各個類別及其相應(yīng)的頻數(shù)全部列出來就是頻數(shù)分布或稱次數(shù)分布,將其用表格的形式表現(xiàn)出來就是頻數(shù)分布表。
。2)分類數(shù)據(jù)的圖示:條形圖和圓形圖
2.順序數(shù)據(jù)的整理與顯示
除了可以用分類數(shù)據(jù)的整理及圖示方法外,還有累積頻數(shù)和累計頻率。
。1)累積頻數(shù):將各類別的頻數(shù)逐級累加起來,一種方法是從類別順序的開始一方向類別順序的最后一方累加頻數(shù),向上累積;另一種方法是從類別順序的最后一方向類別
順序的開始一方累加頻數(shù),向下累積。
累計頻率:將各類別的百分比逐級累加起來。
。2)圖示:累計頻數(shù)或頻率分布圖
(二) 數(shù)值型數(shù)據(jù)的整理與顯示
1. 數(shù)據(jù)的分組
方法:單變量分組(離散變量且變量值較少)和組距分組(連續(xù)變量或變量值教多)
組距分組的步驟:
。1)確定分組組數(shù),經(jīng)驗公式:k= 1+ log10n / log102;
(2)對原始資料進行排序;
。3)求極差:最大觀察值減去最小觀察值。
。4)確定各組組距:組距=極差/組數(shù)=某組的上限值-該組的下限值
(5)確定組限:組中值=(上限+下限)/ 2
a. 第一組的下限值應(yīng)比最小的觀察值小,最后一組的上限值應(yīng)比最大的觀察值大。
b. 不要使用開口組
c. 組限值應(yīng)能被5除盡,且一般使用整數(shù)。
(6)確定各組觀察值出現(xiàn)的頻數(shù):組距分組遵循“不重不漏”的原則;分組時“上組限不在內(nèi)”以防止重復(fù)。
。7)制作頻數(shù)分布表
2. 數(shù)值型數(shù)據(jù)的圖示:直方圖、折線圖
直方圖與條形圖的區(qū)別:前者用面積而后者用條形的長度來表示各類別頻數(shù)的多少,前者高度與寬度均有意義,前者的各矩形通常是連續(xù)排列而后者通常是分開排列。