2010年7月21日 星期三

990722資料蒐集

一、變異數:

(一)表示團體中各分數之分散情形的統計數,亦即用來表示個別差異大小的指標。

(二) 離差(資料值與期望值的差異)平方和的平均。
◎變異數計算方式:

母體變異數



樣本變異數

◎計算樣本變異數時,分母取(n-1)而非(n)的原因:
實務上,母體變異數通常未知,須以樣本變異數估計之,而樣本變異數會隨所 抽選樣本的不同而有變動(非固定),若考慮很多次抽樣,每次都以”/n-1 ”的 公式計算樣本變異數,則有些樣本變異數會高於母體變異數,有些則低於母體 變異數,但平均而言會與母體變異數很接近;反之,若計算樣本變異數時均除 以n,則平均而言會偏向低於母體變異數

二、標準差 SD (邊長)= 離均差平方和 SS(面積總和) / N ,再開根號,變異數(平均面積)= 標準差平方。
◎標準差計算方式:







次數分配屬於或近似常態分布時,以平均數為中心,上下各增減一個標準差範圍內之次數占68.27%:






三、全距:又稱極差,是用來表示統計資料中的變異量數(measures of variation),其最大值與最小值之間的差距;即最大值減最小值後所得之數據。表示分散情形之最簡陋方式, 容易受兩極端分數所影響,不穩定。
全距可以用ω(讀做omega)來表示。
公式
ω=XH-XL
其中的ω為全距,XH為最大值,XL為最小值。
特徵
全距為離散程度的最簡單測度值,易受極端值影響。其適用於等距變數、比率變數,不適用於名義變數或次序變數。

四、四分差:四分差(interquartile range, IQR),又稱四分位距。是描述統計學中的一種方法,以確定第三四分位數和第一四分位數的區別(即 的差距)[1]。與方差、標準差一樣,表示統計資料中各變量分散情形,但四分差更多為一種穩健統計(robust statistic)。

定義
四分差通常是用來構建箱形圖,以及對機率分佈的簡要圖表概述。對一個對稱性分佈數據(其中位數必然等於第三四分位數與第一四分位數的算術平均數),二分之一的四分差等於絕對中位差(MAD)。中位數是聚中趨勢的反映。
IQR = Q3 − Q1

五、使用時機:推論統計常用到標準差,若有極端分數則常用平均差。若以中位數為集中量數時,應以四分差為變異量數;若以算術平均數為集中量數時,則應以標準差為變異量數。

六、T分數:T分數(T Scores)
  T 分數是教育統計學名詞,為莫考兒(W.A. McCall)所創,為尊崇心理學家桑代克(E.L. Thorndike)及特門(L.M. Terman)二氏,故取其姓氏第一字母 T,命名為T分數。其標準差設定為10,平均數設定為 50 。為最常用的一種標準分數。計算公式如下:
  T 表示標準分數
  Z 表示Z分數
  X 表示原始分數
  表示平均數
  SD表示標準差
  式中按直線轉換方式計算。
  能力全距(range)在T分數的分配上,在 20與80之間(平均數上下各3個標準差,已包括99.74%的面積)。六○分在平均數以上SD/10,亦即一個標準差之處,原始 分 數 是 常 態 分 配 時,六○分以上之人數為15.87%,約為百分之十六。


1.T分數是一個指標,公式為T=<10((X-M)/SD)+50>,即將原始分數減去團體平均數,將餘數除以標準差再乘以10後再加上50計算而成。
小蘇的成績T分數是62==>10((X-M)/SD)+50=62,
移項後,(X-M)/SD=1.2,
因此題為全國性的數學成績表示樣本數大於30,為常態分配,
且標準化後值為Z=(X-M)/SD,因此Z=1.2,
透過查表可知Pr=(Z
2.而小陳的成績PR值為75,表示是贏過75%的學生。

由上可知,小蘇的成績高於小陳的成績。
簡單的說T分數能50分就不錯了!!

沒有留言:

張貼留言