2010年8月18日 星期三

990819單一樣本、獨立樣本、成對樣本

◎單一樣本:同一個母群,重複抽樣(同一班前後測)
◎獨立樣本:1位受試者只有1個依變項,每個受試者是獨立的,而全體受試者可以分為n組,檢定時主要是想知道這n組的依變項的平均數或變異數是否相等(例如:男女生,兩個樣本)
◎成對樣本:不同班配對(不同班,一號對一號,二號對二號)

◎統計分析:平均數差異檢定

990819上課筆記

平均數

標準差

T檢驗

實驗組

4.6

0.89(較集中)

對照組

4.5

1.45(較分散)

◎一般來說,只要看平均數和標準差就可以判斷。

◎T檢驗:兩個平均數比較,兩個是否來自同一母群

◎中央極限定律:是機率論中討論隨機變數和的分布以常態分佈極限的一組定理。這組定理是數理統計學和誤差分析的理論基礎,指出了大量隨機變數之和近似服從常態分佈的條件。

◎平均數會趨近於母群平均,標準差比較小,但與母群無關。

母群

樣本

平均數

趨近於

平均數

標準差

標準差

T值不重要,要看星號*

區間估計點估計量是用來估計母體參數的樣本統計量。由於點估計量的值不會恰好等於母體參數值,因此區間估計值(interval estimate通常是由點估計加減邊際誤差(margin of error求得。區間估計是根據樣本資料以兩個數值構成一個區間,來概括未知的母體參數,此兩數值稱為區間估計值,而兩數值間的長度則稱為信賴區間(Confidence Interval)。

在估計方法中,點估計是針對未知參數提供單一的推估值。區間估計(interval estimation) 則著重在建立一個未知參數可能出現的範圍 (區間) 。 點估計的結果雖然較為明確,但區間估計則提供較具彈性的推估結果。

信賴區間寬度越窄越好,信心水準越大越好,但這是兩難,無法同時達成。

欲求得一個較窄的信賴區間,信心必然不強,要求較強的信心水準,必然需

要較寬的區間。

990819資料蒐集-信度與效度

資料來源:關秉寅
信度與效度

1、 信度(reliability)與效度(validity)是所有測量的重要議題。兩者都是關心我們所設計的具體指標與這些指標所預測之構念(construct)間的關係。
構念是指將一些觀念,事實或印象有系統的組織起來後,所形成的概念。

2、 信度是指可靠性或一致性。信度好的指標在同樣或類似的條件下重複操作,可以得到一致或穩定的結果。
信度有三種:
(1)穩定信度(stability reliability):這是一種長期的信度。也就是指標在不同時間做測量時,可以得到同樣的結果。通常我們是用測試與再測試方法(test-retest method)來檢視一個指標的穩定信度,也就是將同樣的指標對同一群體重新施測,如果每次都得到同樣的結果,則此指標即有穩定信度。
(2)代表性信度(representative reliability):代表性信度是橫跨各個次母體或群組的信度。也就是指標用於不同次母體或群組(如年齡、性別)時,可以得到同樣的結果。例如,對年齡的測量,應該是詢問不同年齡層時,都可得到一致性的資訊,不論此指標是正確的問到年齡,還是有同樣方向的偏誤,如以多報少。做次母群體分析(subpopulation analysis)時,除了比較指標使用在不同的次母群體或群組的結果外,還涉及利用其他獨立的資訊,以判斷指標使用在不同群組時所得到的結果是否有同樣的誤差。
(3) 同等信度(equivalence reliability):同等信度是應用在利用多重指標測量同一構念的情況。我們感興趣的是:是否不同指標能得到一致的測量結果?
研究者常用折半法(the split-half method)來做此種信度的分析。其作法是將測量同一構念的多重指標隨機分成兩組後進行測量,然後判定是否兩組指標得到相同的結果。我們可以用如Cronbach’s α這種統計方法來做此種信度分析。如果多重指標有相當的信度,我們就可利用這些指標來建構量表。
另一種同等信度的特殊分析方法是做編碼者間信度(intercoder reliability)的分析。當我們用多位觀察者、評判者或編碼者時就可用此方法。其目的是檢視不同的觀察者或編碼者是否彼此間的意見一致。

3、如何增進信度
(1)明確的概念化:當我們只測量單一構念或構念的一個面向(subdimension),並有清楚的理論定義時,信度就會增加。
(2) 提升測量尺度的精確性
(3)使用多重指標:多重指標能使研究者測量一個構念的廣泛定義內容。這就好像是從概念領域中做抽樣(sampling from the conceptual domain),使研究者能測量到一個構念的不同層面。
(4)使用預試(pretests)、前導研究(pilot studies)及重複測試(replication)

5、效度是指概念定義(conceptual definition)及操作化定義(operational definition)間是否契合。因此,當我們說一個指標有效度時,我們是在特定目的及定義的情況下做此判斷。同樣的指標在不同的研究目的下,可能有不同的效度。
測量的效度比信度難達到。因為構念是抽象的,而指標則是具體的觀察。我們對於一個測量是否有效度並無絕對的信心,但可判斷是否比另一測量更有效度。測量的效度有四種類型:
(1)表面效度(face validity):這是最容易達成及最基本的效度。此類效度就是由學界來判斷指標是否真的測量到所欲測量到的構念。
(2)內容效度(content validity):這是一種特殊的表面效度。此類效度關心的是:是否一個定義的內容都在測量中呈現出來?構念定義包含著想法與概念的「空間」,指標測量應該抽樣到或包含到此空間中所有的想法。內容效度的達成有三個步驟:
─ 說明構念定義的內容
─ 從此定義所包含的區域或部份中做抽樣
─ 發展指標將定義來連結定義的這些部份

(3)校標效度(criterion validity):此類效度是用某些標準或校標來精確的指明一個構念。檢視測量指標的這種效度是要將它與測量同一構念且研究者有信心的指標來做比較。這種效度有兩個次類型:
─ 併行效度(concurrent validity):一個指標必須與既存且已被視為有效的指標相關連。
─ 預測效度(predictive validity):一個指標能預測在邏輯上與構念相關的事件。此指標與預測的事件是指向同一構念,但又有區別。這和假設測定不同。假設測定是一個變項預測另一不同的變項。

(4)建構效度(construct validity):建構效度(或構念效度)是用於多重指標的測量情況。此類效度也有兩個次類型:
─ 聚合效度(convergent validity):當測量同一構念的多重指標彼此間聚合或有關連時,就有此種效度存在。
─ 區別效度(discriminant validity):此種效度也稱之為分歧效度(divergent validity),與聚合效度相反。此類效度是指當一個構念的多重指標相聚合或呼應時,則這個構念的多重指標也應與其相對立之構念的測量指標有負向相關。例如與「政治容忍」相關的多重指標應會與「政治不容忍」相關的多重指標間有負向相關。

0819資料蒐集

資料來源:http://joechuang.wordpress.com/2009/12/07/%e5%a6%82%e4%bd%95%e7%94%a8excel%e8%a8%88%e7%ae%97z%e5%88%86%e6%95%b8%e5%8f%8at%e5%88%86%e6%95%b8/
如何用excel計算Z分數及T分數
Z 分數的公式 = (有空再補)
T 分數的公式 = Z 分數 *10 +50
Z 分數在Excel的函數為:STANDARDIZE,完整格式如:STANDARDIZE (需要標準化的值, 平均數, 標準差)
它需要三個參數:需要標準化的值、平均數、標準差
平均數的公式:AVERAGE,完整格式如:AVERAGE(範圍)
標準差的公式:STDEV,完整格式如:STDEV(範圍)

操作說明

Z 分數









原始的成績是如此












C1 這格要填入Z分數的計算公式,使用 STANDARDIZE。
第一個參數就是周節輪的成績 B2。
第二個參數是全部同學的成績平均 AVERAGE($B$2:$B$6),使用 $ 符號鎖住位址是因為等下公式要一直往下複製,鎖住複製公式時才不會偏移。
第三個參數是全部同學的標準差 STDEV($B$2:$B$6)。
設定完後再把公式往下複製即可。
T 分數
簡單多了,只要在 D2 這格填入公式 = C2*10+50,再把公式往下複製即可。

2010年8月11日 星期三

990812上課筆記

疑中存情: 懷疑中存在的情份-明明懷疑你卻還是相信你(老師)
虛無假設Ho :研究者認為不可能的答案 (推翻虛無假設來證明假設是真的)
無罪推論:還沒找到犯罪證據前,都是無罪的。

研究:找到現象及問題(找題目),不疑處有疑(別人都不懷疑,自己懷疑)→假設(研究者認為可能的答案,大膽假設可能的答案是什麼,然後再小心的透過實驗去求證)要證明不可能的答案不可能發生→


課程要證明有效要如何證明,假設這課程是無效的,那兩班成績考完應該是一樣的,但考出來的結果卻是有差異的→不可能的答案沒有發生,於是課程是有效的。


卡方檢定:無母數檢定,出現機率相等

例:電影院散場時有四個門,理論上每一個門經過的人數應相等,若有100人,左一有26人、左二24人、右二27人、右四23人 ,每一個門經過的人都差不多

但若左一有42人、左二有20人、右二有16人、右一有22人→出現機率差異大,有顯著差異。




2010年8月4日 星期三

990805上課筆記

標準分數

◎集中量數
◎變異量數:分散情形,使用標準差,標準差愈大愈分散,標準差愈小愈集中。

◎平均分數可能相同,但變異量並不會相同。

◎常態分配:往中間集中、對稱。數量愈大,愈趨於常態。平均數會出現在常態分配最高的地方,約百分之四十左右(0.3989)。中數往往是平均數也是眾數。

1個標準差→0.3413

2個標準差→0.1359

3個標準差→0.0214

4個標準差→0.0013





◎標準差(看分散或集中程度)的特質:全距(最大減最小)會趨近於六個標準差(6個SD,左右兩邊各3個SD)。例如:平均75分,標準差是4分,全距:75+4*3=97,75-4*3=63,分數介於63-97之間,若全部有1000人,分數介於97~63之間的佔99.9%



平均皆為75分

一個SD是2

考81分

(81-75)/2=3SD



一個SD是4

考83分

(83-75)/2=2SD



誰的分數比較好?81分



◎T分數=Z*10+50



◎魏氏智力測驗

平均數=100

標準差=15

智商=15*Z+100



若有學生智商120=15*Z+100Z=(120-100)/15=20/15=1.3

智商120→贏過約百分之九十七的人,前百分之三

中間50%+34%(一個標準差)+13%(2個標準差)=97%



若全部有10000人,T分數50-60分的有多少人?10000*0.3413=3413人

T分數在40-60分的有多少人(常態分配左右對稱)3413*2=6826人

T分數剛好50分的有10000*0.3989=3989人

Z分數=4.0的機率 →0.0001

分辨差異性時要算出發生的機率是多少

2010年7月28日 星期三

990729

990729


◎母群population:10個班有300個學生


樣本sample:從母群中抽出一些人

樣本和母群的平均數會一樣,前提是要隨機取樣

但樣本和母群的標準差不會一樣

推論統計的兩項工作:

  1. 樣本比較
  2. 樣本推估-母群 ,國中學測、大考結果的母群等於樣本數(幾乎所有學生都參與考試),不需推論

T檢驗(檢驗平均數有無變化,用在前後測、或實驗組與對照組,用在兩組比較)
若有三組以上要用單因子變異數分析(ANOVA),檢驗變異數
事後比較(Posteriori comparison):
基於統計決策所所進行平均數考驗之後續考驗(follow-up test)
在獲得顯著的F值之後所進行的多重比較,稱為事後比較(posteriori comparisons)
◎Spss:會跑出報表→敘述統計
↑(轉換)
試算表:幾乎電腦都有,使用較方便
腦力

名義變項:所謂名義變項(nominal variable),是指利用名稱或數值來分辨人、事、物之類別的變項。例如:宗教、血型、教學方法、學生學號,及國家發展程度等都是名義變項。
次序變項:所謂次序變項(ordinal variable),是指可利用數值或名稱來加以排序或賦予等第的變項。次序變項雖具有多少或優劣的次序和方向性,但並不說明多少或優劣之間差異的大小量。例如,前述的操行成績就是一種次序變項,中小學畢業獎項、段考名次都算是次序變項。
等距變項:所謂等距變項(interval variable),是指可以賦予名稱(類別)並加以排序,而且還可計算出期間差異之大小量的變項。等距變項須具有相等單位(equal unit)這一特性;所謂相等單位,是指在差異大小量的系列上各段之基本單位的間隔應完全相等(林清山,民81)例如,溫度、燈光照明度、喇叭的音量。
等比變項:所謂等比變項(ratio variable),是指可以賦予名稱、排序,並計算出差異大小量,還可以找出某比率(倍數)等於某比率的變項。等比變項必須具備有「絕對零點」,所謂絕對零點是指沒有數量存在的點。例如年齡、身高、體重、薪資。
◎信賴區間:95%信賴區間是從樣本數據計算出來的一個區間,保證在所有樣本當中,有95%會把真正的母體參數包含在區間之中。

◎顯著性(錯誤機率)p<0.05。例:p=0.059→錯誤率,表示正確率是94.1%

◎T值=比較值

◎自由度:n-1(兩點決定一直線,當一點出現,另一點大概就決定了)
◎P值:錯誤率
Spss實際操作:
一、先輸入數字












二、分析→比較平均數法→成對樣本t檢定















三、點選其中兩項














四、按確定後,會跑出報表


















◎非常重要的參考網頁:http://mail.leader.edu.tw/~tlhwu/statistics.htm

2010年7月27日 星期二

大學新生入學指定考試成績

九十九學年度指定科目考試各科成績標準一覽表





※以上五項標準均取為整數(小數只捨不入),且其計算均不含缺考生之成績,計算方式如下:
頂標:成績位於第88百分位數之考生成績
前標:成績位於第75百分位數之考生成績
均標:成績位於第50百分位數之考生成績
後標:成績位於第25百分位數之考生成績
底標:成績位於第12百分位數之考生成績

例:某科之到考考生為99982人,則該科五項標準為
頂標:成績由低至高排序,取第87985名(99982×88%=87984.16,取整數,小數無條件進位) 考生的成績,再取整數(小數只捨不入)。
前標:成績由低至高排序,取第74987名(99982×75%=74986.5,取整數,小數無條件進位) 考生的成績,再取整數(小數只捨不入)。
均標:成績由低至高排序,取第49991名(99982×50%=49991)考生的成績,再取整數(小數只捨不入)。
後標:成績由低至高排序,取第24996名(99982×25%=24995.5,取整數,小數無條件進位) 考生的成績,再取整數(小數只捨不入)。
底標:成績由低至高排序,取第11998名(99982×12%=11997.84,取整數,小數無條件進位)考生的成績,再取整數(小數只捨不入)。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
大學新生入學指定考試成績依各招生系指定標準分為頂標、前標、均標、後標、及底標等五級。
頂標分數為成績位於第88百分位數之考生成績(前12%)、
前標分數為成績位於第75百分位數之考生成績(前25%)、
均標分數為成績位於第50百分位數之考生成績(前50%)、
後標分數為成績位於第25百分位數之考生成績、
底標分數為成績位於第12百分位數之考生成績。
由於各系指定考試科目不盡相同且各科加權分數亦有所差異,因此已無法從錄取分數來評各系錄取之排序高低。又因各科題目之難易不一導致各科之五級標準也不同,因此從錄取分數除以加權總數所得之平均單科成績也無法反應各系錄取之排序高低。因此,本報告以各系之錄取分數除以各系指考各科標準加權總數所得之比值(得分比值)來評量各系錄取學生之程度,若頂標比值為1.00或以上時, 表示所錄取學生程度在前12%以內,比值愈高表示程度愈好;若前標比值為1.00或以上時, 表示所錄取學生程度在前25%以內;若均標比值為1.00或以上時,表示所錄取學生程度在前50%以內。若頂標比值為小於1.00,而前標比值大於1.00時,表示所錄取學生程度大部分大約在前12至25%之間。表一為本校各系在93與94學年度指定考試錄取學生之大致程度。從表中可看出本校在93學年度只有外國語文學系、財務金融學系、及財經法律學系的頂標比值在1.00以上,在94學年度也只有外國語文學系、財務金融學系、及資訊管理學系的頂標比值在1.00以上,亦即學生程度在前12%以內;其他的系所錄取學生程度大都在前12至25%之間。而農學院的某些系,例如農藝學系、園藝學系、森林學系、昆蟲學系、畜產學系、土壤環境科學系、水土保持學系、及工學院土木工程學系有學生是在25%以上。近年來改名的生物產業機電工程學系及食品暨應用生物科技學系所錄取學生程度也大都在前12至25%之間。就94年度而言,全校各系所錄取學生程度以財務金融學系、資訊管理學系、企業管理學系、物理學系、行銷學系、外國語文學系及應用經濟學系為最佳。與各系93年度所招新生比較,各系在94年度所招新生的程度大都有稍許之提昇。

2010年7月25日 星期日

學測、基測資料蒐集

資料來源:http://163.20.152.20/~typ45/bctestQ&A.html

Q:學測成績單(或復習考)上的 (原/量)各代表甚麼意思?

A:「原」指的是該科原始答對題數,「量」指的是換算後的量尺分數 (註:各科量尺分數滿分為80分,最低分為1分,五科滿分為400分,從96年起已加考作文,滿分成為412分)。

Q:何謂PR值(百分等級)?

A:PR值簡單講,就是平均每100人裡可以贏過的人數。例如若PR=87,代表平均每100人中,可以贏過87個人,輸了12個人(自己本身也算1人,所以總共正是87+12+1=100人)。故PR值最高為99,最低為0,PR值愈高成績愈好。

Q:國中基本學力測驗成績單中的百分PR值代表什麼意思?

A:承續上題說明。國中基本學力測驗分數通知單上所提供的PR值,是先將該次測驗所有考生的量尺總分排序後,依照人數均分成一百等分,該生大約會落在第幾個等分中。簡單來說,若某位考生的PR值為95,即表示該生的分數高於該次測驗全國約95%考生。

Q:何謂量尺分數?

A:所有考生在這一科的表現,也就是「多少考生答對多少題」這樣整體的統計資料所換算出來的,因為具有和群體比較的意義,好像一把用來測「量」個人表現的「尺」,所以稱為「量尺分數」。

Q:量尺分數如何換算?考前可以得知錯一題扣幾分嗎?

A:我曾打電話到製作復習考的偉文圖書公司詢問量尺分數如何換算的,但該公司回答此為商業機密不得公開,只說與師大心測中心的換算公式接近。而我翻閱心測中心曾提供的資料,也故意不將公式說清楚講明白,因此這個換算方式外人無從得知。但我們知道,因為考生程度不一樣,考題難度也不同,它是以每次考完後的成績去換算的,因此量尺分數都要等考完才會公佈,所以每次考前並無法得知該次錯一題扣幾分。

按這裡,我節錄94年第二次基測的量尺分數對照表來詳加說明。

Q:答對的題數不一樣,有沒有可能量尺分數一樣?

A:當然有可能,例如說94年第二次基測中,社會科共有61題,若答對0-12題,得到的均為1分。想想看,61題中,A,B,C,D隨便亂猜好歹也中個十來題吧,當然也有可能猜不到十題,而這些都視為沒有程度,因此量尺分數都是1分。除此之外,這次社會科中,答對36,37題的人量尺分數均為26分,自然科也有這種現象,通常這種情形常發生在題數較多的科目中(社、自)。

Q:答對的題數一樣,有沒有可能量尺分數不一樣?

A:就單科而言,這是不可能的。舉例:兩個人若同樣答對25題,量尺分數都是42分,這25題是不分題號的,也就是不管你是答對哪25題,都是得42分。不過,就五科加總而言,就有可能發生五科總答對題數較多的人反而量尺總分較低的情況,這也是造成社會大眾批評此制度不是為造就通才,而是為造就專才,導致各科不平均發展。舉例說明:在94年第二次基測中,若每科錯1題(共錯5題),所得到的總分為54+54+56+55+56=275分,連建中北一女都沾不上邊,但相反的另外一個人他也是共錯5題,不過他是全錯在自然科,他的總分為60+60+60+60+50=290分(以之前滿分三百分而言),居然高出15分之多,所以這個制度被批評正是此原因。

Q:總量尺分數不一樣,有沒有可能PR值會一樣?

A:當然有可能。目前量尺分數最高分為400分(若加作文則為412分),PR值最多只有100個段距,因此很容易產生量尺分數不一樣但PR值一樣的情形。例如在93年第一次基測中,無論是262,263,264分,其PR值均為95;或280分以上,其PR值均為99。

按這裡,可以看到92與93年第一次基測的量尺分數PR值與累積人數表。

Q:總量尺分數一樣,有沒有可能PR值會不一樣?

A:不可能。若兩位同學的總分都相同,則他們的PR值必定也會一樣。

Q:錄取與否是看PR值還是看量尺總分?

A:前面已提到若量尺分數不一樣,PR值是有可能會一樣的。因此錄取某所高中是看是否已達到此高中的最低錄取量尺分數,而非PR值。不過這些全是在考完且放榜後才會知道各高中的最低錄取量尺分數,事前是無法得知的。

Q:以復習考(模擬考)所公佈的成績去查看可以考上的高中落點,是否客觀具參考性?

A:否。前面提到,復習考(模擬考)是以該承辦公司自己內部的換算公式去換算量尺分數的,若這家公司的量尺分數不客觀,當然就不具有參考性。打個比方,本校去年度有一次復習考全國三沒有任何學生的量尺總分達到280分以上(當時滿分為300分)(也就是建中北一女的錄取標準左右),所有學生成績都嚴重偏低,可是最後本校卻共有12位同學考上建中或北一女。其他還有很多次復習考也有類似的現象,我審慎客觀的判斷,偉文圖書公司的量尺換算公式並不與師大心測中心接近,是有滿大的一個誤差。因此以後同學們拿到成績單後,不要以成績去判斷能考上的高中落點,應以「PR值」去判斷落點較為客觀。除此之外,因實際在登記分發時是以兩次基測擇較高那次去分發的,這也是另外一個復習考成績不客觀的原因之一。

Q:哪裡可以查看到每年台北區公立高中登記分發最低錄取分數?

A:您永遠也查不到最正確的數據,因為教育部不公開。因此每年都是靠各個學校明查暗訪所調查出來的,但這大部份還有些許誤差,難以做到100%正確,不過這樣也具有參考價值了。

按這裡,我節錄一份民國93年台北區公立高中登記分發最低錄取分數,當然這也不是百分之一百正確的,而且每年都在變化中,僅供大家參考。

Q:在本校排名為何大約可以考上甚麼樣的高中?

A:雖然本校(永平高中國中部)學生每年程度不一,但就這幾屆來看,大約全校排名前10名左右,可以考上第一志願(PR=99)。前20名左右可以考上前三志願(PR=97)。若想考上永平高中的高中部(PR=86~88),至少要100名以內。若是要考上公立高中(PR=70以上),至少要有前250名內,當然以上只是粗估,每年狀況不一樣,僅供家長同學們參考。


2010年7月21日 星期三

如果讓我重做一次研究生




990722資料蒐集

一、變異數:

(一)表示團體中各分數之分散情形的統計數,亦即用來表示個別差異大小的指標。

(二) 離差(資料值與期望值的差異)平方和的平均。
◎變異數計算方式:

母體變異數



樣本變異數

◎計算樣本變異數時,分母取(n-1)而非(n)的原因:
實務上,母體變異數通常未知,須以樣本變異數估計之,而樣本變異數會隨所 抽選樣本的不同而有變動(非固定),若考慮很多次抽樣,每次都以”/n-1 ”的 公式計算樣本變異數,則有些樣本變異數會高於母體變異數,有些則低於母體 變異數,但平均而言會與母體變異數很接近;反之,若計算樣本變異數時均除 以n,則平均而言會偏向低於母體變異數

二、標準差 SD (邊長)= 離均差平方和 SS(面積總和) / N ,再開根號,變異數(平均面積)= 標準差平方。
◎標準差計算方式:







次數分配屬於或近似常態分布時,以平均數為中心,上下各增減一個標準差範圍內之次數占68.27%:






三、全距:又稱極差,是用來表示統計資料中的變異量數(measures of variation),其最大值與最小值之間的差距;即最大值減最小值後所得之數據。表示分散情形之最簡陋方式, 容易受兩極端分數所影響,不穩定。
全距可以用ω(讀做omega)來表示。
公式
ω=XH-XL
其中的ω為全距,XH為最大值,XL為最小值。
特徵
全距為離散程度的最簡單測度值,易受極端值影響。其適用於等距變數、比率變數,不適用於名義變數或次序變數。

四、四分差:四分差(interquartile range, IQR),又稱四分位距。是描述統計學中的一種方法,以確定第三四分位數和第一四分位數的區別(即 的差距)[1]。與方差、標準差一樣,表示統計資料中各變量分散情形,但四分差更多為一種穩健統計(robust statistic)。

定義
四分差通常是用來構建箱形圖,以及對機率分佈的簡要圖表概述。對一個對稱性分佈數據(其中位數必然等於第三四分位數與第一四分位數的算術平均數),二分之一的四分差等於絕對中位差(MAD)。中位數是聚中趨勢的反映。
IQR = Q3 − Q1

五、使用時機:推論統計常用到標準差,若有極端分數則常用平均差。若以中位數為集中量數時,應以四分差為變異量數;若以算術平均數為集中量數時,則應以標準差為變異量數。

六、T分數:T分數(T Scores)
  T 分數是教育統計學名詞,為莫考兒(W.A. McCall)所創,為尊崇心理學家桑代克(E.L. Thorndike)及特門(L.M. Terman)二氏,故取其姓氏第一字母 T,命名為T分數。其標準差設定為10,平均數設定為 50 。為最常用的一種標準分數。計算公式如下:
  T 表示標準分數
  Z 表示Z分數
  X 表示原始分數
  表示平均數
  SD表示標準差
  式中按直線轉換方式計算。
  能力全距(range)在T分數的分配上,在 20與80之間(平均數上下各3個標準差,已包括99.74%的面積)。六○分在平均數以上SD/10,亦即一個標準差之處,原始 分 數 是 常 態 分 配 時,六○分以上之人數為15.87%,約為百分之十六。


1.T分數是一個指標,公式為T=<10((X-M)/SD)+50>,即將原始分數減去團體平均數,將餘數除以標準差再乘以10後再加上50計算而成。
小蘇的成績T分數是62==>10((X-M)/SD)+50=62,
移項後,(X-M)/SD=1.2,
因此題為全國性的數學成績表示樣本數大於30,為常態分配,
且標準化後值為Z=(X-M)/SD,因此Z=1.2,
透過查表可知Pr=(Z
2.而小陳的成績PR值為75,表示是贏過75%的學生。

由上可知,小蘇的成績高於小陳的成績。
簡單的說T分數能50分就不錯了!!

990722上課筆記

一、集中量數:
(一)平均數:簡化描述其狀態,具代表性,最常用。數量多才會形成常態分配,但樣本數不到30時使用時要小心
(二)中數
(三)眾數
二、變異量數:
(一)標準差:表示分散程度是多少。找出與平均數相距的面積相加再除以個數。
例1:有七個學生,分數為16.12.11.9.8.4.3,n(個數)=7,總和=63,m平均數為9,
16-9=7 ,7的平方=49
12-7=5,5 的平方=25
11-9=2,2的平方=4
9-9=0,0的平方=0
8-9=-1,-1的平方=1
以此類推將結果相加=124
124/7=17.71 每一個平均分到的面積(變異量)
17.71開根號=4.21(標準差)

公式口訣:平方和減和的平方除以N再開根號

例2:教師評鑑分數
M=4.2,SD=1.1→意見較集中
M=4.3,SD=1.7→意見較分散

標準差愈大,愈分散


例3:



















理論上標準差愈大,對高分群較有影響;標準差愈小,對低分群較有影響。但不一定完全如此。
(二)四分差:把百分之七十五到百分之二十五的找出來
(三)全距:最高分和最低分放在一起就知道差距有多大,最高分減最低分
(四)平均差

平均數把每一個人當成等量,光看平均數無法看出其另一個特質,所以要用變異量數,可看出整體量的變化(分散或集中)。

2010年7月14日 星期三

990715資料蒐集

一、敘述統計與推論統計
(A)敘述統計
(1)統計:是在面對不確定的狀況下,能夠幫助我們做出明智決策的一種科學方法。
(2)統計方法:蒐集、整理、分析統計資料與解釋並推論統計分析結果的科學方法。
(3)統計所研究是關於全體不確定現象的通則,而非個別事件發生的結果。
(4)統計應用的領域隨著時代的進步而日益擴大,但是統計方法的應用仍有其限制,應特別注意下列兩點::
(a)統計是一門科學而不是預言或魔術師,它必須從「足夠多」的統計資料中才能找研究對象全體的通則。
(b)統計資料必須客觀而周延,否則統計結果必有偏差,而導致錯誤的統計推論。

(B)推論統計
(1)定義:從母群體(population)中隨機抽樣,做為樣本(sample)後,我們根據樣本所收集到的資料,來推論估計母群體的性質。這類統計方法稱之為推論統計(inferentialstatistic)。
(2)推論統計另一個重要的概念是假設的設立。 我們一般按照費雪爾(R.A. Fisher),把假設分為虛無假設(null hypothesis)與對立假設(alternative hypothesis)兩種,且分別以符號Ho及H1表示之。費雪爾建議:將實驗者心目中盼望得到的研究結果當作是對立假設H1 ;而將與對立假設完全相反的結果當作是虛無假設Ho。在兩種假設當中,只有虛無假設是直接受到統計檢定。費雪爾希望藉由統計測驗推翻虛無假設,從而間接的為對立假設的可信性提供支持。 他這種思考法,是基於以下的信念:要證明一個敘述為真是非常困難的,但要否定一個敘述則只需提供一個反例即可。

(C)平均數、眾數、中數
(1)平均數:將一組數或量相加總,再除以該組數的個數,稱之為算術平均數。
(2)眾數(mode):一組資料中出現次數最多的數。
(3)中數(median):中位數就是一組資料由小至大排列,最中間那一個數。

(D)常態分配:大多數的人大概都聽過或了解「常態分配」的意思。譬如說,考試的結果一般都是中等成績的人佔大多數,而考的很差及很優異的人就佔少數。畫出來的曲線就像是

990715上課筆記

書:心理與教育統計學 林清山



如何處理群數資料─統計
敘述統計(描述性)─例:氣象統計去年12個月分的平均氣溫。敘述統計量越多,做推論統計實錯誤率較少。
推論統計(預測性)─例:明天氣溫高或低。每一個分數會有誤差,可能發生誤差的機率是多少。
統計的樣本數量盡量大於30(至少30)。



平均數:集中量數(每一個數字到平均數的距離加起來等於零)
中數:由小排到大,在中間的數
眾數:出現次數最多的數



常態分配─例:打彈珠
常態分配正中間的數往往是平均數、眾數、中數,完美理想的常態分配平均數就是眾數、中數

test

測試測試