◎單一樣本:同一個母群,重複抽樣(同一班前後測)
◎獨立樣本:1位受試者只有1個依變項,每個受試者是獨立的,而全體受試者可以分為n組,檢定時主要是想知道這n組的依變項的平均數或變異數是否相等(例如:男女生,兩個樣本)
◎成對樣本:不同班配對(不同班,一號對一號,二號對二號)
◎統計分析:平均數差異檢定
2010年8月18日 星期三
990819上課筆記
平均數 | 標準差 | T檢驗 | |
實驗組 | 4.6 | 0.89(較集中) | |
對照組 | 4.5 | 1.45(較分散) |
◎一般來說,只要看平均數和標準差就可以判斷。
◎T檢驗:兩個平均數比較,兩個是否來自同一母群
◎中央極限定律:是機率論中討論隨機變數和的分布以常態分佈為極限的一組定理。這組定理是數理統計學和誤差分析的理論基礎,指出了大量隨機變數之和近似服從常態分佈的條件。
◎平均數會趨近於母群平均,標準差比較小,但與母群無關。
母群 | 樣本 | |
平均數 | 趨近於 | 平均數 |
標準差 | 〉 | 標準差 |
◎T值不重要,要看星號*
◎區間估計:點估計量是用來估計母體參數的樣本統計量。由於點估計量的值不會恰好等於母體參數值,因此區間估計值(interval estimate)通常是由點估計加減邊際誤差(margin of error)求得。區間估計是根據樣本資料以兩個數值構成一個區間,來概括未知的母體參數,此兩數值稱為區間估計值,而兩數值間的長度則稱為信賴區間(Confidence Interval)。
在估計方法中,點估計是針對未知參數提供單一的推估值。區間估計(interval estimation) 則著重在建立一個未知參數可能出現的範圍 (區間) 。 點估計的結果雖然較為明確,但區間估計則提供較具彈性的推估結果。
◎信賴區間寬度越窄越好,信心水準越大越好,但這是兩難,無法同時達成。
欲求得一個較窄的信賴區間,信心必然不強,要求較強的信心水準,必然需
要較寬的區間。
990819資料蒐集-信度與效度
資料來源:關秉寅
信度與效度
1、 信度(reliability)與效度(validity)是所有測量的重要議題。兩者都是關心我們所設計的具體指標與這些指標所預測之構念(construct)間的關係。
構念是指將一些觀念,事實或印象有系統的組織起來後,所形成的概念。
2、 信度是指可靠性或一致性。信度好的指標在同樣或類似的條件下重複操作,可以得到一致或穩定的結果。
信度有三種:
(1)穩定信度(stability reliability):這是一種長期的信度。也就是指標在不同時間做測量時,可以得到同樣的結果。通常我們是用測試與再測試方法(test-retest method)來檢視一個指標的穩定信度,也就是將同樣的指標對同一群體重新施測,如果每次都得到同樣的結果,則此指標即有穩定信度。
(2)代表性信度(representative reliability):代表性信度是橫跨各個次母體或群組的信度。也就是指標用於不同次母體或群組(如年齡、性別)時,可以得到同樣的結果。例如,對年齡的測量,應該是詢問不同年齡層時,都可得到一致性的資訊,不論此指標是正確的問到年齡,還是有同樣方向的偏誤,如以多報少。做次母群體分析(subpopulation analysis)時,除了比較指標使用在不同的次母群體或群組的結果外,還涉及利用其他獨立的資訊,以判斷指標使用在不同群組時所得到的結果是否有同樣的誤差。
(3) 同等信度(equivalence reliability):同等信度是應用在利用多重指標測量同一構念的情況。我們感興趣的是:是否不同指標能得到一致的測量結果?
研究者常用折半法(the split-half method)來做此種信度的分析。其作法是將測量同一構念的多重指標隨機分成兩組後進行測量,然後判定是否兩組指標得到相同的結果。我們可以用如Cronbach’s α這種統計方法來做此種信度分析。如果多重指標有相當的信度,我們就可利用這些指標來建構量表。
另一種同等信度的特殊分析方法是做編碼者間信度(intercoder reliability)的分析。當我們用多位觀察者、評判者或編碼者時就可用此方法。其目的是檢視不同的觀察者或編碼者是否彼此間的意見一致。
3、如何增進信度
(1)明確的概念化:當我們只測量單一構念或構念的一個面向(subdimension),並有清楚的理論定義時,信度就會增加。
(2) 提升測量尺度的精確性
(3)使用多重指標:多重指標能使研究者測量一個構念的廣泛定義內容。這就好像是從概念領域中做抽樣(sampling from the conceptual domain),使研究者能測量到一個構念的不同層面。
(4)使用預試(pretests)、前導研究(pilot studies)及重複測試(replication)
5、效度是指概念定義(conceptual definition)及操作化定義(operational definition)間是否契合。因此,當我們說一個指標有效度時,我們是在特定目的及定義的情況下做此判斷。同樣的指標在不同的研究目的下,可能有不同的效度。
測量的效度比信度難達到。因為構念是抽象的,而指標則是具體的觀察。我們對於一個測量是否有效度並無絕對的信心,但可判斷是否比另一測量更有效度。測量的效度有四種類型:
(1)表面效度(face validity):這是最容易達成及最基本的效度。此類效度就是由學界來判斷指標是否真的測量到所欲測量到的構念。
(2)內容效度(content validity):這是一種特殊的表面效度。此類效度關心的是:是否一個定義的內容都在測量中呈現出來?構念定義包含著想法與概念的「空間」,指標測量應該抽樣到或包含到此空間中所有的想法。內容效度的達成有三個步驟:
─ 說明構念定義的內容
─ 從此定義所包含的區域或部份中做抽樣
─ 發展指標將定義來連結定義的這些部份
(3)校標效度(criterion validity):此類效度是用某些標準或校標來精確的指明一個構念。檢視測量指標的這種效度是要將它與測量同一構念且研究者有信心的指標來做比較。這種效度有兩個次類型:
─ 併行效度(concurrent validity):一個指標必須與既存且已被視為有效的指標相關連。
─ 預測效度(predictive validity):一個指標能預測在邏輯上與構念相關的事件。此指標與預測的事件是指向同一構念,但又有區別。這和假設測定不同。假設測定是一個變項預測另一不同的變項。
(4)建構效度(construct validity):建構效度(或構念效度)是用於多重指標的測量情況。此類效度也有兩個次類型:
─ 聚合效度(convergent validity):當測量同一構念的多重指標彼此間聚合或有關連時,就有此種效度存在。
─ 區別效度(discriminant validity):此種效度也稱之為分歧效度(divergent validity),與聚合效度相反。此類效度是指當一個構念的多重指標相聚合或呼應時,則這個構念的多重指標也應與其相對立之構念的測量指標有負向相關。例如與「政治容忍」相關的多重指標應會與「政治不容忍」相關的多重指標間有負向相關。
信度與效度
1、 信度(reliability)與效度(validity)是所有測量的重要議題。兩者都是關心我們所設計的具體指標與這些指標所預測之構念(construct)間的關係。
構念是指將一些觀念,事實或印象有系統的組織起來後,所形成的概念。
2、 信度是指可靠性或一致性。信度好的指標在同樣或類似的條件下重複操作,可以得到一致或穩定的結果。
信度有三種:
(1)穩定信度(stability reliability):這是一種長期的信度。也就是指標在不同時間做測量時,可以得到同樣的結果。通常我們是用測試與再測試方法(test-retest method)來檢視一個指標的穩定信度,也就是將同樣的指標對同一群體重新施測,如果每次都得到同樣的結果,則此指標即有穩定信度。
(2)代表性信度(representative reliability):代表性信度是橫跨各個次母體或群組的信度。也就是指標用於不同次母體或群組(如年齡、性別)時,可以得到同樣的結果。例如,對年齡的測量,應該是詢問不同年齡層時,都可得到一致性的資訊,不論此指標是正確的問到年齡,還是有同樣方向的偏誤,如以多報少。做次母群體分析(subpopulation analysis)時,除了比較指標使用在不同的次母群體或群組的結果外,還涉及利用其他獨立的資訊,以判斷指標使用在不同群組時所得到的結果是否有同樣的誤差。
(3) 同等信度(equivalence reliability):同等信度是應用在利用多重指標測量同一構念的情況。我們感興趣的是:是否不同指標能得到一致的測量結果?
研究者常用折半法(the split-half method)來做此種信度的分析。其作法是將測量同一構念的多重指標隨機分成兩組後進行測量,然後判定是否兩組指標得到相同的結果。我們可以用如Cronbach’s α這種統計方法來做此種信度分析。如果多重指標有相當的信度,我們就可利用這些指標來建構量表。
另一種同等信度的特殊分析方法是做編碼者間信度(intercoder reliability)的分析。當我們用多位觀察者、評判者或編碼者時就可用此方法。其目的是檢視不同的觀察者或編碼者是否彼此間的意見一致。
3、如何增進信度
(1)明確的概念化:當我們只測量單一構念或構念的一個面向(subdimension),並有清楚的理論定義時,信度就會增加。
(2) 提升測量尺度的精確性
(3)使用多重指標:多重指標能使研究者測量一個構念的廣泛定義內容。這就好像是從概念領域中做抽樣(sampling from the conceptual domain),使研究者能測量到一個構念的不同層面。
(4)使用預試(pretests)、前導研究(pilot studies)及重複測試(replication)
5、效度是指概念定義(conceptual definition)及操作化定義(operational definition)間是否契合。因此,當我們說一個指標有效度時,我們是在特定目的及定義的情況下做此判斷。同樣的指標在不同的研究目的下,可能有不同的效度。
測量的效度比信度難達到。因為構念是抽象的,而指標則是具體的觀察。我們對於一個測量是否有效度並無絕對的信心,但可判斷是否比另一測量更有效度。測量的效度有四種類型:
(1)表面效度(face validity):這是最容易達成及最基本的效度。此類效度就是由學界來判斷指標是否真的測量到所欲測量到的構念。
(2)內容效度(content validity):這是一種特殊的表面效度。此類效度關心的是:是否一個定義的內容都在測量中呈現出來?構念定義包含著想法與概念的「空間」,指標測量應該抽樣到或包含到此空間中所有的想法。內容效度的達成有三個步驟:
─ 說明構念定義的內容
─ 從此定義所包含的區域或部份中做抽樣
─ 發展指標將定義來連結定義的這些部份
(3)校標效度(criterion validity):此類效度是用某些標準或校標來精確的指明一個構念。檢視測量指標的這種效度是要將它與測量同一構念且研究者有信心的指標來做比較。這種效度有兩個次類型:
─ 併行效度(concurrent validity):一個指標必須與既存且已被視為有效的指標相關連。
─ 預測效度(predictive validity):一個指標能預測在邏輯上與構念相關的事件。此指標與預測的事件是指向同一構念,但又有區別。這和假設測定不同。假設測定是一個變項預測另一不同的變項。
(4)建構效度(construct validity):建構效度(或構念效度)是用於多重指標的測量情況。此類效度也有兩個次類型:
─ 聚合效度(convergent validity):當測量同一構念的多重指標彼此間聚合或有關連時,就有此種效度存在。
─ 區別效度(discriminant validity):此種效度也稱之為分歧效度(divergent validity),與聚合效度相反。此類效度是指當一個構念的多重指標相聚合或呼應時,則這個構念的多重指標也應與其相對立之構念的測量指標有負向相關。例如與「政治容忍」相關的多重指標應會與「政治不容忍」相關的多重指標間有負向相關。
0819資料蒐集
資料來源:http://joechuang.wordpress.com/2009/12/07/%e5%a6%82%e4%bd%95%e7%94%a8excel%e8%a8%88%e7%ae%97z%e5%88%86%e6%95%b8%e5%8f%8at%e5%88%86%e6%95%b8/

如何用excel計算Z分數及T分數
Z 分數的公式 = (有空再補)
T 分數的公式 = Z 分數 *10 +50
Z 分數在Excel的函數為:STANDARDIZE,完整格式如:STANDARDIZE (需要標準化的值, 平均數, 標準差)
它需要三個參數:需要標準化的值、平均數、標準差
平均數的公式:AVERAGE,完整格式如:AVERAGE(範圍)
標準差的公式:STDEV,完整格式如:STDEV(範圍)
T 分數的公式 = Z 分數 *10 +50
Z 分數在Excel的函數為:STANDARDIZE,完整格式如:STANDARDIZE (需要標準化的值, 平均數, 標準差)
它需要三個參數:需要標準化的值、平均數、標準差
平均數的公式:AVERAGE,完整格式如:AVERAGE(範圍)
標準差的公式:STDEV,完整格式如:STDEV(範圍)
操作說明
Z 分數

原始的成績是如此
C1 這格要填入Z分數的計算公式,使用 STANDARDIZE。
第一個參數就是周節輪的成績 B2。
第二個參數是全部同學的成績平均 AVERAGE($B$2:$B$6),使用 $ 符號鎖住位址是因為等下公式要一直往下複製,鎖住複製公式時才不會偏移。
第三個參數是全部同學的標準差 STDEV($B$2:$B$6)。
設定完後再把公式往下複製即可。
T 分數
簡單多了,只要在 D2 這格填入公式 = C2*10+50,再把公式往下複製即可。
第一個參數就是周節輪的成績 B2。
第二個參數是全部同學的成績平均 AVERAGE($B$2:$B$6),使用 $ 符號鎖住位址是因為等下公式要一直往下複製,鎖住複製公式時才不會偏移。
第三個參數是全部同學的標準差 STDEV($B$2:$B$6)。
設定完後再把公式往下複製即可。
T 分數
簡單多了,只要在 D2 這格填入公式 = C2*10+50,再把公式往下複製即可。

2010年8月11日 星期三
990812上課筆記
疑中存情: 懷疑中存在的情份-明明懷疑你卻還是相信你(老師)
虛無假設Ho :研究者認為不可能的答案 (推翻虛無假設來證明假設是真的)
無罪推論:還沒找到犯罪證據前,都是無罪的。
虛無假設Ho :研究者認為不可能的答案 (推翻虛無假設來證明假設是真的)
無罪推論:還沒找到犯罪證據前,都是無罪的。
研究:找到現象及問題(找題目),不疑處有疑(別人都不懷疑,自己懷疑)→假設(研究者認為可能的答案,大膽假設可能的答案是什麼,然後再小心的透過實驗去求證)要證明不可能的答案不可能發生→
課程要證明有效要如何證明,假設這課程是無效的,那兩班成績考完應該是一樣的,但考出來的結果卻是有差異的→不可能的答案沒有發生,於是課程是有效的。
卡方檢定:無母數檢定,出現機率相等
例:電影院散場時有四個門,理論上每一個門經過的人數應相等,若有100人,左一有26人、左二24人、右二27人、右四23人 ,每一個門經過的人都差不多
但若左一有42人、左二有20人、右二有16人、右一有22人→出現機率差異大,有顯著差異。

2010年8月4日 星期三
990805上課筆記
標準分數
◎集中量數
◎變異量數:分散情形,使用標準差,標準差愈大愈分散,標準差愈小愈集中。
◎平均分數可能相同,但變異量並不會相同。
◎常態分配:往中間集中、對稱。數量愈大,愈趨於常態。平均數會出現在常態分配最高的地方,約百分之四十左右(0.3989)。中數往往是平均數也是眾數。
1個標準差→0.3413
2個標準差→0.1359
3個標準差→0.0214
4個標準差→0.0013
◎標準差(看分散或集中程度)的特質:全距(最大減最小)會趨近於六個標準差(6個SD,左右兩邊各3個SD)。例如:平均75分,標準差是4分,全距:75+4*3=97,75-4*3=63,分數介於63-97之間,若全部有1000人,分數介於97~63之間的佔99.9%
平均皆為75分
一個SD是2
考81分
(81-75)/2=3SD
一個SD是4
考83分
(83-75)/2=2SD
誰的分數比較好?81分
◎T分數=Z*10+50
◎魏氏智力測驗
平均數=100
標準差=15
智商=15*Z+100
若有學生智商120=15*Z+100Z=(120-100)/15=20/15=1.3
智商120→贏過約百分之九十七的人,前百分之三
中間50%+34%(一個標準差)+13%(2個標準差)=97%
若全部有10000人,T分數50-60分的有多少人?10000*0.3413=3413人
T分數在40-60分的有多少人(常態分配左右對稱)3413*2=6826人
T分數剛好50分的有10000*0.3989=3989人
◎Z分數=4.0的機率 →0.0001
分辨差異性時要算出發生的機率是多少
◎集中量數
◎變異量數:分散情形,使用標準差,標準差愈大愈分散,標準差愈小愈集中。
◎平均分數可能相同,但變異量並不會相同。
◎常態分配:往中間集中、對稱。數量愈大,愈趨於常態。平均數會出現在常態分配最高的地方,約百分之四十左右(0.3989)。中數往往是平均數也是眾數。

1個標準差→0.3413
2個標準差→0.1359
3個標準差→0.0214
4個標準差→0.0013
◎標準差(看分散或集中程度)的特質:全距(最大減最小)會趨近於六個標準差(6個SD,左右兩邊各3個SD)。例如:平均75分,標準差是4分,全距:75+4*3=97,75-4*3=63,分數介於63-97之間,若全部有1000人,分數介於97~63之間的佔99.9%
平均皆為75分
一個SD是2
考81分
(81-75)/2=3SD
一個SD是4
考83分
(83-75)/2=2SD
誰的分數比較好?81分
◎T分數=Z*10+50
◎魏氏智力測驗
平均數=100
標準差=15
智商=15*Z+100
若有學生智商120=15*Z+100Z=(120-100)/15=20/15=1.3
智商120→贏過約百分之九十七的人,前百分之三
中間50%+34%(一個標準差)+13%(2個標準差)=97%
若全部有10000人,T分數50-60分的有多少人?10000*0.3413=3413人
T分數在40-60分的有多少人(常態分配左右對稱)3413*2=6826人
T分數剛好50分的有10000*0.3989=3989人
◎Z分數=4.0的機率 →0.0001
分辨差異性時要算出發生的機率是多少
2010年8月3日 星期二
訂閱:
文章 (Atom)