Spearman 的等級相關(guān)性
?
相關(guān)性度量兩個變量之間的關(guān)聯(lián)強(qiáng)度。例如,如果我們有興趣了解父子的身高之間是否存在關(guān)系,則可以計算相關(guān)系數(shù)來回答這個問題。要了解有關(guān)關(guān)聯(lián)的更多信息,請參閱此處。
相關(guān)性分析的方法:相關(guān)性主要有兩種類型:
- 參數(shù)相關(guān):靜態(tài) Pearson 相關(guān) (r):它測量兩個變量(x 和 y)之間的線性依賴性,被稱為參數(shù)相關(guān)檢驗,因為它取決于數(shù)據(jù)的分布。它用于數(shù)值數(shù)據(jù)。
非參數(shù)相關(guān) – Kendall(tau) 和 Spearman(rho):它們是基于秩的相關(guān)系數(shù),稱為非參數(shù)相關(guān)。它用于分類數(shù)據(jù)。
?
什么是 Spearman 相關(guān)性
Spearman 秩相關(guān)是兩個連續(xù)變量之間單調(diào)關(guān)系的強(qiáng)度和方向的統(tǒng)計度量。因此,這些屬性將按其首選項的順序進(jìn)行排名或放置。它用符號 “rho” (ρ) 表示,值可以在 -1 到 +1 之間。正值 rho 表示兩個變量之間存在正關(guān)系,而負(fù)值 rho 表示負(fù)關(guān)系。rho 值為 0 表示兩個變量之間沒有關(guān)聯(lián)。
Spearman 相關(guān)公式
哪里
ρρ = Spearman 相關(guān)系數(shù)
rank = 變量值相對于數(shù)據(jù)集中其他值的位置或順序
d我= 為每個數(shù)據(jù)項的兩個變量值分配的排名差異
n = 觀測總數(shù)
逐步計算 Spearman 的秩相關(guān)性
將原始數(shù)據(jù)轉(zhuǎn)換為排名:
創(chuàng)建排名涉及為數(shù)據(jù)集中的值分配數(shù)字順序,其中最小值的排名為 1,第二個最小值的排名為 2,依此類推。
數(shù)據(jù):
| 數(shù) |
X1 |
Y1 |
|---|---|---|
| 1 |
7 |
5 |
| 2 |
6 |
4 |
| 3 |
4 |
5 |
| 4 |
5 |
6 |
| 5 |
8 |
10 |
| 6 |
7 |
7 |
| 7 |
10 |
9 |
| 8 |
3 |
2 |
| 9 |
9 |
8 |
| 10 |
2 |
1 |
為 X 創(chuàng)建排名1:
- 對 X 的值進(jìn)行排序1按升序排列: .
2, 3, 4, 5, 6, 7, 7, 8, 9, 10 - 根據(jù)排序順序分配排名: .由于有兩個綁定值 (6 和 7),因此會分配它們的平均排名 (6.5)。
1, 2, 3, 4, 5,6.5, 6.5, 8, 9, 10
注意:如果數(shù)字相同,則考慮其等級的平均值。
對 Y 執(zhí)行相同的作1我們得到:
| 數(shù) |
等級 X1 |
等級 Y1 |
|---|---|---|
| 1 |
6.5 |
4.5 |
| 2 |
5 |
3 |
| 3 |
3 |
4.5 |
| 4 |
4 |
6 |
| 5 |
8 |
10 |
| 6 |
6.5 |
7 |
| 7 |
10 |
9 |
| 8 |
2 |
2 |
| 9 |
9 |
8 |
| 10 |
1 |
1 |
斯皮爾曼相關(guān)性 :
在 Spearman 的秩相關(guān)中,該過程涉及將原始數(shù)據(jù)轉(zhuǎn)換為秩。這樣做是為了評估兩個變量之間的單調(diào)關(guān)系,而不依賴于數(shù)據(jù)點的特定數(shù)值。
讓我們考慮在變量 X 中取 10 個不同的數(shù)據(jù)點1和 Y1.然后按照以下步驟作:
- 按升序排列值,從最小到最大。
- 根據(jù)每個值在排序順序中的位置為每個值分配排名。最小值的秩為 1,次小值的秩為 2,依此類推。
- 然后找出每個數(shù)據(jù)項的兩個變量值所給定的排名差異的平方。
| 數(shù) | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|---|---|---|---|---|
| X1 | 7 | 6 | 4 | 5 | 8 | 7 | 10 | 3 | 9 | 2 |
| Y1 | 5 | 4 | 5 | 6 | 10 | 7 | 9 | 2 | 8 | 1 |
| 等級 X1 | 6.5 | 5 | 3 | 4 | 8 | 6.5 | 10 | 2 | 9 | 1 |
| 等級 Y1 | 4.5 | 3 | 4.5 | 6 | 10 | 7 | 9 | 2 | 8 | 1 |
| d2 | 4 | 4 | 2.25 | 4 | 4 | 0.25 | 1 | 0 | 1 | 0 |
計算 d2
獲得排名后,您可以計算排名的差異。因此,在這種情況下,第一個數(shù)據(jù)點的排名差為 2,我們將其平方,同樣,我們?nèi)?X 之間排名中第二個數(shù)據(jù)點的差值我和 Y我它是 2,將其平方,我們得到 4。所以,像這樣,我們在排名中產(chǎn)生差異,通過平方,我們得到最終的 d 平方值。我們將所有值相加,然后在上述公式中使用該值計算 Spearman 系數(shù)。
通過將 d 的值2和 n 值
Spearman 相關(guān)性的性質(zhì)
- rs采用介于 -1(負(fù)關(guān)聯(lián))和 1(正關(guān)聯(lián))之間的值。
- rs= 0 表示無關(guān)聯(lián)。
- 當(dāng)關(guān)聯(lián)不是線性的時,可以使用它。
- 它可以應(yīng)用于序數(shù)變量。
單調(diào)和非單調(diào)關(guān)系
單調(diào)關(guān)系是兩個變量之間的數(shù)學(xué)關(guān)系,其中關(guān)系的方向(增加或減少)保持一致。
非單調(diào)關(guān)系是兩個變量之間的數(shù)學(xué)關(guān)系,其中關(guān)系的方向不是始終增加或減少。
Anscombe 數(shù)據(jù)的 Spearman 相關(guān)性
Anscombe 數(shù)據(jù)也稱為 Anscombe 四重奏,由四個數(shù)據(jù)集組成,這些數(shù)據(jù)集具有幾乎相同的簡單統(tǒng)計屬性,但在繪制時看起來卻大不相同。每個數(shù)據(jù)集由 11 (x, y) 點組成。它們由統(tǒng)計學(xué)家 Francis Anscombe 于 1973 年構(gòu)建,用于證明在分析數(shù)據(jù)之前繪制數(shù)據(jù)的重要性以及異常值對統(tǒng)計屬性的影響。這里給出了這 4 組 11 個數(shù)據(jù)點。請在此處下載 CSV 文件 當(dāng)我們繪制這些點時,它看起來像這樣。我在這里考慮 3 組 11 個數(shù)據(jù)點。
用于繪制數(shù)據(jù)的 Python 代碼
- Python3 語言
?
以下內(nèi)容為付費內(nèi)容,請購買后觀看
工程師必備
- 項目客服
- 培訓(xùn)客服
- 平臺客服
TOP






















