Spearman 的等級相關(guān)性

?

相關(guān)性度量兩個變量之間的關(guān)聯(lián)強(qiáng)度。例如,如果我們有興趣了解父子的身高之間是否存在關(guān)系,則可以計算相關(guān)系數(shù)來回答這個問題。要了解有關(guān)關(guān)聯(lián)的更多信息,請參閱此處。 

相關(guān)性分析的方法:相關(guān)性主要有兩種類型:

  • 參數(shù)相關(guān):靜態(tài) Pearson 相關(guān) (r):它測量兩個變量(x 和 y)之間的線性依賴性,被稱為參數(shù)相關(guān)檢驗,因為它取決于數(shù)據(jù)的分布。它用于數(shù)值數(shù)據(jù)。
    非參數(shù)相關(guān) – Kendall(tau) 和 Spearman(rho):它們是基于秩的相關(guān)系數(shù),稱為非參數(shù)相關(guān)。它用于分類數(shù)據(jù)。
    ?

什么是 Spearman 相關(guān)性

Spearman 秩相關(guān)是兩個連續(xù)變量之間單調(diào)關(guān)系的強(qiáng)度和方向的統(tǒng)計度量。因此,這些屬性將按其首選項的順序進(jìn)行排名或放置。它用符號 “rho” (ρ) 表示,值可以在 -1 到 +1 之間。正值 rho 表示兩個變量之間存在正關(guān)系,而負(fù)值 rho 表示負(fù)關(guān)系。rho 值為 0 表示兩個變量之間沒有關(guān)聯(lián)。

Spearman 相關(guān)公式

?編輯

哪里

ρρ = Spearman 相關(guān)系數(shù)

rank = 變量值相對于數(shù)據(jù)集中其他值的位置或順序

d= 為每個數(shù)據(jù)項的兩個變量值分配的排名差異

n = 觀測總數(shù)

逐步計算 Spearman 的秩相關(guān)性

將原始數(shù)據(jù)轉(zhuǎn)換為排名:

創(chuàng)建排名涉及為數(shù)據(jù)集中的值分配數(shù)字順序,其中最小值的排名為 1,第二個最小值的排名為 2,依此類推。

數(shù)據(jù):

數(shù)

X1

Y1

1

7

5

2

6

4

3

4

5

4

5

6

5

8

10

6

7

7

7

10

9

8

3

2

9

9

8

10

2

1

為 X 創(chuàng)建排名1:

  1. 對 X 的值進(jìn)行排序1按升序排列: .2, 3, 4, 5, 6, 7, 7, 8, 9, 10
  2. 根據(jù)排序順序分配排名: .由于有兩個綁定值 (6 和 7),因此會分配它們的平均排名 (6.5)。1, 2, 3, 4, 5,6.5, 6.5, 8, 9, 10

注意:如果數(shù)字相同,則考慮其等級的平均值。

對 Y 執(zhí)行相同的作1我們得到:

數(shù)

等級 X1

等級 Y1

1

6.5

4.5

2

5

3

3

3

4.5

4

4

6

5

8

10

6

6.5

7

7

10

9

8

2

2

9

9

8

10

1

1

斯皮爾曼相關(guān)性 :

在 Spearman 的秩相關(guān)中,該過程涉及將原始數(shù)據(jù)轉(zhuǎn)換為秩。這樣做是為了評估兩個變量之間的單調(diào)關(guān)系,而不依賴于數(shù)據(jù)點的特定數(shù)值。

讓我們考慮在變量 X 中取 10 個不同的數(shù)據(jù)點1和 Y1.然后按照以下步驟作:

  • 按升序排列值,從最小到最大。
  • 根據(jù)每個值在排序順序中的位置為每個值分配排名。最小值的秩為 1,次小值的秩為 2,依此類推。
  • 然后找出每個數(shù)據(jù)項的兩個變量值所給定的排名差異的平方。
數(shù) 1 2 3 4 5 6 7 8 9 10
X1 7 6 4 5 8 7 10 3 9 2
Y1 5 4 5 6 10 7 9 2 8 1
等級 X1 6.5 5 3 4 8 6.5 10 2 9 1
等級 Y1 4.5 3 4.5 6 10 7 9 2 8 1
d2 4 4 2.25 4 4 0.25 1 0 1 0

計算 d2

獲得排名后,您可以計算排名的差異。因此,在這種情況下,第一個數(shù)據(jù)點的排名差為 2,我們將其平方,同樣,我們?nèi)?X 之間排名中第二個數(shù)據(jù)點的差值我和 Y我它是 2,將其平方,我們得到 4。所以,像這樣,我們在排名中產(chǎn)生差異,通過平方,我們得到最終的 d 平方值。我們將所有值相加,然后在上述公式中使用該值計算 Spearman 系數(shù)。

通過將 d 的值2和 n 值

Spearman 的等級相關(guān)性的圖4?編輯

Spearman 相關(guān)性的性質(zhì)

  • rs采用介于 -1(負(fù)關(guān)聯(lián))和 1(正關(guān)聯(lián))之間的值。
  • rs= 0 表示無關(guān)聯(lián)。
  • 當(dāng)關(guān)聯(lián)不是線性的時,可以使用它。
  • 它可以應(yīng)用于序數(shù)變量。

單調(diào)和非單調(diào)關(guān)系

單調(diào)關(guān)系是兩個變量之間的數(shù)學(xué)關(guān)系,其中關(guān)系的方向(增加或減少)保持一致。

非單調(diào)關(guān)系是兩個變量之間的數(shù)學(xué)關(guān)系,其中關(guān)系的方向不是始終增加或減少。

文件?

Spearman 的等級相關(guān)性的圖6 編輯

Anscombe 數(shù)據(jù)的 Spearman 相關(guān)性

Anscombe 數(shù)據(jù)也稱為 Anscombe 四重奏,由四個數(shù)據(jù)集組成,這些數(shù)據(jù)集具有幾乎相同的簡單統(tǒng)計屬性,但在繪制時看起來卻大不相同。每個數(shù)據(jù)集由 11 (x, y) 點組成。它們由統(tǒng)計學(xué)家 Francis Anscombe 于 1973 年構(gòu)建,用于證明在分析數(shù)據(jù)之前繪制數(shù)據(jù)的重要性以及異常值對統(tǒng)計屬性的影響。這里給出了這 4 組 11 個數(shù)據(jù)點。請在此處下載 CSV 文件 當(dāng)我們繪制這些點時,它看起來像這樣。我在這里考慮 3 組 11 個數(shù)據(jù)點。

用于繪制數(shù)據(jù)的 Python 代碼 

  • Python3 語言
 

?

以下內(nèi)容為付費內(nèi)容,請購買后觀看

App下載
技術(shù)鄰APP
工程師必備
  • 項目客服
  • 培訓(xùn)客服
  • 平臺客服

TOP

1