在 Excel 中計算相關性:您的操作指南
已發表: 2022-07-13Microsoft Excel 讓您不僅可以創建電子表格,還可以使用該軟件計算關鍵函數,例如兩個變量之間的關係。 該指標稱為相關係數,可用於衡量一項操作對另一項操作的影響,從而為業務操作提供信息。
對自己的 Excel 技能沒有信心? 沒問題。 這是在 Excel 中計算和理解相關係數的方法。
什麼是相關性?
相關性衡量兩個變量之間的關係。 相關係數為 0 意味著變量之間沒有影響——一個變量的增加或減少對另一個變量沒有一致的影響。
+1 的相關係數表示“完全正相關”,這意味著隨著變量 X 的增加,變量 Y 以相同的速率增加。 同時,相關值 -1 是“完全負相關”,這意味著隨著變量 X 的增加,變量 Y 以相同的速率減少。 相關性分析還可能返回介於 -1 和 +1 之間的任何結果,這表明變量以相似但不相同的速率變化。
相關值可以幫助企業評估特定操作對其他操作的影響。 例如,公司可能會發現,隨著社交媒體營銷支出的增加,客戶參與度也會增加,這表明增加支出可能是有意義的。
或者他們可能會發現特定的廣告活動會導致客戶參與度的相關下降,進而表明需要重新評估當前的努力。 變量不相關的發現也很有價值。 雖然常識可能表明您的產品中的新功能或特性會增加參與度,但它可能沒有可衡量的影響。 相關性分析允許公司查看這種關係(或缺乏這種關係)並做出合理的戰略決策。
如何在 Excel 中計算相關係數
- 打開 Excel。
- 安裝分析工具包。
- 從頂部欄菜單中選擇“數據”。
- 選擇右上角的“數據分析”。
- 選擇相關性。
- 定義您的數據范圍和輸出。
- 評估你的相關係數。
那麼如何在Excel中計算校正係數呢? 簡單的! 按著這些次序:
1. 打開 Excel。
第一步:打開 Excel 並為相關變量數據創建一個新工作表。 在 A 列中輸入第一個變量的數據點,在 B 列中輸入第二個變量的數據點。您還可以在 C、D、E 列等中添加其他變量——Excel 將為每個變量提供一個相關係數。
在下面的示例中,我們在 A 列中輸入了六行數據,在 B 列中輸入了六行數據。
2. 安裝分析工具包。
下一個? 如果沒有,請安裝 Excel 分析工具包。
選擇“文件”,然後選擇“選項”,您將看到以下屏幕:
選擇“加載項”,然後單擊“開始”。
現在,選中“分析工具包”框,然後單擊“確定”。
3. 從頂部欄菜單中選擇“數據”。
安裝 ToolPak 後,從頂部 Excel 欄菜單中選擇“數據”。 這為您提供了一個子菜單,其中包含針對您的數據的各種分析選項。
4. 選擇右上角的“數據分析”。
現在,在右上角查找“數據分析”並單擊它以獲取此屏幕:
5. 選擇相關。
從菜單中選擇相關性,然後單擊“確定”。
6. 定義您的數據范圍和輸出。
現在定義您的數據范圍和輸出。 您只需左鍵單擊並將光標拖過要選擇的數據,它就會自動填充到“相關性”框中。 最後,為您的相關數據選擇一個輸出範圍——我們選擇了 A8。 然後,單擊“確定”。

7. 評估你的相關係數。
現在將顯示您的關聯結果。 在我們的示例中,第 1 列和第 2 列中的值具有完美的負相關; 當一個上升時,另一個以相同的速度下降。
Excel 相關矩陣
Excel 相關結果也稱為 Excel 相關矩陣。 在上面的例子中,我們的兩列數據產生了一個完美的校正矩陣 1 和 -1。 但是,如果我們用不太理想的數據集生成相關矩陣會發生什麼?
這是我們的數據:
這是矩陣:
矩陣中的單元格 C4 為我們提供了第 3 列和第 2 列之間的相關性,這是一個非常弱的 0.01025,而第 1 列和第 3 列產生了更強的負相關性 -0.17851。 然而,迄今為止最強的相關性是在第 1 列和第 2 列之間,為 -0.66891。
那麼這在實踐中意味著什麼? 假設我們正在研究特定行為對社交媒體活動效果的影響,其中第 1 列代表點擊社交廣告的訪問者數量,第 2 列和第 3 列代表兩種不同的營銷標語。 相關矩陣顯示第 1 列和第 2 列之間存在很強的負相關,這表明第 2 列版本的標語顯著降低了整體用戶參與度,而第 3 列僅略有下降。
定期創建 Excel 矩陣可以幫助公司更好地了解一個變量對另一個變量的影響,並確定可能存在哪些(如果有的話)負面或正面影響。
Excel 相關公式
如果您更喜歡自己輸入相關公式,這也是一種選擇。 這是它的樣子:
X 和 Y 是您的測量值,∑ 是總和,帶有橫條的 X 和 Y 表示測量值的平均值。 您將按如下方式計算:
- 計算變量 X 的總和減去 X 的平均值。
- 計算變量 Y 的總和減去 Y 的平均值。
- 將這兩個結果相乘並將該數字放在一邊(這是第一個結果)。
- 將 X 的總和減去 X 的平均值平方。將 Y 的總和減去 Y 的平均值平方。將這兩個數字相乘。
- 取平方根(這是第二個結果)。
- 將第一個結果除以第二個結果。
- 你得到相關係數。
容易,對吧? 是和不是。 雖然插入數字並不復雜,但創建和管理這個公式通常比它的價值更麻煩。 內置的 Excel Toolpak 通常是一種更簡單(更快)的方法來查明係數和發現關鍵關係。
相關≠非因果
沒有提到相關性不等於因果關係的文章是不完整的。 換句話說,僅僅因為兩個變量一起上升或下降並不意味著一個變量是另一個變量上升或下降的原因。
考慮幾個非常奇怪的例子。
這張圖片顯示了海盜數量與全球平均氣溫之間近乎完美的負相關——隨著海盜變得越來越稀缺,平均氣溫升高。
問題? 雖然這兩個變量是相關的,但兩者之間沒有因果關係; 更高的溫度並沒有減少海盜人口,更少的海盜也沒有導致全球變暖。
雖然相關性是一個強大的工具,但它只指示兩個變量之間增加或減少的方向,而不是增加或減少的原因。 為了發現因果關係,公司必須增加或減少一個變量並觀察其影響。 例如,如果相關性表明客戶參與度隨著社交媒體支出的增加而上升,則值得選擇支出略有增加,然後對結果進行衡量。 如果更多的支出直接導致參與度增加,那麼這種聯繫既是相關的,也是因果的。 如果不是,可能有一個(或多個)因素支持這兩個變量的增加。
跟上相關性
Excel 相關性為營銷、銷售和支出策略開發提供了堅實的起點,但它們並不能說明全部情況。 因此,值得使用 Excel 的內置數據分析選項來快速評估兩個變量之間的相關性,並將此數據用作更深入分析的起點。