在 Excel 中计算相关性:您的操作指南
已发表: 2022-07-13Microsoft Excel 让您不仅可以创建电子表格,还可以使用该软件计算关键函数,例如两个变量之间的关系。 该指标称为相关系数,可用于衡量一项操作对另一项操作的影响,从而为业务操作提供信息。
对自己的 Excel 技能没有信心? 没问题。 这是在 Excel 中计算和理解相关系数的方法。
什么是相关性?
相关性衡量两个变量之间的关系。 相关系数为 0 意味着变量之间没有影响——一个变量的增加或减少对另一个变量没有一致的影响。
+1 的相关系数表示“完全正相关”,这意味着随着变量 X 的增加,变量 Y 以相同的速率增加。 同时,相关值 -1 是“完全负相关”,这意味着随着变量 X 的增加,变量 Y 以相同的速率减少。 相关性分析还可能返回介于 -1 和 +1 之间的任何结果,这表明变量以相似但不相同的速率变化。
相关值可以帮助企业评估特定操作对其他操作的影响。 例如,公司可能会发现,随着社交媒体营销支出的增加,客户参与度也会增加,这表明增加支出可能是有意义的。
或者他们可能会发现特定的广告活动会导致客户参与度的相关下降,进而表明需要重新评估当前的努力。 变量不相关的发现也很有价值。 虽然常识可能表明您的产品中的新功能或特性会增加参与度,但它可能没有可衡量的影响。 相关性分析允许公司查看这种关系(或缺乏这种关系)并做出合理的战略决策。
如何在 Excel 中计算相关系数
- 打开 Excel。
- 安装分析工具包。
- 从顶部栏菜单中选择“数据”。
- 选择右上角的“数据分析”。
- 选择相关性。
- 定义您的数据范围和输出。
- 评估你的相关系数。
那么如何在Excel中计算校正系数呢? 简单的! 按着这些次序:
1. 打开 Excel。
第一步:打开 Excel 并为相关变量数据创建一个新工作表。 在 A 列中输入第一个变量的数据点,在 B 列中输入第二个变量的数据点。您还可以在 C、D、E 列等中添加其他变量——Excel 将为每个变量提供一个相关系数。
在下面的示例中,我们在 A 列中输入了六行数据,在 B 列中输入了六行数据。
2. 安装分析工具包。
下一个? 如果没有,请安装 Excel 分析工具包。
选择“文件”,然后选择“选项”,您将看到以下屏幕:
选择“加载项”,然后单击“开始”。
现在,选中“分析工具包”框,然后单击“确定”。
3. 从顶部栏菜单中选择“数据”。
安装 ToolPak 后,从顶部 Excel 栏菜单中选择“数据”。 这为您提供了一个子菜单,其中包含针对您的数据的各种分析选项。
4. 选择右上角的“数据分析”。
现在,在右上角查找“数据分析”并单击它以获取此屏幕:
5. 选择相关。
从菜单中选择相关性,然后单击“确定”。
6. 定义您的数据范围和输出。
现在定义您的数据范围和输出。 您只需左键单击并将光标拖过要选择的数据,它就会自动填充到“相关性”框中。 最后,为您的相关数据选择一个输出范围——我们选择了 A8。 然后,单击“确定”。
7. 评估你的相关系数。
现在将显示您的关联结果。 在我们的示例中,第 1 列和第 2 列中的值具有完美的负相关; 当一个上升时,另一个以相同的速度下降。
Excel 相关矩阵
Excel 相关结果也称为 Excel 相关矩阵。 在上面的例子中,我们的两列数据产生了一个完美的校正矩阵 1 和 -1。 但是,如果我们用不太理想的数据集生成相关矩阵会发生什么?
这是我们的数据:
这是矩阵:
矩阵中的单元格 C4 为我们提供了第 3 列和第 2 列之间的相关性,这是一个非常弱的 0.01025,而第 1 列和第 3 列产生了更强的负相关性 -0.17851。 然而,迄今为止最强的相关性是在第 1 列和第 2 列之间,为 -0.66891。
那么这在实践中意味着什么? 假设我们正在研究特定行为对社交媒体活动效果的影响,其中第 1 列代表点击社交广告的访问者数量,第 2 列和第 3 列代表两种不同的营销标语。 相关矩阵显示第 1 列和第 2 列之间存在很强的负相关,这表明第 2 列版本的标语显着降低了整体用户参与度,而第 3 列仅略有下降。
定期创建 Excel 矩阵可以帮助公司更好地了解一个变量对另一个变量的影响,并确定可能存在哪些(如果有的话)负面或正面影响。
Excel 相关公式
如果您更喜欢自己输入相关公式,这也是一种选择。 这是它的样子:
X 和 Y 是您的测量值,∑ 是总和,带有横条的 X 和 Y 表示测量值的平均值。 您将按如下方式计算:
- 计算变量 X 的总和减去 X 的平均值。
- 计算变量 Y 的总和减去 Y 的平均值。
- 将这两个结果相乘并将该数字放在一边(这是第一个结果)。
- 将 X 的总和减去 X 的平均值平方。将 Y 的总和减去 Y 的平均值平方。将这两个数字相乘。
- 取平方根(这是第二个结果)。
- 将第一个结果除以第二个结果。
- 你得到相关系数。
容易,对吧? 是和不是。 虽然插入数字并不复杂,但创建和管理这个公式通常比它的价值更麻烦。 内置的 Excel Toolpak 通常是一种更简单(更快)的方法来查明系数和发现关键关系。
相关≠非因果
没有提到相关性不等于因果关系的文章是不完整的。 换句话说,仅仅因为两个变量一起上升或下降并不意味着一个变量是另一个变量上升或下降的原因。
考虑几个非常奇怪的例子。
这张图片显示了海盗数量与全球平均气温之间近乎完美的负相关——随着海盗变得越来越稀缺,平均气温升高。
问题? 虽然这两个变量是相关的,但两者之间没有因果关系; 更高的温度并没有减少海盗人口,更少的海盗也没有导致全球变暖。
虽然相关性是一个强大的工具,但它只指示两个变量之间增加或减少的方向,而不是增加或减少的原因。 为了发现因果关系,公司必须增加或减少一个变量并观察其影响。 例如,如果相关性表明客户参与度随着社交媒体支出的增加而上升,则值得选择支出略有增加,然后对结果进行衡量。 如果更多的支出直接导致参与度增加,那么这种联系既是相关的,也是因果的。 如果不是,可能有一个(或多个)因素支持这两个变量的增加。
跟上相关性
Excel 相关性为营销、销售和支出策略开发提供了坚实的起点,但它们并不能说明全部情况。 因此,值得使用 Excel 的内置数据分析选项来快速评估两个变量之间的相关性,并将此数据用作更深入分析的起点。