type
status
date
slug
summary
tags
category
icon
password
文章来源:
🤔 一个简单的开头
相关系数:用于衡量两个变量之间的相关性的大小
📝主旨内容
皮尔逊pearson相关系数
1、原理
(1)总体皮尔逊相关系数
(2)样本皮尔逊相关系数
2、相关性的可视化:散点图
3、理解误区
(1)非线性相关也会导致线性相关系数很大,例如图2。
(2)离群点对相关系数的影响很大,例如图3,去掉离群点后,相关系数为0.98。
(3)如果两个变量的相关系数很大也不能说明两者相关,例如图4,可能是受到
了异常值的影响。
(4)相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关
关系(非线性相关),例如图5
4、总结
(1)非线性相关也会导致线性相关系数很大,例如图2。
(2)离群点对相关系数的影响很大,例如图3,去掉离群点后,相关系数为0.98。
(3)如果两个变量的相关系数很大也不能说明两者相关,例如图4,可能是受到
了异常值的影响。
(4)相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关
关系(非线性相关),例如图5
5、相关性大小分析
6、皮尔逊相关系数的使用条件:独立,差距不太大,符合正态分布
7、正态性检验方法
(1)大样本(n>30):雅克‐贝拉检验(Jarque‐Bera test)
(2)小样本(5≤n≤50):Shapiro‐wilk夏皮洛‐威尔克检验
(3)Q-Q图
8、相关性分析步骤:
(1)正态性检验(不满足正态性则用spearman相关性分析)
(2)绘制矩阵散点图(不满足线性关系则用spearman相关性分析)
(3)计算皮尔逊相关系数
(4)相关系数表的美化
(5)假设检验:t检验,p值判断法
二、斯皮尔曼spearman等级相关系数
1、原理
(1)第一种
(2)第二种
2、代码
3、假设检验
(1)小样本情况,即𝒏≤30时,直接查临界值表即可
(2)大样本情况
三、两种相关系数的选择
🤗总结归纳
致谢:
欢迎您在底部评论区留言,一起交流~
- 作者:昕昕丶未来不是梦
- 链接:https://pisce.buzz/article/jianmo00501
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。