type
status
date
slug
summary
tags
category
icon
password
文章来源:
 

🤔 一个简单的开头

相关系数:用于衡量两个变量之间的相关性的大小

📝主旨内容

皮尔逊pearson相关系数

1、原理

(1)总体皮尔逊相关系数
notion image
(2)样本皮尔逊相关系数
notion image

2、相关性的可视化:散点图

3、理解误区

notion image
notion image
(1)非线性相关也会导致线性相关系数很大,例如图2。 (2)离群点对相关系数的影响很大,例如图3,去掉离群点后,相关系数为0.98。 (3)如果两个变量的相关系数很大也不能说明两者相关,例如图4,可能是受到 了异常值的影响。 (4)相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关 关系(非线性相关),例如图5

4、总结

(1)非线性相关也会导致线性相关系数很大,例如图2。 (2)离群点对相关系数的影响很大,例如图3,去掉离群点后,相关系数为0.98。 (3)如果两个变量的相关系数很大也不能说明两者相关,例如图4,可能是受到 了异常值的影响。 (4)相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关 关系(非线性相关),例如图5

5、相关性大小分析

notion image

6、皮尔逊相关系数的使用条件:独立,差距不太大,符合正态分布

7、正态性检验方法

(1)大样本(n>30):雅克‐贝拉检验(Jarque‐Bera test)
(2)小样本(5≤n≤50):Shapiro‐wilk夏皮洛‐威尔克检验
(3)Q-Q图

8、相关性分析步骤:

(1)正态性检验(不满足正态性则用spearman相关性分析)
(2)绘制矩阵散点图(不满足线性关系则用spearman相关性分析)
(3)计算皮尔逊相关系数
(4)相关系数表的美化
notion image
(5)假设检验:t检验,p值判断法

二、斯皮尔曼spearman等级相关系数

1、原理

(1)第一种
notion image
notion image
(2)第二种
notion image

2、代码

3、假设检验

(1)小样本情况,即𝒏≤30时,直接查临界值表即可
(2)大样本情况
notion image

三、两种相关系数的选择

notion image

🤗总结归纳

 
致谢:
💡
欢迎您在底部评论区留言,一起交流~
 
 
2023数学建模国赛【数学建模】4、拟合算法
昕昕要努力生活
昕昕要努力生活
一个考研人
公告
type
status
date
slug
summary
tags
category
icon
password
🎉欢迎来到昕昕的世界🎉
-- 关于我 ---
姓名:彭蕊
昵称:嘉九、昕、Pisces、熙白
学校:河北经贸大学
专业:21级数据科学与大数据技术
-- 访问后端 ---
-- 近期内容 ---
教资
低代码
Java
R语言
大创
卷积神经网络
TensorFlow
算法基础课
Linux
微信小程序
蓝桥杯
数学建模
联系我们