Lazy loaded image
学习笔记
🗒️【数学建模】5、相关分析
字数 877阅读时长 3 分钟
2023-8-26
2023-9-3
type
status
date
slug
summary
tags
category
icon
password
文章来源:
 

🤔 一个简单的开头

相关系数:用于衡量两个变量之间的相关性的大小

📝主旨内容

皮尔逊pearson相关系数

1、原理

(1)总体皮尔逊相关系数
notion image
(2)样本皮尔逊相关系数
notion image

2、相关性的可视化:散点图

3、理解误区

notion image
notion image
(1)非线性相关也会导致线性相关系数很大,例如图2。 (2)离群点对相关系数的影响很大,例如图3,去掉离群点后,相关系数为0.98。 (3)如果两个变量的相关系数很大也不能说明两者相关,例如图4,可能是受到 了异常值的影响。 (4)相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关 关系(非线性相关),例如图5

4、总结

(1)非线性相关也会导致线性相关系数很大,例如图2。 (2)离群点对相关系数的影响很大,例如图3,去掉离群点后,相关系数为0.98。 (3)如果两个变量的相关系数很大也不能说明两者相关,例如图4,可能是受到 了异常值的影响。 (4)相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关 关系(非线性相关),例如图5

5、相关性大小分析

notion image

6、皮尔逊相关系数的使用条件:独立,差距不太大,符合正态分布

7、正态性检验方法

(1)大样本(n>30):雅克‐贝拉检验(Jarque‐Bera test)
(2)小样本(5≤n≤50):Shapiro‐wilk夏皮洛‐威尔克检验
(3)Q-Q图

8、相关性分析步骤:

(1)正态性检验(不满足正态性则用spearman相关性分析)
(2)绘制矩阵散点图(不满足线性关系则用spearman相关性分析)
(3)计算皮尔逊相关系数
(4)相关系数表的美化
notion image
(5)假设检验:t检验,p值判断法

二、斯皮尔曼spearman等级相关系数

1、原理

(1)第一种
notion image
notion image
(2)第二种
notion image

2、代码

3、假设检验

(1)小样本情况,即𝒏≤30时,直接查临界值表即可
(2)大样本情况
notion image

三、两种相关系数的选择

notion image

🤗总结归纳

 
致谢:
💡
欢迎您在底部评论区留言,一起交流~
 
 
上一篇
【数学建模】8、图论最短路径求解:迪杰斯特拉算法和贝尔曼福特算法
下一篇
java基础day01【环境变量,HelloWorld】

评论
Loading...