10장.인과와 상관
10장.인과와 상관
10.1 인과와 상관
인과관계 밝히기
- 인과 그래프: 원인과 결과를 원과 화살표로 나타낸 것.
인과관계와 상관관계
- 인과관계: 원인과 결과의 관계
- 상관관계: 관련성. 어떤 특정한 조합이 일어나기 쉬움. 확률변수 사이가 독립이 아니라는 의미.
🔖인과와 상관의 차이
- 관찰연구: 실섬 없이 현재 상태 관찰
- 무작위 통제 실험: 여타 요인의 영향을 제거할 수 있어 인과관계 간파 가능
- 중첩: 두 변수에 관련된 외부 변수가 존재할 때
- 중첩요인: 외부 변수
🔖인과-상관-허위상관
- 허위상관: 인과관계는 없지만 상관관계는 있을 때
🔖인과관계를 알면 할 수 있는 일
- 개입: 원인 변수를 변화시킴으로써 결과 변수를 바꿀 수 있음
🔖상관관계를 알면 할 수 있는 일
- 예측: 상관관계는 2개 변수 X, Y 사이의 관련성이므로, 한쪽 변수로부터 또 다른 변수를 예측할 수 있다.
인과관계와 상관관계의 다양한 사례
🔖허위상관의 예
🔖시간은 중첩요인이 되기 쉬움
🔖초콜릿 소비량과 노벨상 수상자 수
🔖우연히 생긴 상관
- 수많은 변수를 마구잡이로 해석하면 통계적으로 유의미한 결과를 얻을 수도 있음
10.2 무작위 통제 실험
인과관계를 밝히려면
무작위 통제 실험
- 무작위 통제 실험: 알고자 하는 요인인 변수 X에 표본을 무작위로 할당하고 개입 실험을 수행한 다음, 변수 Y와 비교하는 방법
- 중첩요인을 확인하지 않더라도, 그 효과를 무작위를 이용하여 무효화 할 수 있음.
🔖통계학에서의 인과관계
- 인과 추론의 근본 문제: A라는 경우와 반대되는 B라는 경우 양쪽을 관찰할 수는 없음
🔖무작위 통제 실험의 이론적 배경
- 개인 수준이 아닌 집단 수준을 생각하여, 인과의 평균적인 효과를 고려하게 됨
- 실제 관찰
🔖선택편향
- 선택편향: 관측 가능한 a는 원래 알고자 하는 효과 a에 편향이 더해진 값
10.3 통계적 인과 추론
인과효과를 추정하는 또 다른 방법
- 다중 회귀
- 층별 해석
This post is licensed under CC BY 4.0 by the author.