10.데이터 탐색과 시각화
10. 데이터 탐색과 시각화
- 데이터 탐색부터 모델링 단계 구조 예시
- EDA와 데이터 시각화는 구별해서 생각!
- EDA 단계에서 데이터 파악을 좀 더 효율적으로 하기 위해 시각화를 함.
- 데이터 시각화(시간시각화, 비교 시각화, 분포 시각화, 관계 시각화, 공간 시각화)의 궁극적 목적은 커뮤니케이션
- EDA 단계에서 데이터 파악을 좀 더 효율적으로 하기 위해 시각화를 함.
- EDA와 데이터 시각화는 구별해서 생각!
10-1. 탐색적 데이터 분석
- EDA: 가공하지 않은 원천의 데이터를 있는 그대로 탐색하고 분석하는 기법을 뜻한다.
- EDA를 하는 주요 목적
- 데이터 형태와 척도가 분석에 알맞게 되어있는지 확인
- 데이터의 평균, 분산, 분포, 패턴 등의 확인을 통해 데이터 특성 파악
- 데이터의 결측값이나 이상치 파악 및 보완
- 변수 간의 관계성 파악
- 분석 목적과 방향성 점검 및 보정
- 데이터 형태와 척도가 분석에 알맞게 되어있는지 확인
10-1-1. 엑셀을 활용한 EDA
1
2
3
console.log('소스코드는?')
This post is licensed under CC BY 4.0 by the author.