Post

10.데이터 탐색과 시각화

10. 데이터 탐색과 시각화

  • 데이터 탐색부터 모델링 단계 구조 예시
    alt text
    • EDA와 데이터 시각화는 구별해서 생각!
      • EDA 단계에서 데이터 파악을 좀 더 효율적으로 하기 위해 시각화를 함.
      • 데이터 시각화(시간시각화, 비교 시각화, 분포 시각화, 관계 시각화, 공간 시각화)의 궁극적 목적은 커뮤니케이션

10-1. 탐색적 데이터 분석

  • EDA: 가공하지 않은 원천의 데이터를 있는 그대로 탐색하고 분석하는 기법을 뜻한다.
  • EDA를 하는 주요 목적
    1. 데이터 형태와 척도가 분석에 알맞게 되어있는지 확인
    2. 데이터의 평균, 분산, 분포, 패턴 등의 확인을 통해 데이터 특성 파악
    3. 데이터의 결측값이나 이상치 파악 및 보완
    4. 변수 간의 관계성 파악
    5. 분석 목적과 방향성 점검 및 보정

10-1-1. 엑셀을 활용한 EDA

1
2
3
    console.log('소스코드는?')
    
This post is licensed under CC BY 4.0 by the author.

Trending Tags