6장.다양한 가설검정
6.1 다양한 가설검정 가설검정 방법 구분해 사용하기 🔖가설검정 해석의 흐름 귀무가설이나 검정통계량 -> 방법에 따라 달라짐 필요한 검정통계량 -> 데이터 유형이나 성질에 따라 다름 ❗가설검정 방법을 선택할 때는 데이터 유형, 표본의 수, 양적 변수 분포의 성질을 먼저 확인하자! 🔖데이터 유형 2가지 변수 사이...
6.1 다양한 가설검정 가설검정 방법 구분해 사용하기 🔖가설검정 해석의 흐름 귀무가설이나 검정통계량 -> 방법에 따라 달라짐 필요한 검정통계량 -> 데이터 유형이나 성질에 따라 다름 ❗가설검정 방법을 선택할 때는 데이터 유형, 표본의 수, 양적 변수 분포의 성질을 먼저 확인하자! 🔖데이터 유형 2가지 변수 사이...
🔖고객의 소리 💬제품의 부품을 보관하는 창고에서 생산 공장까지 운송 비용을 낮출 수 있을지 검토하고 싶다. 🔖전제 조건 창고 -> 생산 공장으로 부품 전달 운송 비용: 과거 데이터에서 정량적으로 계산되어 있음 집계 기간: 20190101 ~ 20191231 051.물류 데이터를 불러오자 데이터 불러오기 생산 공장 데이터...
🔖전제조건 여기서는 use_log_months.cv와 customer_join.csv 041.데이터를 읽어 들이고 이용 데이터를 수정하자 import pandas as pd customer = pd.read_csv("customer_join.csv") uselog_months = pd.read_csv("use_log_months.csv") ...
5.1 가설검정의 원리 또 하나의 추론통계 방법 가설검정: 분석자가 세운 가설을 검증하기 위한 방법. p값이라는 수치를 계산하여 가설을 지지하는지 여부를 판단합니다. 🔖가설 검증하기 확증적 자료분석: 미리 세운 가설을 검증하는 접근법 탐색적 자료분석: 전체 데이터를 탐색적으로 해석하는 접근법...
4.1 추론통계를 배우기 전에 전수조사와 표본조사 모집단을 알아보는 방법 🔖전수조사 모집단의 모든 요소 조사 🔖표본조사 모집단의 일부인 표본으로 모집단의 성질을 추정 데이터를 얻는다는 것 모집단 분포: 모집단을 나타내는 분포 모집단 분포가 양적 변수의 분포라면 평균이나 분산을 정의할 수 있는데, 이...
🔖전제 조건 use_log.csv와 customer_join.csv만 사용합니다. 031.데이터를 읽어 들이고 확인하자 데이터 불러오기 import pandas as pd customer = pd.read_csv('customer_join.csv') customer.isnull().sum() import pandas as pd usel...
🔖전제 조건 스포츠 센터 종일 회원: 언제든 이용 가능 주간 회원: 낮에만 이용 가능 야간 회원: 밤에만 이용 가능 정책 입회비가 들지만, 비정기적으로 입회비 반액 할인이나 입회비 무료 행사를 해서 신규회원을 늘리고 있다. 탈퇴하려면 월말까지 신청하면 그 다...
이용할 데이터 정보 011.데이터를 읽어 들이자 import pandas as pd uriage_data = pd.read_csv("uriage.csv") # uriage: 매출 이력 uriage_data.head() kokyaku_data = pd.read_excel("kokyaku_daicho.xlsx") # kokyaku: 고객 정보 k...
이용할 데이터 정보 001. 데이터를 읽어 들이자 import pandas as pd # 라이브러리 판다스 임포트 customer_master = pd.read_csv('customer_master.csv') customer_master.head() # 5행 출력 item_master = pd.read_csv('item_master.csv...
6-1 군집 알고리즘 타깃을 모르는 비지도 학습 비지도 학습: 타깃이 없을 때 사용하는 머신러닝 알고리즘. 과일 사진 데이터 준비하기 사과(100개), 바나나(100개), 파인애플(100개)을 담고 있는 흑백 사진 넘파이 배열의 기본 저장 포맷인 npy 파일로 저장되어 있음. !wget https://bit.ly/fruits...