4장. 모델 훈련
🔖선형 회귀를 학습시키는 두 가지 방안 닫힌 형태의 방정식을 사용하여 훈련 세트에 가장 잘 맞는 모델 파라미터(즉, 훈련 세트에 대해 비용 함수를 최소화하는 모델 파라미터)를 직접 계산한다. 경사 하강법이라 불리는 반복적인 최적화 방식을 이용하여 모델 파라미터를 조금씩 바꾸면서 비용 함수를 훈련 세트에 대해 최소화시킨다. 결국에는 앞의 방법과...
🔖선형 회귀를 학습시키는 두 가지 방안 닫힌 형태의 방정식을 사용하여 훈련 세트에 가장 잘 맞는 모델 파라미터(즉, 훈련 세트에 대해 비용 함수를 최소화하는 모델 파라미터)를 직접 계산한다. 경사 하강법이라 불리는 반복적인 최적화 방식을 이용하여 모델 파라미터를 조금씩 바꾸면서 비용 함수를 훈련 세트에 대해 최소화시킨다. 결국에는 앞의 방법과...
Q01. 모험가 길드 ✔️문제 유형 그리디 ✔️문제 모험가 N명 모험가 길드에서 N명의 모험가를 대상으로 ‘공포도’ 측정, ‘공포도’가 높은 모험가는 쉽게 공포를 느껴 위험 상황에서 제대로 대처할 능력 떨어짐 모험가 그룹 구성 : 공포도가 X인 모험가는 반드시 X명 이상으로 구성한 모험가 그룹에...
1. 당장 좋은 것만 선택하는 그리디 그리디(탐욕): 현재 상황에서 지금 당장 좋은 것만 고르는 방법. 현재의 선택이 나중에 미칠 영향 고려 X 💡그리디 알고리즘 문제 특징 o 문제 출제의 폭이 매우 넓어 암기만으로 모든 문제 대처는 불가! ⭐어떤 문제를 만났을 때 단순히 현재 상황에서 가장 좋아 보...
복잡도 시간 복잡도 표기 빅오 표기법 가장 빠르게 증가하는 항만을 고려!! ⭐코딩 테스트에서는 최악의 경우에 대한 연산 횟수가 가장 중요!! ⭐ 상수를 고려해야하는 경우도 존재!! 빅오 표기법이 항상 절대적인 것은 아님! 시간 제한이 1초인 문제에 대한 예시(대략 10,000,000개에 ...
1. 자료형 수 자료형 정수형: 양의 정수, 음의 정수, 0 실수형: 소수점 아래의 데이터를 포함하는 자료형(소수부가 0이거나, 정수부가 0인 소수는 0 생략 가능) e를 통해 지수 표현 가능 -> e 다음에 오는 수는 10의 지수부 의미 컴퓨터는 2진수를 이용하고, 실수를 처리할 때 부동 소수점 방식을...
SGDClassifier 확률적 경사 하강법(Stochastic Gradient Decent:SGD)을 통해 SVM, logistic regression 등의 선형 분류기를 학습시킬 수 있는 분류기입니다. 결정 함수를 이용하여 점수 계산 -> 점수가 임곗값보다 크면 샘플을 양성 클랫에 할당. 🔖SGD??? Stochastic...
3.1 MNIST ⭐기본적으로 사이킷런은 내려받은 데이터셋을 사용자 홈 디렉터리 안의 scikit_learn_data 디렉터리에 캐싱한다. 🔖data 다운로드 from sklearn.datasets import fetch_openml # 사이킷런 1.2에서 추가된 parser 매개변수 기본값이 1.4 버전에서 'liac-arff'에서 'auto...
큰 그림 보기. 데이터 구하기 데이터로부터 인사이트를 얻기 위해 탐색하고 시각화하기. 머신러닝 알고리즘을 위해 데이터를 준비하기. 모델을 선택하고 훈련하기. 모델을 미세 튜닝하기. 솔루션 제시하기. 시스템을 론칭하고, 모니터링하고, 유지 보수하기. 2.1 실제 데이터로 작업하기 StatLib 저장소에 있는 주택 가격...
1.1 머신러닝이란? 머신러닝: 데이터에서 학습하도록 컴퓨터를 프로그래밍하는 과학. 용어 훈련 세트: 시스템이 학습하는 데 사용하는 샘플 훈련 사례(or 샘플): 각각의 훈련 데이터 모델: 머신러닝 시스템에서 학습하고 예측을 만드는 부분 정확도: 성능 측정 1.2 왜 머신러닝을 사용하나요? 프로그램이 훨씬...
클라우드에서 개발하기 - 깃허브 데브 깃허브 데브 접속하기 방법 1. 저장소에서 마침표 눌러 접근하기 방법 2. 주소를 입력해 깃허브 데브에 직접 접속하기 저장소 주소 깃허브 데브 주소 https://github.com/pinkkj/test-1 ...