728x90
반응형

GridSearch 2

머신러닝 프로세스 한 번에 처리하기 | Pipeline, make_pipeline

파이프라인 (Pipeline) 은 전처리의 각 단계, 모델 생성, 학습 등을 포함하는 여러 단계의 머신러닝 프로세스를 한 번에 처리할 수 있는 클래스로, 머신러닝의 sklearn 라이브러리에 내장되어 있습니다. 변환기 (Transformer) 전처리 작업 파이프라인의 경우에는 변환기 (Transformer) 들로만 구성 데이터셋을 기반으로 일련의 모델 파라미터들을 추정 fit_transform() 추정기 (Estimator) 전체 프로세스 파이프 라인의 경우에는 여러 개의 변환기와 함께 마지막에 추정기 넣음 데이터셋을 변환하는 추정기 fit() 1. pipe = [ 변환기, 추정기] pipeline(pipe, verbose = True)​ 2. make_pipeline(변환기, 추정기) 샘플 import..

그녀의 일 2023.03.09

모델의 최적의 하이퍼 파라미터 찾기 | Hyperparameter tuning - GridSearchCV, RandomizedSearchCV

1. GridSearchCV() : 시도해 볼 하이퍼파라미터들을 지정하면, 모든 조합에 대해 교차검증 후 가장 좋은 성능을 내는 하이퍼파라미터 조합을 찾음. 단, 하이퍼파라미터 값들이 많아지면 시간이 오래 걸린다는 단점이 있음. 파라미터 설명 ​주요 매개변수 > estimator : 모델 객체 지정 > param_grid : 하이퍼파라미터 목록을 dictionary 로 전달 > scoring : 평가 지표 > cv : 교차검증 시 fold 개수 > n_jobs : 사용할 CPU 코어 개수 (1: 기본값, -1: 모든 코어 다 사용) ​ 메소드 > fit(X, y) : 학습 > predict(X) : 제일 좋은 성능을 낸 모델로 예측 > predict_proba(X) : 제일 좋은 성능을 낸 모델로 pre..

그녀의 일 2023.03.09
728x90
반응형