Driverless AI의 앙상블 학습

이 섹션에서는 Driverless AI의 앙상블 학습 기능에 관해 설명합니다.

앙상블 방법

앙상블 방법은 음이 아닌 가중치를 가진 선형 모델입니다. 가중치는 폴더 레벨이 아닌 모델 레벨에서 할당됩니다. 예를 들어, 두 모델이 함께 앙상블된 경우(LightGBM 모델 및 XGBoost 모델) 선형 모델은 모든 LightGBM CV 모델을 할당할 가중치 및 모든 XGBoost CV 모델을 할당할 가중치를 찾습니다. Driverless AI가 단일 모델(레벨 1)을 앙상블할 때, 가중치가 모델 레벨에서 할당되기 때문에 CV 모델 예측의 평균을 취합니다.

앙상블 레벨

Driverless AI에는 accuracy 노브에 연결된 여러 가지 앙상블 레벨이 있습니다. accuracy가 증가하면 앙상블 레벨이 증가합니다.

또한, 앙상블 레벨은 전문가 설정 패널의 모델 설정에서 Ensemble Level for Final Modeling Pipeline 을 사용하여 제어할 수 있습니다. 다음은 각각의 앙상블 레벨에 대한 설명입니다.

  • level 0: 앙상블은 없고, 최종 단일 모델만 있음. 교차 검증은 모델 검증 성능의 결정에만 사용됩니다. 최종 모델은 전체 데이터 세트에서 학습됩니다.

  • level 1: 한 개의 모델에 대해 교차 검증이 수행되고, CV 모델 예측이 앙상블됩니다.

  • level 2: 2개의 모델에 대한 교차 검증이 수행되고, CV 모델 예측이 앙상블됩니다. 예를 들어, Driverless AI는 XGBoost 모델 및 LightGBM 모델을 앙상블하도록 하는 선택이 가능합니다. 앙상블은 교차 검증 XGBoost 모델과 교차 검증 Light GBM 모델의 예측을 블렌딩하여 수행됩니다. Driverless AI가 5-폴드 교차 검증을 결정한 경우, 10개의 모델이 앙상블됩니다(XGBoost 모델의 5개 CV 모델 및 LightGBM 모델의 5개 CV 모델).

  • level 3: 레벨 2와 같지만 3개의 모델.

  • level 4: 레벨 2와 같지만 4개의 모델.

Notes:

  • 최종 모델의 앙상블에 관한 설명은 Ensemble Base Model Fold Scores 의 실험 로그를 확인하십시오.

  • Expert Settings 패널에서 Ensemble Level for Final Modeling Pipeline 설정을 통해 앙상블 레벨을 수동으로 설정할 수 있습니다.