Mli 구성¶
h2o_mli_nthreads¶
h2o_mli_nthreads (Number)
Default value 8
MLI에서 사용할 H2O 인스턴스의 스레드 수입니다.
mli_sample_above_for_scoring¶
mli_sample_above_for_scoring (Number)
Default value 1000000
행 수가 UI 데이터 채점을 위한 이 MLI 샘플 제한을 초과하는 경우.
mli_sample_above_for_training¶
mli_sample_above_for_training (Number)
Default value 100000
행 수가 대리 모델 학습을 위한 이 MLI 샘플 제한을 초과하는 경우.
mli_interpreter_status_cache_size¶
mli_interpreter_status_cache_size (Number)
Default value 1000
인터프리터 상태 캐시 항목의 최대 수입니다.
mli_sample_training¶
mli_sample_training (Boolean)
Default value True
not only sample training, but also sample scoring.
mli_strict_version_check¶
mli_strict_version_check (Boolean)
Default value True
MLI에 대한 엄격한 버전 확인
mli_cloud_name¶
mli_cloud_name (String)
Default value 'H2O-MLI-DAI'
MLI 클라우드 이름
mli_ice_per_bin_strategy¶
mli_ice_per_bin_strategy (Boolean)
Default value False
기능별 빈 예측을 사용하여 원본 모델 ICE를 계산하거나(true) 《한 프레임》 전략을 사용합니다(false).
mli_dia_default_max_cardinality¶
mli_dia_default_max_cardinality (Number)
Default value 10
기본적으로 DIA는 카디널리티 <= mli_dia_default_max_cardinality인 범주형 열에 대해 실행됩니다.
mli_dia_default_min_cardinality¶
mli_dia_default_min_cardinality (Number)
Default value 2
기본적으로 DIA는 카디널리티 >= mli_dia_default_min_cardinality인 범주형 열에 대해 실행됩니다.
enable_mli_keeper¶
enable_mli_keeper (Boolean)
Default value True
MLI에서 파일 시스템/메모리/DB의 효율적인 사용을 보장하는 MLI 키퍼를 활성화합니다.
enable_mli_sa¶
enable_mli_sa (Boolean)
Default value True
MLI Sensitivity Analysis 활성화
enable_mli_priority_queues¶
enable_mli_priority_queues (Boolean)
Default value True
우선 순위 큐 기반 설명자 실행을 활성화합니다. 우선 순위 큐는 사용 가능한 시스템 리소스를 제한하고 시스템의 과도한 사용을 방지합니다. 해석 실행 시간은 (상당히) 느릴 수 있습니다.
mli_sequential_task_execution¶
mli_sequential_task_execution (Boolean)
Default value True
설명자는 기본적으로 순차적으로 실행됩니다. 이 옵션은 하드웨어 강도와 설명자 수에 따라 해석 시간을 줄일 수 있는 모든 설명자를 병렬로 실행하는 데 사용할 수 있습니다. 설명자 종속성, 임의 설명자 순서 및 하드웨어 과도 이용을 고려하십시오.
mli_dia_sample_size¶
Sample size for Disparate Impact Analysis (Number)
Default value 100000
행 수가 이 제한을 초과하면 서로 다른 영향 분석을 위해 샘플링합니다.
mli_pd_sample_size¶
Sample size for Partial Dependence Plot (Number)
Default value 25000
행 수가 이 제한을 초과하면 Partial Dependence Plot을 샘플링합니다.
mli_pd_numcat_num_chart¶
Unique feature values count driven Partial Dependence Plot binning and chart selection (Boolean)
Default value True
실험에서 숫자 및 범주 모두로 사용된 기능의 경우 Partial Dependence Plot 숫자 및 범주 비닝 및 UI 차트 선택 간의 동적 전환을 사용합니다.
mli_pd_numcat_threshold¶
Threshold for Partial Dependence Plot binning and chart selection (<=threshold categorical, >threshold numeric) (Number)
Default value 11
〈mli_pd_numcat_num_chart’가 활성화된 경우 숫자 비닝 및 차트를 사용하고, 기능 고유 값 수가 임계값보다 크면 범주형 비닝 및 차트를 사용합니다.
new_mli_list_only_explainable_datasets¶
new_mli_list_only_explainable_datasets (Boolean)
Default value False
New Interpretation 화면에는 선택한 모델을 설명하는 데 사용할 수 있는 데이터 세트만 표시됩니다. 이로 인해 서버가 크게 느려질 수 있습니다.
enable_mli_async_api¶
enable_mli_async_api (Boolean)
Default value True
비동기/대기 기반 비차단 MLI API 활성화
enable_mli_sa_main_chart_aggregator¶
enable_mli_sa_main_chart_aggregator (Boolean)
Default value True
Sensitivity Analysis에서 기본 차트 수집기 활성화
mli_sa_sampling_limit¶
Sample size for SA (Number)
Default value 500000
Sensitivity Analysis를 위한 샘플링 시기(샘플링 후 행 수).
mli_sa_main_chart_aggregator_limit¶
mli_sa_main_chart_aggregator_limit (Number)
Default value 1000
데이터 세트 인스턴스 수가 주어진 제한보다 클 경우 Sensitivity Analysis에서 기본 차트 수집기를 실행합니다.
mli_predict_safe¶
mli_predict_safe (Boolean)
Default value False
MLI(PD, ICE, SA, …)에서 predict_safe()(true) 또는 predict_base()(false)를 사용합니다.
mli_max_surrogate_retries¶
mli_max_surrogate_retries (Number)
Default value 5
대리 모델 빌드에 실패할 경우의 최대 재시도 횟수입니다.
enable_mli_symlinks¶
enable_mli_symlinks (Boolean)
Default value True
MLI 설명자 절차에서 (파일 복사 대신) symlinks 링크 사용을 허용합니다.
h2o_mli_fraction_memory¶
h2o_mli_fraction_memory (Float)
Default value 0.45
h2o MLI jar에 할당할 메모리 비율
excluded_mli_explainers¶
Exclude specific explainers by explainer ID (List)
Default value []
예를 들어 Sensitivity Analysis 설명자를 제외하려면 다음 사용: exclude_mli_explainers=[〈h2oaicore.mli.byor.recipes.sa_explainer.SaExplainer〉].
enable_ws_perfmon¶
enable_ws_perfmon (Boolean)
Default value False
RPC API 성능 모니터를 활성화합니다.
mli_kernel_explainer_workers¶
mli_kernel_explainer_workers (Number)
Default value 4
Kernel Explainer에서 MOJO를 사용하여 채점할 때 병렬 작업자 수입니다.
mli_run_kernel_explainer¶
Use Kernel Explainer to obtain Shapley values for original features (Boolean)
Default value False
Kernel Explainer를 사용하여 원래 기능에 대한 Shapley 값을 얻습니다.
mli_kernel_explainer_sample¶
Sample input dataset for Kernel Explainer (Boolean)
Default value True
Kernel Explainer용 샘플 입력 데이터 세트.
mli_kernel_explainer_sample_size¶
Sample size for input dataset passed to Kernel Explainer (Number)
Default value 1000
Kernel Explainer에 전달된 입력 데이터 세트의 샘플 크기입니다.
mli_kernel_explainer_nsamples¶
Number of times to re-evaluate the model when explaining each prediction with Kernel Explainer. Default is determined internally (String)
Default value 'auto'
〈auto〉 또는 int. 각 예측을 설명할 때 모델을 재평가하는 횟수입니다. 샘플이 많을수록 SHAP 값의 분산 추정치가 낮아집니다. 〈auto〉 설정은 nsamples = 2 * X.shape[1] + 2048을 사용합니다. 이 설정은 기본적으로 비활성화되어 있으며 DAI가 내부적으로 올바른 숫자를 결정합니다.
mli_kernel_explainer_l1_reg¶
L1 regularization for Kernel Explainer (String)
Default value 'aic'
〈num_features(int)〉, 〈auto〉 (현재 기본값이지만 더 이상 사용되지 않음), 〈aic〉, 〈bic〉 또는 float. 특징 선택에 사용할 l1 정규화(추정 절차는 편향된 lasso를 기반으로 함). 〈auto〉 옵션은 현재 가능한 샘플 공간의 20% 미만이 열거될 때 aic을 사용하고, 그렇지 않으면 정규화를 사용하지 않습니다. 〈auto〉 의 동작은 AIC 대신 〈num_features〉 를 기반으로 하는 향후 버전에서 변경됩니다. aic 및 bic 옵션은 정규화를 위해 AIC 및 BIC 규칙을 사용합니다. 〈num_features(int)〉 사용 시 상위 기능의 수정 번호가 선택됩니다. float를 전달하면 기능 선택에 사용되는 sklearn.linear_model.Lasso 모델의 알파 매개변수가 직접 설정됩니다.
mli_kernel_explainer_max_runtime¶
Max runtime for Kernel Explainer in seconds (Number)
Default value 900
Kernel Explainer의 최대 런타임(초)입니다. 기본값은 900이며 15분에 해당합니다. 이 매개변수를 -1로 설정하면 최대 런타임에 관계없이 제공된 Kernel Shapley 샘플 크기가 준수됩니다.
mli_nlp_tokenizer¶
mli_nlp_tokenizer (String)
Default value 'tfidf'
MLI의 텍스트 열에서 토큰을 추출하는 데 사용되는 토크나이저입니다.
mli_image_enable¶
mli_image_enable (Boolean)
Default value True
이미지 실험을 위해 MLI를 활성화합니다.