시스템 구성¶
exclusive_mode¶
Exclusive level of access to node resources (String)
Default value 'safe'
safe: 동일한 노드에서 다른 실험을 실행 중일 수 있다고 가정 moderate: 동일한 노드에서 다른 실험이나 작업을 실행하지 않는다고 가정하지만 여전히 물리적 코어 수만 사용. max: 실험을 제외하고는 노드에서 다른 것을 전혀 실행하지 않는다고 가정. 다중 노드가 활성화된 경우 이 옵션은 적용될 때 worker_remote_processors=1이 아닌 한 아무 효과가 없음. 각 전용 모드를 선택한 다음 각 전문가 설정을 사용하여 미세 조정할 수 있습니다. 독점 모드를 변경하면 모든 독점 모드 관련 옵션이 기본값으로 재설정되고 새 모드에 대한 특정 규칙이 다시 적용되어 독점 모드 규칙의 일부인 전문가 옵션의 미세 조정이 취소됩니다. 상위 실험에서 신규/계속/재조정/재교육된 실험을 실행하기로 선택하면 모든 모드 규칙이 다시 적용되지 않고 미세 조정이 유지됩니다. 모드 동작을 재설정하려면 〈safe’와 원하는 모드 간에 전환할 수 있습니다. 이 방법으로 새 하위 실험은 선택한 모드에 대한 기본 시스템 리소스를 사용합니다.
max_cores¶
Number of cores to use (0 = all) (Number)
Default value 0
실험당 사용할 최대 CPU 코어 수입니다. 모든 코어를 사용하려면 <= 0으로 설정하십시오. 환경 변수 〈OMP_NUM_THREADS’를 OpenMP에 사용할 코어 수로 설정할 수도 있습니다(예: bash: 〈export OMP_NUM_THREADS=32〉 및 〈export OPENBLAS_NUM_THREADS=32〉 에).
max_fit_cores¶
Maximum number of cores to use for model fit (Number)
Default value 10
모델의 핏 호출에 사용할 최대 코어 수 제어(0 = 모든 물리적 코어 >= 1 해당하는 수)
use_dask_cluster¶
If full dask cluster is enabled, use full cluster (Boolean)
Default value True
전체 다중 노드 분산 클러스터(True) 또는 단일 노드 dask(False)를 사용할지 여부. 경우에 따라 전체 클러스터를 사용하는 것이 비효율적일 수 있습니다. 예를 들어 중간 크기의 데이터에 대해 한 번에 하나의 DGX를 사용하는 경우 DGX 노드가 여러 개 있는 것이 더 효율적일 수 있습니다.
max_predict_cores¶
Maximum number of cores to use for model predict (Number)
Default value 0
모델의 예측 호출에 사용할 최대 코어 수 제어(0 = 모든 물리적 코어 >= 1 해당하는 수)
max_predict_cores_in_dai¶
Maximum number of cores to use for model transform and predict when doing MLI and AutoDoc. (Number)
Default value 4
DAI-MLI GUI 및 R/Py 클라이언트 내에서 작업을 수행할 때 모델의 변환 및 예측 호출에 사용할 최대 코어 수 제어(0 = 모든 물리적 코어 >= 1 해당하는 수).
batch_cpu_tuning_max_workers¶
Tuning workers per batch for CPU (Number)
Default value 0
튜닝을 위해 CPU 모드에서 사용되는 작업자 수 제어(0 = 소켓 수 -1 = 모든 물리적 코어 >= 1 해당하는 수). 더 많은 작업자가 더 병렬화되지만 모델은 서로 덜 학습합니다.
cpu_max_workers¶
Num. workers for CPU training (Number)
Default value 0
학습을 위해 CPU 모드에서 사용되는 작업자 수 제어(0 = 소켓 수 -1 = 모든 물리적 코어 >= 1 해당하는 수)
assumed_simultaneous_dt_forks_munging¶
Assumed/Expected number of munging forks (Number)
Default value 3
데이터 테이블로 인해 시스템이 과부하되지 않도록 하기 위한 예상 최대 포크 수입니다. 이 값을 초과하여 사용하는 경우 시스템 속도가 저하되기 시작합니다
max_max_dt_threads_munging¶
Max. threads for datatable munging (Number)
Default value 4
먼징(munging)을 위해 데이터 테이블에 사용할 최대 스레드 수.
max_max_dt_threads_readwrite¶
Max. threads for datatable reading/writing (Number)
Default value 4
파일 읽기/쓰기를 위해 데이터 테이블에 사용할 최대 스레드 수
max_dt_threads_munging¶
Max. Num. of threads to use for datatable and openblas for munging and model training (0 = all, -1 = auto) (Number)
Default value -1
데이터 먼징(munging) 중 데이터 테이블에 사용할 최대 스레드 수(프로세스당)(0 = 모두, -1 = 자동). 포크가 여러 개인 경우 스레드는 포크에 분산됩니다.
max_dt_threads_readwrite¶
Max. Num. of threads to use for datatable read and write of files (0 = all, -1 = auto) (Number)
Default value -1
데이터 읽기 및 쓰기 중 데이터 테이블에 사용할 최대 스레드 수(프로세스당)(0 = 모두, -1 = 자동). 포크가 여러 개인 경우 스레드는 포크에 분산됩니다.
max_dt_threads_stats_openblas¶
Max. Num. of threads to use for datatable stats and openblas (0 = all, -1 = auto) (Number)
Default value -1
stats 및 openblas 데이터 테이블에 사용할 최대 스레드 수(프로세스당)(0 = 모두, -1 = 자동). 포크가 여러 개인 경우 스레드는 포크에 분산됩니다.
num_gpus_per_experiment¶
#GPUs/Experiment (-1 = all) (Number)
Default value -1
교육 작업을 위해 실험당 사용할 GPU 수. 모든 GPU인 경우 -1로 설정합니다. 실험은 다양한 모델을 생성합니다. 현재 num_gpus_per_experiment!=-1은 GPU 잠금을 비활성화하므로 단일 실험 및 단일 사용자에게만 권장됩니다. GPU가 비활성화되거나 시스템에 GPU가 없는 경우 무시됩니다. 추가 정보: https://github.com/NVIDIA/nvidia-docker/wiki/nvidia-docker#gpu-isolation dask 를 사용할 때 다중 노드 컨텍스트에서 이것은 노드당 값을 나타냅니다. ImageAutoModel의 경우 전체 실험에 대해 하나의 모델 유형만 있기 때문에 전체 모델 유형에 사용된 총 GPU 수를 나타냅니다. 예를 들어 4개의 GPU가 있고 각각 2개의 GPU에서 2개의 ImageAuto 실험을 실행하려는 경우 각 실험에 대해 num_gpus_per_experiment를 2로 설정할 수 있으며 4개의 GPU는 각각 2개의 GPU만 사용하는 2개의 실험에서 한 번에 하나씩 사용됩니다.
min_num_cores_per_gpu¶
Num Cores/GPU (Number)
Default value 2
- GPU당 CPU 코어 수. GPU당 코어 수가 충분하도록 GPU 수를 제한합니다.
비활성화하려면 -1로 설정합니다.
num_gpus_per_model¶
#GPUs/Model (-1 = all) (Number)
Default value 1
모델 학습 작업당 사용할 GPU 수. 모든 GPU일 경우 -1로 설정합니다. 예를 들어 -1로 설정하면 4개의 GPU를 사용할 수 있는 경우 단일 모델의 학습에 모두 사용할 수 있습니다. 현재 둘 이상의 GPU 또는 노드가 있는 dask 모델 및 이미지 자동 파이프라인 구축 레시피에만 적용 가능합니다. GPU가 비활성화되거나 시스템에 GPU가 없는 경우 무시됩니다. ImageAutoModel의 경우 최대 num_gpus_per_model 및 num_gpus_per_experiment(-1인 경우 모든 GPU)가 사용됩니다. 추가 정보: https://github.com/NVIDIA/nvidia-docker/wiki/nvidia-docker#gpu-isolation dask 를 사용할 때 다중 노드 컨텍스트에서 이것은 노드당 값을 나타냅니다.
num_gpus_for_prediction¶
Num. of GPUs for isolated prediction/transform (Number)
Default value 0
fit/fit_transform 외부에서 실행할 때 모델 예측 및 트랜스포머 변환에 사용할 GPU 수. -1은 모두를 의미하고, 0은 GPU가 없음을 의미하고, >1은 가시적인 한계까지 다수의 GPU를 의미합니다. 예측/변환이 fit/fit_transform과 동일한 프로세스에서 호출되면 GPU 수는 일치하지만 새 프로세스는 적용 가능한 모델/트랜스포머에 대한 GPU 수에 이 수를 사용합니다. 예외: Tensorflow, pytorch 모델/트랜스포머 및 RAPIDS는 GPU가 있는 경우 항상 GPU에서 예측합니다. RAPIDS를 사용하려면 GPU에서도 python 스코어링 패키지를 사용해야 합니다. dask를 사용할 때 다중 노드 컨텍스트에서 이것은 노드당 값을 나타냅니다.
gpu_id_start¶
GPU starting ID (0..visible #GPUs - 1) (Number)
Default value -1
-1로 시작할 gpu_id : 자동 모드. 예를 들어 2개의 실험은 각각 num_gpus_per_experiment를 2로 설정하고 4개의 GPU를 사용할 수 있습니다. CUDA_VISIBLE_DEVICES=…를 사용하여 GPU를 제어하는경우(선호되는 방법), gpu_id=0은 제한된 장치 목록에서 첫 번째입니다. 예를 들어 CUDA_VISIBLE_DEVICES=〉4,5’이면 gpu_id_start=0은 장치 #4를 나타냅니다. 예를 들어 전문가 모드에서 2개의 실험을 2개의 GPU 중 고유한 하나의 GPU에서 각각 실행합니다. Experiment#1: num_gpus_per_model=1, num_gpus_per_experiment=1, gpu_id_start=0 Experiment#2: num_gpus_per_model=1, num_gpus_per_experiment=1, gpu_id_start=1 예를 들어 전문가 모드에서 2개의 실험을 8개의 GPU 중 고유한 하나의 GPU에서 각각 실행합니다. Experiment#1: num_gpus_per_model=1, num_gpus_per_experiment=4, gpu_id_start=0 Experiment#2: num_gpus_per_model=1, num_gpus_per_experiment=4, gpu_id_start=4 예를 들어 위와 같지만 이제 4개의 GPU/모델 모두에서 실행합니다. Experiment#1: num_gpus_per_model=4, num_gpus_per_experiment=4, gpu_id_start=0 Experiment#2: num_gpus_per_model=4, num_gpus_per_experiment=4, gpu_id_start=4 num_gpus_per_model!=1이면 전역 GPU 잠금이 비활성화됩니다(기본 알고리즘이 임의의 GPU ID를 지원하지 않고 순차 ID만 지원하기 때문). 따라서 모든 사용자의 모든 실험에서 겹침을 방지하려면 위의 내용대로 올바르게 설정해야 합니다. 추가 정보: https://github.com/NVIDIA/nvidia-docker/wiki/nvidia-docker#gpu-isolation GPU 선택은 래핑되지 않으므로 gpu_id_start + num_gpus_per_model은 가시적 GPU 수보다 작아야 합니다.
allow_reduce_features_when_failure¶
Whether to reduce features when model fails (String)
Default value 'auto'
모델이 실패하지 않을 때까지 특징을 줄일지 여부. 현재 non-dask XGBoost 모델(예: GLMModel, XGBoostGBMModel, XGBoostDartModel, XGBoostRFModel)의 경우, 일반 피팅 중이거나 Optuna를 사용할 때. GPU OOM에 주로 유용합니다. XGBoost에 GPU 메모리가 부족하면 이를 감지하고(skip_model_failures 설정에 관계없이) 특징의 서브세트에 대해 XGBoost를 사용하여 특징 선택을 수행합니다. 데이터 세트는 모든 특징을 포함하는 더 많은 모델로 점차적으로 2배 감소합니다. 이 분할은 장애가 발생하지 않을 때까지 계속됩니다. 그런 다음 포함할 특징을 결정하기 위해 모든 하위 모델을 사용하여 절대 정보 이득으로 변수 중요도를 추정합니다. 마지막으로 가장 중요한 특징을 가진 단일 모델은 OOM으로 이어지지 않은 특징 수를 사용하여 구축됩니다. 〈auto〉 의 경우 동일한 실험 시드에 대해 OOM 실행 조건이 변경될 수 있으므로 재현 가능한 실험이 활성화된 경우 이 옵션은 〈off〉 로 설정됩니다. 축소는 특징 선택 단계의 행이 아닌 특징에서만 수행됩니다.
reduce_repeats_when_failure¶
Number of repeats for models used for feature selection during failure recovery. (Number)
Default value 1
allow_reduce_features_when_failure를 사용하는 경우 이 설정은 특성 선택에 사용되는 하위 모델의 반복 횟수를 제어합니다. 단일 반복의 경우 각 하위 모델은 특성의 단일 서브 세트만 고려하지만, 여러 번 반복하면 중요한 상호 작용을 찾을 수 있는 기회가 더 많은 특징을 셔플(shuffle)합니다. 반복할수록 정확도가 높아질 수 있습니다. 이 옵션을 사용하면 반복 수가 늘어납니다.
fraction_anchor_reduce_features_when_failure¶
Fraction of features treated as anchor for feature selection during failure recovery. (Float)
Default value 0.1
allow_reduce_features_when_failure를 사용하는 경우 이 설정은 모든 하위 모델에 대해 고정된 앵커로 처리되는 특징의 일부를 제어합니다. 반복할 때마다 새 앵커를 얻습니다. 튜닝과 진화의 경우, 확률은 다른 개체의 이전 중요도(존재하는 경우)에 따라 달라지는 반면, 최종 모델은 앵커 특징에 대해 균일한 확률을 사용합니다.
xgboost_reduce_on_errors_list¶
Errors from XGBoost that trigger reduction of features (List)
Default value ['Memory allocation error on worker', 'out of memory', 'XGBDefaultDeviceAllocatorImpl', 'invalid configuration argument', 'Requested memory']
축소된 하위 모델에서 리핏을 트리거하기 위해 사용하는 XGBoost의 오류 문자열입니다. allow_reduce_features_when_failure를 참조하십시오.
lightgbm_reduce_on_errors_list¶
Errors from LightGBM that trigger reduction of features (List)
Default value ['Out of Host Memory']
축소된 하위 모델에서 리핏을 트리거하기 위해 사용하는 LightGBM의 오류 문자열입니다. allow_reduce_features_when_failure를 참조하십시오.
num_gpus_per_hyperopt_dask¶
#GPUs/HyperOptDask (-1 = all) (Number)
Default value -1
모델 하이퍼옵트 학습 작업당 사용할 GPU 수. 모든 GPU를 사용하려면 이를 -1로 설정합니다. 예를 들어 -1로 설정되어 있고 4개의 GPU를 사용할 수 있으면 Dask 클러스터에서 단일 모델의 학습에 모두 사용할 수 있습니다. GPU가 비활성화되어 있거나 시스템에 GPU가 없는 경우 무시됩니다. 다중 노드 컨텍스트에서 이는 노드당 값을 가리킵니다.
detailed_traces¶
Enable detailed traces (Boolean)
Default value False
상세 추적 활성화 여부(GUI 추적에서)
debug_log¶
Enable debug log level (Boolean)
Default value False
디버그 로그 수준 활성화 여부(로그 파일 내)
log_system_info_per_experiment¶
Enable logging of system information for each experiment (Boolean)
Default value True
각 실험 로그의 시작 부분에 CPU, GPU, 디스크 공간과 같은 시스템 정보의 로깅을 추가할지 여부. 동일한 정보가 이미 시스템 로그에 기록되어 있습니다.
enable_projects¶
Enable Projects workspace (Boolean)
Default value True
프로젝트 작업 공간 활성화(알파 버전, 평가용)
enable_license_manager¶
enable_license_manager (Boolean)
Default value False
H2O.ai 라이센스 관리 서버를 사용하여 라이센스/소프트웨어 사용 권한을 관리하도록 Driverless AI를 전환합니다.
license_manager_address¶
license_manager_address (String)
Default value 'http://127.0.0.1:9999'
H2O.ai 라이센스 관리 서버와 통신할 주소. 위 값이 필요하며 〈enable_license_manager〉 가 True로 설정되어 있어야 합니다. 형식: {http/https}://{ip address}:{port number}
license_manager_project_name¶
license_manager_project_name (String)
Default value 'default'
Driverless AI가 리스 검색을 시도할 라이센스 관리자 프로젝트의 이름. 참고: 제대로 작동하려면 License Manager 서버 내에 활성 라이센스가 있어야 합니다.
license_manager_lease_duration¶
license_manager_lease_duration (Number)
Default value 3600000
H2O.ai License Manager 서버를 사용하는 경우 사용자 리스가 리스 갱신 전까지 계속될 것으로 예상되는 시간(밀리초).
기본값: 3600000(1시간) = 1시간 * 60분/시간 * 60초/분 * 1000밀리초/초
license_manager_worker_lease_duration¶
license_manager_worker_lease_duration (Number)
Default value 21600000
H2O.ai License Manager 서버를 사용하는 경우 Driverless AI 작업자 노드 리스가 리스 갱신 전까지 계속될 것으로 예상되는 시간(밀리초). 기본값: 21600000(6시간) = 6시간 * 60분/시간 * 60초/분 * 1000밀리초/초
license_manager_ssl_certs¶
license_manager_ssl_certs (String)
Default value 'true'
License Manager 서버가 HTTPS로 시작된 경우에만 사용 부울(true/false) 또는 파일/디렉터리 경로를 허용합니다. License Manager 서버에 요청할 때 SSL 인증서 확인을 시도할지 여부를 나타냅니다. True: SSL 인증서 확인 시도, 인증서가 자체 서명된 경우 실패 False: SSL 인증서 확인 생략. /path/to/cert/directory: 디렉터리에 인증서 <cert.pem> 를 로드하고 인증서 확인에 사용 python 요청 패키지와 동일한 방식으로 작동: https://requests.readthedocs.io/en/latest/user/advanced/#ssl-cert-verification
license_manager_worker_startup_timeout¶
license_manager_worker_startup_timeout (Number)
Default value 3600000
Driverless AI 작업자가 시동을 계속 시도하고 제한 시간이 초과되기 전에 라이센스 관리자로부터 리스를 받는 시간. 시간 초과의 경우 작업자 시동은 실패합니다.
license_manager_dry_run_token¶
license_manager_dry_run_token (String)
Default value ''
License Manager 서버와 통신하거나 리스를 받는 데 문제가 있는 경우에도 Driverless AI를 실행할 수 있도록 하는 긴급 설정입니다.
라이센스 관리자 UI 또는 라이센스 관리자 서버의 로그에서 얻을 수 있는 인코딩된 문자열입니다.
dask_cuda_cluster_kwargs¶
Set dask CUDA/RAPIDS cluster settings for single node workers. (Dict)
Default value {'scheduler_port': 0, 'dashboard_address': ':0', 'protocol': 'tcp'}
단일 노드 작업자에 대한 dask CUDA/RAPIDS 클러스터 설정을 지정합니다. 추가 환경 변수를 설정할 수 있습니다. 참조: https://dask-cuda.readthedocs.io/en/latest/ucx.html#dask-scheduler 예: ucx 사용의 경우: 다음의 {} 사전 버전: dict(n_workers=None, threads_per_worker=1, processes=True, memory_limit=〉auto〉, device_memory_limit=None, CUDA_VISIBLE_DEVICES=None, data=None, local_directory=None, protocol=〉ucx〉, enable_tcp_over_ucx=True, enable_infiniband=False, enable_nvlink=False, enable_rdmacm=False, ucx_net_devices=〉auto〉, rmm_pool_size=〉1GB〉) WARNING: Do not add arguments like {〈n_workers〉: 1, 〈processes〉: True, 〈threads_per_worker〉: 1} this will lead to hangs, cuda cluster handles this itself.
dask_cluster_kwargs¶
Set dask cluster settings for single node workers. (Dict)
Default value {'n_workers': 1, 'processes': True, 'threads_per_worker': 1, 'scheduler_port': 0, 'dashboard_address': ':0', 'protocol': 'tcp'}
단일 노드 작업자에 대한 dask 클러스터 설정을 지정합니다.
enable_dask_cluster¶
Enable dask scheduler and worker on singlenode/multinode setup (Boolean)
Default value True
DAI 작업자 노드에 dask 스케줄러 DAI 서버 노드 및 dask 작업자를 활성화할지 여부.
start_dask_worker¶
Start dask workers for given multinode worker (Boolean)
Default value True
이 다중 노드 작업자에 dask 작업자를 시작할지 여부.
dask_scheduler_env¶
Set dask scheduler env. (Dict)
Default value {}
dask 스케줄러 환경을 설정합니다. https://docs.dask.org/en/latest/setup/cli.html 참조.
dask_cuda_scheduler_env¶
Set dask cuda scheduler env. (Dict)
Default value {}
dask 스케줄러 환경을 설정합니다. https://docs.dask.org/en/latest/setup/cli.html 참조.
dask_scheduler_options¶
Set dask scheduler command-line options. (String)
Default value ''
dask 스케줄러 옵션을 설정합니다. https://docs.dask.org/en/latest/setup/cli.html 참조
dask_cuda_scheduler_options¶
Set dask cuda scheduler command-line options. (String)
Default value ''
dask cuda 스케줄러 옵션을 설정합니다. https://docs.dask.org/en/latest/setup/cli.html 참조
dask_worker_env¶
Set dask worker environment variables. NCCL_SOCKET_IFNAME is automatically set, but can be overridden here. (Dict)
Default value {'NCCL_P2P_DISABLE': '1', 'NCCL_DEBUG': 'WARN'}
dask 작업자 환경을 설정합니다. https://docs.dask.org/en/latest/setup/cli.html 참조
dask_worker_options¶
Set dask worker command-line options. (String)
Default value '--memory-limit 0.95'
dask 작업자 옵션을 설정합니다. https://docs.dask.org/en/latest/setup/cli.html 참조
dask_cuda_worker_options¶
Set dask cuda worker options. (String)
Default value '--memory-limit 0.95'
dask cuda 작업자 옵션을 설정합니다. dask_cuda_cluster_kwargs와 유사한 옵션. https://dask-cuda.readthedocs.io/en/latest/ucx.html#launching-scheduler-workers-and-clients-separately 참조 《–rmm-pool-size 1GB》는 보다 효율적인 rapids를 위해 RMM에 1GB를 제공하도록 설정할 수 있습니다
dask_cuda_worker_env¶
Set dask cuda worker environment variables. (Dict)
Default value {}
dask cuda 작업자 환경을 설정합니다. 참조: https://dask-cuda.readthedocs.io/en/latest/ucx.html#launching-scheduler-workers-and-clients-separately
dask_protocol¶
Protocol using for dask communications. (String)
Default value 'tcp'
https://docs.dask.org/en/latest/setup/cli.html을 참조합니다. ucx가 최적이고 tcp가 가장 안정적입니다.
dask_server_port¶
Port using by server for dask communications. (Number)
Default value 8786
dask_dashboard_port¶
Dask dashboard port for dask diagnostics. (Number)
Default value 8787
dask_cuda_protocol¶
Protocol using for dask cuda communications. (String)
Default value 'tcp'
https://docs.dask.org/en/latest/setup/cli.html을 참조합니다. ucx가 최적이고 tcp가 가장 안정적입니다.
dask_cuda_server_port¶
Port using by server for dask cuda communications. (Number)
Default value 8790
https://docs.dask.org/en/latest/setup/cli.html 참조 포트 + 1은 dask 대시보드에 사용됩니다.
dask_cuda_dashboard_port¶
Dask dashboard port for dask_cuda diagnostics. (Number)
Default value 8791
dask_server_ip¶
IP address using by server for dask and dask cuda communications. (String)
Default value ''
빈 문자열이면 네트워크에 연결할 수 있는 IP를 자동으로 감지합니다. worker_mode=multinode를 사용하는 경우 설정해야 합니다.
dask_worker_nprocs¶
Number of processes per dask worker. (Number)
Default value 1
dask(cuda-GPU 아님) 작업자당 프로세스 수. -1이면 cpu count + 1 + nprocs의 dask 기본값을 사용합니다. -2인 경우 총 물리적 코어 수의 DAI 기본값을 사용합니다. 과중한 특징 가공에 권장됩니다. 1이면 작업이 대부분 다중 스레드이며 작업당 전체 노드를 사용할 수 있다고 가정합니다. 과중한 다중 노드 학습 교육에 권장됩니다. dask(dask_cuda 아님) 작업자에게만 적용됩니다.
dask_worker_nthreads¶
Number of threads per process for dask. (Number)
Default value 1
dask 작업자의 프로세스당 스레드 수
dask_cuda_worker_nthreads¶
Number of threads per process for dask_cuda. (Number)
Default value -2
dask_cuda 작업자의 프로세스당 스레드 수. -2인 경우 GPU당 1개의 작업자/GPU만 있어야 하므로 DAI 기본값인 GPU당 물리적 코어를 사용합니다.
lightgbm_listen_port¶
LightGBM local listen port when using dask with lightgbm (Number)
Default value 12400
worker_mode¶
worker_mode (String)
Default value 'singlenode'
- 장기 실행 태스크가 예약되는 방식입니다.
multiprocessing: 현재 프로세스를 즉시 포크합니다. singlenode: redis를 통해 태스크를 공유하고 실행 중인 작업자가 필요합니다. multinode: singlenode와 동일하며 minio를 통해 데이터를 공유합니다.
또한 작업자가 다른 시스템에서 실행할 수 있습니다.
redis_ip¶
redis_ip (String)
Default value '127.0.0.1'
Redis 설정
redis_port¶
redis_port (Number)
Default value 6379
Redis 설정
redis_db¶
redis_db (Number)
Default value 0
Redis 데이터베이스. redis 서버에서 실행되는 각 DAI 인스턴스는 고유한 정수를 가져야 합니다.
main_server_redis_password¶
main_server_redis_password (String)
Default value 'PlWUjvEJSiWu9j0aopOyL5KwqnrKtyWVoZHunqxr'
Redis 암호. 기본 서버 시동 시 무작위로 생성되며 기본적으로 주석 처리되지 않은 구성 파일에 표시됩니다. 시스템당 두 개 이상의 DriverlessAI 인스턴스를 실행하는 경우 각각의 모든 인스턴스가 자체 redis 대기열에 연결되어 있는지 확인합니다.
redis_encrypt_config¶
redis_encrypt_config (Boolean)
Default value False
If set to true, the config will get encrypted before it gets saved into the Redis database.
local_minio_port¶
local_minio_port (Number)
Default value 9001
Minio가 수신 대기할 포트이며 이는 현재 시스템이 다중 노드 기본 서버인 경우에만 적용됩니다.
main_server_minio_address¶
main_server_minio_address (String)
Default value '127.0.0.1:9001'
기본 서버의 minio 서버 위치.
main_server_minio_access_key_id¶
main_server_minio_access_key_id (String)
Default value 'GMCSE2K2T3RV6YEHJUYW'
기본 서버의 minio 서버의 액세스 키.
main_server_minio_secret_access_key¶
main_server_minio_secret_access_key (String)
Default value 'JFxmXvE/W1AaqwgyPxAUFsJZRnDWUaeQciZJUe9H'
기본 서버의 minio 서버의 암호 액세스 키.
main_server_minio_bucket¶
main_server_minio_bucket (String)
Default value 'h2oai'
파일 동기화에 사용되는 minio 버킷의 이름.
worker_local_processors¶
worker_local_processors (Number)
Default value 32
한 번에 처리할 수 있는 최대 로컬 태스크 수
worker_priority_queues_processors¶
worker_priority_queues_processors (Number)
Default value 4
3개의 우선 순위 대기열에 대한 동시성 제한
worker_priority_queues_time_check¶
worker_priority_queues_time_check (Number)
Default value 30
예약된 태스크가 상위 우선 순위로 올라가기 전의 시간 초과
worker_remote_processors¶
worker_remote_processors (Number)
Default value 2
한 번에 처리할 수 있는 최대 원격 태스크 수
worker_remote_processors_max_threads_reduction_factor¶
worker_remote_processors_max_threads_reduction_factor (Float)
Default value 0.7
worker_remote_processors >= 2이면 각 태스크가 스레드를 줄이는 요소이며 datatable, lightgbm, xgboost 등과 같은 다양한 패키지에서 사용됩니다.
redis_result_queue_polling_interval¶
redis_result_queue_polling_interval (Number)
Default value 100
서버가 redis 대기열에서 결과를 추출해야 하는 빈도(밀리초)입니다.
main_server_minio_bucket_ping_timeout¶
main_server_minio_bucket_ping_timeout (Number)
Default value 30
실패하기 전에 기본 서버 minio 버킷을 작업자가 기다려야 하는 시간(초)
worker_start_timeout¶
worker_start_timeout (Number)
Default value 30
작업자가 redis db 초기화를 기다려야 하는 시간(초)입니다.
worker_no_main_server_wait_time¶
worker_no_main_server_wait_time (Number)
Default value 1800
worker_no_main_server_wait_time_with_hard_assert¶
worker_no_main_server_wait_time_with_hard_assert (Number)
Default value 30
worker_healthy_response_period¶
worker_healthy_response_period (Number)
Default value 300
작업자가 비정상으로 표시될 때까지 응답하지 않는 시간(초)
expose_server_version¶
expose_server_version (Boolean)
Default value True
활성화되면 DriverlessAI 기본 버전을 노출합니다.
enable_https¶
enable_https (Boolean)
Default value False
https 설정
아래 명령을 사용하여 테스트에 대한 직접 서명한 인증서를 만들 수 있습니다.
sudo openssl req -x509 -newkey rsa:4096 -keyout private_key.pem -out cert.pem -days 3650 -nodes -subj 〈/O=Driverless AI〉 sudo chown dai:dai cert.pem private_key.pem sudo chmod 600 cert.pem private_key.pem sudo mv cert.pem private_key.pem /etc/dai
ssl_key_file¶
ssl_key_file (String)
Default value '/etc/dai/private_key.pem'
https 설정
아래 명령을 사용하여 테스트에 대한 직접 서명한 인증서를 만들 수 있습니다.
sudo openssl req -x509 -newkey rsa:4096 -keyout private_key.pem -out cert.pem -days 3650 -nodes -subj 〈/O=Driverless AI〉 sudo chown dai:dai cert.pem private_key.pem sudo chmod 600 cert.pem private_key.pem sudo mv cert.pem private_key.pem /etc/dai
ssl_crt_file¶
ssl_crt_file (String)
Default value '/etc/dai/cert.pem'
https 설정
아래 명령을 사용하여 테스트에 대한 직접 서명한 인증서를 만들 수 있습니다.
sudo openssl req -x509 -newkey rsa:4096 -keyout private_key.pem -out cert.pem -days 3650 -nodes -subj 〈/O=Driverless AI〉 sudo chown dai:dai cert.pem private_key.pem sudo chmod 600 cert.pem private_key.pem sudo mv cert.pem private_key.pem /etc/dai
ssl_no_sslv2¶
ssl_no_sslv2 (Boolean)
Default value True
SSL TLS
ssl_no_sslv3¶
ssl_no_sslv3 (Boolean)
Default value True
SSL TLS
ssl_no_tlsv1¶
ssl_no_tlsv1 (Boolean)
Default value True
SSL TLS
ssl_no_tlsv1_1¶
ssl_no_tlsv1_1 (Boolean)
Default value True
SSL TLS
ssl_no_tlsv1_2¶
ssl_no_tlsv1_2 (Boolean)
Default value False
SSL TLS
ssl_no_tlsv1_3¶
ssl_no_tlsv1_3 (Boolean)
Default value False
SSL TLS
ssl_client_verify_mode¶
ssl_client_verify_mode (String)
Default value 'CERT_NONE'
https 설정
클라이언트 검증 모드를 설정합니다.
- CERT_NONE: 클라이언트는 인증서를 제공할 필요가 없으며 제공하는 경우
모든 검증 오류는 무시됩니다.
- CERT_OPTIONAL: 클라이언트는 인증서를 제공할 필요가 없으며 제공하는 경우
인증서는 설정된 CA 체인에 대해 검증됩니다.
- CERT_REQUIRED: 클라이언트는 인증서를 제공해야 하며 인증서는
검증됩니다. 〈ssl_client_key_file〉 및 〈ssl_client_crt_file〉 을 설정해야 합니다. 이 모드를 선택하면 Driverless가 자체 콜백 요청을 검증할 수 있습니다.
ssl_ca_file¶
ssl_ca_file (String)
Default value ''
https 설정
인증 기관 인증서 파일의 경로. 이 인증서는 클라이언트 인증이 켜져 있는 경우 클라이언트 인증서를 검증할 때 사용됩니다.
설정하지 않으면 기본 시스템 인증서를 사용하여 클라이언트를 검증합니다.
ssl_client_key_file¶
ssl_client_key_file (String)
Default value ''
https 설정
CERT_REQUIRED 모드가 설정된 경우 Driverless가 자신을 인증하는 데 사용할 개인 키의 경로입니다.
ssl_client_crt_file¶
ssl_client_crt_file (String)
Default value ''
https 설정
CERT_REQUIRED 모드가 설정된 경우 Driverless가 자신을 인증하는 데 사용할 클라이언트 인증서의 경로입니다.
enable_xsrf_protection¶
Enable XSRF Webserver protection (Boolean)
Default value True
활성화된 경우 웹 서버는 xsrf 쿠키를 제공하고 모든 POST 요청 시 쿠키의 유효성을 검증합니다.
enable_secure_cookies¶
Enable secure flag on HTTP cookies (Boolean)
Default value False
verify_session_ip¶
When enabled, webserver verifies session and request IP address (Boolean)
Default value False
활성화되면 세션 초기자의 IP 주소와 현재 요청 IP를 비교하여 인증된 각 액세스가 검증됩니다.
custom_recipe_security_analysis_enabled¶
custom_recipe_security_analysis_enabled (Boolean)
Default value False
사용자 정의 레시피에서 금지된/위험한 구성에 대한 자동 감지 활성화
custom_recipe_import_allowlist¶
custom_recipe_import_allowlist (List)
Default value []
사용자 정의 레시피로 가져올 수 있는 모듈 목록. 기본 빈 목록은 금지된 모듈을 제외한 모든 모듈이 허용됨을 의미합니다.
custom_recipe_import_banlist¶
custom_recipe_import_banlist (List)
Default value ['shlex', 'plumbum', 'pexpect', 'envoy', 'commands', 'fabric', 'subprocess', 'os.system', 'system']
사용자 정의 레시피로 가져올 수 없는 모듈 목록
custom_recipe_method_call_allowlist¶
custom_recipe_method_call_allowlist (List)
Default value []
- 사용자 정의 레시피에 허용되는 호출의 정규식 패턴 목록입니다.
빈 목록은 금지 목록을 제외한 모든 항목이 허용됨을 의미합니다. 예를 들어 os.path.* 만 허용 목록에 있는 경우 사용자 정의 레시피는 os.path 모듈의 메서드 및 내장된 메서드만 호출할 수 있습니다.
custom_recipe_method_call_banlist¶
custom_recipe_method_call_banlist (List)
Default value ['os\\.system', 'socket\\..*', 'subprocess.*', 'os.spawn.*']
- 사용자 정의 레시피에서 거부되어야 하는 호출의 정규식 패턴 목록입니다.
예를 들어 금지 목록에 os.system 이 있는 경우 사용자 정의 레시피는 os.system() 을 호출할 수 없습니다. 금지 목록에 socket.* 이 있으면 레시피는 socket.socket() 또는 socket.a.b.c() 와 같은 소켓 모듈의 메서드를 호출할 수 없습니다.
custom_recipe_dangerous_patterns¶
custom_recipe_dangerous_patterns (List)
Default value ['rm -rf', 'rm -fr']
- 위험한 시퀀스/구성을 나타내는 정규식 패턴 목록
전체 시스템에 해로울 수 있으며 코드에서 금지되어야 합니다.
allow_concurrent_sessions¶
Enable concurrent session for same user (Boolean)
Default value True
활성화된 경우 사용자는 2개의 브라우저(스크립트)에서 동시에 로그인할 수 있습니다.
extra_http_headers¶
extra_http_headers (Dict)
Default value {}
추가 HTTP 헤더.
enable_imputation¶
대체를 활성화하면 EXPT 설정 GUI에 새로운 선택기가 추가되고 트랜스포머 **(Boolean) 에서 대체 기능이 트리거됩니다.
Default value
False열 대체 활성화
h2o_storage_address¶
h2o_storage_address (String)
Default value ''
H2O 스토리지 엔드포인트의 주소. 로컬 스토리지만 사용하려면 비워 둡니다.
h2o_storage_projects_enabled¶
h2o_storage_projects_enabled (Boolean)
Default value False
로컬 프로젝트 대신 H2O 스토리지에 저장된 원격 프로젝트를 사용할지 여부.
h2o_storage_tls_enabled¶
h2o_storage_tls_enabled (Boolean)
Default value True
스토리지에 대한 채널을 암호화해야 하는지 여부.
h2o_storage_tls_ca_path¶
h2o_storage_tls_ca_path (String)
Default value ''
H2O 스토리지 서버 ID를 확인할 인증 기관 인증서의 경로.
h2o_storage_tls_cert_path¶
h2o_storage_tls_cert_path (String)
Default value ''
H2O 스토리지 서버 인증을 위한 클라이언트 인증서 경로
h2o_storage_tls_key_path¶
h2o_storage_tls_key_path (String)
Default value ''
H2O 스토리지 서버 인증을 위한 클라이언트 키 경로
h2o_storage_internal_default_project_id¶
h2o_storage_internal_default_project_id (String)
Default value ''
원격 HOME 폴더 대신 사용할 스토리지 프로젝트의 UUID.
h2o_storage_rpc_deadline_seconds¶
h2o_storage_rpc_deadline_seconds (Number)
Default value 60
H2O 스토리지를 사용한 RPC 호출 마감 시간(초). 취소되기까지 RPC 호출 완료를 Driverless가 대기하는 최대 시간(초)을 설정합니다.
h2o_storage_rpc_bytestream_deadline_seconds¶
h2o_storage_rpc_bytestream_deadline_seconds (Number)
Default value 7200
H2O 스토리지를 사용한 RPC bytestrteam 호출 마감 시간(초). 취소되기까지 RPC 호출 완료를 Driverless가 대기하는 최대 시간(초)을 설정합니다. 이 값은 아티팩트 업로드 및 다운로드에 사용됩니다.
h2o_storage_oauth2_scopes¶
h2o_storage_oauth2_scopes (String)
Default value ''
스토리지 클라이언트는 사용자 로그인 시 수신된 새로 고침 토큰에서 파생된 자체 액세스 토큰을 관리합니다. 이 옵션이 설정되면 여기에 정의된 범위가 있는 액세스 토큰이 요청됩니다. (공백으로 구분된 목록)
h2o_storage_message_size_limit¶
h2o_storage_message_size_limit (Number)
Default value 1048576000
RPC 요청의 최대 메시지 크기(바이트)입니다. 이 제한보다 큰 요청은 실패합니다.
keystore_file¶
keystore_file (String)
Default value ''
Keystore file that contains secure config.toml items like passwords, secret keys etc. Keystore is managed by h2oai.keystore tool.
log_level¶
log_level (Number)
Default value 1
- 로깅 수준
0: 적게 (CRITICAL, ERROR, WARNING) 1: 기본 (CRITICAL, ERROR, WARNING, INFO, DATA) 2: 많게 (CRITICAL, ERROR, WARNING, INFO, DATA, DEBUG) 서버 및 모든 실험에 영향을 줍니다.
collect_server_logs_in_experiment_logs¶
collect_server_logs_in_experiment_logs (Boolean)
Default value False
관련 서버 로그 수집 여부(h2oai_server.log, systemctl 또는 docker의 dai.log, h2o 로그) H2O.ai에 로그를 보낼 때 유용
per_user_directories¶
per_user_directories (Boolean)
Default value True
모든 사용자 콘텐츠를 각 사용자의 디렉터리로 격리할지 여부. False로 설정하면 모든 사용자 콘텐츠가 단일 디렉터리에 공통이고 레시피가 공유되며 재시작/재조정을 위한 brain 폴더가 공유됩니다. True로 설정하면 각 사용자는 모든 사용자 태스크에 대해 별도의 폴더를 가지며 레시피는 각 사용자에게 격리되며 재시작/재구성을 위한 brain 폴더는 특정 사용자만 사용할 수 있습니다. False에서 True로 또는 다시 False로의 마이그레이션은 GUI 또는 python 클라이언트나 모든 레서피와, 동일한 설정, 재시작, 재조정으로 시험을 시작하여 액세스할 수 있는 모든 실험 컨텐츠에 허용됩니다. 그러나 사용자별 모드로 전환하면 더 이상 공통 brain 폴더가 사용되지 않습니다.
data_import_ignore_file_names¶
data_import_ignore_file_names (List)
Default value ['_SUCCESS']
데이터 세트 가져오기 중 무시할 파일 이름 목록. 위에 나열된 이름의 파일은 DAI가 데이터 세트를 생성할 때 건너뜁니다. 예: 디렉터리에 3개의 파일이 있습니다: [data_1.csv, data_2.csv, _SUCCESS] DAI는 data_1.csv 및 data_2.csv 파일을 사용하여 데이터 세트 생성만을 시도하며 _SUCCESS 파일은 무시됩니다. 기본값을 사용하면 Hadoop에서 데이터를 내보낼 때 일반적으로 생성되는 _SUCCESS 파일이 무시됩니다.
data_import_explode_list_type_columns_in_parquet¶
data_import_explode_list_type_columns_in_parquet (Boolean)
Default value False
true로 설정하면 parquet 파일을 가져올 때 목록 데이터 유형으로 열을 분해합니다.
files_without_extensions_expected_types¶
files_without_extensions_expected_types (List)
Default value ['parquet', 'orc']
파일 이름에 파일 확장자가 없는 경우 Driverless AI가 데이터 가져오기를 시도해야 하는 파일 형식 목록. 파일 확장자가 제공되지 않으면 Driverless AI는 정의된 목록의 첫 번째 유형부터 시작하여 데이터 가져오기를 시도합니다. 기본값 [《parquet》, 《orc》] 예: 〈test.csv〉 (파일 확장자 있음) 대 〈test〉 (파일 확장자 없음)
참고: 지원되는 파일 형식에 대한 자세한 내용은 supported_file_types 구성 옵션을 참조합니다.
do_not_log_list¶
do_not_log_list (List)
Default value ['cols_to_drop', 'cols_to_drop_sanitized', 'cols_to_group_by', 'cols_to_group_by_sanitized', 'cols_to_force_in', 'cols_to_force_in_sanitized', 'do_not_log_list', 'do_not_store_list', 'pytorch_nlp_pretrained_s3_access_key_id', 'pytorch_nlp_pretrained_s3_secret_access_key']
do_not_log_list : 여기에 로그에 기록하지 않으려는 구성을 추가합니다. 그러나 이 구성은 하위 실험이 일관되게 작동할 수 있도록 실험 정보에 계속 저장됩니다.
do_not_store_list¶
do_not_store_list (List)
Default value ['artifacts_git_password', 'auth_jwt_secret', 'auth_openid_client_id', 'auth_openid_client_secret', 'auth_openid_userinfo_auth_key', 'auth_openid_userinfo_auth_value', 'auth_openid_userinfo_username_key', 'auth_tls_ldap_bind_password', 'aws_access_key_id', 'aws_secret_access_key', 'azure_blob_account_key', 'azure_blob_account_name', 'azure_connection_string', 'deployment_aws_access_key_id', 'deployment_aws_secret_access_key', 'gcs_path_to_service_account_json', 'kaggle_key', 'kaggle_username', 'kdb_password', 'kdb_user', 'ldap_bind_password', 'ldap_search_password', 'local_htpasswd_file', 'main_server_minio_access_key_id', 'main_server_minio_secret_access_key', 'main_server_redis_password', 'minio_access_key_id', 'minio_endpoint_url', 'minio_secret_access_key', 'snowflake_account', 'snowflake_password', 'snowflake_url', 'snowflake_user', 'custom_recipe_security_analysis_enabled', 'custom_recipe_import_allowlist', 'custom_recipe_import_banlist', 'custom_recipe_method_call_allowlist', 'custom_recipe_method_call_banlist', 'custom_recipe_dangerous_patterns', 'azure_ad_client_secret', 'azure_blob_keycloak_aad_client_secret', 'artifacts_azure_blob_account_name', 'artifacts_azure_blob_account_key', 'artifacts_azure_connection_string', 'tensorflow_nlp_pretrained_s3_access_key_id', 'tensorflow_nlp_pretrained_s3_secret_access_key']
do_not_store_list : 여기에 전혀 저장하지 않으려는 구성을 추가합니다. 실험에서는 저장되지 않으므로 사용자가 제어할 수 있는 데이터 과학 관련 항목에는 적용되지 않습니다. 이러한 항목은 자동으로 기록되지 않습니다.
datatable_separator¶
datatable_separator (String)
Default value ''
CSV와 같은 테이블 형식 텍스트 파일을 구문 분석할 때 사용할 구분 기호/구분자입니다. 비어 있으면 자동입니다. 시스템 시동 시 제공되어야 합니다.
ping_load_data_file¶
Whether to enable ping of system status during DAI data ingestion. (Boolean)
Default value False
DAI 데이터 수집 중 시스템 상태에 대한 ping을 활성화할지 여부.
ping_sleep_period¶
ping_sleep_period (Float)
Default value 0.1
DAI 상태 확인 간의 기간. ping 프로세스를 중지하는 상위의 속도를 늦추지 않도록 충분히 작아야 합니다.
data_precision¶
data_precision (String)
Default value 'float32'
데이터 저장 정밀도. 〈datatable’은 원래 데이터 테이블 저장 유형(예: bool, int, float32, float64)을 유지합니다(실험적) 〈float32〉 는 속도에 가장 적합. 〈float64〉 는 정확도 또는 매우 큰 입력 값에 가장 적합. 《datatable》 은 메모리에 가장 적합. 〈float32〉 는 상대 오차가 약 1E-7인 약 +-3E38까지의 숫자 허용. 〈float64〉 는 상대 오차가 약 1E-16인 약 +-1E308까지의 숫자 허용. GLM 표준화와 같은 일부 계산의 경우 데이터 값에 대해 이러한 최대값의 sqrt()까지만 처리할 수 있으므로 따라서 32비트 정밀도의 GLM은 표준화가 inf 값을 생성하기 전에 최대 약 1E19 값만 처리할 수 있습니다. 《최우수 개체의 점수가 잘못되었습니다》 가 표시되면 더 높은 정밀도가 필요할 수 있습니다.
transformer_precision¶
transformer_precision (String)
Default value 'float32'
대부분의 데이터 트랜스포머의 정밀도(data_precision과 동일한 옵션 및 참고). 오류가 누적될 수 있는 작업이 많은 트랜스포머에서 더 높은 정밀도에 유용합니다. 또한 트랜스포머의 더 빠른 성능을 원하지만 데이터를 고정밀로 저장하려는 경우에도 유용합니다.
ulimit_up_to_hard_limit¶
ulimit_up_to_hard_limit (Boolean)
Default value True
ulimit 소프트 제한을 하드 제한까지 변경할지 여부(일반 사용자 앱이 아닌 DAI 서버 앱의 경우). 경우에 따라 리소스 제한 문제를 방지합니다. 해당 리소스에 대해 limit_nofile 및 limit_nproc 이하로 제한됩니다.
disable_core_files¶
Whether to disable core files if debug_log=true. If debug_log=false, core file creation is always disabled. (Boolean)
Default value False
limit_nofile¶
limit_nofile (Number)
Default value 65535
파일 제한 수. 다음은 start-dai.sh와 일치해야 합니다.
limit_nproc¶
limit_nproc (Number)
Default value 16384
스레드 수 제한. 다음은 start-dai.sh와 일치해야 합니다.
produce_correlation_heatmap¶
produce_correlation_heatmap (Boolean)
Default value False
상관 heatmap을 디스크에 덤프할지 여부
high_correlation_value_to_report¶
Threshold for reporting high correlation (Float)
Default value 0.95
원래 특징 간의 높은 상관 관계를 보고하는 값
restart_experiments_after_shutdown¶
restart_experiments_after_shutdown (Boolean)
Default value False
If True, experiments aborted by server restart will automatically restart and continue upon user login
datatable_bom_csv¶
datatable_bom_csv (Boolean)
Default value False
CSV 파일을 작성할 때 바이트 순서 표시(BOM)를 포함합니다. Excel의 UTF-8 인코딩을 지원하는 데 필요합니다.
return_before_final_model¶
return_before_final_model (Boolean)
Default value False
check_invalid_config_toml_keys¶
check_invalid_config_toml_keys (Boolean)
Default value True
config.toml 키가 유효한지 확인하고 유효하지 않으면 실패할지 여부
predict_safe_trials¶
predict_safe_trials (Number)
Default value 2
fit_safe_trials¶
fit_safe_trials (Number)
Default value 2
enable_preview_time_estimate¶
enable_preview_time_estimate (Boolean)
Default value True
enable_preview_mojo_size_estimate¶
enable_preview_mojo_size_estimate (Boolean)
Default value True
enable_preview_time_estimate_rough¶
enable_preview_time_estimate_rough (Boolean)
Default value False
allow_no_pid_host¶
Whether to allow no –pid=host setting. Some GPU info from within docker will not be correct. (Boolean)
Default value True
per_transformer_segfault_protection_ga¶
Whether to have per-transformer segfault protection when munging data into transformed features during tuning and evolution. Can lead to significant slowdown for cases when large data but data is sampled, leaving large objects in parent fork, leading to slow fork time for each transformer. (Boolean)
Default value False
per_transformer_segfault_protection_final¶
Whether to have per-transformer segfault protection when munging data into transformed features during final model fitting and scoring. Can lead to significant slowdown for cases when large data but data is sampled, leaving large objects in parent fork, leading to slow fork time for each transformer. (Boolean)
Default value False
submit_resource_wait_period¶
submit_resource_wait_period (Number)
Default value 10
제출을 중단해야 하는지 확인하기 위해 리소스(디스크, 메모리, CPU)를 확인하는 빈도.
stall_subprocess_submission_cpu_threshold_pct¶
stall_subprocess_submission_cpu_threshold_pct (Number)
Default value 100
시스템 CPU 사용량이 이 임계값(%)보다 높으면 하위 프로세스 제출을 중단합니다(비활성화하려면 100으로 설정). 활성화된 경우 합리적인 숫자는 90.0입니다.
stall_subprocess_submission_dai_fork_threshold_pct¶
stall_subprocess_submission_dai_fork_threshold_pct (Float)
Default value -1.0
단위 ulimit nproc 소프트 제한당 DAI 포크 수(모든 실험에서)가 이 임계값(%)(비활성화하려면 -1, 최소 포크의 경우 0으로 설정)보다 높은 경우 하위 프로세스의 제출을 제한/중단합니다. 활성화된 경우 합리적인 숫자는 90.0입니다.
stall_subprocess_submission_experiment_fork_threshold_pct¶
stall_subprocess_submission_experiment_fork_threshold_pct (Float)
Default value -1.0
단위 ulimit nproc 소프트 제한당 실험 포크 수(모든 실험에서)가 이 임계값(%)(비활성화하려면 -1, 최소 포크의 경우 0)보다 높은 경우 하위 프로세스의 제출을 제한/중단합니다. 활성화된 경우 합리적인 숫자는 90.0입니다. 작은 데이터의 경우 검사로 인해 제출된 태스크당 약 0.1초의 오버헤드가 발생하므로 채점의 경우 테스트 속도가 느려질 수 있습니다.
restrict_initpool_by_memory¶
restrict_initpool_by_memory (Boolean)
Default value True
사용 가능한 풀 작업자 수를 줄여 풀 작업자를 사용하지 않더라도 제한할지 여부. 실험이 정말 많으면 좋지만 그렇지 않으면 모든 풀 작업자를 준비하고 태스크 제출만 중단시켜 다중 실험 환경에 동적으로 만들 수 있는 것이 가장 좋습니다.
scoring_data_directory¶
scoring_data_directory (String)
Default value 'tmp'
실행 경로를 기준으로 디렉터리 경로를 스코어링하는 데 사용할 경로
num_models_for_resume_graph¶
num_models_for_resume_graph (Number)
Default value 1000
last_exclusive_mode¶
last_exclusive_mode (String)
Default value ''
전용 모드가 변경된 경우 메모리를 허용하는 내부 도우미
mojo_acceptance_test_errors_fatal¶
mojo_acceptance_test_errors_fatal (Boolean)
Default value True
mojo_acceptance_test_errors_shap_fatal¶
mojo_acceptance_test_errors_shap_fatal (Boolean)
Default value True
mojo_acceptance_test_orig_shap¶
mojo_acceptance_test_orig_shap (Boolean)
Default value True
enable_single_instance_db_access¶
enable_single_instance_db_access (Boolean)
Default value True
true로 설정하면 현재 인스턴스만 데이터베이스에 액세스할 수 있습니다.
enable_pytorch_nlp¶
enable_pytorch_nlp (String)
Default value 'auto'
더 이상 사용되지 않음 - 1.10.2+에서 enable_pytorch_nlp_transformer 및 enable_pytorch_nlp_model에 매핑됨
user_config_directory¶
user_config_directory (String)
Default value ''
모든 *.toml 파일은 이 디렉터리에서 읽고 기본 구성 파일과 동일한 방식으로 처리합니다.
procsy_ip¶
procsy_ip (String)
Default value '127.0.0.1'
procsy 프로세스의 IP 주소 및 포트.
procsy_port¶
procsy_port (Number)
Default value 12347
procsy 프로세스의 IP 주소 및 포트.
h2o_ip¶
h2o_ip (String)
Default value '127.0.0.1'
MLI에서 사용할 IP 주소.
h2o_port¶
h2o_port (Number)
Default value 12348
MLI에서 사용할 H2O 인스턴스의 포트. 각 H2O 노드에는 내부 노드 간 통신을 위한 내부 포트(웹 포트+1, 기본적으로 포트 12349)가 있습니다.
ip¶
ip (String)
Default value '127.0.0.1'
Driverless AI HTTP 서버의 IP 주소 및 포트.
port¶
port (Number)
Default value 12345
Driverless AI HTTP 서버의 IP 주소 및 포트.
port_range¶
port_range (List)
Default value []
검색할 포트 범위를 나타내는 두 개의 정수로 구성된 목록으로, 바인딩할 열린 포트를 동적으로 찾습니다(예: [11111,20000]).
strict_version_check¶
strict_version_check (Boolean)
Default value True
DAI에 대한 엄격한 버전 확인
max_file_upload_size¶
max_file_upload_size (Number)
Default value 104857600000
파일 업로드 제한(기본 100GB)
data_directory¶
data_directory (String)
Default value './tmp'
- 데이터 디렉터리. 모든 애플리케이션 데이터 및 파일 관련 데이터세트 및
실험은 이 디렉터리에 저장됩니다.
data_connectors_logs_directory¶
data_connectors_logs_directory (String)
Default value './tmp'
HDFS, Hive, JDBC 및 KDB+ 데이터 커넥터의 로그가 저장될 디렉터리 경로.
mapr_tickets_directory¶
mapr_tickets_directory (String)
Default value './tmp/mapr-tickets'
MapR 다중 사용자 모드가 활성화된 경우 MapR 티켓을 저장하는 데 사용할 디렉터리 경로. enable_mapr_multi_user_mode가 true로 설정된 경우에만 적용됩니다.
remove_temp_files_server_start¶
remove_temp_files_server_start (Boolean)
Default value False
전체 데이터 디렉터리에 대해 실행하고 모든 임시 파일을 제거할지 여부. 실험 수가 많은 경우(100개 이상) 시동 시간이 느려질 수 있습니다.
remove_temp_files_aborted_experiments¶
remove_temp_files_aborted_experiments (Boolean)
Default value True
실험이 중단/취소된 후 임시 파일을 삭제할지 여부.
usage_stats_opt_in¶
usage_stats_opt_in (Boolean)
Default value True
사용 통계 및 버그 보고에 대한 동의 여부
core_site_xml_path¶
core_site_xml_path (String)
Default value ''
HDFS 데이터 소스에 대한 구성. hdfs coresite.xml core_site_xml_path의 경로는 더 이상 사용되지 않습니다. hdfs_config_path를 사용합니다.
hdfs_config_path¶
hdfs_config_path (String)
Default value ''
(필수) HDFS 구성 폴더 경로. 여러 구성 파일을 포함할 수 있습니다.
key_tab_path¶
key_tab_path (String)
Default value ''
주체 키 탭 파일의 경로입니다. hdfs_auth_type=〉principal〉 일 때 필요합니다. key_tab_path는 더 이상 사용되지 않습니다. hdfs_keytab_path를 사용하십시오.
hdfs_keytab_path¶
hdfs_keytab_path (String)
Default value ''
주체 키 탭 파일의 경로입니다. hdfs auth_type=〉principal〉 일 때 필요합니다.
preview_cache_upon_server_exit¶
preview_cache_upon_server_exit (Boolean)
Default value True
서버 종료 시 미리보기 캐시를 삭제할지 여부
enable_health_api¶
Enable Health API (Boolean)
Default value True
활성화되면 서버는 시스템 개요 및 사용 통계를 제공하는 상태 API를 /apis/health/v1에 노출합니다.
listeners_inherit_env_variables¶
listeners_inherit_env_variables (Boolean)
Default value False
When enabled, the notification scripts will inherit the parent’s process (DriverlessAI) environment variables.
listeners_experiment_start¶
listeners_experiment_start (String)
Default value ''
알림 스크립트 - 이 변수는 실험 수명 주기의 주어진 이벤트에서 실행되는 스크립트의 위치를 가리킵니다. - 이 스크립트에는 실행 가능한 플래그가 활성화되어 있어야 합니다. - 절대 경로를 사용하는 것이 좋습니다.
실험 시작 알림 스크립트 위치
listeners_experiment_done¶
listeners_experiment_done (String)
Default value ''
실험 완료 알림 스크립트 위치
listeners_mojo_done¶
listeners_mojo_done (String)
Default value ''
실험용 MOJO 파이프라인 구축이 완료되면 알림 스크립트가 트리거됩니다. 값은 실행 가능한 스크립트의 절대 경로여야 합니다.
listeners_autodoc_done¶
listeners_autodoc_done (String)
Default value ''
실험용 AutoDoc의 렌더링이 완료되면 알림 스크립트가 트리거됩니다. 값은 실행 가능한 스크립트의 절대 경로여야 합니다.
listeners_scoring_pipeline_done¶
listeners_scoring_pipeline_done (String)
Default value ''
실험용 Python Scoring Pipeline 구축이 완료되면 알림 스크립트가 트리거됩니다. 값은 실행 가능한 스크립트의 절대 경로여야 합니다.
listeners_experiment_artifacts_done¶
listeners_experiment_artifacts_done (String)
Default value ''
실험과, 실험 시작 시 선택한 모든 아티팩트를 구축하면 알림 스크립트가 트리거됩니다. 값은 실행 가능한 스크립트의 절대 경로여야 합니다.
enable_quick_benchmark¶
enable_quick_benchmark (Boolean)
Default value True
애플리케이션 시작 시 빠른 성능 벤치마크를 실행할지 여부
enable_extended_benchmark¶
enable_extended_benchmark (Boolean)
Default value False
애플리케이션 시작 시 확장된 성능 벤치마크를 실행할지 여부
extended_benchmark_scale_num_rows¶
extended_benchmark_scale_num_rows (Float)
Default value 0.1
확장된 성능 벤치마크의 행 수에 대한 스케일링 요소. 엄격한 성능 벤치마킹의 경우 1 이상의 값이 권장됩니다.
extended_benchmark_num_cols¶
extended_benchmark_num_cols (Number)
Default value 20
확장된 성능 벤치마크의 열 수.
benchmark_memory_timeout¶
benchmark_memory_timeout (Number)
Default value 2
numpy 프레임을 생성하여 메모리 대역폭을 테스트할 수 있는 시간(초)
benchmark_memory_vm_fraction¶
benchmark_memory_vm_fraction (Float)
Default value 0.25
numpy 메모리 벤치마크에 사용할 VM 총계의 최대 부분
benchmark_memory_max_cols¶
benchmark_memory_max_cols (Number)
Default value 1500
numpy 메모리 벤치마크에 사용할 최대 열 수
enable_startup_checks¶
enable_startup_checks (Boolean)
Default value True
애플리케이션 시작 시 빠른 시작 검사를 실행할지 여부
application_id¶
application_id (String)
Default value ''
인스턴스를 고유하게 식별해야 하는 애플리케이션 ID 재정의
audit_log_retention_period¶
audit_log_retention_period (Number)
Default value 5
감사 로그 레코드 제거 이후 기간. 이전 레코드 제거를 비활성화하려면 0으로 설정합니다.