Mli_nlp 구성¶
mli_nlp_top_n¶
Number of tokens used for MLI NLP explanations. -1 means all. (Number)
Default value 20
MLI NLP 설명에 사용된 토큰 수. -1은 모두를 의미합니다.
mli_nlp_sample_limit¶
Sample size for MLI NLP explainers (Number)
Default value 10000
MLI NLP 설명자가 사용하는 최대 레코드 수
mli_nlp_min_df¶
Minimum number of documents in which token has to appear. Integer mean absolute count, float means percentage. (Number)
Default value 3
토큰이 표시되어야 하는 최소 문서 수. 정수는 절대 수를 의미하고 부동 소수점은 백분율을 의미합니다.
mli_nlp_max_df¶
Maximum number of documents in which token has to appear. Integer mean absolute count, float means percentage. (Float)
Default value 0.9
토큰이 표시되어야 하는 최대 문서 수. 정수는 절대 수를 의미하고 부동 소수점은 백분율을 의미합니다.
mli_nlp_min_ngram¶
The minimum value in the ngram range. The tokenizer will generate all possible tokens in the (mli_nlp_min_ngram, mli_nlp_max_ngram) range. (Number)
Default value 1
ngram 범위의 최소값. 토크나이저는 (mli_nlp_min_ngram, mli_nlp_max_ngram) 범위에서 가능한 모든 토큰을 생성합니다.
mli_nlp_max_ngram¶
The maximum value in the ngram range. The tokenizer will generate all possible tokens in the (mli_nlp_min_ngram, mli_nlp_max_ngram) range. (Number)
Default value 1
ngram 범위의 최대값. 토크나이저는 (mli_nlp_min_ngram, mli_nlp_max_ngram) 범위에서 가능한 모든 토큰을 생성합니다.
mli_nlp_min_token_mode¶
**Mode used to choose N tokens for MLI NLP.
《top》은 N개의 상위 토큰을 선택합니다. 《bottom》 은 N개의 하위 토큰을 선택합니다. 《top-bottom》 은 math.floor(N/2) 상위 및 math.ceil(N/2) 하위 토큰을 선택합니다. 《linspace》 는 간격이 균등한 N개의 토큰을 선택합니다.** (문자열)
Default value
'top'MLI NLP에 대해 N개의 토큰을 선택하는 데 사용되는 모드. 《top》 은 N개의 상위 토큰을 선택합니다. 《bottom》 은 N개의 하위 토큰을 선택합니다. 《top-bottom》 은 math.floor(N/2) 상위 및 math.ceil(N/2) 하위 토큰을 선택합니다. 《linspace》 는 간격이 균등한 N개의 토큰을 선택합니다.
mli_nlp_tokenizer_max_features¶
The number of top tokens to be used as features when building token based feature importance. (Number)
Default value -1
토큰 기반 기능 중요도를 구축할 때 특징으로 사용할 상위 토큰 수.
mli_nlp_loco_max_features¶
The number of top tokens to be used as features when computing text LOCO. (Number)
Default value -1
텍스트 LOCO를 계산할 때 특징으로 사용할 상위 토큰 수.
mli_nlp_surrogate_tokenizer¶
Tokenizer for surrogate models. Only applies to NLP models. (String)
Default value 'Linear Model + TF-IDF'
대리 모델에 대한 데이터세트를 토큰화할 때 사용할 토크나이저 메서드입니다. 〈TF-IDF〉 또는 〈선형 모델 + TF-IDF〉 를 선택할 수 있으며 후자는 우선 TF-IDF를 실행하여 토큰을 얻은 다음 토큰과 대상 간의 선형 모델을 맞춰 선형 모델의 계수를 기반으로 하는 토큰의 중요도를 얻습니다. 기본값은 〈선형 모델 + TF-IDF〉 입니다. NLP 모델에만 적용됩니다.
mli_nlp_surrogate_tokens¶
The number of top tokens to be used as features when building surrogate models. Only applies to NLP models. (Number)
Default value 100
대리 모델을 구축할 때 특징으로 사용할 상위 토큰의 수. NLP 모델에만 적용됩니다.
mli_nlp_use_stop_words¶
Use stop words for MLI NLP. (Boolean)
Default value True
MLI NLP에 대해 불용어를 사용합니다.
mli_nlp_stop_words¶
List of words to filter out before generation of text tokens, which are passed to MLI NLP LOCO and surrogate models (if enabled). Default is 〈english〉. Pass in custom stop-words as a list, e.g., [〈great〉, 〈good〉] (String)
Default value 'english'
MLI NLP LOCO 및 대리 모델(활성화된 경우)에 전달되는 텍스트 토큰 생성 전에 필터링할 단어 목록입니다. 기본값은 〈english〉 입니다. 사용자 정의 불용어를 목록으로 전달합니다(예: [〈great〉, 〈good〉]).
mli_nlp_append_to_english_stop_words¶
Append passed in list of custom stop words to default 〈english〉 stop words (Boolean)
Default value False
기본 〈english〉 불용어에 사용자 정의 불용어 목록에 전달된 내용을 추가합니다.