Mli_nlp 구성

mli_nlp_top_n

mli_nlp_sample_limit

mli_nlp_min_df

mli_nlp_max_df

mli_nlp_min_ngram

mli_nlp_max_ngram

mli_nlp_min_token_mode

《top》은 N개의 상위 토큰을 선택합니다. 《bottom》 은 N개의 하위 토큰을 선택합니다. 《top-bottom》 은 math.floor(N/2) 상위 및 math.ceil(N/2) 하위 토큰을 선택합니다. 《linspace》 는 간격이 균등한 N개의 토큰을 선택합니다.** (문자열)

Default value 'top'

MLI NLP에 대해 N개의 토큰을 선택하는 데 사용되는 모드. 《top》 은 N개의 상위 토큰을 선택합니다. 《bottom》 은 N개의 하위 토큰을 선택합니다. 《top-bottom》 은 math.floor(N/2) 상위 및 math.ceil(N/2) 하위 토큰을 선택합니다. 《linspace》 는 간격이 균등한 N개의 토큰을 선택합니다.

mli_nlp_tokenizer_max_features

mli_nlp_loco_max_features

mli_nlp_surrogate_tokenizer

mli_nlp_surrogate_tokens

mli_nlp_use_stop_words

mli_nlp_stop_words

mli_nlp_append_to_english_stop_words