自动特征工程

Driverless AI 会执行自动特征工程,并将其作为实验模型构建进程的一部分。通过在数据集各列上进行 transformations 和/或 interactions 以创建新特征。特征的创建和选择本质上是不断演变的(基于之前迭代中的变量重要性),并使用 遗传算法 为实验/数据集找到最佳特征转换和模型参数。

可从实验的 AutoDoc 报告中获取实验创建(应用转换)和使用的特征的详细信息。

可从实验专家面板的 Features Settings 中控制特征工程工作量和演变。

Features Settings

除了 Driverless AI 内置以外的转换器,用户还可上传 自定义转换器 。可从 Driverless AI 开源 custom recipes 中获取某些开源的自定义转换器。

可从实验专家面板的“插件”选项卡中控制要包括哪些转换器。

Include Transformer

Preprocessing transformers 可用于控制输入至不断演变的转换器层的特征。

用户可在已完成实验的 模型操作 中点击 Transform Dataset ,以获取带有(已处理过的)特征的数据集。这将提供实验最佳个体模型的管道。

Transform dataset