特征平台

A.

特征是什么?

What

特征平台是自动进行深度特征合成的平台,提供了丰富的特征加工算子,以及直观便捷的数据探索

从类别型到数值型,从变换算子到汇总算子,特征平台覆盖了数据访问特征工程、数据探索和数据管理四大功能,支撑高性能自动化的特征工程


B.

问题产生的背景?

Backdrop

大数据优于好算法,但好数据则优于大数据。(Peter Norvig)

特征决定了模型能达到的上限,但如何识别和发掘出有用的特征则常常依赖于建模人员的经验,由此造成了模型质量参差不齐

缺乏有效的特征加工工具和方法,也严重制约了数据分析的效率


C.

有哪些特色和创新点?

Innovation

全面的数据类型支持,包括从无序到有序的类别型变量,从新近度、频次到规模的数值型变量

全面的特征工程算子,包括各种Encoding编码、逻辑运算、字符串函数、日期和地理位置变换等变换算子也包括反映数据位置表征、离散程度和分布形状的汇总算子

数据集市分区,基础区、集市区和沙箱区分层隔离;


D.

能否带来真正业务价值?

Value

降低硬件和维护成本,存储成本降低为以前的1/4,支持的用户数是以前的两倍,维护工时缩短60工作日

规范化模型管理和提高建模效率,支撑模型数量提高6倍,宽表数据准备工作量降低为以前的1/4

加快分析建模的速度,从手工式特征工程所需的数周,缩短为短短几小时甚至数分钟


功能架构

Functional Architecture

立即体验,开启数字化转型之旅 !