数据分析师在生产中部署ML模型的重要性
来源:CPDA数据分析师网 / 时间:2020-04-20
怎样做到一键部署到生产
1、只需单击几下,即可让分析师和数据科学家将模型部署到生产中。
2、数据清理,充实,预处理以及模型捆绑在一起,以简化计分流程。
3、对已部署的模型进行版本控制,使用户可以随时部署新版本,比较它们并回滚。
可扩展性和高可用性
1、通过排队,并行和负载平衡处理大量实时预测。
2、运行多个计分节点以实现完全高可用性。
3、自动弹性缩放以处理意外的流量激增。
使用Kubernetes在云上部署
1、在本地或云中部署您的API。
2、Kubernetes的完全本地集成,可实现弹性和可复制的部署。
3、全面的GPU支持,用于深度学习模型。
适用于您的应用程序的强大API引擎
1、部署为API:可视模型,自定义Python或R模型,自定义Python或R函数或SQL查询。
2、易于使用的REST API。嵌入几行代码。
3、自动生成即用型代码样本。
通过反馈回路避免模型漂移
1、同时运行同一模型的多个版本以进行自动A / B测试。
2、监视数据随时间的变化。
3、随时访问日志查询和预测的历史记录,以检查模型性能是否随时间变化。
视觉机器学习与建模可以轻松地利用机器学习技术并获得有关模型性能的即时视觉和统计反馈。
1、自动化机器学习
2、自动特征工程,生成和选择,以在模型中使用任何类型的数据。
3、使用各种交叉验证策略来优化模型超参数。
4、比较来自Dataiku界面的数十种算法,既可以执行有监督的任务,也可以进行无监督的任务。
5、从模型中获得即时的直观见解(变量重要性,功能交互或参数),并通过详细的指标评估模型的性能。
触手可及的深度学习
1、定义模型架构并个性化训练设置。
2、支持Keras,Tensorflow后端,与Tensorboard集成以及使用GPU缩放模型训练。
3、自动处理图像,包括特征提取。
4、直接从Dataiku界面使用预训练的模型
使用可视UI或代码来利用的ML技术
1、Dataiku中的视觉机器学习利用了的机器学习库:Scikit-Learn,MLlib和XGboost。
2、使用Python或R创建,训练和部署高级自定义ML模型。
3、集成可通过代码API访问的任何外部机器学习库。
全面准备生产建立并评估模型后
1、立即将其用于数据工作流中的批处理评分。
2、将其部署为实时预测服务(REST API)。
3、管理您的模型生命周期:只需单击一下,即可部署新版本,重新培训先前版本并回滚到任何安全版本。
4、通过反馈回路控制模型的性能。