数据分析师

手机号

验证码

30天自动登录

数据分析师

如何在边缘计算和人工智能时代为您的数据科学家赋能?

来源:CPDA数据分析师网 / 时间:2021-07-08

数据科学家的效率如何?他们实际感受到的权力有多大?
这是一个相关的问题,在如此多的数据未被充分利用的时候提出,企业是否知道他们需要更好地利用他们的数据,在没有完全了解如何地部署人才的情况下雇佣数据科学家?也许更好的看待它的方法是询问企业是否知道如何更好地利用他们的数据——他们是在招聘数据科学家并期望他们创造奇迹,还是企业确保他们不仅拥有合适的人才,而且他们正在为这些团队提供正确的数据?

垃圾进垃圾出
许多人可能认为找到正确的数据是数据科学家的工作,但他们错了终数据科学家只能使用他们得到的东西,就像销售人员只能用劣质产品做这么多事情,或者一级方程式赛车手只能用一辆普通汽车做这么多事情一样,那么什么是正确的数据?显然,这因企业而异,但从根本上讲,无论组织需求如何,良好的数据都会遵循许多原则,首先它需要新鲜——这意味着它需要反映当时的真实世界,一切都变化如此之快,以至于很多数据很快变得无关紧要,它越是停滞不前,它的价值就越小。

如果数据科学家在有更多信息可用时处理旧数据
他们可以提取的见解与业务运营环境的相关性将降低,其次它需要是实时数据——所以它需要来自现实世界,而不是训练数据,也不是编造的,为什么?因为现实世界是混乱的,会抛出任何人都不会想到的异常现象,从而造成模型和数据科学家针对经过消毒的训练数据提出的无法处理的障碍,换句话说——如果一个企业为其数据科学家和他们的模型提供过时的离线数据,那么企业所能期望的的结果就是无关紧要的、有限的洞察力。

为什么边缘是数据科学家的下一个前沿
这意味着企业需要找到一种方法,不断地为他们的数据科学家提供来自现实世界的实时、进化的数据。他们是怎么做到的?通过边缘计算,边缘计算无需介绍——随着过去几年物联网设备的爆炸式增长,越来越多的数据处理发生在网络边缘,从风力涡轮机和拖拉机到冰箱和路灯的所有传感器都在不断地捕获数据,它是真实的,它是实时的,它是混乱的,而这正是数据科学家需要研究的。

企业需要通过从边缘为他们提供训练数据和性能指标来增强他们的数据科学家的能力
然后他们可以使用它来通知他们的 AI 模型,然后将其部署到边缘设备上,这些真实世界的环境为数据科学家提供了关于他们的模型如何抵御实验室或测试环境中无法重现的异常和变化的重要信息,至少在初阶段,这些模型可能表现不佳——这是一件好事,因为它为数据科学家提供了一些可以挖掘的东西,以了解他们没有想到的事情,也就是说,无论模型表现好坏,都需要对数据进行访问、清理、注释并终反馈到模型中进行持续训练,这是一个需要持续运行的反馈循环,以便系统能够改进和适应。但它必须是对数据的智能提取——没有系统可以管理传感器收集的所有数据,因此有一种方法可以识别并从边缘获取重要的数据是至关重要的。

数据科学家需要能够重新部署传感器和机器来调查

重新成像和分析混淆 AI 模型的数据源。无论以何种方式收集数据,无论该过程如何自动化,在某些时候都会受到人类思维、假设和假设的影响,这些可能基于当时可用的数据和证据,但这可能不再适合获取所需的数据,在这里能够改变正在收集的数据对于数据科学家保持有效、处理相关的信息至关重要。


免费客服热线:400-050-6600

商业联合会数据分析专业委员会



返回列表