数据分析师

手机号

验证码

30天自动登录

数据分析师

怎样能够保证您的大数据是否完整?

来源:CPDA数据分析师网 / 时间:2020-06-22

尽管像这样的例子比比皆是,但内部数据仅占信息图的一半

当内部大数据洞察力与外部数据集结合使用时,收益将成倍增加,考虑一下快餐连锁店的一个简单但非常成功的例子,该快餐店“训练”了其驾车式摄像机,以根据行长(外部数据点)确定要在数字菜单板上显示的项目,当行较长时菜单将包含可以快速提供的产品,当行较短时,菜单将显示需要较长时间准备的利润较高的项目,另一方面是洗手液制造商的示例,尽管进行了广泛的计划和预测,但由于未能根据实时的区域流感暴发来识别和调整分销(其他外部数据点)。

 

这些示例强调了外部数据对于全面的“感知和响应”战略的重要性(对于快餐链而言,如果能够吸引客户,世界上所有有助于他们创建吸引力的菜单的数据分析都将毫无用处,漫长的等待而离开或不满),但是从历史上看,企业一直更加关注公司内部数据,并且我们发现大多数公司内部和外部数据之间存在着持续的,严重的不平等现象,以下是阻止公司将两个数据集结合在一起并获得全面,可操作的图景的主要障碍:

 

成本–内部数据对于企业来说是免费的,因为企业不需要自己付费就可以使用它,因为它们是自己生产的,并且可以让所有员工使用

外部数据通常会带来成本和限制。彭博终端很昂贵,公司中只有很少的人可以使用它们,许多企业确实意识到访问相关和的外部行业数据的重要性,并为此付出了高昂的代价,但是没有工具可以使这种访问民主化,相反有许多可用于分析内部数据的开源免费工具。

 

工具–许多外部数据发布者提供了过时且不友好的工具来访问其数据,这使其难以访问和使用

行业急需在分析工作中寻找,访问和包括外部数据的新方法,考虑到可用的海量数据,将所有相关数据移入企业的四面墙并不总是可行的,并且需要API支持内部数据的轻松快速传输和扩充,复杂性专为企业消费而设计的专有数据通常分布在数十个外部系统中,即使这些数据源在传统企业搜索引擎的范围内,搜索解决方案仍是面向文档的,并且对数据搜索或时间序列搜索(对按时间顺序编入索引,列出或以图形方式显示的一系列数据点通常不图表)(如果他们完全有此支持),典型的文档主要是文本,包含数千个单词,而典型的数据记录几乎没有可用的文本元数据,此外数十亿个时间序列表示的规模比设计用于处理传统文档的传统搜索解决方案高出几个数量级,这两个因素都带来了特殊的挑战,只有专业的数据优先搜索引擎才能应对,旨在融合所有这些数据的数据市场是一个开始,但是他们需要高度精确的,基于AI的搜索功能,这些功能是专门为发掘数据量身定制的。

 

重要的是在大数据时代仅使用内部数据已不再足够

用从外部数据中收集到的数据来补充内部数据洞察力的能力将成为所有类型企业的强大武器,要做到这一点就需要一定程度的外部数据民主化,这与我们在内部数据中更经常看到的情况类似,并且侧重于消除成本,工具和复杂性的障碍。

 

通过添加洞察力系统,您的企业可以在其他企业中脱颖而出,并开拓自己的主导地位。

 

 

 

返回列表