数据分析师

手机号

验证码

30天自动登录

数据分析师

CPDA数据分析师学习之大数据和小数据的区别

来源: / 时间:2022-09-14

我们不能把大量的数据看成是小数据,这些数据随着时间的推移在数据大小上发生了变化,以至于无法在传统的数据处理程序(如Excel)中打开,或者在数据库中超过了存储它的服务器上的资源。这种误解在专家中很常见,他们认为应用现有的知识和方法可以分析更复杂、更大的数据集,之后会因为错误的决策导致突然的财务成本和糟糕的结果。在这种情况下,所谓的大数据和小数据之间的根本区别在下图中可以很好地看到,在y轴上显示了较小系统产生的数据量,在x轴上显示了较大类别系统产生的数据多样性和复杂性:

大数据和小数据的基本区别表现在:

要达到的目标的背景。小数据通常用于回答特定的业务问题。另一方面,大数据的设计目标是长期使用和时间灵活性。

位置上下文。小数据通常位于一个机构内,即在一个服务器上,有时仅在一个文件中。另一方面,大数据分散在多个互联网服务器上,跨多个机构。

结构和内容的上下文。小数据通常是结构化的,即它们来自一个学科或部门,这意味着它们的结构通常是统一的。而大数据是不结构化的,即数据来自多个来源,数据结构和格式多种多样。
准备数据的背景信息。当涉及到小数据时,在大多数情况下,用户准备自己的数据,他通常用于个人需求。对于大数据,数据来自多个来源和多个用户。

数据生命周期环境。小数据的生命周期通常缩短到项目本身的生命周期。对于大数据,数据的存储必须是长期的,因为它们的使用是多功能的,为了未来的研究,需要有以前的数据。

金融投资的背景。对于小数据,财务成本是有限的,用户可以相对较快地从数据丢失中恢复。在应用大数据概念时,数据丢失或不可预见的灾难会导致实体破产和重大财务损失。

上下文的分析。小数据分析相对容易和快速,通常在一个步骤和使用一个程序。对于大数据,除了少数例外,数据分析通常是分步骤进行的。数据需要存储、准备处理、检查、分析和解释。 返回列表