导读:人类正在追求数字化世界,这种数字化是与我们的业务流程和个人生活相关的任何事物。

 

数字化的过程通常被称为数字化转型,它正在深刻地改变当今的商业形态,影响着世界各个行业的公司和消费者。数字化转型并不是相关设备的演进(尽管它们会演进),而是将智能数据集成到我们所做的一切当中。数据驱动的世界将始终处于运行、跟踪、监视、监听、观看状态——因为它将始终处于学习状态。我们认为随机性的事物将被复杂的人工智能算法限制为正常模式,这些算法在未来将以新的个性化方式呈现。人工智能将推动业务、流程和参与的更加自动化,从而提供更高的业务水平效率,并针对业务成果和个人客户喜好量身定制产品。

 

数据是数字转换的核心,是数字化过程的命脉。如今,公司正在利用数据来改善客户体验,开拓新市场,提高员工和流程的生产力,并创造新的竞争优势资源,致力于明天的未来。

全球数据圈描述

如今,数据的使用正在改变我们的生活、工作和娱乐方式。全球各行各业都在使用数据来改变自身,以变得更加敏捷、改善客户体验、引入新的业务模型及开发新的竞争优势来源。消费者生活在一个日益数字化的世界中,例如通过在线和移动渠道与朋友和家人联系时、访问商品和服务时,甚至在睡觉时,数据都涉及到他们生活的方方面面。

当今的经济大部分情况下都依赖数据,并且随着公司在其供应链的各个环节中获取数据、分类数据并从数据中获利,这种依赖性只会在未来增加。企业收集大量的客户数据以提供更高级别的个性化服务;消费者将社交媒体、娱乐、云存储和实时个性化服务数据集成到他们的生活中。

对数据日益依赖的结果将是全球数据圈规模的无止境扩展。

据IDC估计,2018年达到33 ZB,到了2025年,全球数据圈将增长到175 ZB(图1)。

图1 全球数据圈规模

在本研究中,我们将构成数据层的三个主要位置的数据类别隔开

·核心

核心是数据圈的中心,它由企业和云提供商指定的计算数据中心组成。涵盖了所有种类的云计算,包括公共云、私有云和混合云。它还包括企业运营数据中心,例如运行电网和电话网络的数据中心。

·边缘

边缘是指不在核心数据中心的、经过企业强化的服务器和设备。

其中包括服务器机房、位于一线的服务器、基站和为加快响应速度而分布于各个区域和偏远位置的小型数据中心。

·端点

端点包括网络上的所有设备,包括电脑、电话、工业传感器、联网汽车和可穿戴设备。

制造商在可控的生产制造环境中利用实时数据,产品质量得到提升,价格也大幅下降。现在,公司正在寻求产品使用过程中的数据。通过了解客户在随机环境中使用所展现的产品性能,制造商能够延长产品使用寿命,减少产品故障。借助我们使用的日常产品中嵌入并联网的传感器,这是已经成为可能的。

核心通过提供集中的存储归档、服务交付、更深层次的分析、命令和控制以及合规性而发挥关键作用。以此导致的结果是,数据从端点和边缘一直流到核心,然后再流回到边缘和端点,每个位置在整个数据圈中都起着重要的作用。数据的传播推动了核心数据的增长,并影响了整个网络的分析和智能,为内部和外部流程,以及整个生态系统中企业与个人之间的智能和预测性互动提供了动力(图2)。最终结果是企业存储的重要性和增长得到延续。

 图2  从端点到核心往返的数据传播

1.数据创建(数据圈)不同于数据存储

从数据创建的角度来看(图3中的实线),端点以百分比的形式下降,而核心和边缘所占比例在增加。从数据存储角度(图3中的虚线)来看,随着核心成为所有类型数据的首选存储库,端点中存储的数据量将大幅减少。我们预计,到2024年,核心中存储的数据将是端点中存储的数据的两倍以上,完全颠覆了2015年以来的动态。随着对延迟敏感的服务和应用程序在全球范围内的激增,边缘存储也将迎来显著增长。

图3 –创建和存储数据的位置

2.云是新的核心,而其中很多是新增的

如今,随着越来越多具有更高智能水平的设备连接到各种网络,企业和消费者都发现云成为越来越有吸引力的选择,因为可以快速、无所不在地访问其数据。消费者越来越习惯接受端点设备的存储容量较小的事实,并倾向于使用云。到2020年,我们相信存储在公共云中的数据将超过存储在消费者设备中的数据(图4),到2021年,公共云中存储的数据将超过传统数据中心中的数据(图5)。

图4 数据存在哪里?

图5 存储在公共云和传统数据中心的数据对比

业务模式和数据管理的位置可能会发生变化,但是技术要求和挑战仍然存在。数据归档和存储方式必须能够达到适当的性能水平,并能够被分析和智能化,不过实现这一切必须以经济效益且安全的方式进行。鉴于某些行业的数据仍然位于企业内的孤岛,以及企业外的分支机构、承包商站点通常无法访问数据的其他位置,因此这并不是一件容易的事。 

3.企业数据圈和管理对我们的未来至关重要

企业在数据圈管理领域的重要性不断增长,消费者所生成数据的份额从2017年的47%下降到2025年的36%。这种转变很大程度上是由不断变化的、始终被“传感状态”的世界所驱动的。我们的环境不断被捕获分析,并全天候(24x 7 )不间断地被创建。过去消费者对自己的大部分数据负责,但是随着数据在企业核心和边缘基础设施中变得越来越集中,维护和管理数据的责任正在转移到企业/云提供商数据中心。企业已经是数据创建和存储的主要来源和管理者,并且这种趋势会继续强化这些责任(图6和7)。

图6和7 企业数据圈不断扩张

4.实时数据需求驱动边缘

IDC预测,到2025年,全球将有超过1500亿台的联网设备,其中大多数将实时创建数据。例如,生产车间的自动化机器依靠实时数据进行工艺控制和改进。实时数据在2017年占数据圈的15%,到2025年将近30%(图8)。

但是,驱动实时数据产生的不仅仅是机器。据IDC估计,到2025年,世界上每个联网的人平均每天将进行超过4,900次的数字化互动,即每18秒大约进行一次数字化互动(图9)。

图8 实时数据

图9 每个联网的人每天的数据互动

5.对存储的需求仍然很强劲

在全球数据圈中创建的数据量是存储行业的目标。即使有大量创建的数据被丢弃、覆盖或感知,但这些数据存储的时间不过几毫秒,各个行业、政府、企业和消费者对存储容量的需求仍在增长。

在这个数字化的世界中,人工智能将推动业务流程、客户参与和自主式基础设施,消费者生活行为的每个方面都变得高度个性化——包括根据我们前一天的活动、夜间的睡眠模式以及第二天的日程来决定何时叫醒我们,这需要创建和存储前所未有的数据量。

IDC计算出, 2018-2021年的所有介质类型(HDD,SSD,NVM闪存/其他、磁带和光介质)的数据容量出货量将需要超过过去20年所有介质类型的6.9ZB出货量。IDC预测,从2018年到2025年,预计所有介质类型的存储容量出货量都必须超过22ZB,才能满足存储需求。在同一时期,大约59%的容量需要来自HDD行业,而26%的容量需要来自闪存技术,而光存储是唯一一种出现疲劳迹象的介质,因为消费者会继续放弃DVD,而倾向于使用流媒体视频和音频(图10)。

图10 全球数据容量出货量

端点和边缘存储的增长将有利于固态存储,而核心对HDD和磁带提供的经济型存储容量仍然有极大的需求。企业将组合使用磁盘驱动器、SSD、闪存和磁带,以满足对性能、管理和归档的需求。到2025年底,与SSD和其他NVM技术相比,边缘数据将仍以HDD为主,超过80%的企业数据将转移到核心(图11)。

图11 面向企业核心和边缘的全球数据出货量份额

对全球数据圈的区域性视角

无论是人口驱动、应用(例如视频监控)驱动还是数字化转型成熟度驱动,任何特定的国家或地区都将拥有不同的数据圈增长状况。需要注意的是,区域性数据圈的计算是基于设备所在的地理位置,而不是设备拥有者的位置。例如,如果美国的提供商在欧洲、中东和非洲区域拥有和运营数据中心,则创建和存储的数据则属于欧洲、中东和非洲数据圈的一部分。

图12考察了每个区域性数据圈的绝对规模,而图13体现了美国、EMEA、APJxC、中国和全球其他区域的数据圈在生成数据方面所占的份额。

图12 全球数据圈规模和增长情况

图13 全球数据圈份额

1.云在美国以外地区呈爆炸式增长

作为全球领先的云计算提供商的总部区域,美国一直占据着云存储的最大份额,其次是EMEA和APJxC区域。尽管美国的云存储将继续增长,但其他地区的云存储将增长得更快,这是出于使数据更接近最终消费者来减少延迟的需要,以及企业和监管机构规定要求数据在不同区域内本地存储。到2025年,美国在公共云存储中的份额将从2017年的51%大幅下降到31%,而中国的份额将从6%增长至13%(图14)。

图14 2015-2025年按区域划分的云存储CAGR和份额

2.中国和亚太地区/日本在数据成熟度方面更具优势

IDC的全球调查表明,其他区域在某些数据成熟度方面也开始超越美国。尤其是中国和APJ在几个领域的指标尤为出色。中国和APJ更有可能采用企业驱动的数字化转型计划,从而能够量化其数据的价值并增加对边缘计算的使用(图15 )。这得益于新兴市场中相对于较旧的IT领域,投资水平较低。

图15 边缘计算的利用增加

 

对全球数据圈的行业视角

数字化转型和数据增长遍及所有行业和地区,但并非所有业务都受到相同的影响。一些企业更多地依赖于云,而另一些企业则更多地依赖于自己的数据中心,这些数据中心的规模有时非常庞大。对于准备和利用新一轮的数据增长,各个行业处于不同的就绪状态,采取行动的需要也各不相同。

1.推出数据就绪度指数

为了体现不同行业的差异,IDC创建了DATCON(数据就绪度)指数,该指数是首个用于评估各种行业为管理、分析和存储数据的就绪情况的指数。它可以确定需要解决的缺口和企业必须考虑的最紧迫的举措。DATCON指数的范围是1到5,充分对企业创建、捕获、存储和分析数据的能力进行了评分,其中5代表完全优化的行业,而1代表某个行业状态危急,

图16 数据就绪情况级别

DATCON指数是一个综合计算得出的分数,该分数是通过六个评估向量以及基于全球调查、持续开展的IDC研究、专家分析和专有建模技术所确定的众多相关指标综合而成。

 

2.DATCON中的行业占数据圈的接近一半

在2018年,本研究中选择的四个DATCON行业(金融服务,制造业,医疗保健,媒体和娱乐)占了企业数据圈的48%,其中制造业占最大的数据份额,其次是金融服务,媒体和娱乐(图17) )。

图17 2018年全球数据圈

尽管医疗保健是本研究中数据圈中最小的行业,但鉴于医疗保健分析技术的发展、核磁共振成像的频率和分辨率的提高以及当今先进的医疗保健模式中采集的其他与图像和视频有关的数据,它的增长势头将超过其余行业。图18中,IDC对比了2018年至2025年各种行业数据圈的增长与全球数据圈的总体增长情况。

图18 行业数据圈增长对比

3.核心,边缘和端点之间的相互作用是所有行业的关键

尽管所有行业都有数据浪潮覆盖核心、边缘和端点的范例,即在端点处收集的数据在边缘进行处理,在核心处进行传播,然后再分发回端点,这是对边缘计算的最大利用。在DATCON指数中的四个行业中,制造业和金融服务业使用边缘计算最多(图19)。

图19 对边缘计算的利用

 

IDC指导

1.企业必须应对数据管理的挑战

随着数据从以消费者为中心的模式转变为以企业为中心的模式,为提供出色的体验,这增加了企业的压力。企业负责提供正确的见解和出色的客户体验,甚至负责存储客户的数字生活,确保数据模型提供安全、无处不在且实时地接入服务和数据。随着消费者对数字生活体验的要求越来越高,企业必须确保他们能实时提供个性化、不间断的数据和服务。

2.云迁移具有战略意义

云提供商已成为企业数据存储和服务的重要竞争者。最大的提供商具有极少企业可以匹敌的资源、规模、安全性和性能。它们的全球影响力使企业能够为全球各个区域提供服务,而它们的集中访问则能使公司资源利用公司的所有数据来推动当前的分析,并促进未来的人工智能。

3.对数据采取全球性方法

对于企业而言,采取全球性的数据处理方法来提供低延迟、更好的客户体验以及应对监管和合规性压力(要求运营商将数据存储在客户所在的地区)日益重要。无论是在自己的数据中心还是通过云提供商,公司都需要考虑哪些数据的存储需要尽可能地靠近其客户,以及应将其放置在网络中的哪个位置(核心与边缘,云与自有数据中心)。

4.投资边缘

人们正在寻求智能数据来实时地和不断地推动我们的业务和生活。在为决策提供参考时,数据没有时间实现从端点到核心,再返回端点的数据传播。企业边缘有助于弥合这一差距。无论是进行数据分析还是简单地存储已分析的智能数据,边缘对建立实时世界发挥越来越重要的作用。

5.确保您的组织已准备好数据

IDC开发了DATCON指数来体现不同行业的就绪程度,并使各个公司能够通过多种指标评估自身的就绪程度。在提高数据就绪程度方面,高管务必领导企业计划,确保预算到位并确保聘用精通数据的员工且赋予其执行权。

6.为您的IT组织做好数字化转型的准备

在IT部门处理后台文件和记录处理的时代诞生的组织,现在正面临来自一线组织的大量实时、中断驱动的数据。许多IT组织发现,他们需要兼顾物理安全性和数据安全性,既要对被隔离在工厂车间、电网或手术室中的运营数据进行管理,又要把以往处于孤岛中的数据存储库进行整合。应对数字化转型不仅需要新技术,还需要新技能、了解政策并与高层管理人员建立关系。

原文 | SEAGATE :https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf

文中图片来源 | SEAGATE

翻译 | 王圈圈

编辑 | 王圈圈