大数据,目前IT行业里炒的最热的一个词,被称为IT行业内的又一次技术变革。随着社会的发展,社交网络的逐渐成熟移动宽带网络的不断提速,未来10年将是一个“大数据”引领的智慧时代。
那么,人们常说的大数据是指什么呢?
其实“大数据”包含着多种技术概念,简单的来说就是无法在一定的时间内,无法用常规的一些方法或者工具进行抓取、处理的数据集合。
要理解大数据这一概念,首先要从“大”字入手。“大”其实就是暗指“数据规模”。而大数据一般是指在10TB(1TB=1024GB/1GB=1024MB/1MB=1024KB)的规模以上的数据量。所以美国著名的科技公司IBM也将“大数据”的定义为4个V ,即大量化(Volume)、多样化(Variety)、快速化(Velocity)及由此产生的价值(Value)。
• 数据体量巨大。从TB级别,跃升到PB级别。
• 数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等。
• 价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
• 处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
需要注意的一点是,目前所说的大数据不仅仅是指数据本身的规模,也包括采集数据的工具、平台、数据类型、分析系统等等,因此,抢占技术发展的前沿,不仅需要加大处理数据的能力,也需要在个方面不断加强。
作者:尚学先生
链接:https://www.jianshu.com/p/ca44479d4b44