大数据分为哪两个方面 大数据什么大类?
大数据什么大类?
大数据技术可以分为大数据存储和处理技术:数据仓库技术和Hadoop;大数据查询分析、交互分析技术和SQLonhadoop;大数据的实现和应用技术主要是机器学习数据挖掘的发展。大数据包含以下四个特征:
1.巨量:数据量巨大,以TB -
2-2 大数据的特征有哪些?
,规模随着信息技术的飞速发展,数据开始爆炸式增长。大数据中的数据不再以几个GB或TB来衡量,而是以Pb (1000 t)、EB(100万t)或ZB(10亿t)来衡量。
2.多样性
多样性主要体现在三个方面:数据源多、数据类型多、数据之间的相关性强。
数据来源很多,企业面临的传统数据主要是交易数据。互联网和物联网的发展带来了各种来源的数据,如社交网站和传感器。
由于数据来自不同的应用系统和不同的设备,决定了大数据形式的多样性。一般来说,可以分为三类:一是结构化数据,如财务系统数据、信息管理系统数据、医疗系统数据等。,表现为数据之间的强因果关系;二是非结构化数据,如视频、图片、音频等。,特点是数据之间没有因果关系;第三,半结构化数据,如HTML文档、邮件、网页等。,特点是数据之间的因果关系弱。
数据类型很多,非结构化数据是主要数据。在传统企业中,数据是以表格的形式保存的。而70%-85%的大数据是图片、音频、视频、web日志、链接信息等非结构化、半结构化的数据。
数据和频繁的交互有很强的相关性,比如游客在旅游过程中上传的照片和日志,和游客的位置、行程等信息有很强的相关性。
3.高速的
这是大数据区别于传统数据挖掘的最显著特征。大数据和海量数据有两个重要区别:一方面,大数据的数据规模更大;另一方面,大数据对处理数据的响应速度有更严格的要求。实时分析代替批量分析,数据输入、处理、丢弃都是立竿见影,几乎没有延迟。数据的增长速度和处理速度是大数据高速的重要体现。
4.价值
虽然企业有大量的数据,但只有极小一部分是有价值的。大数据背后隐藏的价值巨大。因为大数据中有价值的数据比例很小,大数据的真正价值体现在大量不相关类型的数据上。挖掘有价值的数据用于未来趋势和模式预测分析,并通过机器学习方法、人工智能方法或数据挖掘方法进行深度分析,应用于农业、金融、医疗等领域,以期创造更大的价值。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。