大数据技术是什么_大数据技术有哪些

发布者:自由梦想最新更新时间:2017-11-19 来源: 互联网关键字:大数据 手机看文章 扫描二维码
随时随地手机看文章

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。


在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。


对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。


毫无疑问,世界上所有关注开发技术的人都意识到“大数据”对企业商务所蕴含的潜在价值,其目的都在于解决在企业发展过程中各种业务数据增长所带来的痛苦。


现实是,许多问题阻碍了大数据技术的发展和实际应用。


因为一种成功的技术,需要一些衡量的标准。现在我们可以通过几个基本要素来衡量一下大数据技术,这就是——流处理、并行性、摘要索引和可视化。


大数据技术涵盖哪些内容?


1、流处理


伴随着业务发展的步调,以及业务流程的复杂化,我们的注意力越来越集中在“数据流”而非“数据集”上面。


决策者感兴趣的是紧扣其组织机构的命脉,并获取实时的结果。他们需要的是能够处理随时发生的数据流的架构,当前的数据库技术并不适合数据流处理。


例如,计算一组数据的平均值,可以使用一个传统的脚本实现。但对于移动数据平均值的计算,不论是到达、增长还是一个又一个的单元,有更高效的算法。如果你想构建数据仓库,并执行任意的数据分析、统计,开源的产品R或者类似于SAS的商业产品就可以实现。但是你想创建的是一个数据流统计集,对此逐步添加或移除数据块,进行移动平均计算,而且数据库不存在或者尚不成熟。


数据流周边的生态系统有欠发达。换言之,如果你正在与一家供应商洽谈一个大数据项目,那么你必须知道数据流处理对你的项目而言是否重要,并且供应商是否有能力提供。


2、并行化


大数据的定义有许多种,以下这种相对有用。“小数据”的情形类似于桌面环境,磁盘存储能力在1GB到10GB之间,“中数据”的数据量在100GB到1TB之间,“大数据”分布式的存储在多台机器上,包含1TB到多个PB的数据。


如果你在分布式数据环境中工作,并且想在很短的时间内处理数据,这就需要分布式处理。


并行处理在分布式数据中脱颖而出,Hadoop是一个分布式/并行处理领域广为人知的例子。Hadoop包含一个大型分布式的文件系统,支持分布式/并行查询。


3、摘要索引


摘要索引是一个对数据创建预计算摘要,以加速查询运行的过程。摘要索引的问题是,你必须为要执行的查询做好计划,因此它有所限制。


数据增长飞速,对摘要索引的要求远不会停止,不论是长期考虑还是短期,供应商必须对摘要索引的制定有一个确定的策略。


4、数据可视化


可视化工具有两大类。


探索性可视化描述工具可以帮助决策者和分析师挖掘不同数据之间的联系,这是一种可视化的洞察力。类似的工具有Tableau、TIBCO和QlikView,这是一类。


叙事可视化工具被设计成以独特的方式探索数据。例如,如果你想以可视化的方式在一个时间序列中按照地域查看一个企业的销售业绩,可视化格式会被预先创建。数据会按照地域逐月展示,并根据预定义的公式排序。供应商PercepTIve Pixel就属于这一类。


大数据技术有哪些


1、跨粒度计算(In-DatabaseCompuTIng)


Z-Suite支持各种常见的汇总,还支持几乎全部的专业统计函数。得益于跨粒度计算技术,Z-Suite数据分析引擎将找寻出最优化的计算方案,继而把所有开销较大的、昂贵的计算都移动到数据存储的地方直接计算,我们称之为库内计算(In-Database)。这一技术大大减少了数据移动,降低了通讯负担,保证了高性能数据分析。


2、并行计算(MPP CompuTIng)


Z-Suite是基于MPP架构的商业智能平台,她能够把计算分布到多个计算节点,再在指定节点将计算结果汇总输出。Z-Suite能够充分利用各种计算和存储资源,不管是服务器还是普通的PC,她对网络条件也没有严苛的要求。作为横向扩展的大数据平台,Z-Suite能够充分发挥各个节点的计算能力,轻松实现针对TB/PB级数据分析的秒级响应。


3、列存储 (Column-Based)


Z-Suite是列存储的。基于列存储的数据集市,不读取无关数据,能降低读写开销,同时提高I/O 的效率,从而大大提高查询性能。另外,列存储能够更好地压缩数据,一般压缩比在5 -10倍之间,这样一来,数据占有空间降低到传统存储的1/5到1/10 。良好的数据压缩技术,节省了存储设备和内存的开销,却大大了提升计算性能。


4、内存计算


得益于列存储技术和并行计算技术,Z-Suite能够大大压缩数据,并同时利用多个节点的计算能力和内存容量。一般地,内存访问速度比磁盘访问速度要快几百倍甚至上千倍。通过内存计算,CPU直接从内存而非磁盘上读取数据并对数据进行计算。内存计算是对传统数据处理方式的一种加速,是实现大数据分析的关键应用技术。


注意事项


大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

关键字:大数据 引用地址:大数据技术是什么_大数据技术有哪些

上一篇:思科和VMwar平分SD-WAN天下,初创公司希望渺茫
下一篇:华为发布5G规划白皮书,最具潜力的十大应用场景

推荐阅读最新更新时间:2024-05-07 17:44

新加坡数据创新 将何去何从
由于先天地理条件限制,新加坡的人口密度高、交通拥挤与人口老化问题严重。新加坡政府一直以来期望经由科技通讯技术,缓解影响国家发展的核心问题,试验各种数字创新,近年将智慧国家作为国家重要发展策略,推动各项基础建设,并为企业与研究者提供实验与研究的空间,发展解决方案的模型,并推动应用计划鼓励数字解决方案落地。 在智慧国家计划的框架之下,新加坡各政府单位配合国家发展目标,在交通、环境、制造与健康领域投入资源协助数据创新解决方案开发与应用,透过产官学合作已在上述领域取得初步成果。新加坡希望透过分析开放数据,提升都市运输效率,并达成减碳效果,具体作法包含分析交通票卷、车辆传感器数据分析等。根据智慧国家计划网站公布信息,经由上述作法,该
[网络通信]
传感器是物联网发展关键,大数据将成商业核心
物联网近些年来发展势头迅猛,在各个领域的应用都越来越深入。但是任何技术的发展都受限于基础硬件的核心水平与部署规模,而物联网发展的关键就在于传感器。 物联网通常划分为感知、传输和应用三个层次,感知层以如传感器、RFID(射频识别)等为主,是信息采集的关键部分,传感器更是被誉为物联网时代下的五官。 物联网时代,成千上万的传感器被嵌入到现实世界的各种设备中,如移动终端、智能电表、建筑物和各工业机器等等,各种设备联网后,便产生出数以亿计的数据,随着物联网设备不断扩大和传感器大规模部署,所采集到的大数据将会产生更大的商业价值、创造更多的商业机遇。 物联网的核心价值在哪? 物联网通常划分为感知、传输和应用三个层次,感知层以
[物联网]
边缘计算在地铁等细分场景中如何应用?
“保姆级”边缘计算在细分领域应用案例分享 上周,雷锋网 AI 掘金志邀请到了触景无限副总裁赵寒伟做客雷锋网公开课,以“「边缘计算」在地铁等城市级场景下的实战复盘”为题进行了干货分享。后续将有更多课程上线,添加微信号 suekee777 报名听课。近几年,边缘计算市场规模持续增长,并迅速在安防、智慧城市、自动驾驶等领域被应用,边缘端的处理、分析和存储能力成为考验 AI 公司的关键。 赵寒伟认为,物联网和云发展多年,平台建设和打通完成度已经非常高,但智慧城市迟迟没有真正到来,是因为基础的感知没有实现,智慧城市细分领域多,感知涉及每个层面,而芯片算力和边缘计算决定了感知能力,也唯有在前端智能分析,与后端配合,才能将城市物联网数据
[嵌入式]
边缘计算在地铁等细分场景中如何应用?
汽车观察 | 车联网:风向何处吹
  随着5G,大数据,云计算,人工智能等新一代技术和汽车交通等领域的深度融合,车与车、路、人、云的多维信息交互网络正在形成,汽车智能化水平不断提升,自动驾驶、综合信息服务、智慧交通等加速发展,车联网产业已经成为国际竞争的热点和焦点。   那么,当下我国的车联网行业究竟处于一个什么样的发展阶段?它的应用情况如何?当下面临着什么样的问题?下一步又该如何走?   1月31日,第七届中国车联网大会在北京召开。会议间隙,《汽车观察》记者就以上话题对与会专家进行了采访。     国内车联网发展处于第二阶段   汽车保有量的不断提升使得中国车联网行业前景被看好,根据新思界产业研究中心发布的《2018年车联网行业深度市场调研及投资分析报告》数
[嵌入式]
物联网概念下的程序设计
各种生活中看似寻常的对象,正被尝试赋予连网的能力,而能和外在环境互动,提供许多有趣的应用可能性,然而,要建构出各种应用、落实在生活中,还是得倚靠软件。下面就随网络通信小编一起来了解一下相关内容吧。 物联网(Internet of Things)」是最近另一火红的名词。在市场上,有愈来愈多的装置、设备,打着物联网的名号,纷纷快速推出。什么是物联网呢?简单来说,传统的互联网,连上网的都是计算机,不论是大型还是小型,通通都是计算机,所以基本上是个计算机网络。 随着技术进步,大家都知道连移动电话也都具备上网能力了,这是因为现在的智能电话,里子其实也都是计算机,这都是拜计算机技术进步之赐。之后,连电视也上网,所以我们有了智能电视这个名词
[网络通信]
中国电信教你怎样避免大数据杀熟
12月30日消息,网购总比别人价格高?订酒店新号码比旧号码费用更低?打车同一条线路价格越来越高?如果你遇到过以上这些情况,那你可能遭遇到大数据杀熟了!那什么是大数据杀熟?大数据杀熟如何避免?来看看中国电信是怎么说的吧! 首先什么是大数据杀熟,简单来说,就是指同样的商品或服务,老客户看到的价格反而比新客户要贵出许多的现象。 接下来是了解大数据杀熟是如何实现的,具体如下: 1.消费记录:系统根据你之前购买的产品、购买频率,从而判断你的身份是宝妈,还是青年,以及哪些产品你接下来还会复购,提些价也不会影响。 2.搜索记录:如果你之前经常搜索某款产品或者将其加入了购物车,系统会判断你有较强的购买意愿,减少给你优惠价格的概率。 3购买行为
[手机便携]
直面云与大数据 老牌厂商LSI如何再焕新春
“沉舟侧畔千帆过,病树前头万木春”。在“岁月”这把“杀猪刀”面前,无数的曾推动社会变革的技术湮灭在了历史的浩瀚长河之中,取而代之的是更符合历史发展的新兴技术。在这之中,IT行业无疑是技术“淘汰率”最高的行业,几乎每天都有新兴的技术或者拥有新兴技术的公司诞生,而同样有着无数的公司因为跟不上时代的步伐而惨遭“淘汰”,如何在这个技术快速革新的时代顺应潮流,进而引领潮流是每个IT公司朝思暮想的目标。   自计算机技术诞生以来,衍生了无数的新兴技术与公司,也许曾经的他们红极一时,但随之凋零,现在还能被我们所熟知的并且保持旺盛生命力的公司少之又少。而现在,IT行业似乎再一次到了技术革新的时代,全球数据量的海量增长,尤其是以非结构化数据为主的
[网络通信]
直面云与<font color='red'>大数据</font> 老牌厂商LSI如何再焕新春
AI窥人(二):彻底“AI化”会变成什么样?
我们知道,美剧《西部世界》主要讲了一个“作为人工智能的接待员如何从被人类奴役的状态中觉醒,并最终反抗人类”的故事。 这一主题其实是有些老套的。不过随着剧情展开,这些觉醒后的接待员闯入了人类世界。而从AI的视角来审视人类,我们惊讶发现绝大多数人在被人工智能系统所掌控,成为幕后大数据公司的产品而已。 剧中有一个关于“人类意识”的隐喻,那就是复制出一个人类意识的代码只需要一万多行,可以说人类大多数行为和决策都是可以被算法预测的;但同时,这些代码一旦输入到仿真人体后,就会很快崩溃,可以想见人工智能的处理能力仍然无法执行人类充满矛盾的行为逻辑。 看来人类真是一个足够复杂的矛盾体呀。 随着智能时代的到来,越来越多的数字智
[嵌入式]
AI窥人(二):彻底“AI化”会变成什么样?
小广播
最新网络通信文章
换一换 更多 相关热搜器件
随便看看
电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved