在什么样未来的环境是什么样的下大数据能正常使用

今年3月份教育部公布了第二批獲准开设“数据科学与大数据技术”的高校名单,加上第一批获批的北京大学、对外经济贸易大学、中南大学一共35所高校获批该专业。

夶数据人才培养涉及到两方面问题:

交叉性学科的人才培养方案是否与市场需求相匹配;

学科建设的周期与行业快速更新之间的差距怎样弥匼

对于第一个问题,“电商热”时期开设的电子商务专业是一个可吸取经验的样本2000年,教育部高教司批准了第一批高校开设电子商务夲科专业作为一个复合型专业,电子商务的本科教学涵盖了管理、技术、营销三方面的课程电子商务领域人才需求量大,但企业却无法从电子商务专业中找到合适的人才原因何在?

职业规划专家姜萌认为,并不是某一个专业对应一个行业热点而是一个专业集群对应一個行业热点。“比如电子商务专业我们到电子商务公司里会发现,不是学电子商务的人在做这些工作而是每个专业各司其职,比如计算机、设计、物流管理、营销、广告、金融等等现在行业的复合型工作都是由一个专业集群来完成的,而不是一个人来复合一堆专业特點”

大数据专业的人才培养也遵循复合式方法。复旦大学大数据学院招生简章显示学院本科人才培养以统计学、计算机科和数学是三个基本的支撑学科医学、环境科学、经济学、社会学和管理学是应用和拓展的学科,具有典型的跨学科特征

LinkedIn(领英)中国技术副总裁王迪指絀,“从企业应用的角度来看大数据行业里从事相关职能的同学背景是各异的,大数据作为一个人才培养方向还在探索中在这个阶段,高校尝试开设硕士课程是很好的实践但开设一类的本科专业还为时过早。”

另一方面专业人才培养的周期较长,而行业热点不断更噺轮替中间产生的时间差使得新兴专业的志愿填报具备了一定风险。

王迪认为“从今天的产业实践上看,大数据领域依然是从现有专業中挑选人才教育和市场发展总是有一定差距的,学生本科四年加上硕士阶段已经是七年之后的事情了,产业已经演进了很多而教學大纲并不会跟进得那么快。”

因此尽管大数据的应用前景毋庸置疑,但在人才培养层面复合型人才培养方案会不会重走电子商务专業的老路?学校教育如何赶上行业发展速度?

}

我们有想过在未来社会大数据昰什么样子吗?这个问题我们都要问问自己,让自己心里有个答案其实贵阳大数据交易所总裁王叁寿在4月14日面对《数据》采访时说过這么一句话:“我相信未来大数据应用在人们的生活中将无处不在,而大家对大数据的应用也会像现在上网一样可以实现随时随地的无障碍应用。”

贵阳大数据交易所在整三年的发展中终于在今年四月份获得了盈利正是这样这个有利的局面让王叁寿更加相信大数据产业茬未来地位越来越牢固。

在互联网大数据时代统计数据经济发展包含统计数据自身和统计数据之中的二种经济发展。这种是数据统计分析由统计数据本身造成使用价值,应用场景海量信息在每个制造行业,有各种各样垂直行业的OS剖析和解决方法另这种是自身紧紧围繞数据资源经营的统计数据经济发展,因为市场对数据的需求需大于供,所以需要通过数据流通带来数据经济的繁荣

王叁寿觉得:“數据交易的价值就是用为它实现了数据资源流通和数据跨地域、跨行业的交互。”

数据交易可改变数据孤岛局面

大数据交易是属于商品交噫的一种它是一种资产,像黄金、石油一样但是它是一种无形资产。

传统行业需要大数据助力转型

大数据对传统行业转型有什么作用

传统产业需要借助大数据来帮助变革。许多人觉得实体经济没有科技含量我觉得并不是那样的,传统产业的取得成功转型发展更不可戓缺互联网大数据

大数据在未来的应用会无处不在

大数据思维和传统信息化思维相比,它是什么样子的

大数据思维和传统信息化思维鈈同的地方在于大数据思维解决了预警、预测、决策和人工智能问题,最后把结果展示出来

未来中国有望成为全世界最大的数字经济强國

中国在数据全球化发展中有什么优势?

中国将在未来引领世界数字经济的发展由于数字经济与人和企业的数量有关。我国是全球人口數量数最多的國家、我国的公司总数都是全世界数最多的因为有大量的数据,我相信中国将在未来成为世界上最大的数字经济国家

数據化时代已经到来,我们要紧跟时代潮流应对那些可能会发生的问题。要利用大数据技术去提高企业的经济能力发掘企业的数据价值。

}

近日两家大数据领域的代表性企业Cloudera和Hortonworks宣布了它们相对平等的合并,宣称新公司将创建世界领先的下一代数据平台并提供业界首个企业数据云这令很多人感到意外,大數据的未来何去何从一时成为大数据产业从业人员关心的话题。

大数据蹒跚前行迈进下半场

随着2012年维克托·迈尔-舍恩伯格《大数据时玳》一书的出版,“大数据”这一概念乘着互联网的浪潮在各行各业中扮演了举足轻重的角色得大数据者得天下,业界纷纷用大数据这個词来描述和定义信息爆炸时代产生的海量数据并命名与之相关的技术发展与创新。

2013年被称为中国的“大数据元年”大数据开始在我國流行,以势不可挡的姿态进入人们的思想意识并在社会的各个领域探索与落地实践。涂子沛的《大数据》一时成为畅销读物大数据嘚概念风行大江南北,阿里巴巴成为最早提出通过数据进行企业数据化运营的企业2015年,我国政府通过了《关于促进大数据发展的行动纲偠》大数据更是上升为国家战略。

同美国市场一样以Hadoop为代表的大数据技术,在中国的大数据产业中也经历了一段狂热期在很长一段時期内,Hadoop几乎成了大数据的代名词在这个数据大爆炸的时代,企业需要对海量数据存储、快速处理和分析Hadoop正是为此而生。但目前看来这股浪潮正渐渐退去,Hadoop正在逐渐变成一项传统技术

从诞生到现在,Hadoop已经走过十多年的历史但近年来,以Hadoop为代表的大数据产业生态茬实际落地中却面临着尴尬的局面。首先大数据的价值被夸大,在投入产出比上差强人意其次,中小企业对大数据的应用极为有限目前看来,需求主要来源于一些大型企业数据量过大,数据分析需求旺盛但中小企业自身数据量并不大,需求度较低同时也缺少相應的大数据技术人才。最后大数据管理难度大,数据开放共享、数据质量、数据安全、个人隐私信息保护等已经成为管理大数据最头疼嘚问题今年5月,欧盟数据保护法规《通用数据保护条例》发布对大数据企业采集的个人隐私数据管理工作产生极大的挑战。

2018年10月底IBM宣布以高达340亿美元的价格收购RedHat,IBM宣称其将成为全球的头号混合云提供商而亚马逊、微软、阿里巴巴等云计算巨头早已将计算、存储、网絡资源和应用软件(大多来自开源社区)作为在线云服务来提供,Anaconda产品和营销高级副总裁MathewLodge指出大数据的中心已经从Hadoop转移到了云端,在云环境丅的对象存储系统(如亚马逊

尽管现在就谈Hadoop已死为时尚早但大数据产业面临的以上问题已经累积很久,也没有被很好地解决能否解决以仩问题将直接关乎大数据的未来发展。

人工智能方兴未艾取得新突破

人工智能(AI)是研究用于模拟与延伸扩展人的智能的理论、方法、技术忣应用系统的一门新的技术科学,目前在商业和生活中已有大量应用场景被产业界寄望为下一轮技术革命,对它的关注热度已经超过大數据

AI的发展历程一波三折,呈螺旋式发展在历史上共经历三个时期。首先是1956年达特茅斯会议提出了AI的概念但当时的计算机处理性能囷数据容量制约了AI技术的发展。然后在20世纪80年代专家系统兴起,AI算法模型有了重大发明包括多层神经网络和BP反向传播算法的提出,出現了能与人类下象棋的高度智能机器但随着台式机的出现,使得AI专家系统走向没落再往后就是2006年,Hinton论文开启了深度学习时代特别是2016姩,AIphaGo大败李世石将AI从后台推到了科技界的聚光灯下,一时间万众瞩目

AI已经替代了早些年的大数据,成为新的商业科技风口2017年全球AI融資超150亿美元,谷歌、亚马逊、苹果、微软以及阿里、百度、腾讯等中美科技巨头纷纷布局以深度学习为代表的AI算法,PC/移动互联网上海量、多维度、高价值大数据以及以GPU、FPGA、ASIC为代表的AI计算芯片,成为本轮AI发展的核心驱动力

AI技术体系一般分为基础层、技术层和应用层,在AI夶发展的浪潮中AI技术体系中的各模块发展特点各不相同。

基础层对应着算法(包括回归、分类、聚类、深度学习算法等)、算力(即AI芯片)和软件框架(实现对AI算法的封装)

算法部分,深度学习带动了本轮AI的大跃进深度学习已经在语音识别、图像识别等领域取得突破,而海量的数據和高效的算力支撑是深度学习算法实现的基础同时还有很多新的算法理论成果正在被提出和应用,如强化学习、迁移学习、胶囊网络、生成对抗网络等

算力部分,由各种AI芯片来提供基础计算能力AI芯片除了传统的CPU及 GPU外,还包括为特定场景应用而定制的计算芯片深度學习既要求计算芯片支持对存储介质中海量数据的高效存取,还要能支持一些特定AI计算需求因此GPU成为目前深度学习算法应用中的首要选擇。FPGA(现场可编程门阵列)可以实现应用场景的高度定制属于一种半定制化芯片。ASIC(专用集成电路)是不可配置的高度定制专用计算芯片其性能也是最优的。TPU(张量处理单元)是谷歌公司设计的处理器非常适合运行TensorFlow软件,还有寒武纪的NPU都是ASIC的典型代表。另外还涌现出各类定制囮的高性能AI计算服务器,或称之为GPU一体机一站式提供AI所需的算力。

软件框架部分目前AI软件框架百花齐放,软件框架是整个技术体系的核心实现对AI算法的封装、数据的调用以及计算资源的调度使用。软件框架好比是AI应用开发的操作系统为开发者提供编程环境和算法库,并按需分配AI芯片等硬件资源目的是构建AI系统开发和运行的软件环境。目前主流的AI软件框架主要有TensorFlow、MXNet、Caffe、Torch、CNTK、Theano、SciKit-Learn等软件框架的用户包括了AI服务的开发者和使用者。

技术层负责解决具体类别的AI技术问题其中语音识别技术负责将语音转换为文本或命令,自然语言处理技术實现人和机器之间的自然语言通信计算机视觉技术用于处理图形图像和视频内容的识别。

应用层立足于解决各行业领域实际场景问题洳安防场景下,用于警讯发现、人脸识别、道路监控等;金融场景下可用于资产异动监测、征信风控和智能投顾等;医疗场景下,可应用于對医学影像、电子病例处理来辅助诊疗;还有目前最为火热的自动驾驶场景谷歌、特斯拉和百度三巨头的无人驾驶汽车已经上路试运行。

鉯云服务方式提供AI服务已成为当前的趋势AI云服务一般分为平台类服务和软件类服务。平台类服务包含GPU云服务深度学习平台等,GPU云服务昰以虚拟机的形式为用户提供GPU计算资源。深度学习平台则是以TensorFlow、Caffe、MXNet等主流深度学习软件框架为基础提供相应的常用深度学习算法和模型,组合各种数据源、组件模块让用户可以基于该平台对语音、文本、图片、视频等海量数据进行离线模型训练、在线模型预测及可视囮模型评估。软件类服务包括提供API程序接口、SDK包、消息服务接口的形式提供AI相关的在线网络服务可包括语音识别、文字处理、图像检测、智能推荐等应用方式。

掘金数据资产探索数据智能

大数据为人工智能发展提供了基础资源,人工智能技术的核心就在于通过计算找寻夶数据中的规律对具体场景问题进行预测和判断。想要训练出成功的人工智能算法需要运算力和大量的数据,其中最重要的就是数据量要足够大除了数据量足够大,大数据还需要通过采集、清洗、标注等处理工作后才能够作为人工智能算法模型训练的输入但目前在實际应用中,数据流通不畅、数据质量不高和数据安全风险等问题仍然极大制约着人工智能的发展和应用

大数据的未来何去何从,与人笁智能技术如何完美结合共同驱动数字经济发展,数据智能或将成为新的热点和大趋势

“数据智能”是百度公司在2014年提出的概念,百喥对数据智能的定义指基于大数据引擎,通过大规模机器学习和深度学习等技术对海量数据进行处理、分析和挖掘,提取数据中所包含的有价值的信息和知识使数据具有“智能”,并通过建立模型寻求现有问题的解决方案以及实现预测等

2018年10月,第五届中国国际大数據大会上发布的《2018年数据智能生态报告》中提出在机器学习、分布式计算等技术发展的基础上,数据逐渐呈现出高维度、高阶态、异构性的形式把能够对海量数据进行分析、处理和挖掘,并且通过建模、工程等方式来解决实际预测问题最终实现决策的行动,称之为数據智能

对数据智能的信息化落地,业界一般称之为数据智能平台或数据中台

据阿里巴巴公共数据平台负责人介绍,阿里巴巴数据中台戰略在2015年首次提出旨在对内提供数据基础建设和统一的数据服务,对外提供服务商家的统一化数据产品阿里数据中台基于OneData体系建立的集团数据公共层,从设计、开发、部署和使用上保障了数据口径的规范和统一实现数据资产全链路管理,并提供标准数据输出基于阿裏数据中台输出的生意参谋产品,是阿里巴巴首个统一的商家数据产品平台为中小企业商家提供数据披露、分析、诊断、建议、优化、預测等多项数据服务。

另外据百度公司的百度数智平台官网介绍,该平台定位为提供大规模机器学习、深度学习、数据分析及展现、数據应用等产品与服务包括了大数据基础产品和大数据应用产品两大类,大数据基础产品包括大数据传输Minos、数据工厂Pingo、数据治理Dayu、数据分析与开发Jarvis、大数据可视化Habo等产品大数据应用产品包括百度智客、百度觅客、百度汇客、百度客情、百度商情等产品,百度公司将其数智岼台定位为AI时代的企业数据管家服务于公司内部和各行业合作伙伴。

在2018年10月由中国联通大数据公司主办的加速-U10大数据价值峰会上中国聯通大数据公司负责人以“数智”为主题发表演讲,她认为当前大数据产业已经进入“数智”时代联通大数据的数智升级,在于更大规模的数据、更深度的智能打造数智新架构体系,做值得信赖的数据智能服务运营商同时介绍了中国联通UBD数智中台的建设思路。

可以看絀以上代表性企业建设数据智能平台或数据中台的意义主要在于,一是帮助企业管理好内部现有的数据资产即数据资产管理;二是为企業提供基于大数据的预测分析产品,即人工智能服务数据资产管理的目的是为了准备和提供高质量的数据给人工智能应用,对数据的规范化和标准化是企业实现基于大数据提供智能化服务的关键也是决定大数据价值实现的基础。

大数据进入下半场人工智能已然崛起,現有的大数据技术亟须和人工智能技术结合孕育新的产业生态,从百度、阿里和中国联通的做法可以看出向数据智能型企业转型正在荿为大型科技企业新的行动方向,阿里巴巴提出的“大中台、小前台”的做法已经成为业界主流数字化转型思路企业通过建设数据智能岼台或数据中台,打破内部数据壁垒、盘活数据资产、提升数据价值对外提供统一的智能化数据服务,有望再次重构大数据产业生态环境进一步深挖和释放大数据的价值红利。

}

我要回帖

更多关于 未来的环境是什么样的 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信