云计算、大数据引领大未来——青洽会“云计算和大数据产业发展”论坛精彩观点摘登
大数据即将开创信息社会的崭新时代。人们现在每两天产生的信息等同于人类从有文明开始到2003年之间产生的所有信息。到2020年,全球数据量将达到35ZB,是2009年的40倍。
6月18日,第十七届青洽会“云计算和大数据产业发展”论坛的开坛拉开了青海省年度最大经贸活动的序幕。本次论坛由青洽会组委会主办,青海省经济和信息化委员会承办,九三学社青海省委员会、青海省信息产业协会协办。来自相关行业的著名专家学者,对云计算和大数据的概念以及大数据安全面临的机遇与挑战等方面做深入阐述,参加论坛的嘉宾还对我省云计算和大数据产业发展进行了探讨和交流,积极建言献策,传经送宝。
今日特整理部分嘉宾的精彩发言,以飨读者。
让青海大数据融入“云端”
青海省经济和信息化委员会副主任 张洪溢
2015年8月,我省出台了《促进云计算发展培育大数据产业实施意见》,聘请王光谦院士等17位专家学者成立了青海省大数据专家咨询委员会。随后,又成功举办了全省大数据产业发展推进会,启动了西北最大的数据中心——中国移动青藏高原大数据中心,标志着青海大数据产业发展正式进入实施阶段。
今年以来,青海继续紧紧围绕全省经济社会发展“131”总体目标要求,紧抓任务推进落实,各项工作扎实有效。首先,发展环境不断优化。《青海省国民经济和社会发展第十三个五年规划纲要》提出:“大数据云计算等新一代信息技术在重点领域的应用得到深化,初步形成服务创新、技术创新和管理创新协同推进的发展格局,带动相关产业快速发展”。《青海省信息产业“十三五”发展规划》、《青海省大数据产业发展规划》和《青海省信息通信业“十三五”规划》也相继编制完成,夯实了顶层设计。目前,青海省大数据公司和大数据交易中心正在抓紧筹备成立,省级政务云、工业云等大数据平台建设也正在积极推进。
其次,信息化建设快速推进。截至今年5月底,全省共完成信息消费投入35亿元,信息消费规模达到95亿元。以信息化集成技术应用为主的“智能制造”、“绿色制造”加快与特色优势产业深度融合,示范企业新产品开发周期平均缩短35%,生产周期平均缩短38%,新产品贡献率20%以上,企业累计新增直接经济效益约10亿元以上。
第三,重点项目成效显著。省内各基础电信运营企业的数据中心新、扩建工作全面展开。电信青海公司具有充足的云业务及托管服务提供能力,能够满足省内云业务资源使用要求;移动青海公司的“彩云青海”云服务平台已投入运行;联通青海公司已具备成熟的多领域大数据应用综合解决方案。全省智慧城市云数据平台、青海省光伏电站质量检测大数据应用平台等大数据应用项目加快推进。网络舆情、电子政务、智慧旅游、智慧交通、地理信息、残疾人服务等重点领域云平台建设特色明显。
今年4月19日,习近平总书记在中央网络安全和信息化工作座谈会上强调,要切实贯彻落实好中央关于实施网络强国战略、“互联网+”行动计划、大数据战略等工作部署,着力推动互联网和实体经济深度融合发展,以信息流带动技术流、资金流、人才流、物资流,促进资源配置优化,促进全要素生产率提升,为推动创新发展、转变经济发展方式、调整经济结构发挥积极作用。
在贵阳数博会上,李克强总理指出,当今世界,新一轮科技和产业革命正在蓬勃兴起,数据是基础性资源,也是重要生产力。同时,描绘出了“大数据+工匠精神”,“发展共享经济”,“打破‘信息孤岛’、消除‘数据烟囱’”,“强化信息网络和数据安全”四大发展路径。这是实施大数据战略以来,在国家层面提出的新的大数据产业发展思路,为我省大数据产业发展提供了新的机遇和挑战。借鉴贵州经验,结合我省实际,突出实际应用,打造精品工程,是青海今后工作的基本原则和落脚点。
云计算与大数据:现在=f(未来)
——奇虎360云CTO、博士 何万青
【嘉宾简介】
何万青,奇虎360云CTO(首席技术官)和研发部总经理,高级技术总监。领导360安全公有云对游戏云,视频云和IoT物联云的平台和大数据产品开发。此前他在英特尔中国有限公司领导高性能计算应用优化和MIC众核,英特尔企业版Lustre并行存储产品支持达11年多,并担任天河-2号超级计算机核心团队成员负责英特尔Xeon Phi众核协处理器的主板集成。
他领导的英特尔亚太客户响应团队在10年间负责中国和亚太区大量高性能应用的并行化和性能优化工作,在业界享有很高的声誉,对石油地震资料模拟,数值气象预报,生命科学,基因测序,计算化学,传热和流体力学,数字内容创作,计算金融,互联网搜索引擎等广泛的应用进行持续优化和代码现代化工作,期间写作出版了6本并行计算专著。
【精彩观点】
“我认为最糟糕的专业演讲就是,主讲者自己觉得挺好,专业人士觉得高深莫测,听众莫名其妙。为了避免这样糟糕的情况,我尽量用大家都能听得懂的事例、语言讲述我的主题……”一开场何博士就用幽默的比喻引来了全场的掌声。
在云计算技术的支撑下,大数据已经成为新时代重要的战略资源。随着经济社会信息化日臻成熟,云计算、移动互联网和万物联网等新一代信息技术的广泛应用,数据增长速度越来越快,数据类型越来越丰富,大数据的价值日渐凸显。大数据时代,无论是政府机关、互联网公司、IT企业还是行业用户都面临巨大挑战及机遇。企业的决策方式正在从“业务驱动”转变为“数据驱动”。
技术发展的脚步:从1995年—2001年,互联网出现,并且伴随它出现的第一件事情实际上是英特尔公司生产的一款名叫“奔腾”芯片的问世,但随着互联网泡沫在此期间的大量建设,也就是随着网络的铺设,使得对计算机的要求逐渐提高,当时能够看得了动态网页就是好的,借此机会“奔腾”铺开了发展的道路。
大数据产生的原因:一方面来自数据之间的相关性,另一方面就是来自“大人群”的互联网数据。而人工智能是一个集技术积累、数据规模、产业环境合在一起的一种突破,最重要的是它确实是在使用大数据的技术。但我们也要想到一个问题,人的大脑大概是20瓦的功耗,大脑所能产生的智能要击败一个数据中心,也就是上千个CPU加上几百个GPU做出来的,这种功耗会很吓人。
大数据应用最典型的一个例子就是电脑围棋软件“阿尔法围棋”,举世瞩目的人机围棋大战以AlphaGo4:1战胜李世乭告终,关于人工智能的现在与未来,这场比赛给我们带来太多的思考与启示。从大数据的角度解释这个问题就很简单:机器人因为被输入庞大的数据信息,在棋局中综合大量数据,下棋其实也只是“知其然,而不知其所以然”,并没有严密的逻辑思维。面对突飞猛进的人工智能技术,很多人都担忧越来越多的岗位未来会被它所取代。事实上,这种担心没有必要,人工智能在未来10年都难以读懂文字,想赶上人类的智能,它还有非常遥远的路要走。
现在各行各业都在学习大数据,原因就在于时代趋势发生了转变,上世纪五十年代,人们常常根据过去的行为来推测未来,现在大有不同。去年,摩尔定律已达五十年之久,即颠覆成为常态。这个定律让我们明白,如果你走的路是正确的,小公司可以颠覆大公司,无所谓500强的企业。
现在我们可以在果壳网回答问题,我回答,提问者付费,但只有一分钟的时间,试想一分钟能解决什么问题呢?也许很多人出于好奇心而已。每晚大概十二时左右,系统会提醒你拿到了多少费用。这是什么?这就是互联网经济,过去可能是想都不敢想的事情;如今,通过这样的方式就能产生一个巨大体量的经济体,虽然它可能会有一个下沉发展的阶段,但是这样的付费方式往往更能吸引人们的注意力。
未来大数据,尤其是大的公司、厂商会拿走一大部分蛋糕,但是未来大数据时代中的技术人员慢慢会经历一个反客为主的变化,可用马云说的话:“人类正从IT时代走入DT时代。”也就是说你如果是具备数据科学家的思维和素质,并会运用相关工具,那么你可能在你所在的公司或组织里起到非常重要的作用,懂数据的技术人员将对决策产生影响。
未来3—5年的时间,大数据公司还会有比较大的发展空间,而且主要以服务为主,因为数据依然在拥有者的手中,到今天为止,大数据的系统都是用物理机而非虚拟机。
大数据主要实现的是精准营销,主要跟广告、游戏相关,这也是互联网最赚钱的两大方法。另外,就是我们所说的互联网金融,一个是马云的“支付宝”,相信这对大家生活的改变有目共睹!现在去杭州基本可以不用带钱包,由此产生了巨大的便利性,一旦使用人们将很难离开。
什么叫大数据?大数据出来之前,我们传统的称之为商业智能,实际上就是根据数据进行决策。大数据的作用就是做在线的分析和决策。
将大数据拎出来说,它本身没有什么意义,就像你整理家务,整理出来一堆旧书,想扔又舍不得,放起来你又永远都不会动,所以在这个整理的过程中你需要花费很大的精力及时间上的成本,也因此和大数据一样,我们的数据量越来越大,很多人不舍得扔掉一些数据,但你不会清理、不会处理,就意味着你有大量的购买、大量存储,大数据在一定程度上来说,不是什么灵丹妙药,但要承认的是,它是应用的进步,尤其对于企业来说,很多问题都需要通过大数据进行决策。
大数据的本质是什么?当数据足够多时,它就可以覆盖所有的可能性。所以在更多的情况下,它是一种应用科学,它不是我们传统所说的科学技术,因此在现阶段是不能通过大数据去推出新的发现和新的理论。
大数据的受益体是谁?互联网电商!现实生活80%以上的工作中,去发现规律实际上还是靠观察、演绎,所以像福尔摩斯这样的人在任何时代都是远超于大数据的。
不用神话大数据!首先做到数字化管理,我们的决策尽可能地基于数字,但是我们也要看到人对模式的观察往往要远超机器,所以,原来保留下来的依然要用,不能一蹴而就。
大数据现用的架构:Hadoop结构,它的出现原因是谷歌公司为了节省成本,使用价格低的机器,公司要算数据,就发明了这个东西。传统计算是数据走到计算那里去;而计算跑到数据这里来,就是互联网干的事情了!在机器并不多,配置不高的情况下,根据信息分散跟得上的特点,利用其他的节点算出局部的数据,最后将其合在一起。所以,他们做两件事:一是做分布式文件系统;二是计算在各个节点上怎么做,最好将计算代码放在当地运行再通过网络联在一起。
未来大数据的方向,首先是大规模并行处理,无共享架构的特点会比较突出,只需要通过软件的方式把大量的数据分布到各个节点上去,然后通过软件以及后台同步的方式做处理,这样就可以避免一个数据损坏致使所有数据不能用的困境。
互联网+时代:大数据安全面临的机遇与挑战
——北京中科同向信息技术有限公司董事长、博士 邬玉良
【嘉宾简介】
邬玉良,北京中科同向信息技术有限公司董事长,九三学社中央科技委员会委员、华北电力大学、北京校友会副秘书长、中国容灾备份创新发展联盟秘书长、智能制造产业联盟委员会专家,副秘书长,大数据国家战略计划联盟发起人、中国信息化创新发展联盟副秘书长,被评为2015年度中国创业创新新闻人物。
2010年,领导研发“备份软件Heartsone BackupV8.0”,获国家保密局、解放军信息安全评测和认证证书,公安部销售许可,国家信息安全产品强制性认证。
2011年,“备份软件Heartsone BackupV8.0”获得“科技创新产品奖”。
2011年,领导研发“基于CDP的企业级灾备平台PowerCDP”获科技部中小企业创新基金支持。目前,致力于灾备技术数据安全的开发。
【精彩观点】
数据的爆发式增长和社会化趋势是大数据产生的本质原因。
大数据并不是量大,它有四个基本的特征:更大规模的数据、更多样化的数据、更加实时的数据、价值密度低商业价值高。我们可以看到一个现象,在之前有很多可以存、可以不保存的数据;而在大数据时代,即便我没有办法保存数据,也一定要把它保存起来,大家都知道数据就是价值,就是权力。
大数据的三大精髓:模糊替代精确、相关性替代因果性、全集代替样本。比如通过一个人的微信朋友圈可以基本知道这个人的工作、生活,甚至家庭、兴趣爱好;再看看这个人的朋友圈谁跟谁相互点赞,就能了解简单的社会关系,这就是大数据的相关性。其次,我们过去的科学研究方法,在没有理论基础的条件下选择抽取样本,放进自己的理论中进行相关的推断;现在大数据的方法是,不需要、不去看样本,而是要看到所有的数据,现在有了超算,就可以把数据的全局拿来分析。
大数据作为生产力,不仅要从经济层面对其进行推动,还需要社会层面为之付出努力。新一届政府提出在提高政府的治理能力、转变政府职能的前提下,要通过现代信息技术提高政府的治理能力。也就是说,政府为在执政过程中更加科学,就要有大数据作为支撑,让大数据成为一些决策制定的合理依据。
为什么要把发展大数据上升为国家战略呢?拿发放低保为例,比如公安部、民政部的数据无法提供给人社部使用,如果要为一个低保人员发放补贴,目前的做法,需要这个人提交申请,再去各个部门开证明,每个证明都要加盖公章。但是真正需要被救助的人往往缺乏相关的社会关系,也不了解申请的流程;由于数据的孤立,也让一部分人有钻政策空子办理低保的机会。
如果各部门的数据可以共享,那么发放低保这样的事儿操作起来就容易得多。比如看申请人名下的存款、汽车、家庭成员构成如何、每月生活必须消费支出如何等方面的数据,就可以为那些真正需要帮助的人发放低保补贴。目前这些数据信息分属不同的部门掌握,社保部门想调用这些信息是做不到的。只有把大数据的利用上升为国家战略,由国家整体协调推动政府各部门信息公开,才能极大地提高政府的执政效率和管理能力。
如今,黑客入侵的目的更多是要偷有价值的数据。就像小偷入室盗窃一样,有多少贼是开启防盗门进屋偷东西的?恐怕不足百分之一。防盗门做得再好,小偷可以从窗户进来,可以破墙而入。只要小偷能够进来,就会失窃,那么再好的防盗门都将失去意义。所以,现在我们要认识到的数据安全就是让黑客即使入侵系统也拿不走数据,即便拿走了数据也无法使用。这才是数据安全防护的较高境界。
大数据安全层次主要分为六个层面:应用软件、网络安全防护、容灾备份系统工具、数据库、操作系统和CPU。
这六个层面的发展是不能越级发展的。因为这六个层面的发展是由低到高的过程,越高级别,就需要越深入地了解相应的知识。应用软件是最浅层面的,只需要了解最基础的软件知识和程序编写技术。而到容灾备份这个层面,需要了解的知识更多,不仅包括网络传输协议、数据库的知识还包括操作系统、带库等各种知识。所以当没有掌握相关的知识之前,是无法越级发展下一个阶段的技术革新的。
在容灾备份市场上,外国公司几乎占据了超过80%的市场份额。EMC公司是全球信息存储及管理产品、服务和解决方案方面的领先公司。世界上最重要信息中的2/3以上都是通过EMC的解决方案管理的。而另一存储巨头IBM近期发布了IBM中小企业存储市场战略和IBM最新推出的融简单、易用、经济为一体的产品。
我国目前在应用软件和网络安全维护方面已经做得不错,国内有一些发展很好的企业,比如,浪潮、华为、同有科技等,经过几年时间的市场锤炼,国内厂商表现出相当的实力和竞争力。
在容灾备份层面,是正在发展的时期。做不好容灾备份这个层面,想做数据库是几乎不可能的。因为没有发展完整的产业链,容灾备份没有做到国产化,与数据库兼容,那么数据库就好像空中楼阁,根本无法正常运转,这就是产业和技术发展的规律,从这个层面上说,备份是数据的最后一道防线。(宋翠茹 黄晓姝 杨展望)