互联网和数字经济飞速发展的这几年来,人类社会群体行为和个体行为的标准化和标签化的过程已经完成,到今天,谁能真正找到能够让这些数据发挥价值的方式,谁就可以享受到产业红利。从这个角度来看,我们不难发现当前人工智能应用较好的领域大多是信息化程度更高、数据密集的产业,如:互联网、智慧城市、医疗健康、金融等。人工智能时代的数据常常被类比为工业时代的石油,但数据又与石油具有完全不同的再生属性,行业不断产生和积累的数据蕴含着巨大的应用价值,这就需运用云计算、算法、平台等先进的技术工具来挖掘数据潜力。
9月25日,阿里云栖大会在杭州开幕。在Intel数据驱动专场上,由阿里巴巴集团副总裁、阿里云智能计算平台总裁、高级研究员贾扬清(花名扬青);汇医慧影联合创始人兼首席运营官郭娜;北高峰资本创始人、人工智能科学家闵万里(花名山景);Intel高级首席工程师、大数据分析和人工智能创新院院长戴金权(Jason)等几位行业嘉宾就“云端智能加速释放数据潜能”做了主题探讨。以下是圆桌实录:
主持人:非常荣幸和各位探讨云端智能加速释放数据潜能这个主题。年,中国的人工智能已跻身世界前沿。扬清在人工智能算法和开源框架领域,大家认为您是带路者,现在也在阿里从事AI的前沿研究,请您解析一下中国在人工智能的竟技场上走到了什么阶段,还面对什么机遇和挑战?
贾扬清:我应该算是阿里新人吧,刚加入6个月时间,之前有幸在开源(框架)方面做过比较有意思的工作。从AI之前的发展来说,它是和开放的科研、工程紧密结合起来的,中国的工程师和科研人员在AI发展当中起到了非常重要的作用,像TensorFlow、PyTorch背后都有中国工程师强大的身影,MXNet也是咱们中国的研究生创造的。所以我觉得在算法、工程能力上,咱们非常和世界接轨,甚至站在前列。就年看,算法的能力在增长,或者说变得相对稳定。我们说两步走,算法、应用各往前一步时,我们今天最大的机遇在于怎么样让AI算法应用当中落地。我们在科研领域训练深度学习算法单枪匹马就可以了,但在实际应用当中却需要让算法和数据、业务逻辑需要非常紧密地结合起来,这是当前的大趋势,也是AI可以来进一步创造价值的一个点。
主持人:非常感谢扬清,其实和今天的主题相呼应了,人工智能进入了产业落地的关键期。李克强总理在政府报告里提出了“智能+”,着重强调促进人工智能和实体经济相结合,来为行业赋能。想问一下山景(闵万里),您离开阿里从事相关行业的投资,在投资过程当中对于”智能+”在各行各业的应用有更加深刻的了解,您分享一下。
闵万里:智能化是大势所趋,前面经过了IT建设之后,到今天的信息化,人类社会的群体行为、个体行为的标准化、标签化已经完成了。谁可以从(数据)中找到智能,找到价值创造的方式,谁就可以享受到产业的红利。按照这个方向去看的话,会发现许多数据密集的产业、行业,比如:天然数据密集的互联网、智慧城市(这么多摄象头)、医疗健康(各种各样的传感器、CT扫描)等,这些都是数据密集产业。基本上可以说数据密集的行业和产业今天都是待开垦的金矿。在智能化手段的大潮下,用云计算的计算力,用算法平台等作为工具成为新时代的掘油,我们钻出来的是行业中更深层次的价值。所以我说智能化刚刚开始,而且潜在的空间非常大。更重要的是智能化所用的原材料是数据+计算力,而数据恰恰处在一个源源不断被创造的数据通货膨胀的年代,这跟石油天然不同。今天上午我们主论坛上在说数据是石油,但数据不同于石油,石油是不可再生,是有限蕴藏的资源,而数据却每分每秒都在产生。在数据通货膨胀的年代,智能的释放需要眼明手快的技术手段。十年前只有想法没有云计算搞不定,没有AI也搞不定,今天有了云计算、AI算法、caffe这些平台,又有源源不断产生新的数据作为原材料,所以价值创造几乎没有代价。这跟原来的工业革命靠重资本的方式完全不同,所有的行动都在产生数据。然后计算力,今天有了云之后计算力又唾手可得,而且老百姓都可以用得起超级计算,这个时候比拼的就是不是资本而是IQ了。谁有创造力,谁有产业经验,谁有胆识,谁就有可能第一个把产业更深层次的价值淘出来,所以我说人工智能刚刚开始。
主持人:我看过一部纪录片《你好AI》,这里边有汇医慧影在心脏病手术中,用英特尔的产品去做数据切片的工作。汇医慧影也是云端智能释放数据潜能特别成功的案例。请郭总分享一下在医疗领域,汇医慧影是如何用AI来挖掘出巨大大数据潜力的?
郭娜:汇医慧影目前在AI医疗医疗影像公司当中,影像数据AI在阿里云上应用方面是阿里云全球最大的客户,这是和阿里的关系。第二就是汇医慧影也是Intelcapital投资的全球唯一一家医疗影像AI公司。刚刚扬清谈到算法逐渐走向成熟的时候,今年是应用开发和商业落地特别好的时机。我们和英特尔拍了全球首部《你好AI》的人工智能的纪录片,当中就谈到了主动脉必行主动脉夹层和辅主动脉瘤这两个大病,我们通过AI算法能够将原来两三天的手术规划在两分钟时间内计算好。所以大家可以看到,一边我们在谈算法,一边我们在谈算力,到应用行业的时候,我们所有的医疗数据潜力得到了最大程度的释放和潜能的激发。所以医疗不是传统行业,我们看到不管是肿瘤药、癌症药,医疗一直走在最前沿,因为我们对生命是不断探索的。
特别要谈一下,我自己就AI数据、医疗如何结合的有一个特别深的感慨。我们在去年和英特尔共同发布了关于乳腺癌AI诊断的产品,当时英特尔历史上第一次把logo换成粉红色,就是来支持这个项目。我觉得它有一个特别好的公益性质,因为乳腺癌这是女性的第一大癌症。此外,让我们万万没想到的是这个事情不光在算法、我们的市场宣传、公益方面取得了非常好的效果,同时就在今年上半年,美国的NCCN关于乳腺癌肿瘤临床治疗指南当中就写到关于AI对新辅助化疗的决策。我们看到算法在快速演进,同时垂直行业应用当中的突破作为一种新的范式对于原来行业的改变也是在与时俱进的。
主持人:请Jason(戴金权)介绍一下Intel还有什么战略布局?
戴金权:我们和汇医慧影有非常紧密的合作,不光是IntelCapital的投资,在技术上也有很多合作,包括演讲当中也提到了英特尔最新处理器通过算力来加速AI的计算。同时在阿里云平台上,Intel最新的至强处理器上最新的推理加速都在阿里平台上有非常好的支持,所以他们(汇医慧影)可以在阿里云上高效地进行计算。
主持人:郭总,能不能分享一下。
郭娜:英特尔是一家伟大的公司,所以被Intel投资之后我们也要让自己成为非常好的技术公司。得益于英特尔非常多,我刚刚谈到不光是marketing,英特尔最新的技术,无论是云上还是边缘计算,所有最新的东西其实是美国和中国技术一起来让我们的算法跑得更加好,更适应。
可能天池这样的比赛对开发者有很大的激励作用,像我们刚刚谈到《你好AI》里边这个主动脉的产品,我们和英特尔一起还入选了年的国家科协的前沿创新奖。这个又在更大社会意义上来做这件事情。汇医慧影也愿意在技术潮流中一方面技术更加落地,另一方面努力跟最先进平台和算法保持一致,让我们最好的技术应用到垂直行业当中。所以其实合作很多,从市场、销售、技术支持,再到整个对社会影响力上,大家共同的推进吧。
主持人:刚才听到阿里云相当一部分客户就是医疗方面的,是吗?
郭娜:其实云栖大会不是第一次来了,但是这个组合更加亲切。每年云栖大会上汇医慧影都会作为医疗影象AI公司和阿里共同发布一个新的算法。比如今年3月份,我们和阿里共同发布的是肺结核人工智能诊断的新算法。我们看到在新疆、西藏包括整个一带一路很多地区肺结核感染率还是很高的,我们现在基本做到一秒一张肺结核X光片就可以筛出来,并且准确率达到96%以上,其实这块儿落地的效益还是蛮明显的。
主持人:云端智能现在确实成为一个核武器了,在挖掘数据巨大的潜力。像山景(闵万里)刚才说的,阿里和英特尔在数据智能方面给行业解决了不少的痛点,请扬清和Jason来分享一下阿里和英特尔在挖掘数据潜力方面到底你们的威力在哪里?
贾扬清:我觉得山景老师(闵万里)提到非常好的一点,今天大家越来越多地用到数据的力量,从无限当中来挖掘价值。山景老师(闵万里)作为我们数据平台非常重要的用户,对我们一直在提出越来越高的要求。这个让我想起来以前在软硬件领域说的一个定理,叫安迪比尔定理。WhatAndygives,Billtakes,Andy是Intel的CEO,Bill是微软的CEO。基本上硬件的能力或者我们提供的系统能力永远不够,因为软件永远能够提出更高的要求。像刚才说阿里云最大用户,从所有的行业合起来的情况来看,阿里云最大的用户是阿里巴巴自己。我们自己一直以来数据呈指数级增长,我们的应用呈指数级增长,但是对于基础架构和系统来说有这样的问题,我们不能光烧钱,所以有许多系统优化相关的问题,这时候就非常需要软硬件协同设计的能力。在构建一个大数据、人工智能系统时候,利用我们所观察到的计算模式的不同,比如有些对于存储有比较高的要求,有些对于计算有更高的要求。通过我们说叫performanceguiderofoptimization来进行更加深入的调优。我们跟Intel有非常多的合作,从我们的工作场景出发来非常深入地做端到端的优化。最近我们推出TPCx-BB这样的benchmark,我们一起合作获得了比第二名快一倍,便宜一半的效果,这在一定程度上体现出来软硬件协同的价值。
戴金权:我们和阿里云这边有非常多的软硬件优化的合作。硬件每提高一个数量级上的性能,软件可以达到另一个数量级性能。我们在TPCx-BB大数据处理分析端到端的benchmark上的世界记录,包括我们和阿里在Flink新一代的实施计算方面,特别是和大数据以及人工智能相结合方面,我们有非常多一起优化,一起来合作的工作。刚才提到英特尔很多的硬件产品,比如第二代的至强处理器等等,都已经在阿里云上有非常好的销售表现。我们通过软硬件合作可以大大提高效率,从而从计算上、能力上,通过大数据和AI来给大家带来更多价值。
主持人:山景(闵万里)您也是阿里云的用户?
闵万里:应该说城市大脑是阿里云的用户吧。因为基本上城市当中交通信号的实施控制、交通信号都是通过多源异构的实时数据流的融合,再把它映射到空间上不同的路段上。这种计算量是海量的,尤其是有高德每位用户都贡献数据时候,没有云是很难做的。十多年前做智慧城市时候,那时候搞一些报表做每周分析、事后分析,今天我们讲的是实时分析和提前介入,所以眼明手快是越来越快了,没有滞后。
主持人:城市大脑也是一个超算集群?
闵万里:不只是一个,有可能是多个,有可能城市大脑收到的的某一组信号是来自于另外一个超算集群算出来的。比如:天气预报我们知道是巨大计算量的事。天气预报说杭州5点钟开始下暴雨,这对城市大脑来说只是一条信息,但是这条信息需要城市大脑迅速地蔓延开计算出来交通应该怎么组织。这只是一条信息,但它背后中国气象局用了很大的算力去计算,它就像接力赛,一个集群一个集群在不断接力。如果溯源的话,城市大脑所用到集群可能远远地超出了今天所讲的狭义大脑的计算平台,包括其他领域的数据处理、分析、采集所用到的集群,可能不在城市大脑的范畴,但是有强硬关联。
主持人:想请各位大佬给我们画一下重点,年我们应该