三年夜派系决战AI芯片:英特尔压宝神经收集处置器 时候:2018-06-01来历:21世纪经济报导(广州)阅读次数:1255
5月23日,在有着103年汗青的旧金山艺术宫中,英特尔的新晋科技年夜会 人工智能开辟者年夜会(简称 AIDC )如期而至。这一次,英特尔聚焦在拓宽人工智能生态。 在罗马式建筑和科技感的AI场景间之间,英特尔的AI掌舵者Naveen Rao侃侃而谈英特尔的人工智能软硬件组合,而*重磅的信息莫过在Nervana神经收集芯片的发布预告,依照计划,英特尔*新的AI芯片Nervana NNP L-1000,将在2019年正式推向市场,这也是英特尔**个商用神经收集处置器产物。 两年前,Naveen Rao仍是深度进修草创公司Nervana Systems的首席履行官兼结合开创人。在公司被英特尔收购后,Nervana成了英特尔人工智能的焦点战舰,Nervana NNP系列也应运而生,Naveen Rao则被录用为人工智能产物事业部的总负责人。 英特尔人工智能产物事业部副总裁、Nervana团队成员Carey Kloss在接管21世纪经济报导记者专访时谈道: 我们创业早期就最先研发Lake Crest(Nervana NNP系列初代芯片代号)。那时我们全部团队大要45人,正在构建一个*年夜的Die(硅芯片),我们开辟了Neon(深度进修软件),还构建了云栈,这些都是小团队所完成的。可是这也是挑战地点,小团队成长会有阵痛,我们花了很长时候才把**批产物拿出来,Nervana在2014年成立,直到客岁芯片才真正问世。 不外,插手英特而后,Nervana可使用英特尔的各类资本, 固然,挪用资本其实不是一件轻易的工作,可是英特尔在产物的市场化方面具有丰硕的经验。同时,英特尔有迄今为止我见过的*佳的后硅培育(post-silicon bring-up)和架构阐发。 Carey Kloss告知21世纪经济报导记者, 出品芯片方面,我们稀有百个系统同时运行,Nervana的员工和6个月前刚插手的成员也都为了新品通宵达旦地协同工作。 在他看来,Nervana此刻处在公道的节拍中,已具有了来岁获得成功的所有要素。 除Nervana,英特尔收购的人工智能旗舰企业还包罗专谛视觉处置的Movidius、FPGA(现场可编程门阵列)巨子Altera、智能驾驶相干的Mobileye等。事实上,从2011年最先,英特尔就最先不竭地投资人工智能相干的公司,此中也包罗了中国的寒武纪、地平线。 与此同时,英特尔的竞争敌手也在日趋强大。英伟达的GPU在人工智能范畴高歌大进;谷歌前不久发布了第三代AI芯片TPU,该芯片针对谷歌的深度进修架构TensorFlow进行了优化,而且谷歌对开辟者供给了TPU等底层办事;客岁,百度结合ARM、紫光展锐和汉枫电子发布DuerOS聪明芯片,首要供给语音交互解决方案;Facebook和阿里巴巴也纷纭进军芯片范畴,此中,阿里巴巴达摩院正在研发名为Ali-NPU的神经收集芯片,首要用在图象、视频辨认和云计较等场景。 在这场人工智能芯片的 遭受战 中,英特尔又将若何应对? 三年夜派系争霸 从整体来看,今朝全球人工智能的款式还没有开阔爽朗,属在各自做手艺摸索的局部战,还没有进入群雄逐鹿的整体战。人工智能是一个笼统的概念,具体的利用场景差别颇年夜,各家公司偏重点有所分歧,若按照手艺和营业门户进行分类,可以将全球公司分为三个派系。 其一是系统利用派,*典型的代表是谷歌和Facebook。他们不但开辟人工智能的系统级框架,好比谷歌出名的人工智能框架Tensorflow、Facebook的Pytorch,并且还年夜范围地投入利用。例如,谷歌斥重金研发主动驾驶,推出翻译等2C营业。而Facebook也将人工智能手艺普遍利用在社交收集中的图象处置,天然说话处置等诸多范畴。 第二类是芯片派,今朝首要是供给算力撑持,*年夜的玩家就是英特尔和英伟达。英伟达的GPU捉住了计较装备需求的要害机会,在图形衬着、人工智能和区块链范畴的计较表示十分凸起,在这些营业方面也给英特尔带来压力。同时英伟达仿佛和英特尔的 Intel Inside 分歧,它更但愿成为真实的算力平台,而且成功推出了本身的CUDA平台。 就在5月30日,英伟达发布了全球首个融会人工智能和高机能计较的计较平台 HGX-2,这也是今朝*年夜的GPU DGX-2背后的计较平台。 作为传统算力范畴的老迈英特尔天然不甘示弱,50年的企业很有老骥伏枥的意味,最近几年来在人工智能范畴几次倡议重磅并购:2015年167亿美元收购 现场可编程门阵列巨子 (Field Programmable Gate Array,FPGA)Altera,为将来算力的成长趋向奠基根本,FPGA在云计较、物联网、边沿计较等方面有很年夜的潜力;2016年英特尔收购Nervana,打算用这家公司在深度进修方面的能力来匹敌GPU;同年还收购了视觉处置芯片草创公司Movidius;2017年英特尔以153亿美元收购以色列协助驾驶公司Mobileye,旨在进军主动驾驶范畴。 在系统利用派和芯片派以外,第三类是手艺利用派,剩下的年夜部门公司都属在这一类型。固然分歧的公司都宣称本身在深度进修、人工智能范畴有着深挚乃至怪异的手艺堆集,但现实上年夜多是基在系统利用派和芯片派的手艺平台。只不外手艺利用派更多的面向C端用户,包罗主动驾驶、图象辨认、企业级利用等。客不雅上说,手艺利用派属在 正人善假在物也 。 从今朝的竞争款式上来看,系统利用派已逐步占有了整体优势,在人工智能范畴具有了*焦点的竞争力。在传统的电脑和手机时期,系统和芯片更多是合作关系,芯片乃至加倍占有主导地位。具体来看,好比在电脑市场上,英特尔在算力范畴完全制霸,横跨PC和苹果的MAC机。而系统方面,Windows和iOS各有所长,没法取代对方,但他们配合的英特尔却没法取代。到了手机时期,固然算力的主角从英特尔变成了高通,可是芯片仍然处在焦点的地位,其主要性和操作系统不相上下。 而*近1-2年,情势转变很快,苹果放出要本身研发和出产MAC芯片的口风,英特尔股价一度闻风下跌。在人工智能范畴,如许的趋向加倍较着,因为计较场景的需求差别化极年夜,谷歌按照本身的需要研发成熟的芯片变得需要,手艺上也更可行。英特尔假如要为分歧的场景定制芯片,意味着英特尔将周全转入2B范畴,和之前的2B2C模式比拟,纯2B的营业明显会更像乙方,营业线的复杂度会急剧增加。而汗青上来看,一家公司从2C转向2B整体来看常常都是由于掉去了在行业中的焦点统治地位华体会体育app而不能不退而求次。 压宝Nervana NNP 那末,在剧烈竞争中,英特尔又若何进一步加码芯片事业? Naveen Rao插手了英特而后,成为英特尔副总裁、AI事业部(AIPG)负责人,主导推出英特尔神经收集处置器(Nervana NNP)系列芯片。此次在AIDC年夜会上提出为开辟者供给软件东西、硬件、生态。在业内看来,以英特尔的手艺实力,软件东西和硬件其实不成问题,可是生态却有待商议。在PC时期,生态的焦点是芯片,是以环绕芯片构建生态便可以令英特尔安如盘石,可是在人工智能时期,人工智能系统才是生态的焦点,供给算力的芯片是生态的一部门,CPU可以供给算力,GPU也能够供给,英特尔可以出产,英伟达也能够出产,乃至谷歌、苹果本身也能够出产。 今朝在数据科学和深度进修计较范畴,英特尔的芯片结构首要有Xeon(至强)芯片系列、Movidius的视觉芯片VPU、Nervana NNP系列、和FPGA(现场可编程门阵列)。这几条产物线别离对应几个分歧的细分利用场景。 Nervana NNP系列则是神经收集处置器,在深度进修的练习和揣度阶段中,Nervana NNP首要针对练习阶段的计较,依照英特尔的打算,到2020年要将深度进修练习(Deep Learning,简称 DL )的结果提高100倍。这款神经收集处置器由英特尔和Facebook一路合作设计,可以猜测该芯片很年夜水平上应当会对Facebook的机械进修框架Pytorch有很好的撑持,究竟Facebook的Pytorch的野心必定是要和谷歌的Tensorflow一决高低。不外*新款芯片2019年才会正式推出商用,届时深度进修的款式转变若何没法预感。 Naveen Rao在其博客中写道: 我们正在开辟**个商用神经收集处置器产物英特尔Nervana NNP-L1000(代号Spring Crest),打算在2019年发布。与**代Lake Crest产物比拟,我们估计英特尔Nervana NNP-L1000将实现3-4倍的练习机能。英特尔Nervana NNP-L1000还将撑持bfloat16,这是业内普遍采取的针对神经收集的一种数值型数据格局。将来,英特尔将在人工智能产物线上扩年夜对bfloat16的撑持,包罗英特尔至强处置器和英特尔FPGA。 事实上,Spring Crest在2018年末推出的传言早已有之,可是今朝看来,官方发布的2019年这一时候点略有延迟。对此,Carey Kloss向记者注释道: 进入更现代化的制程节点,我们集成了更多的Die(硅芯片),可以取得更快的处置速度。可是需要必然的时候去制造硅片,也需要时候把硅片酿成新的神经收集处置器,这是延迟的缘由。 对两代芯片的区分,他阐发称: Lake Crest作为**代处置器,在GEMM(矩阵运算)和卷积神经上都实现了很是好的计较操纵率。这不但仅是指96%吞吐量的操纵率,而是在没有充实定制化的环境下,我们也获得了年夜大都环境下实现GEMM高在80%的计较操纵率。当我们开辟下一代芯片时,假如我们可以或许连结高计较操纵率,新的产物在机能上有3到4倍的机能晋升。 谈和竞争,Carey Kloss暗示: 我不知道我们竞争敌手的线路图是甚么,但我们的反映速度相对较快,所以我认为我们不会在神经收集处置上处在劣势。好比bfloat16已有一段时候了,它*近变得更受接待,很多客户提出撑持bfloat16的要求,我们也慢慢转向撑持bfloat16。 而对照谷歌的TPU来看,他认为TPU二代近似在Lake Crest,TPU三代近似在Spring Crest。 四面出击 除备受存眷的Nervana NNP,英特尔的Xeon芯片首要面向办事器和年夜型计较装备,好比我国超等计较机河汉一号和二号就采取了Intel Xeon六核处置器。 在视觉芯片方面,英特尔的营业量增加敏捷。Movidius VPU芯片早就面向在汽车、无人机等新兴的硬件市场,好比年夜疆无人机、特斯拉,和Google Clips摄像头中都采取了Movidius的视觉芯片。 Movidius的市场负责人Gary Brown告知21世纪经济报导记者: 在Movidius,我们研发的芯片被称作视觉处置单位VPU。VPU是一种兼具计较机视觉和智能摄像头处置器的芯片。所以我们的芯片所做的处置大要有三类: ISP处置,也就是图象旌旗灯号处置,基在摄像头捕获手艺的处置,和计较机视觉和深度进修。 他举例道,具体的利用场景包罗VR产物和机械人手艺、智能家居、工业摄像头、AI摄像头,还监控和安保。此中, 监控和安保是一个庞大的市场,特别在中国,监控和安保摄像头的市场特殊年夜,有一些年夜公司在研发监控摄像头,例如海康威视和年夜华。 Gary Brown还提到,智能家居范畴今朝正在敏捷成长,固然市场很小,可是成长神速。 有良多公司在研发智能装配,如智能家庭安防、小我家庭助手、智能门铃,和公寓和家庭的拜候节制。可是在家居范畴,要做到低本钱、低能耗、电池寿命长,和很是精准长短常有挑战性的。由于好比室外的树荫在移动,就有可能触发了防盗警报,是以很是低的误报率长短常主要的,要有杰出的正确性。 而公司的挑战之一就是若何继续缔造高机能的芯片, 我们有一些策略,好比,用一个前端算法下降功耗,如许我们就可以封闭年夜部门芯片,只运作小部门*优化的脸部检测功能。当一张脸呈现时,其他芯片将被启动。如许就可以一向连结脸部监控系统开启。我们还良多演算节能手艺,使家用智能摄像头续航时候到达年夜致6个月。 Gary Brown注释道。 另外,FPGA这条线则由Altera执掌场合排场。跟着5G海潮的到来,IoT物联网的数据阐发和计较需求会暴增,物联网的接入节点最少是数百亿级的范围,比手机范围要超出跨越1-2个数目级。物联网的典型需求是需要矫捷利用算法的转变,这是FPGA的强项,FPGA可以经由过程本身布局的改变来顺应定制化计较场景的需求,这也使得英特尔在将来为更多分歧类型的装备供给高效供给芯片酿成可能。从167亿美元的收购金额便可以看出,英特尔买的明显不只是面前的价值。 速攻企业级场景 英特尔近期的一项查询拜访显示,在美国企业客户中,50%以上都正在转向采取基在英特尔Xeon处置器的现有的云解决方案来知足其对人工智能的初步需求。而多位英特尔高管在接管采访时都向记者暗示,没有一种解决方案合用在所有的人工智能场景,英特尔会按照客户需求对手艺和营业进行搭配。好比,英特尔会将Xeon和FPGA、或Xeon和Movidius设置装备摆设在一路,从而实现更高机能的人工智能功能。 对英特尔而言,这些强化的人工智能功能将被普遍地利用在企业级场景。Naveen Rao就暗示: 在加快向人工智能驱动的将来计较过渡之时,我们需要供给周全的企业级解决方案。这意味着我们的解决方案要供给*普遍的计较能力,而且可以或许撑持从毫瓦级到千瓦级的多种架构。 Carey Kloss进一步向21世纪经济报导记者注释人工智能芯片的利用场景: Spring Crest可以说是*高档级的Nervana神经元处置器架构。是以它的客户就包罗超年夜范围计较中间、已具有相当壮大的数据科学工作的年夜型企业、当局等等。假如你需求的是低延且小模子,Xeon就可以帮忙到你,它可以把数据从云到端买通。 具体来看,英特尔也在医疗、无人驾驶、新零售、物联网等场景上做了摸索。好比在医疗方面,据介绍,英特尔正在与诺华(Novartis)合作,利用深度神经收集来加快高内在挑选 这是初期药品研发的要害元素。两边的合作把练习图片阐发模子的时候从11个小时缩短到了31分钟 效力提高了20多倍。 在无人商铺方面,英特尔为京东无人便当店供给 计较年夜脑 ,今朝已在多个智能门店(中石化易捷便当店、京东之家)和智能售卖机项目中摆设利用。在算法上,京东方面暗示,无人商铺用到的机械进修算法首要集中在知人、知货、知场3个标的目的,因为触及线上线下数据买通,将视频等非布局化数据转化为布局数据等,需要用到此刻比力风行的机械视觉范畴CNN(卷积神经收集)算法,聪明供给链方面用到的传统机械进修算法,如SVM、统计学的线形回归,逻辑回归等。在收集前提比力好的环境下,大都视频数据可使用较年夜模子在云端完成。在收集欠安的环境下,经由过程端计较好比移动端,边沿计较利用小收集完成。而利用的硬件包罗Intel的边沿办事器等。 虽然英特尔外遇劲敌,转型、扩大的程序十分果断。仅从研发数值来看,按照IC Insights的统计数据,2017年排名前10位的半导体厂商研发总支出为359亿美元,英特尔位列**。陈述显示,2017年英特尔的研发支出为131亿美元,占团体总支出的36%,约为英特尔2017年发卖额的五分之一。 跟着各家的巨额投入,AI芯片的战争还将愈演愈烈。