AI芯片为何突然火了


细数芯片的历史,就是一个从专用芯片转向通用芯片,又转为专用芯片的过程。

 

最早追溯到上世纪60年代,Intel从专用芯片转向通用型芯片中央处理器(CPU),英伟达转成GPU,这两年又产生了TPU。


这个整套体系都是一个把芯片越做越普世化的过程,但这两年由于终端要降低成本,所以又要返回到专用芯片,因为通用芯片相对来说,效率比较低,制作成本比较高。


所以,这两年专用芯片开始火起来。

 

从通用型的、服务器型的、集成型的芯片,转成专用型的,部分设备使用的,有一定功能的芯片,再加上这两年正好赶上AI大爆发,大家就很自然地把AI的需求烧制到这些芯片里,也就是我们看到的AI芯片异军突起。

 

为何终端场景会催生专用芯片?


终端的场景为什么一定要用终端芯片,而不能通过一个捕捉器做网络传输送到云端、送到服务器端,用服务器的CPU、或GPU、或TPU去处理,然后再返回数据呢?

 

是因为你的网络无论多快,中间都有几百毫秒的时间差,而终端芯片未来都需要做到当机立断、直接分析。

 

比如一个机器人,它看到你之后,需要迅速分析出你有什么特点,并跟你对话。这个过程中,如果机器人只有接收器,需要传送到云端再回来,无论网络多快,都会有时间差。

 

所以,为了提高响应速度,终端开始催生自带处理器的需求,比如能做图像识别、语义识别、语音识别,运动机能的一些处理等,那么这个时候,终端就需要具备一定的人工智能能力(AI能力)。

 


专用芯片起势后,玩家们到底比拼什么?


当专用芯片这个需求起来之后,玩家们就要开始比拼了,具体来说,比的是:

 

第一,你的硬件结构是不是最优。


硬件行业的特点是:没有最优、只有更优。


硬件永远都在迭代,背后的原因,主要是摩尔定律在起作用。此外,当摩尔定律晶体管变成量子化的东西后,它会继续进化,从分子层面进到原子内部层面,再继续找其它的计算位。

 

第二,算法是不是最优。

 

前两年大家非常痴狂的去搞神经网络算法的时候,变体非常多,从最开始简算的RNN变到LSTM,变到更为复杂的结构,从最开始设计CNN,到CNN的复杂结构,再到用CNN做对抗网络…

 

在大家疯狂竞争算法的时候,2017年又出来一个理论说:神经元的基础单元不应该是神经,而应该是一个胶囊;这样一来,算法底层又改了,Hinton先生把自己30年前的学术成果给推翻了。在Capsule  Network中,in&out在单个处理单元上变得更复杂,虽然网络连接过程还是原来的样子。


所以,很多人又只能整个推翻,重来。

 

第三,工程细节是不是最优。


人们也发明了很多种方法,比如原来是全连接的,后来又有CNN部分模块连接,然后又出现了很多类似Dropout的模式,连接着同时遗忘着,发现比正常的还更好。

 

第四,工程上的创新每天都在发生。


每个工程师都有工程上的创新。100个工程师里如果有一个工程师有了意义深远的创新,那么对于整个行业来说,又是一场大变革。

 

无论是怎样的创新,都在不断突破,不断提升效率。比如,在算法上,AlphaGoMaster和AlphaGo  Zero,后者的效率相对前者就有突飞猛进的增长。

 

所以,一旦底层被改变,一切又变得不一样了,又得迭代。比如,原来可能是20秒解决,你能19.8秒解决;但现在,突然底层一变,你变成10秒解决了,就又是一层迭代了。


没办法,这个行业就是这样。

 

从硬件、软硬结合,软件、算法几个方面来看,每天都在迭代,所以它很难:由于它没有定型,无定型态的结果导致对专用芯片的固定性要求是非常苛刻的。


因为专用芯片很大的问题是一旦定板、开模,这个东西就不能改,这是一个很大的问题。所以,如何做一个适用性最强的专用芯片,这是非常重要的。一般的专用芯片做完之后,比如只服务于某一种语音识别机的芯片,一旦算法更新,底层对模块的要求就又不一样了,那么这个专用芯片就不能用了。于是,只能再做一个新的专用芯片。

 

这个事情的迭代速度太快了。

 

芯片的三种类型:


前面大致罗列了专用芯片崛起的背景,接下来我们具体聊一下芯片到底有哪三种类型:


  • 集成型的芯片(CPU、GPU、TPU),属于它的模块阵列非常统一的,它能处理几乎所有的事情,又叫通用型芯片

  • FPGA可编程门阵列

  • 专用芯片


其中,FPGA相当于编写硬件,通过改变硬件可以随时调整功能逻辑,但FPGA有以下几个大问题:

 

  • 成本比较高,真正好的FPGA要8000元-1万元。

  • 编写复杂,门槛高,修改难度大。

  • 编程过程中的效率比高级算法低,这样就导致开发难度也比较大。


所以,FPGA是个过渡过程,它能够衔接通用型芯片和底层专用芯片。

 

说完FPGA,再说说专用芯片。


专用芯片的特点是价格极其便宜,只要你开模、打板之后,基本上一片50-100元就搞定了,但开模费500万,而且一旦开模就改不了。(营长注:这里500万为概数,杨歌想表达是开模费很高,对公司来说,是一笔不小的负担。据营长所知,开模费的量级一般在数百万-数千万之间。)

 

如果用数学的方式来理解这三类芯片,那就是:


  • 专用芯片又叫阶跃函数,意思就是,这个东西开了模之后,下一次你要再改,你就得整个上一等;

  • FPGA是线性函数,慢慢涨、慢慢涨;

  • CPU、GPU等集成型芯片是指数函数,成本高,但它是一个好的模式。


专用芯片的成败关键:


目前,大家倾向于回归专用芯片,这也是因为专用芯片在2017年有两大推动力:比特币的挖矿机人工智能

 

基于这两股力量,编写专用芯片需求来了,因为FPGA和CPU成本太高了。


但专用芯片的问题也来了,那就是,无论哪个时代,不管你是20世纪70、80年代,还是现在,专用芯片都会有过时的一天,因为技术一直在迭代。这时候,就是考验你对专用芯片把控力的时候了,一句话,你设计的专用芯片到底能支撑业务走多久。

 

如果你编出来的专用芯片,能持续三年使用,那么同期你就可以去研发另外更新的专用芯片。三年后,当原来的专用芯片产能要下降的时候,你可以拿新的专用芯片顶上。你要能顶上,那这个能力就厉害了。

 

但如果你的专用芯片半年就过时了,那你的成本就太高了,因为你每个专用芯片的打板就需要500万以上,对初创公司来讲是完全承受不起的。(营长注:此为概数,只是为强调打板花费较大。)如果你还不停地在打板,那你的公司就危险了,你还不如用FPGA和CPU来做,现在多核CPU也能完成。

 

现在专用芯片的一个竞争在于,你编写出来专用芯片是否鲁棒性、适应性和存续性足够强,是否能够适应更多的人工智能算法模块,是否能扛住算法变体…

 

比如当CNN一变体,卷积核一变体,这个芯片能不能扛住?当LSTM的循环网络内部结构中,忘记门和记忆门这两个发生变化,你能否扛住?

 

当然,Capsule  Network一出来,不仅你扛不住了,大家都扛不住了。

 

总的来说,你要让你的专用芯片在容错性和鲁棒性、适应性上做到最强,这样,你的成本才能算得过账来。但大部分技术人员的账,可能算不了三到五年的时间。

 

还有些人把目光放在非常细的地方,一定要编到极致,保证局部的鲁棒性、容错性提到最高,但长期的、中长期,比如三年期,这样不一定行。

 

比如,在交通图像监察识别上,你怎么用都不出错,正确率99.9%,但突然过两年算法一升级,你怎么办?


因此,我不建议把目光放到单个场景的适应性上,我认为应该放在一个长期的、场景变革的使用性上,这点非常重要。

 

这些问题其实是现在AI芯片竞争最重要的底层逻辑。在AI芯片领域,我们投了鲲云科技,他们的联合创始人为斯坦福的客座教授、帝国理工的教授、英国皇家工程院院士,发表300多篇的论文。

 

他们的特点能把芯片的适用性做得很好,芯片的场景适应性、网络适应性、算法适应性非常强。

 

同样做的很好的公司还有地平线、寒武纪、深鉴等,不过也有一些公司,场景化的正确率只有95%,甚至85%,那么这些芯片可能就没法用,或者只能调动一定的模块函数,不能调动大部分模块函数。

 

目前来说,深度学习训练过程是不需要用AI专用芯片的,因为AI专用芯片主要还是在某一个终端应用场景用。一般来说,终端人工智能芯片并不执行训练过程,它只执行使用过程。这是大家容易产生理解误区的一个点。

 

AI芯片市场距离饱和还很远:

 

说到终端市场,英伟达也在猛攻终端市场。英伟达去年出了一个TX2的新型芯片(也是终端芯片)。但英伟达的终端芯片是一个轻版的集成化芯片,是把它集成化的GPU镶在了一个小的芯片上,形式了一个专用芯片。所以,现在的AI专用芯片还需要扛住英伟达的竞争。

 

目前,人工智能技术有三层:


  • 基础数学物理层

  • 技术模块中间层

  • 应用层

 

技术模块中间层(简称模块层)是指图像识别、语言识别、语义识别、运动机能识别;底层,即基础数学物理层,就是芯片,数据传输、数据存储结构、算法结构、算法模块。

 

而应用层中,几个比较大的场景有:


  • 智能家具、智能房屋、智慧城市

  • 机器人

  • 个人语音助手

 

这几个场景的入口模块都需要完整的、完全标准的模块层,就是说语音识别、语义识别都则需要非常精准,无论是器械,还是一个机器人,都需要模块层要很成熟,同时需要底层芯片层很成熟。目前,大家都在竞争这个市场。

 

二十年后,周围的物体可能拍一拍都能动、都能说话,每一个东西都需要两个基础的模块体系。


  • 第一个模块体系:硬件模块体系,就是它的硬环境。

  • 第二个模块体系:也就是软环境。

 

软环境就是科大讯飞、商汤、旷视等等在做的东西,硬环境就是英伟达、通讯云、鲲云、深鉴等公司在做的。

 

现在的AI专用芯片市场,如果说市场饱和度满分是10分,现在也就1分不到。

 

虽然现在才1分不到,但今年的AI芯片公司突然火起来,就是因为大家预期了十年之后的应用场景,十年之后这个市场是很大的,不过大到什么程度不好做预期。

 

现在市场上的几家公司,显然还是不足以形成大的竞争。

 

如果做个比喻,现在的市场,也就是刚刚进入体育场,裁判还没有开始吹哨的时候。

 

对于AI专用芯片来说,应用场景还没有完全开发完,有人去做无人机监测、有人去做道路摄像头监测、有人是做家居环境。总的来说,目前各家的应用场景都还没有锁定,还处在一个恶补基础知识的阶段。

 

当然,这个阶段完成之后,可能有的转向交通,有的转向家庭环境了,各有各自的立足的垂直领域,并继续迭代。那么等到那时候,可能就不竞争了。




注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2020 ITdaan.com