网站首页
IC库存
IC展台
电子资讯
技术资料
PDF文档
我的博客
IC72论坛
ic72 logo
搜索关键字: 所有资讯 行业动态 市场趋势 政策法规 新品发布 技术资讯 价格快报 展会资讯
  • 达普IC芯片交易网 > 新闻中心 > 行业动态 > 正文
  • RSS
  • 寒武纪带头引燃AI“芯”战火!十大国产芯片同台竞技“硬刚”国际大厂
    http://www.ic72.com 发布时间:2019-11-18 15:29:44

     

    11月14日,在正在进行的深圳高交会上,国内AI芯片巨头寒武纪发布了边缘端AI芯片“思元220”和思元220-M.2边缘加速卡。据了解,思元220是一款专门用于深度学习的SoC边缘加速芯片,采用台积电16nm工艺,基于寒武纪全新的MLUv02架构,峰值算力达到32TOPS(INT4),在算力方面甚至超越了英伟达上周发布的系统级模块Jetson Xavier,且功耗仅为10W。这也让人不禁感叹,中国AI芯片正在从追赶实现超越。

    image002.jpg

      (图片来源于网络)

      据不完全统计,截止目前,国内已有超过 20 家企业投入到 AI 芯片的研发中来,当然也有更多新兴创业公司也都想蹭一蹭AI芯片的热度。但在竞争日趋激烈的AI芯片市场,只有不断的刷新自己的产品线,打造更强力的芯片才有机会赢得市场。

    image004.gif

      而寒武纪此次推出的思元220,显然是再次填补了自家产品链上的缺口。至此,寒武纪已经完成了覆盖云端(思元100、思元270)、边缘端(思元220)、终端(1A、1H、1M处理器IP),即云边终的使命。不过,本土AI芯片市场并不乏有实力的玩家。寒武纪思元220之后,国内还有哪些更值得关注的AI芯片呢?

      1.地平线:旭日二代

      与寒武纪同为AI独角兽企业的地平线,在上月刚刚发布了同样用于边缘计算的AI芯片旭日二代。旭日二代集成了地平线第二代BPU架构(伯努利架构),典型算法模型的算力利用率大于90%,加上地平线自家的高效算法,每TOPS算力可以处理的图像帧数高于同样标称4T算力的AI芯片,并且是同等算力GPU的10倍。

      规格方面,旭日二代采用28nm工艺,因为面向AIoT应用,其设计功耗仅为2W。当然算力从纸面数据上看4TOPS并不算太高,但考虑到其低功耗和28nm制程带来的成本优势,旭日二代在AIoT领域有很大机会去开辟出属于自己的市场空间。

      2.华为:昇腾(Ascend)310

      去年10月份发布的昇腾310采用了华为AI芯片中统一使用的达芬奇架构,而统一架构的优势在于对开发者非常友好。据编者了解,在AI芯片中统一使用达芬奇架构后,开发者在面对云端、边缘端、侧端等不同芯片的应用开发时只需要进行一次算子开发和调试,即可应用于不同平台,大幅度降低了迁移成本。

    image005.jpg

      从规格上看,昇腾310兼顾了AI算力提升与能效平衡,采用12nmFFC工艺,在最大功耗8W的条件下,可以达到16TOPS(INT8), 8TOPS(FP16)的性能。另一方面,华为在软件层面上对开发者的支持可能是最大的优势,除了上述提及的统一架构带来的优势外,华为还为其推出了高效灵活的自定义指令集,面向张量和向量计算进行设计,能够充分发挥出3D Cube的性能优势,提高各计算单元的利用率,并有效解决目前在AI应用中出现的能效比等普适性问题。而从产业的角度来看,开发成本的大幅降低可以有效推动AI应用的落地发展。

      3.紫光展锐:虎贲T710

      与前面的芯片都面向较为单一的使用场景不同,紫光展锐今年8月推出的高性能AI边缘计算平台虎贲T710一开始就面向日渐复杂的应用场景,以及应对不断增长的算力需求。

      据了解,虎贲710采用了异构双核架构NPU 和8核CPU架构,搭载了4颗2.0GHz的Arm Cortex-A75和4颗1.8GHz的Arm Cortex-A55,以及800MHz的IMG PowerVR GM 9446图形处理器。同时,为了应对各种不同AI应用的需求,虎贲T710还包含了 CPU、GPU、NPU、ISP、VDSP等处理单元。除了支持多种AI训练框架外,还支持多种AI模型量化方式和Android NN,拥有紫光展锐自研SDK,便于第三方应用程序能更高效地部署AI功能。此外,虎贲T710还整合了多媒体和无线通信能力,例如4K@30fps编解码、802.11AC、BT 5.0等功能。

      4. 嘉楠科技:勘智K210

      低功率和高性能并存从来都是一个伪命题,两者不得兼容。出于对低功率的要求,目前大多数AI芯片公司的解决办法是通过叠加模块来提升算力,例如在芯片中加入NPU来弥补AI算力的不足等。不过也有部分厂商另辟蹊径,从指令集的角度入手提升芯片算力,嘉楠科技的勘智K210就是其中之一。

    image006.jpg

      勘智K210中内置的FPU双核64位处理器采用了精简指令集RISC-V,使其自身功耗仅为0.3W,即使搭载摄像头等外部设备,功耗仍能够维持在1W左右。算力方面,在0.3W的条件下,勘智K210可提供1TOPS的算力,超过3TOPS/W的效率,能很好地适应各种超低功耗应用下的需求。

      5.比特大陆:BM1880

      与嘉楠科技相似,在当年比特币挖矿热时,依靠矿机研发崛起的比特大陆,也同样走向了AI芯片之路。在去年10月,比特大陆推出的AI芯片BM1880,是比特大陆首款面向边缘端计算的低功耗AI协处理器BM1880,采用28nm工艺,Arm A53双核架构以及RISC-V指令集CPU,其典型功耗2W,int 8精度算力能够达到1 TOPS,在Winograd卷积加速下,这一数值可以达到2 TOPS,支持CNN/RNN/DNN等。

      6.平头哥:含光800

      阿里平头哥在今年表现得相当活跃,7月份发布了基于RISC-V的处理器IP核“玄铁910”;8月,平头哥又发布SoC芯片设计平台“无剑”,但还没有一款芯片产品诞生。终于在9月,平头哥发布了自家首款AI芯片“含光800”。

      据达摩院介绍,在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在11月7日,阿里巴巴平头哥的AI芯片含光800在MLPerf基准联盟公布的Resnet50基准测试结果中,击败了谷歌TPU v3、英伟达T4和英特尔CLX 9282等获得单芯片性能第一。不过阿里并没有将这款处理器投入到市场上,而是将其用于阿里生态中,在云端与终端更好的结合,突出软硬结合的优势,并以无剑平台为核心,为企业提供普惠算力。

      7.云天励飞:DeepEye1000

      与寒武纪类似,云天初芯也在今年的高交会期间,正式发布了DeepEye1000芯片。DeepEye100专注边缘和端侧视觉应用,采用22nm工艺,基于多核异构并行计算架构设计,内置四核神经网络处理器,可支持INT16 / INT12 / INT8混合精度量化数据,采用存算融合体系架构和可重构计算阵列,可以灵活、高效的执行各种深度学习算法模型的推理计算,峰值算力达2.0Tops。

    image008.gif

      其中,DeepEye1000神经网络处理器由云天励飞自主研发,深度定制指令集,定制指令多达160条以上,支持主流神经网络模型。神经网络处理器采用可重构计算阵列,支持灵活可编程计算流,计算效率超过99%。另外,DeepEye1000还支持H.264和H.265解码,可支持4K@30fps视频、4路高清视频并行的实时分析。

      8.天数智芯:Iluvatar CoreX I

      作为天数智芯的首款边缘端AI推理芯片,Iluvatar CoreX I采用16nm制程工艺,基于32核并行数据流和图计算的CNN优化架构,支持检测、分类、识别等视觉智能算法,支持主流深度学习框架,能效比达到1 TFLOPS/W-0.2 TFLOPS/mm2,可支持实现超高能效比的边缘计算加速。同时支持FP16精度,单芯片算力达4.8TFLOPS,物体检测可达1000fps,支持TensorFlow框架原生兼容、客户开发环境无痛迁移,提供高性价比的消费级方案和高稳定性的工业级方案,面向行业用户提供端到端解决方案,面向开发用户提供软硬结合开发环境。

      9.依图科技:求索(QuestCore)芯片

      依图在今年5月份推出的“求索”是全球首款深度学习云端定制 SoC 芯片,定位服务器芯片/云端 AI 芯,可独立使用,将与依图的智能视觉分析软件结合,作为软硬件一体化的解决方案,适用于加速各类视觉推理任务,比如交通运输、公共安全、智慧医疗和智慧零售等行业,尤其是对云端智能视频实时分析等应用具有强需求的企业环境。

      在能效上,“求索”峰值性能达到 11.2T(深度学习推理运算),功耗 20W,摄像头单路功耗仅为英伟达 GPU P4 的 30%,同等功耗下,深度学习推理运算性能是市面同类产品的 2~5 倍。这款产品也支持 TensorFlow、PyTorch 等各类深度学习框架,适用于加速各类视觉推理任务,最高 50 路 FHD 视频流硬件解码,另外还支持虚拟化、容器化,可将 AI 云的弹性计算和调度提升一个量级。

      10.百度:昆仑

      百度的“昆仑”是中国第一款云端全功能AI芯片,其中包含训练芯片昆仑818-300,推理芯片昆仑818-100,主要面向AI大规模运算需求,这是目前为止业内设计算力最高的AI芯片。

      而在参数方面,“昆仑”采用了14nm工艺,拥有260Tops性能,512GB/s内存带宽,功耗仅为100+W。昆仑AI芯片具有高效、低成本和易用三大特征,其针对语音、NLP、图像等专门优化,同等性能下成本降低10倍,支持paddle等多个深度学习框架、编程灵活度高、灵活支持训练和预测。与含光800类似的是,百度表示将使用昆仑芯片,通过“百度昆仑云服务器”为用户提供强大的云算力。但截至目前,“昆仑”并没有任何量产的消息。

      小结:

      综上,国产AI芯片如今已走上高速发展的快车道,性能和技术上的不断刷新,也让一众本土AI芯片玩家站上了更高的舞台,与国外如英伟达、英特尔这样的老牌芯片巨头们同台竞技。虽然从某些参数上来看,国产AI芯片已经有很大的进步且能媲美国际大厂的产品,但长远来看,本土AI芯片企业想要从追赶实现超越,还有一段路要走。

      毕竟,并不是所有初创公司都能够像互联网巨头一般,有着充足的资金支持、完善的生态以及他们自身业务、应用等对于芯片的需求。对于国内AI创企们而言,目前的要做的不仅是从纸面数据上对芯片性能进行提高,更重要的是找到合适的应用领域,融入合适的生态圈,尽快取得落地应用并推广才是当务之急。


    www.ic72.com 达普IC芯片交易网
  • 行业动态
  • 市场趋势
  • 政策法规
  • 新品发布
  • Baidu

    IC快速检索:abcdefghijklmnopqrstuvwxyz0123456789
    COPYRIGHT:(1998-2010) IC72 达普IC芯片交易网
    客户服务:service@IC72.com 库存上载:IC72@IC72.com
    (北京)联系方式: 在线QQ咨询:点击这里给我发消息 联系电话:010-82614113 传真:010-82614123
    京ICP备 09027246号-1 京公网安备 11010802018497 号 企业资质