3500/15 106M1079-01 支持先进和复杂的人工智能计算
耐能NPU IP系列允许ResNet、YOLO和其他深度学习网络在离线环境下的边缘设备上运行。耐能NPU IP为edge AI提供完整的硬件解决方案,包括硬件IP、编译器、模型压缩。它支持各种类型的卷积神经网络(CNN)模型,如Resnet-18、Resnet-34、Vgg16、GoogleNet和leNet,以及主流的深度学习框架,包括Caffe、Keras和TensorFlow。
耐能NPU IP系列功耗在0.5W以下,KDP 300版本功耗不到5mW。整个产品线的能效高于1.5 TOPS/W(注2)。通过采用滤波分解技术,可以将一个大规模的卷积计算块分割成若干个较小的卷积计算块进行并行计算。与可重构卷积加速技术一起,来自小块的计算结果将被整合,以实现更好的整体计算性能。通过耐能的模型压缩技术,未优化模型的尺寸可以缩小几十倍。
此外,耐能NPU可以与耐能的视觉识别软件相结合,为实时识别分析和响应提供解决方案。
KDP 300通过3D结构光和双镜头相机的图像分析支持3D实时面部识别。KDP 300也适用于要求超低功耗的边缘设备。包括计算和SRAM(静态随机存取存储器)在内的功率小于5mW。
KDP 500可以对海量人脸、手和身体姿势进行实时识别、分析和深度学习,非常适合智能家居和智能监控领域的应用。它的计算能力高达152 GOPS (500MHz)(每秒十亿次运算),同时保持100mW的功耗。
KDP 700支持更先进和复杂的人工智能计算,以及高端智能手机、机器人、无人机和智能监控设备的深度学习推理。它目前正处于开发阶段,预计将提供卓越的计算能力,峰值吞吐量可达4.4 TOPS(1GHz)(每秒万亿次运算),同时功耗保持在300~500mW。
注1:测量条件:CNN切片尺寸150x150,CNN帧率5fps,主频20Mhz。注2:能效因半导体工艺而异。在40 nm工艺下,耐能NPU的能效可以达到1.5TOPS/W以上
51308351-175
51101318-900
TC-FXX101
51107404-100
PFS-778-D-5/1
10001/1/1
620-2030
FTA-T-08
SDS-C2-D2CM-1
620-2033
620-0090
51309150-225
620-0038C
51304516-250
51201557-100
51400159-HDW
621-1100RC
10205/1/1
10213/2/3
621-0010-AR
621-3580RC
51304441-200
10212/1/1
10201/1/1
10101/2/3
51199932-200
FC-TPSU-2430
51304446-150
TC-IOLI01