2022 年初推出的最新一代产品,提供了三个新的主要功能:
- 分散处理、集中收集方式,提升 ALU(算术逻辑单元) 单元的数据输入效率
- 极低功耗模式允许 NPU在不依赖 DRAM 的情况下运行,以支持常开的场景。
- 除了现有的 INT8 和 INT4 支持外,多精度ALU可支持多种数据结构: INT8, INT4, FP16(半精度浮点格式),可实现更高效、更灵活的数据处理。
推进 NPU 技术
“我们认为 NPU 技术的发展有三个不同的方向。第一是在 IP 层面上提高效率,”Park 解释道。 “一种方法是确保为大量 ALU 提供充足的数据并得到充分利用。还有提高ALU单元的密度并提升给它填充数据的能力。优化计算精度和改良未使用单元的电源管理方式也有帮助。”
由于移动设备的功率限制,为了省电IP将会在制程支持的最低电压下运行。这将很难通过改善效率提升性能,这也是为什么需要寻找其他方法来改进 NPU 技术的原因。
“第二个方向是整个电源系统效率的提高。 NPU 效率提升后,系统中其他组件的能效也需要相应提升。这些组件有 CPU、ISP(图像信号处理器)、NoC(片上网络)、DRAM 和电源管理 IC,”Park 说。 “其他 IP 消耗的功率通常与推运算速率成正比,如果这些 IP 的速度提升率与 NPU不一样,那么NPU 的预算力限度将随着时间的推移而愈发不足。系统层级上的改进包括最大限度地减少跨 IP 的数据传输、将CPU 任务卸载到更高效的内核等方法。”