本文由以下作者联合采写:
• Samsung Foundry 边缘和端点业务营销总监 Tim Dry
• Blaize 平台工程副总裁 Santiago Fernandez Gomez
• VeriSilicon 北美平台解决方案销售副总裁 Mahadev Kolluru
Blaize 面向边缘人工智能 (AI) 的新型流式处理器,是中小企业利用半导体行业资源追求自身目标的新机遇的真实案例。
直到现在,AI 应用所采用的处理器芯片大多仍是 GPU 等器件的改装,而这些器件最初的开发用途并不在此。这既是因为这些现有器件确实非常实用,也是因为大多数公司都认为开发 AI 专用处理器的成本高昂、程序复杂且/或风险极大,因此望而却步。
但随着 AI 市场开始急速扩张,位于边缘和端点的各种新应用将会需要更贴近具体任务和场景定制的半导体,不再需要在云端进行 AI 处理。我们开始注意观察半导体行业如何不断演进以满足这些需求,以及这对于 AI 市场以及期望进入该市场的企业有何影响。
边缘 AI 初创公司 Blaize 就是一个非常实用的案例,该公司以工业、智慧城市、汽车传感器融合、最后一公里配送和零售等应用领域的客户为目标,最近推出了 Pathfinder 和 Xplorer 等模块化系统平台及随附的软件工具。
该公司指出,现有边缘解决方案对于这些行业而言,“不是太小而难以承担计算负载,就是太贵且难以实现生产。” Blaize 携手 Samsung Foundry 和设计/IP 公司 VeriSilicon 开发了新型图形流式传感器 (GSP),助力实现多传感器处理能力、紧凑尺寸、低耗电量和易于编程等优势,立志弥补上述不足。
为什么选择流式处理器?
流式处理器在实时分析多种来源的连续图形数据方面具有多重优势,例如工厂车间或零售门店的摄像头或传感器的协作组合产生的数据。与传统批处理式处理器不同,流式处理器不需要临时存储数据进行处理,也不需要重新聚合不同批次的数据。这在总体上降低了存储要求并减少了延迟,同时还提高了边缘 AI 环境下通常所需任务的处理效率。
例如,Blaize 实现的 GSP 让 Pathfinder 模组可以提供五个独立的神经网络,可按照 10 帧/秒(总计 50 fps)的帧率和不足 100 毫秒的延迟传输视频流,同时还支持在不同媒体流之间同步处理多个工作负载。从而让平台具有完全的可编程性,实现传感器融合、对象检测、图像降噪、视频及激光雷达/雷达数据融合,以及取决于特定用例的其他功能。特别是,GSP 尽管能够提供 16 万亿次运算/秒 (TOPS) 的处理能力,其功率仅为 7 瓦。
从战略角度来看,这些能力很有吸引力,但是采用可靠经济的硅将其推向市场则是一项艰巨的任务,直到最近,仍然很少有公司愿意或能够解决这一问题。这项工作远远超出了常见定制芯片的范畴,需要广泛的先进设计和制造能力、多种电路 IP 的集成,以及大范围的跨领域开发团队协作,而这些在传统上属于大型专业企业的领域,并非初创公司所能力及。
而且除了基础的开发障碍(时间、物理布局、存储器管理等)之外,考虑到业务和技术因素,还必须达成迅速而可靠的上市时间。这种项目通常只有一次成功的机会,因而放大了风险回报考量。
确保开发成功的战略选择
因此,在 Blaize 初次与 Samsung Foundry 接触并介绍项目目标和要求时,晶圆代工团队建议邀请 VeriSilicon 加入,因为后者是能够提供定制硅解决方案和半导体 IP 的一站式供货源,拥有丰富的业绩履历,其中包括与 AI 相关的其他项目。作为 Samsung Advanced Foundry Ecosystem (SAFE™) 合作计划的成员,VeriSilicon 自己的许多设计项目也是借助三星的制程实现的,同时在战略规划和开发策略方面积累了经验。
首先要作出的一项重要决策就是选择制程节点。在考虑了所有可用选项之后,Samsung Foundry 的 14 纳米 FinFET 制程击败几种后续节点胜出。