2025 年3 月25 日,曦智科技发布了全新的光电混合计算卡“曦智天枢”。在发布现场,曦智科技的创始人兼首席执行官沉亦晨博士称:“曦智天枢首次将光电混合计算应用于复杂的商业化模型中,这是曦智科技在光电混合算力技术的产品化和商业化进程里的重要突破。”我们坚信,光电混合能够给智能制造领域带来算力革新。
天枢是一款可编程光电混合计算卡。它深度融合了光芯片与电芯片各自的优势特点。并且采用了3D 先进封装技术。该产品在光电集成度方面较前代产品有明显提升。在光子矩阵规模方面也有明显提升。在精度方面实现了明显提升。在可编程性方面也实现了明显提升。天枢在对科学计算(例如伊辛算法)予以支持的基础之上,进一步强化了对ResNet50 等商业算法应用的支持力度。并且,在持续保持光计算优势的同时,极大地提升了产品的通用适配性。
曦智科技光电混合计算卡“曦智天枢”
2012 年12 月,曦智科技首次向外界发布了光电混合计算产品。在特定算法下,该产品成功验证了光电混合计算相较于主流GPU 具有数百倍的速度优势。如今,曦智天枢的诞生,意味着光电混合技术在产品实现方面已经取得了重大的跨越。
天枢运用的是非相干架构。这种架构的设计使得系统易于进行扩展。并且,它具备着出色的抗干扰能力以及更高的计算精度。天枢的核心处理器包含光学处理单元(OPU)和电学专用集成电路(ASIC)。光芯片与电芯片借助3D 先进封装技术协同运作,主频速率为1GHz,输出精度是8bit。其中,光芯片的面积达到600 平方毫米,比上一代芯片增大了3 倍。光芯片上的器件数量超过四万个,器件尺寸进一步变小,集成度有了显着提升。天枢最大能够支持128x128 的矩阵规模,是上一代芯片的4 倍,运算能力和灵活性都得到了提升。用户通过API 能够自由地配置计算矩阵系数,这使得天枢具备了更强的适应性和优化空间。
光子计算是一种被动的运算方式。在光通过光子矩阵的过程中,运算任务就能够完成。它对传统CMOS 电子芯片的运算逻辑进行了颠覆。光子芯片的性能提升与光子矩阵的规模、主频速率和波长数量等参数有关。并且它不依赖于晶体管的密度以及芯片制程的提升。曦智科技的首席技术官孟怀宇博士在发布会上首次向外界提出了等效光算力(EOPP:Effective Optical Processing Power)标准。该标准是一种综合算力评价方法,考虑了矩阵规模、输出精度以及权重刷新速度等因素。与当前主流的电芯片指标计算方法相比,它更符合光计算的原理和特点。光电混合计算是未来的算力趋势。孟怀宇博士表示,他们希望业界对于光子计算的算力能够有一个更客观的衡量标准。
天枢采用光电混合3D TSV(Through Silicon Via,硅通孔)+ FlipChip(倒装芯片)封装技术,目的是实现光电芯片间的高效集成。 TSV 的运用带来了显着效果,降低了光电芯片间的传输延迟,提升了信号完整性和散热性能,还能够节省芯片面积,为芯片设计提供了更高的灵活性。孟怀宇博士称:曦智科技从创立伊始便察觉到封装对光电集成的重要性,并且持续努力去攻克技术难关。 TSV 成功落地,解决了传统封装技术的瓶颈,其价值与意义惠及整个光电混合产业。
在软件方面,天枢搭载了曦智光电混合计算软件栈。该软件栈的算子库包含RVV(RiscV Vector)算子,还有电矩阵(dMAC)加速算子以及光矩阵(oMAC)加速算子。它能够支持CV 类和LLM 类模型,同时也支持non-AI 算子,例如Ising 和LineSolver 等。用户借助曦智编译器,能够灵活运用这些算子去构建高效的应用模型。同时,平台支持用户自定义算子,利用OpenCL C/C++语言进行编译与优化,从而进一步拓展了算法开发的灵活性。
曦智科技光电混合计算卡“曦智天枢”
曦智科技的软件栈与Pytorch 和onNX 等主流框架深度融合。客户能够借助软件栈,直接运用天枢的光矩阵和电矩阵加速单元,对模型和算法进行加速与验证。同时,客户还可以把模型通过曦智编译框架进行编译,然后部署在端侧,以进行推理。天枢通过软件栈成功运行了深度卷积神经网络模型ResNet50 ,同时也成功运行了AI 大语言模型LlaMA 2 ,并且首次实现了光电混合计算在商业化场景中的应用。
曦智科技的首席运营官王泷称:天枢的背后,是曦智科技硅光团队、数字团队、模拟团队、封装团队、系统团队以及软件团队协同努力的成果。我们期望能有更多的开发者以及生态伙伴,借助天枢与我们一同去探索光电混合算力更为广阔的应用场景,并且朝着光电混合算力商业化的方向一同前进。
曦智科技启动了下一代光电混合计算产品的研发。曦智科技的创始人兼首席执行官沉亦晨博士称:“未来产品会提升计算能力,以此来支持更复杂的商业化应用场景,为人工智能和算力中心提供新型算力支撑。”