2025.10.17
广东吉洋视觉专注AOI视觉检测设备 ( 存储芯片封测AOI;芯片封装AOI;芯片封测AOI;芯片切割AOI;芯片制造AOI )
Tachyum 周三打破沉默,宣布其用于AI 和 HPC 的 Prodigy 通用处理器将增加核心数量,以提升性能。
该公司还表示,已完成 C 轮融资,资金来自一位欧洲投资者,总额为 2.2 亿美元,并与该投资者签署了 5 亿美元的 Prodigy 采购订单。最后,该公司透露,其 Prodigy 处理器尚未流片,最终规格也尚未确定,这表明该处理器距离量产还有数年时间。
每个芯片组有 256 个核心
最大的新闻是,Tachyum 的 Prodigy 处理器将采用多芯片设计,该系统级封装 (SiP) 内的每个计算芯片将包含 256 个通用核心(今年早些时候为192 个核心,最初为 128 个核心)。这意味着整个 SiP 将提供更多核心,以实现公司“性能是最高性能 x86 处理器的 3 倍,性能是最高性能 HPC GPGPU 的 6 倍”的承诺。然而,这一性能承诺存在一个问题:该公司仍未确定 CPU 的规格,因此尚未完成芯片的流片,其实际性能还有待观察。Tachyum
创始人兼首席执行官 Radoslav Danilak 博士表示:“凭借最新一轮融资,我们能够完成 Prodigy 的流片,采用最新的创新和设计,以满足不断变化的市场需求。”
Tachyum 将利用 C 轮融资所得资金完成流片流程和时间表。Tachyum 计划近期公布其处理器的“升级规格和性能”——具体时间尚未公布,但我们可以大致推测,大概在 2027 年左右。
商业出货可能将于 2027 年开始
一旦收到资金(预计在一个月内到位),Tachyum 就可以完成 RTL 和物理设计(假设不添加任何内容),进行最终验证,然后流片 Prodigy 芯片。由于 Prodigy 预计将采用台积电的 5nm 级工艺技术制造,Tachyum 将在 4 到 4.5 个月内获得第一批硅片(取决于设计的复杂程度,以及公司在将 GDSII 文件发送给生产合作伙伴后的运气 — — 因为写入光掩模需要 1 到 1.5 个月,然后大约三个月的时间来制造第一批晶圆)。如果 Tachyum 在 2025 年 11 月 1 日向制造商提交 GDSII 文件,它将在 2026 年 2 月或 3 月获得硅片。
在拿到硅片后,Tachyum 工程师将提出并验证设计,以确保其按预期运行,然后调整固件。如果芯片按计划运行,该流程将在六到七个月内完成——最早在 2026 年 8 月,保守估计也在 2026 年 10 月。一旦工程样品达到目标规格,Tachyum 就会将其提供给早期客户和合作伙伴进行评估和验证,这可能还需要 2 到 3 个月的时间。如果每个人都对这些样品感到满意,Tachyum 可能会在 2027 年初开始 Prodigy 的量产。
如果 Prodigy 处理器的生产进度一切顺利,那么商业出货可能会在 2027 年中期开始。这个时间与 Tachyum 提到的 2027 年潜在 IPO 相吻合——可能计划与 Prodigy 的初始收入同时发生。
如果 Tachyum 能够在 2027 年成功发布其Prodigy CPU 的商业化,这将是近代开发时间最长的处理器——其开发将耗时约 10 年。 Prodigy 最初的目标是 2019 年流片,2020 年上市,但时间表一再推迟:先是推迟到 2021 年,然后是 2022 年、2023 年、2024 年、2025 年,现在,该公司期待在 2026 年获得其芯片的首批样品。尽管遭遇这些挫折,但该公司仍然对其发展持乐观态度。
“我们目睹了人工智能霸权之争的激烈进行,我们很高兴能将一款颠覆性的芯片推向市场,它将以可承受的价格(仅为现有解决方案的一小部分)支持参数比人脑突触大几个数量级的人工智能模型。”Danilak 表示。
一而再再而三延期的芯片
Prodigy 通用处理器自最初计划发布以来,一再延期。最初计划于 2019 年流片,2020 年上市,但计划多次调整:从 2021 年推迟到 2022 年,再推迟到 2023 年,最后推迟到 2024 年。今年早些时候,Tachyum 再次更新计划,称将在 2025 年流片,从而推迟了原定于明年第一季度发布的参考服务器样品。虽然该公司正式计划 在 2025 年开始量产 Prodigy 处理器,但该公司能否在短短一年内完成所有必要的里程碑(流片、调试、样品、量产启动)仍有待观察。
如上所述,根据最初规划,Tachuym 的 Prodigy 设计基于全新的微架构,拥有 192 个定制的 64 位计算核心,据称该微架构不仅适用于通用计算,还适用于高度并行的 AI 和 HPC 计算。值得一提的是,该 ISA 集成了大量矢量和矩阵指令,以应对人工智能和超级计算应用的需求,而新的性能优化指南则包含了 AI 和 HPC 软件开发的设计指南。
Prodigy 指令集架构 (ISA) 融合了 RISC 和 CISC 设计的元素;据 Tachyum 介绍,该 ISA 避免了传统 CISC 处理器中常见的复杂、冗长且低效的可变长度指令。所有指令均标准化为 32 位或 64 位,部分指令还加入了内存访问功能,以进一步提升性能。
Tachuym 的 Prodigy FPGA 内置性能计数器,可实时监控和分析运行时事件。该公司表示,这些工具可帮助程序员和工程师识别瓶颈并优化代码以提高效率,从而使该处理器成为高要求计算任务的理想选择。
该手册提供了具体的优化技术,包括管理调度限制、改进内存例程、对齐分支和指令以及缓解寄存器转发挑战。此外,它还提供了处理缓存操作、加载/存储对齐以及访问特殊寄存器的指导,确保开发人员能够对软件进行微调以实现最佳性能。
Tachyum 创始人兼首席执行官 Radoslav Danilak 博士表示:“软件程序员、测试工程师、编译器开发人员以及系统和解决方案工程师将非常高兴有机会深入了解 Prodigy 如何提供固有的性能优势,从而高效处理 AI、云和 HPC 工作负载。Prodigy 的集成功能将帮助用户实现业界领先的计算效率,从而更快地获得洞察、更快地开展研究并更快地生成结果。”
郑重声明:
1、部分内容来源于网络,本文版权归原作者所有,转载文章仅为传播更多信息之目的。
2、本文仅供学术交流,非商用。如果某部分不小心侵犯了大家的利益,请联系删除。