Tachyum目标每秒/ s
启动接近录制了“通用”处理器,品牌神童,旨在提供行业领先的性能在服务器、计算机和人工智能工作负载。

林利Gwennap
欧洲创业Tachyum所谓的通用处理器,有了长足的进展,旨在提供业界领先的性能在服务器,超级计算机,人工智能工作负载。该公司计划很快带了处理器和样本今年晚些时候。模拟规范和其他基准测试来验证其性能要求,显示3 x的优势领先英特尔和Nvidia数据中心芯片。使用16位浮点数据,设计可以提供超过每秒/ s。
处理器,品牌的天才,拥有128 CPU核,实现一个自定义VLIW-style指令集的基础上模拟,Tachyum预计他们将在5.7 ghz,速度比任何x86或GPU核心。VLIW设计使高性能通用代码不复杂instruction-reordering硬件的开销。每个核心还包含两个1024位宽矢量单元和一个强大的矩阵相乘引擎。台积电5纳米技术、芯片估计有950 w计划书,要求液体冷却。该公司计划出售低版本。
自定义VLIW指令集包一个或两个RISC-like指令每32位字和四个字包。与大多数VLIW结构,天才实现了一些动态的重新排序。即使这个简单的重新排序,CPU只需要10个管道阶段。加快人工智能工作负载,每个核心都有一个矩阵引擎处理广泛的人工智能的数据类型,包括TF32 BF16, FP8 INT8, INT4。矩阵引擎类似于Nvidia的张量核心但更大;FP8矩阵相乘时,它可以生产8192操作每循环。
首席执行官雷达手表Danilak Tachyum建设开发芯片,可以表现在多种工作负载,cpu和gpu称之为通用处理器。位于斯洛伐克布拉迪斯拉发,在硅谷,Tachyum从IPM集团和斯洛伐克投资者筹集了4200万美元。
免费通迅
获得最新的半导体市场新发展的分析和研究分析。
用户可以查看全文TechInsights平台。
你必须是一个用户访问生产分析报告和服务。
如果你不是一个用户,你应该!关于访问下面输入您的电子邮件与我们联系。