麦享科技9月6日消息,前不久我们报道过日本将研发100倍性能的下一代Z级AI超算FugakuNEXT,预计2030年问世,主要的性能来自于NVIDIA下下代GPU。
不过AI领域成为各国高科技竞争的制高点,日本也也不想落伍,哪怕现在可以随便买NVIDIA最先进的AI显卡,日本人也要防着被卡脖子。
因此在技术研发上,日本也要搞自己的AI芯片,一边用NVIDIA的GPU,一边也在研发性能不输NVIDIA的加速芯片,而且走的是定制浮点加速路线。
日本NEDO资助的这家公司名为Pezy Computing KK,其芯片产品型号为Pezy,2012年推出了第一代Pezy芯片,今年Hotchips 25会议上宣布了Pezy-SC4系列,明年会正式上市。
从nxp网站汇总的表格来看,Pezy-SC4将使用台积电5nm工艺,面积555.7mm2,48亿晶体管,2048个核心,1.5GHz频率,64MB L3缓存,96GB HBM3内存,600W功耗。
性能方面,FP64峰值性能24.6TFLOPS,FP32峰值49.2TFLOPS,FP16则是98.4TFLOPS。
未来还有下一代Pezy-SC5系列,升级台积电3nm工艺,面积暴增到785mm2,100亿晶体管,4096组核心,192GB HBM3e内存,900W功耗。
性能也是翻倍增长,同时还会加入FP8支持,性能达到329.6TFLOPS,全面适应AI时代。
对比NVIDIA的GPU如何呢?Pezy-SC3及SC4的FP64能效是41.9 、41 gflops/wa,SC5能达到45.8 gflops/w。
NVIDIA的H200的FP64能效是47.9 gflops/w,B200是33.3 gflops/w,而B300只有0.89 gflops/w,这主要是B300面向AI运算,FP64性能快阉割完了。
从这里的结果来看,日本公司研发的该系列芯片性能足以比肩NVIDIA顶级GPU,而且是兼顾了FP64到FP8等格式在内的,高精度计算上甚至有更多优势。