當(dāng)?shù)貢r(shí)間4月9日,谷歌在美國舉行了「Google Cloud Next25」大會(huì),正式發(fā)布了專為AI設(shè)計(jì)的第七代TPU(Tensor Processing Unit)加速器「Ironwood」,單芯片峰值算力可達(dá)4614TFLOPs。據(jù)介紹,Ironwood是谷歌首款在其張量核和矩陣數(shù)學(xué)單元中支持 FP8計(jì)算的TPU,而此前谷歌的TPU僅支持用於推理的INT8格式和處理以及用於訓(xùn)練的BF16格式和處理。
Ironwood還大幅增加高頻寬內(nèi)存(HBM)容量,每顆芯片的HBM容量提高到了192GB,達(dá)到了Trillium的6倍,可處理更大型的模型和數(shù)據(jù)集運(yùn)算,減少頻繁的數(shù)據(jù)傳輸需求,同時(shí),HBM帶寬也大幅提升,Ironwood單顆芯片的內(nèi)存帶寬可達(dá)7.2Tbps,是Trillium的4.5倍,以確保數(shù)據(jù)快速存取。