亞馬遜AWS發表Inferentia 2晶片,加速大規模模型推理

2024-12-26 07:13
 31
亞馬遜AWS發表Inferentia 2晶片,將運算效能提高三倍,加速器總記憶體提高四分之一。 Inferentia 2支援分散式推理,最多可支援1750億個參數,成為大規模模型推理的有力競爭者。