亞馬遜AWS發表Inferentia 2晶片，加速大規模模型推理-Redplanx

亞馬遜AWS發表Inferentia 2晶片，加速大規模模型推理

賓士EQE SUV 加速加速 AWS 能推理晶片效能亞馬遜競爭模型記憶體分散式大規模加速器記憶體記憶體規模記憶記憶體加的

2024-12-26 07:13

31

亞馬遜AWS發表Inferentia 2晶片，將運算效能提高三倍，加速器總記憶體提高四分之一。 Inferentia 2支援分散式推理，最多可支援1750億個參數，成為大規模模型推理的有力競爭者。

Prev：CATL ha Yutong ofirma peteî marco de cooperación estratégica diez años

Next：Amazon AWS releases Inferentia 2 chip to accelerate large-scale model reasoning