Amazon AWS rilascia il chip Inferentia 2 per accelerare l'inferenza di modelli su larga scala-Redplanx

Amazon AWS rilascia il chip Inferentia 2 per accelerare l'inferenza di modelli su larga scala

ragionamento chip distribuito azione acceleratore scala memoria A

2024-12-26 07:13

Amazon AWS rilascia il chip Inferentia 2, che triplica le prestazioni di elaborazione e aumenta di un quarto la memoria totale dell'acceleratore. Inferentia 2 supporta il ragionamento distribuito e può supportare fino a 175 miliardi di parametri, rendendolo un forte concorrente per il ragionamento su modelli su larga scala.

Prev：Amazon AWS lanza el chip Inferentia 2 para acelerar la inferencia de modelos a gran escala

Next：Amazon AWS verëffentlecht Inferentia 2 Chip fir grouss Skala Modellinferenz ze beschleunegen