Amazon AWS brengt Inferentia 2-chip uit om grootschalige modelinferentie te versnellen-Redplanx

Amazon AWS brengt Inferentia 2-chip uit om grootschalige modelinferentie te versnellen

AWS prestatie Amazon meter schaal geheugen

2024-12-26 07:13

Amazon AWS brengt Inferentia 2-chip uit, die de computerprestaties verdrievoudigt en het totale acceleratorgeheugen met een kwart vergroot. Inferentia 2 ondersteunt gedistribueerd redeneren en kan tot 175 miljard parameters ondersteunen, waardoor het een sterke concurrent is voor redeneren op grote schaal.

Prev：Amazon AWS frigiver Inferentia 2-chip for at accelerere storskala modelslutning

Next：Amazon AWS gefur út Inferentia 2 flís til að flýta fyrir ályktun af stórum gerðum