Amazon AWS brengt Inferentia 2-chip uit om grootschalige modelinferentie te versnellen

31
Amazon AWS brengt Inferentia 2-chip uit, die de computerprestaties verdrievoudigt en het totale acceleratorgeheugen met een kwart vergroot. Inferentia 2 ondersteunt gedistribueerd redeneren en kan tot 175 miljard parameters ondersteunen, waardoor het een sterke concurrent is voor redeneren op grote schaal.