Amazon AWS släpper Inferentia 2-chip för att påskynda storskalig modellinferens

2024-12-26 07:13
 31
Amazon AWS släpper Inferentia 2-chip, som tredubblar datorprestanda och ökar det totala acceleratorminnet med en fjärdedel. Inferentia 2 stöder distribuerade resonemang och kan stödja upp till 175 miljarder parametrar, vilket gör den till en stark konkurrent för storskaliga modellresonemang.