Amazon AWS ავრცელებს Inferentia 2 ჩიპს, რათა დააჩქაროს მასშტაბური მოდელის დასკვნა-Redplanx

Amazon AWS ავრცელებს Inferentia 2 ჩიპს, რათა დააჩქაროს მასშტაბური მოდელის დასკვნა

2024-12-26 07:13

Amazon AWS გამოუშვებს Inferentia 2 ჩიპს, რომელიც სამჯერ ზრდის გამოთვლის შესრულებას და ზრდის ამაჩქარებლის მთლიან მეხსიერებას მეოთხედით. Inferentia 2 მხარს უჭერს განაწილებულ მსჯელობას და შეუძლია 175 მილიარდამდე პარამეტრის მხარდაჭერა, რაც მას ძლიერ კონკურენტად აქცევს ფართომასშტაბიანი მოდელის მსჯელობისთვის.