Amazon AWS ავრცელებს Inferentia 2 ჩიპს, რათა დააჩქაროს მასშტაბური მოდელის დასკვნა

31
Amazon AWS გამოუშვებს Inferentia 2 ჩიპს, რომელიც სამჯერ ზრდის გამოთვლის შესრულებას და ზრდის ამაჩქარებლის მთლიან მეხსიერებას მეოთხედით. Inferentia 2 მხარს უჭერს განაწილებულ მსჯელობას და შეუძლია 175 მილიარდამდე პარამეტრის მხარდაჭერა, რაც მას ძლიერ კონკურენტად აქცევს ფართომასშტაბიანი მოდელის მსჯელობისთვის.