SenseTime wypuszcza multimodalny, wielozadaniowy, uniwersalny duży model „Scholar 2.5”

0
Firma SenseTime wypuściła niedawno wielomodalny, wielozadaniowy, uniwersalny duży model o nazwie „Scholar 2.5” z 3 miliardami parametrów. Jest to najdokładniejszy i największy model ImageNet spośród światowych modeli open source. Model ten uzyskał wynik ponad 65,0 mAP w zestawie danych porównawczych wykrywania obiektów COCO, zapewniając wydajną i dokładną percepcję oraz wsparcie w zrozumieniu ogólnych zadań scenicznych, takich jak jazda autonomiczna i roboty. Obecnie „Scholar 2.5” został wydany na platformie open source OpenGVLab.