SenseTime lanza el modelo grande universal multimodal y multitarea "Scholar 2.5"

2024-12-20 10:35
 0
SenseTime lanzó recientemente un modelo grande universal multimodal y multitarea llamado "Scholar 2.5", con 3 mil millones de parámetros. Es el modelo ImageNet más grande y preciso entre los modelos globales de código abierto. Este modelo logró una puntuación de más de 65,0 mAP en el conjunto de datos de referencia de detección de objetos COCO, proporcionando soporte de percepción y comprensión eficiente y precisa para tareas de escenarios generales, como la conducción autónoma y los robots. Actualmente, "Scholar 2.5" se lanzó en la plataforma de código abierto OpenGVLab.