کاربرد مدل زبان بصری در رانندگی خودران-Redplanx

به عنوان یک فناوری هوش مصنوعی جدید، مدل زبان بصری (VLM) در حال تغییر قوانین بازی در صنعت رانندگی خودمختار است. این مدل قادر به درک و تفسیر اطلاعات بصری و متنی است و به خودرو اجازه می دهد تا محیط اطراف خود را بهتر درک کند و تصمیم بگیرد. به عنوان مثال، VLM می تواند به وسایل نقلیه کمک کند تا علائم راهنمایی و رانندگی و علائم جاده را تشخیص دهند، اهداف عابران پیاده و سایر وسایل نقلیه را درک کنند و حتی رفتار سایر رانندگان را پیش بینی کنند. این امر نه تنها می تواند ایمنی و کارایی وسایل نقلیه خودران را بهبود بخشد، بلکه به حل برخی از مشکلاتی که مدت هاست گریبانگیر صنعت رانندگی خودران بوده است، مانند نحوه برخورد با سناریوهای ترافیکی پیچیده و عوامل نامشخص نیز کمک می کند.