Штучний інтелект Ілона Маска Grok навчили працювати з зображеннями і документами
Компанія xAI представила першу версію своєї моделі штучного інтелекту, Grok-1.5V, яка може обробляти не лише текст, а й візуальну інформацію, таку як документи, графіки, фотографії та скриншоти. Про це розробники повідомили на своєму сайті.
Grok може перетворювати блок-схеми на код Python, створювати історії на основі малюнків і пояснювати меми. Це покоління моделі було розроблено для поліпшення кодування, математики та обробки довших контекстів для кращого розуміння запитів.
xAI також випустила тестовий набір даних RealWorldQA, що містить запитання та відповіді до 700 зображень. Цей набір даних допоможе оцінити моделі штучного інтелекту і з'ясувати, як вони справляються зі складними ситуаціями. xAI стверджує, що її технологія отримала найкращі результати порівняно з конкурентами OpenAI та Google.