Искусственный интеллект Илона Маска Grok научили работать с изображениями и документами
Компания xAI представила первую версию своей модели искусственного интеллекта Grok-1.5V, которая может обрабатывать не только текст, но и визуальную информацию, такую как документы, графики, фотографии и скриншоты. Об этом разработчики сообщили на своем сайте.
Grok может преобразовывать блок-схемы в код Python, создавать истории на основе рисунков и объяснять мемы. Это поколение модели было разработано для улучшения кодирования, математики и обработки более длинных контекстов для лучшего понимания запросов.
xAI также выпустила тестовый набор данных RealWorldQA, содержащий вопросы и ответы к 700 изображениям. Этот набор данных поможет оценить модели искусственного интеллекта и узнать, как они справляются со сложными ситуациями. xAI утверждает, что ее технология получила самые лучшие результаты по сравнению с конкурентами OpenAI и Google.