Инженер Microsoft пытался рассказать об уязвимости ИИ. Компания не позволила
Шейн Джонс, инженер в Microsoft, сообщил, что алгоритм DALL-E 3, разработанный компанией OpenAI, имеет уязвимости в системе безопасности, которые могут позволить генерацию изображений с насильственным или откровенным содержанием. Об этом сообщает GeekWire.
Он приводит пример изображений, направленных против Тейлор Свифт, для демонстрации возможного негативного влияния. Джонс сообщил об этой проблеме руководству Microsoft, запретившему ему раскрывать ее публично. Однако он обратился к Конгрессу, чтобы сообщить об этой уязвимости.
Джонс утверждает, что нашел способ обойти защиту DALL-E 3. Он сообщил об этом руководству Microsoft, которое попросило его сообщить о проблеме OpenAI. По его словам, изъян может позволить генерировать вредоносные изображения с насильственным или тревожным содержанием. Джонс попытался привлечь внимание общественности к этой проблеме, опубликовав пост на LinkedIn, однако менеджер из Microsoft требовал его удалить. Он согласился, но никаких пояснений от юридического отдела Microsoft не поступало.
OpenAI ответила на обвинения, утверждая, что их модель имеет надежные фильтры безопасности, отфильтровывающие вредные изображения и контент сексуального или насильственного характера. Они также обеспечивают дополнительные функции безопасности для их продуктов. Microsoft в свою очередь заявила, что регулярно расследует и решает проблемы, связанные с новыми технологиями, и ценит усилия своих сотрудников.