Інженер Microsoft намагався розповісти про вразливість штучного інтелекту. Компанія не дозволила
Шейн Джонс, інженер в Microsoft, повідомив, що алгоритм DALL-E 3, розроблений компанією OpenAI, має вразливості в системі безпеки, які можуть дозволити генерацію зображень з насильницьким або відвертим вмістом. Про це повідомляє GeekWire.
Він наводить приклад зображень, що були спрямовані проти Тейлор Свіфт, для демонстрації можливого негативного впливу. Джонс повідомив про цю проблему керівництву Microsoft, яке заборонило йому розкривати її публічно. Однак він звернувся до Конгресу, щоб повідомити про цю вразливість.
Джонс стверджує, що знайшов спосіб обійти захист DALL-E 3. Він повідомив про це керівництву Microsoft, яке попросило його розказати про проблему OpenAI. За його словами, вада може дозволити генерувати шкідливі зображення з насильницьким або тривожним вмістом. Джонс спробував привернути увагу громадськості до цієї проблеми, опублікувавши пост на LinkedIn, проте менеджер з Microsoft вимагав його видалити. Він погодився, але жодні пояснення від юридичного відділу Microsoft не надходили.
OpenAI відповіла на звинувачення, стверджуючи, що їхня модель має надійні фільтри безпеки, які відфільтровують шкідливі зображення та контент сексуального або насильницького характеру. Вони також надають додаткові функції безпеки для їхніх продуктів. Microsoft своєю чергою заявила, що регулярно розслідує та вирішує проблеми, пов'язані з новими технологіями, і цінує зусилля своїх співробітників.