Прихована вразливість. Інженер Microsoft заявив, що його змусили замовчувати загрозу діпфейків в DALL-E 3

01.02.2024 ClearMind

Microsoft могла знати про значну вразливість свого ШІ-генератора зображень (Фото:wolterke/Depositphotos)

Інженер Microsoft Шейн Джонс стверджує, що виявив вразливість у генераторі зображень DALL-E 3 від OpenAI, яка дозволяє користувачам створювати порнографічний контент та зображення насильства.

Головний керівник відділу розробки програмного забезпечення Microsoft Шейн Джонс стверджує, що на початку грудня виявив уразливості в генераторі зображень OpenAI DALL-E 3, що дозволяє користувачам обходити заходи безпеки для створення жорстоких і відвертих зображень. Він сповістив про це керівництво, в Microsoft порадили йому передати інформацію OpenAI, що й було зроблено. Однак швидкої відповіді не було, через що він вирішив написати відкритого листа OpenAI на LinkedIn.

Як інженер розповів у своєму зверненні до сенаторів США та генпрокурора Боба Фергюсона, опублікованому GeekWeek, юридичний відділ Microsoft звернувся з вимогою, аби він видалив допис із застереженнями зі своєї сторінки, обіцяючи надати обґрунтування цього прохання, які так і не надійшли.

«Протягом наступного місяця я неодноразово просив пояснити, чому мені сказали видалити свій лист. Я також запропонував поділитися інформацією, яка могла б допомогти у виправленні конкретної вразливості, яку я виявив, і надати ідеї щодо того, як зробити технологію створення зображень ШІ безпечнішою. Юридичний відділ Microsoft досі не відповів і не зв’язався зі мною безпосередньо», — стверджує Джонс.

Фахівець також зауважує, що нещодавній інцидент з масовим поширенням фейкових порнозображень зі співачкою Тейлор Свіфт є прикладом зловживань того ж типу, що й ті, що викликали його занепокоєння щодо DALL-E 3

«Microsoft знала про ці вразливості та потенціал для зловживань», — наголошує він.

Після публікації листа Джонса в OpenAI заявили, що його повідомлення про вразливість не були підтверджені.

«Ми негайно дослідили звіт співробітника Microsoft, коли ми його отримали 1 грудня, і підтвердили, що техніка, якою він поділився, не обходить наші системи безпеки», — заявив представник OpenAI в коментарі Engadget.

Своєю чергою представники Microsoft стверджують, що провели також внутрішню перевірку і не підтвердили наявність проблеми.

«Оскільки його звіт стосувався продукту OpenAI, ми заохотили його повідомити через стандартні канали звітності OpenAI. … Наші команди провели розслідування та підтвердили, що описані методи не оминули наші фільтри безпеки в жодному з наших рішень для створення зображень на основі ШІ», — йдеться в заяві.

З усім тим, Джонс продовжує наполягати на тому, що вразливість є, і виступати за вилучення DALL-E з публічного доступу.

«Ґрунтуючись на моєму розумінні того, як була навчена модель, і виявлених мною вразливостях безпеки, я дійшов висновку, що DALL-E 3 становить загрозу громадській безпеці та має бути вилучена з публічного використання, доки OpenAI не зможе усунути ризики, пов’язані з цією моделлю», — резюмує він у зверненні до влади.

Нагадаємо, минулого тижня в Мережі масово поширилися порнографічні матеріали зі співачкою Тейлор Свіфт, згенеровані за допомогою штучного інтелекту. Проблема вимагала реакції від соцмережевих платформ та викликала занепокоєння Білого дому.

ЗМІ з’ясували, що підроблені зображення Свіфт створювала певна спільнота людей, і інструмент Microsoft Designer, який базується частково на технології DALL-E 3 від OpenAI, був серед використаних нею.