Корпорація Apple представила демоверсію своєї нової ШІ-моделі, яка призначена для редагування фотографій за текстовими запитами користувача. Про це повідомляє видання The Verge.
Для розробки ШІ-моделі Apple співпрацювала з Каліфорнійським університетом. Вихідний код MGIE перебуває у відкритому доступі на Github.
В Apple зазначили, що нейромережа працює в мультимодальному режимі. Вона здатна одночасно розуміти текстовий запит від користувача і розпізнавати об’єкти на фотографіях. Поки що ШІ-модель розуміє тільки англійську мову.
Нейромережа MGIE може змінити розмір фото, колірні параметри та окремі деталі в кадрі. Також модель здатна виконувати простіші дії – змінювати різкість або контраст зображення. MGIE має вбудовані фільтри та художні ефекти, тому все редагування можна провести всередині однієї нейромережі.
Як вважають експерти, наразі ШІ-модель перебуває на ранній стадії розробки. Ймовірно, у майбутньому компанія впровадить MGIE у свої продукти.
Назва нейромережі MGIE розшифровується як «редактор зображень з використанням MLLM». Нагадаємо, що деякі платформи вже пропонують схожі моделі. Наприклад, DALL-E 3 від OpenAI також може виконувати прості завдання з редагування фото за допомогою текстових команд.