Поділитись:

Штучний інтелект навчився перетворювати абсурдні текстові запити на зображення

Неділя, 10 січня 2021, 00:10
Штучний інтелект навчився перетворювати абсурдні текстові запити на зображення

Лабораторія дослідження штучного інтелекту OpenAI розробила нейромережу, що створює картинки на основі дослідження безлічі зображень і текстових описів до них. Через сюрреалістичні результати творчості нейромережу назвали DALL·E – це похідне від імен знаменитого художника-сюрреаліста Сальвадора Далі та робота Воллі з однойменного мультфільму, пише Бабель.

DALL·E створює дуже цікаві картини, змішуючи людей, тварин, неживі об’єкти, візерунки й текст. Нейромережа демонструє, що мова може стати інструкцією, за якою штучний інтелект створюватиме зображення з досить високою точністю. Таким чином, поєднання візуальної та текстової інформації для подібної технології – вже підкорена вершина.

Але подекуди результати такої творчості зовсім неочікувані. Наприклад, нейромережа створила серію зображень крісла у вигляді авокадо.

Або кілька картинок, на яких дитина-овоч у спідничці вигулює песика.

Серед інших зображень – розплавлені окуляри, дивні чайники, стакани, існування яких неможливе тощо.

Зокрема, DALL·E здатна робити тривимірні моделі об’єктів з різних ракурсів, уміє працювати з оптичними ефектами. Для нейромережі потрібно правильно сформулювати описи до картинок. Приміром, у реченні «їжачок у червоному капелюсі, жовтих рукавицях та в зелених штанях» штучний інтелект не лише має правильно визначити означені об’єкти, але й сформувати асоціації без змішування.

Штучний інтелект навчився перетворювати абсурдні текстові запити на зображення

Чим більше об’єктів отримує для аналізу DALL·E і чим абстрактніші описи, тим більше виникає плутанини між об’єктами та асоціаціями. Подекуди нейромережа самостійно заповнює «пробіли» в реченнях, підшукуючи об’єкти, які не згадувалися, але які мають бути присутніми за асоціацією.

Також DALL·E експериментує з об’єктами, яких не може існувати в реальності – розробники пояснюють, що ця здатність уже ближче до мистецтва.

В OpenAI зазначають, що технологія має великий потенціал для широкого впливу на суспільство. На прикладі результатів роботи нейромережі можна буде аналізувати такі проблеми, як економічний вплив на певні професії та робочі процеси, упередження тощо.

ЧИТАЙТЕ ТАКОЖ: 

Надрукувати
мітки:
коментарів