12 жовтня 2023 року з'явився революційний розвиток у сфері штучного інтелекту з новою моделлю, здатною генерувати 3D об'єкти з текстових описів. Розроблена дослідниками MIT, ця інноваційна алгоритм використовує величезні набори даних та передові технології машинного навчання для створення детальних та точних 3D-репрезентацій на основі простих текстових запитів.
Модель, названа "Text2Model", дозволяє користувачам вводити описові фрази, і за лічені хвилини переводить ці слова в повністю змодельовані 3D об'єкти. Наприклад, простий запит на кшталт "червоний спортивний автомобіль" може дати реалістичну 3D-модель, яку можна маніпулювати у віртуальному просторі. Це може мати значні наслідки для різних галузей, включаючи ігри, віртуальну реальність та навіть архітектуру.
Дослідники продемонстрували можливості моделі, показавши ряд створених об'єктів, від повсякденних предметів до складніших структур, як-от будівлі та пейзажі. Вони підкреслили потенціал для демократизації 3D-моделювання, дозволяючи людям без художніх навичок створювати деталізовані дизайни, просто використовуючи описи.
У часи, коли візуальний контент панує, можливість швидко та ефективно виробляти 3D активи є значним досягненням. Поточні процеси створення 3D моделей часто вимагають спеціалізованих навичок та програмного забезпечення, що робить їх недоступними для багатьох користувачів. Text2Model може змінити цю ситуацію, потенційно забезпечуючи розвиток малих підприємств та підприємців у творчих сферах.
Окрім простоти використання, дослідники підкреслили адаптивність технології. Її можна інтегрувати з існуючим дизайнерським програмним забезпеченням, що робить її універсальним інструментом для професіоналів та любителів. Розробники очікують, що платформи, що включають цю модель, значно покращать досвід користувачів у створенні персоналізованого контенту.
Особливо цікаві наслідки для ігор. Розробники можуть швидко створювати прототипи нових предметів або середовищ, прискорюючи процес розробки ігор. Крім того, освітні платформи можуть використовувати цю технологію, щоб допомогти студентам візуалізувати складні концепції у таких предметах, як інженерія та дизайн.
Безпека та етичні аспекти залишаються важливими, оскільки потенціал для зловживань, зокрема у створенні оманливих образів, викликав занепокоєння. Дослідницька група запевняє, що впроваджує засоби для пом'якшення таких ризиків шляхом моніторингу виходу та надання рекомендацій для відповідального використання.
Запуск проекту Text2Model викликав позитивні відгуки як у академічному середовищі, так і у потенційних промислових користувачів. Інтерес зростає в надзвичайно швидкому темпі, і багато хто з нетерпінням чекає, як ця технологія розвиватиметься.
Ті, хто зацікавлений в розширеній інформації про цю піонерську технологію, можуть знайти повну статтю на MIT Technology Review.