Stable Diffusion XL 1.0 требует меньше вычислительных ресурсов, что делает ее более эффективной и доступной для использования на компьютерах с ограниченными возможностями. Создатели генеративной модели сообщили, что обновленная версия искусственного интеллекта значительно улучшила свою производительность в решении поставленной задачи.
Компания Stability AI официально выпустила новую версию своей генеративной нейронной сети Stable Diffusion XL 1.0 (SDXL 1.0). Эта версия представлена в формате софта с открытым исходным кодом и доступна всем желающим. Разработчики утверждают, что SDXL 1.0 требует меньше производительного оборудования, поэтому она может привлечь больше поклонников, чем предыдущая версия 0.9. SDXL 1.0 доступна на платформе GitHub со всеми конфигурациями и файлами, а также в виде веб-приложения на платформах Clipdrop и DreamStudio.
В интервью для TechCrunch разработчик Stability AI Джо Пенн рассказал, что новая версия генеративной нейронной сети обладает яркими цветами, точной цветопередачей, улучшенной контрастностью, более детальными тенями и продвинутой работой с освещением. SDXL 1.0 считается самой продвинутой генеративной нейронной сетью на рынке. Она была разработана с использованием 3,5 миллиардов параметров, а также способна создавать изображения с разрешением 1 Мп (720p) за считанные секунды.
Разработчики сообщают, что модель Stable Diffusion XL 0.9 имела возможность генерировать изображения высокого разрешения, но требовала мощных компьютеров для работы. Однако, согласно информации издания SiliconANGLE, новая версия SDXL 1.0 может быть запущена даже на простых системах и дает приемлемые результаты, что делает модель более доступной по сравнению с конкурентами. Кроме того, представители компании Stability AI сообщают о значительном улучшении технологии генерации текстового контента. В настоящее время, даже лучшие генеративные сети могут успешно формировать изображения с различными текстовыми надписями или логотипами, что ранее было проблемой.
В SDXL 1.0 была найдена решение для данной проблемы. Теперь модель способна создавать текст в четком и разборчивом виде, что делает генеративные изображения с преобладающим текстовым контентом гораздо более приятными для восприятия. Кроме того, модель была обновлена с функциями inpainting, позволяющими восстанавливать поврежденные или отсутствующие элементы на изображении, и outpainting, которая условно расширяет зону видимости в кадре, добавляя новые детали на изображении. Новая версия модели также способна работать с сложными текстовыми инструкциями, состоящими из нескольких отдельных подсказок.
Каталог нейросетей Ailib. Вся информация взята из открытых источников.
Реклама и размещение: [email protected] или t.me/fozzepe