Россия открывает двери для иностранцев, разделяющих традиционные ценности. По указу Владимира Путина, получить временное разрешение на проживание даже без знания русского языка и истории страны смогут те, кто уезжает из государств, где "навязывают "неолиберальные установки". Отработкой поручения президента займется кабмин, на это правительству дали месяц. Как оценивают указ Путина в Совфеде и Госдуме...
КомпанияBlack Forest Labs, основанная выходцами из Stability AI (разработчик Stable Diffusion), без предварительных анонсов выпустила новую модель генеративного искусственного интеллекта Flux. Релиз взорвал сообщество генеративного ИИ: все разговоры теперь только о новой модели. И она того стоит! Давай разберемся, как ее использовать и на что она способна.
ЧТО ЗА FLUX?
Flux — новейшая базовая модель (а точнее — семейство моделей) генеративного искусственного интеллекта для создания изображений по текстовым описаниям. Flux, созданный покинувшими компанию Stability AI разработчиками, уже предлагает все то, что должна была обеспечить архитектура Stable Diffusion 3, которая до сих пор в подвешенном состоянии.
Модель Flux отличается новым текстовым декодером с 12 миллиардами параметров, что позволяет ей намного увереннее распознавать запросы и точнее следовать им. При обучении модели не было той жесткой цензуры, которая привела к практически полной неработоспособности Stable Diffusion 3 Medium; в результате позы людей у Flux выглядят более естественными. С количеством пальцев на руках дело стало лучше, но проблема побеждена не до конца; добавлена работа с текстом на изображениях — то, что заявлялось как принципиальное отличие Stable Diffusion 3.
Модель существует в трех вариантах:
FLUX.1 [pro] — полная версия модели, доступная только через API. Да, разработчики тоже хотят кушать, а их инвесторы — получить прибыль;
FLUX.1 [dev] — самая крупная модель с 12 миллиардами параметров, доступная для локальной установки. Модель открытая, весовые коэффициенты доступны для скачивания и дальнейшего обучения, но с оговорками: лицензия на эту модельнекоммерческая; возможность коммерческого использования оговаривается отдельно;
FLUX.1 [schnell] — дистиллированная турбо‑версия модели, позволяющая создавать изображения всего за четыре шага. Эта модель распространяется по лицензии Apache 2.0, но обучить ее производные, скорее всего, не получится в силу технических ограничений.
Нас интересуют две последние модели — dev и schnell.
А кто разработчики?
О том, чтоBlack Forest Labsсостоит из выходцев из Stability AI, не написал только ленивый. Эта команда разработчиков стояла у истоков технологии латентной диффузии, впоследствии покинув Stability AI и основав собственную компанию. На Reddit есть немногодополнительной информации.
ВОЗМОЖНОСТИ FLUX
Flux — гигантская по современным меркам модель, способная воспринимать огромное количество концепций и рисовать в широком диапазоне стилей. На словах это мало отличается от возможностей моделей SDXL, особенно с учетом многочисленных ремиксов и лор. На деле же результаты работы Flux поражают. И ведь это только первая версия базовой модели на основе новой архитектуры. Улучшения наверняка на очереди.
Модель способна работать с текстом, то есть добавлять на картинки надписи в точности, как просили. Кстати, обрати внимание на очки — слабое место SDXL.
Flux неплохо понимает необычные концепции.
Способна воспроизводить уличные сценки (обрати внимание на руки; это исходная генерация без использования восстанавливающих моделей).
Выдает кадры из псевдоисторических голливудских фильмов (на руке с первой попытки — пять пальцев; незамутненное счастье).
И даже рисует иллюстрации для детских книг.
Для всего этого разнообразия не потребовалось ни «бросания костей» в виде многочисленных попыток генерации, ни поиска и скачивания соответствующих лор.
Хочешь попробовать новую модель на своем компьютере? Ни AUTOMATIC1111, ни WebUI Forge для этого не подойдут. На момент написания статьи единственный софт, поддерживающий Flux, — ComfyUI или он же с оболочкой SwarmUI.
Дальше мы рассмотрим продвинутый инструментарий, позволяющий не только получить доступ к большому числу тонких настроек нейросети, но и автоматизировать генерацию высококачественных изображений.
Читай также
Ранее мы уже изучили базовые возможности Stable Diffusion и установку нейросети на компьютер, рассмотрели несколько базовых моделей и научились работать с лорами, стилями и рефайнерамив приложении Fooocus. Это приложение прекрасно подходит для начала работы, позволяя сразу же получить красивые изображения, но довольно скоро пользователь упирается в потолок. В Fooocus нет возможности сразу генерировать картинки в высоком разрешении или автоматически исправлять проблемы с руками и лицами; для этого существуют более продвинутые, но и намного более сложные в использовании варианты, один из которых мы будем изучать. А впрошлой статьемы разобрались еще с одним продвинутым интерфейсом — WebUI reForge.
COMFY И SWARMUI
ComfyUI — одновременно и бэкенд, то есть движок, и фронтенд, то есть интерфейс, для генерации изображений по текстовым описаниям. Движок Comfy — один из лучших, а управление памятью, пожалуй, лучшее из имеющегося на сегодняшний день. В то же время интерфейс ComfyUI своеобразен, сложен в освоении и нравится не всем. Ниже — пример простейшей настройки генерации в Comfy с использованием модели SDXL и рефайнера.
Усложнение условий генерации усложняет и диаграмму. Впрочем, у такого подхода есть и положительные стороны: полный доступ ко всем внутренностям движка и возможность как сохранять, так и скачивать готовые диаграммы‑воркфлоу, позволяющие буквально в несколько кликов повторить то, на создание чего у автора диаграммы ушли многие часы работы.
Если же тебе хочется чего‑то более привычного, то на помощь придет SwarmUI — оболочка для Comfy, интерфейс которой очень похож на A1111. SwarmUI — продукт очередного выходца из Stability AI (интересно, там вообще кто‑нибудь остался?). Его место среди прочих интерфейсов можно описать так:
AUTOMATIC1111 — «классический» WebUI, апстрим для разнообразных форков;
WebUI Forge — форк AUTOMATIC1111 с более высокой скоростью работы и оптимизированным механизмом работы с видеопамятью. На данный момент ведется активная разработка, репозиторий в статусе экспериментального; в продукте будут отрабатываться новые технологии — от интерфейса Gradio 4 до нового движка;
WebUI reForge — активный форк WebUI Forge, в котором присутствуют как оптимизации Forge, так и новинки из AUTOMATIC1111 и ComfyUI;
ComfyUI — мощный и отлично оптимизированный продукт с самой широкой совместимостью с различными технологиями диффузии. Интерфейс в стиле блок‑схем — не для всех;
SwarmUI — оболочка для Comfy, напоминающая WebUI. «Вы находитесь здесь!»
УСТАНОВКА И НАЧАЛО РАБОТЫ
SwarmUI сейчас имеет статус бета‑версии и активно разрабатывается. Готового файла для скачивания пока нет; для установки SwarmUI в Windows тебе придется самостоятельно установить:
После этогоскачай.bat-файл установщика и запусти его. Дистрибутив установится в папку SwarmUI. В процессе установки скачается и распакуется архив с портативной версией Comfy, который используется в качестве движка.
Пока не спеши ничего запускать; для работы с Flux тебе придется скачать еще несколько файлов. Процесс описан в документациив разделе Black Forest Labs’ Flux.1 Models.
В Дагестане задержали сотрудника патрульно-постовой службы по делу о смерти участника СВО в отделении полиции после избиения. По словам родителей погибшего, сначала их убедили, что у сына остановилось сердце, и заставили записать видео об отсутствии претензий к правоохранителям. После публикации кадров, на которых покойному наносят удары и бьют его электрошокером, они потребовали расследования. Депутат Султан Хамзаев сообщил, что в этом отделении подобный случай не первый.
Екатерина Мизулина опубликовала видео, на которых 46-летний блогер Алексей Поднебесный целует и держит за грудь сидящую у него на коленях школьницу. По версии СК, на следующий день блогер вступил с девочкой в половую связь в квартире. По словам Поднебесного, девушка говорила, что ей 23 года. Ранее лидер "движения инцелов" России заявлял, что у женщин должны быть права животных, оправдывал массовые убийства в школах и бросался под газонокосилку.
Американская компания Google продолжает открыто проявлять предвзятое отношение к россиянам, особенно к блогерам. Эксперт РОЦИТ, первый вице-президент и исполнительный директор АКАР Валентин Смоляков рассказал, в чем это проявляется.
У кемпингового фонаря Lumina компании Lumina Gear множество функций. Помимо основной — обеспечения освещения в походе, он является надежным источником питания для мобильных устройств и может крепиться с помощью магнита к ферромагнитным поверхностям.
Нигерийский наркобарон, выдававший себя за футболиста, заводил романы с молодыми женщинами — звал замуж и катал по разным странам. В очередном путешествии девушка наркобарона всегда оставалась в аэропорту одна с его чемоданом. В нём были спрятаны наркотики. Но возлюбленные нигерийца узнавали об этом, только попав в руки полиции. Так произошло с россиянкой Марией Дапиркой. На родину она вернулась, отсидев 10 лет во вьетнамской тюрьме. Как устроена вербовка и что ждёт Дапирку в России...
Российские войска успешно наступают на Покровск. Взятие этого города может привести к крайне неблагоприятным последствиям для ВСУ. Как пишет чешское издание Forum24, украинский фронт в Донбассе распадается. Какое значение имеет взятие Покровска и почему вторжение Вооруженных сил Украины в Курскую область ничего не изменило на линии фронта -- в материале военного обозревателя Михаила Ходаренка.
Команда исследователей из ETH Zurich открыла новый подвид бежевых жировых клеток, деятельность которых не приносит никакой пользы организму. Бежевые клетки считают промежуточным вариантом между белыми и бурыми жировыми клетками. Задача белых клеток накапливать энергию, а бурые ее активно сжигают для обогрева тела. Бежевые клетки могут выполнять обе эти функции, но новый подвид делает это крайне противоречивым образом.
Боевые действия в Курской области и вся специальная военная операция завершатся в ближайшие два-три месяца, заявил командир спецназа "Ахмат" Апты Алаудинов. Он также утверждает, что в составе вторгшихся в Курскую область частей ВСУ много наемников подразделений стран НАТО. Тем временем ТАСС со ссылкой на источник в медицинских службах сообщает, что в результате атаки ВСУ на Курскую область погибли 17 человек.