DF2 :: ФОРУМЫ > Midjourney

Axolotl

08 Nov 2024, 18:29

Цитата

Но вот такой вопрос. Как мне в этом же стиле нарисовать другие картинки?
У меня выбран тот же режим "Illustratio" - но стиль получается довольно сильно разный от картинки к картинке.

Если вопрос про именно Recraft, то нажми создать новый стиль (кнопка плюсик в меню стилей) и используй получившуюся картинку в качестве стилевого референса.

Цитата

И никак не хочет создавать просто лес, без дороги, даже если я прямо про это пишу.
Везде примерно одинаковая дорога.
А уж про непроходимую чащу, заваленную буреломом - тем более.
Не можешь подсказать в этом?

Общий совет: никогда не пиши то, чего не должно быть в картинке, кроме редких случаев, когда это какое-то очень устойчивое словосочетание. Скажем, если нужен человек без головы то лучше писать "headless" а не without a head.
Если у тебя в запросе написано "no road", то скорее всего она тебе дорогу и нарисует.

Если по какой-то причине сетка пытается рисовать то, что тебе не нужно, даже если этого нет в запросе, то там есть кнопочка настроек, когда на нее нажимаешь, появляется надпись "Exclude from image", жмешь на плюсик и пишешь туда то ,чего не должно быть на картинке. Это в Recraft. В Midjourney отрицательные запросы пишутся в конце запроса после команды --no.

Цитата

Вот ещё проблема - никак не удаётся нарисовать препятствие впереди.
То есть - прямо преграждающий забор, стену, терновник.

Думаю сетку путает "fence from right to left"
Вот, например, в бинговском Dall-E по запросу
"Painting of a village road, a sturdy wooden fence is blocking the way"

(Раскрыть)

Другой путь - inpainting. Генерируешь дорогу, включаешь режим выделения (сверху значок лассо), выделяешь нужный кусок дороги и пишешь в запросе что-нибудь типа "A fence is blocking the road"

Это опять же про Recraft. В Midjourney есть еще способы, как добиться подобного.

SerAlexandr

07 Jan 2025, 16:52

Мне временами вспоминается картинка - предшественница шутеек про нейросетевые картинки. Там взяли готовую крутую картинку рыцаря в броне и с мечом (Артаса?), стёрли на ней кисть руки и карандашом пририсовали кривые закорючки. И подписали "вот всё могу нарисовать, а как до рук доходит...".
А нагуглить никак не могу почему-то. Вдруг кто вспомнит

Axolotl

09 Jan 2025, 01:17

Цитата(SerAlexandr @ 07 Jan 2025, 20:52)

Мне временами вспоминается картинка - предшественница шутеек про нейросетевые картинки. Там взяли готовую крутую картинку рыцаря в броне и с мечом (Артаса?), стёрли на ней кисть руки и карандашом пририсовали кривые закорючки. И подписали "вот всё могу нарисовать, а как до рук доходит...".
А нагуглить никак не могу почему-то. Вдруг кто вспомнит

Руки всё еще регулярная проблема для сеток, но именно что регулярная, а не постоянная. А имея возможность просто перегенерить всю картинку, сделать вариацию или попросту заново сгенерить только выбранный кусок, это и вовсе перестало быть главным ограничением. Но да, для художников руки тоже часто являются сложной задачей.

tolich

19 Apr 2025, 10:52

Luw.ai обнаружил на картинке NSFW. Где он?
Нажмите для просмотра прикрепленного файла

laViper

19 Apr 2025, 11:01

А кто шарит - сейчас нормально эти ИИ рисуют фентези или как обычно дальше голых девок с мечом не продвинулись?
Ну то есть можно ли отрисовать различных фентези-существ с разным средневековым оружием, кроме попсовых мечей да молотов?

tolich

19 Apr 2025, 11:19

Вот: не молот, не меч, не девка.
Нажмите для просмотра прикрепленного файла

laViper

19 Apr 2025, 14:25

Просто с тем же арбалетом вечно были проблемы, они выдают что-то вроде такого, где явно ИИ не сильно понимает что и куда должно располагаться.

Axolotl

27 Apr 2025, 23:34

Цитата(laViper @ 19 Apr 2025, 15:01)

А кто шарит - сейчас нормально эти ИИ рисуют фентези или как обычно дальше голых девок с мечом не продвинулись?
Ну то есть можно ли отрисовать различных фентези-существ с разным средневековым оружием, кроме попсовых мечей да молотов?

Не так давно (в конце марта) вышла генерация картинок в ChatGPT 4o. Там еще раз пробили потолок в плане понимания запросов, и в том числе в плане работы с объектными референсами. И с умением генерировать в картинке сложный текст скачок прям на порядок (в том числе с кириллицей справляется). Понимает весьма комплексные запросы и может, например, вставить объект с референсной картинки в сгенерированную. Художественная сторона, если пытаться сойти с дорожки мэйнстримных стилей, правда, как обычно у них хромает. Но фэнтези – как раз тот самый мэйнстрим. Там в принципе они пошли другим путём, это уже не совсем diffusion модель, а autoregressive, и они как-то это все скрестили с LLM на более глубоком уровне, но пока детально не вникал.
Сам я сильно ей тест-драйв не устраивал, поэтому про конкретно экзотическое оружие не скажу, не пробовал, подписки на ЧатЖПТ у меня нет, а для бесплатного режима там лимит на в три картинки в день. Только если будешь пробовать, сразу предупреждаю, там цензура порой доходит до абсурда. Возможно, временно, и потом ослабят цензуру. Полагаю, что сейчас тупо не хотят провоцировать и перестраховываются, пока хайп вокруг их новой модели не уляжется.

Mefista

28 Apr 2025, 00:02

Цензура из-за лоликонов, они умудряются даже из зажатых до смешного моделей выбивать маленьких девочек в купальниках. Я на Nightcafe сижу, попадались, хотя оно даже слово exposed плохо переваривает.

Axolotl

28 Apr 2025, 00:23

Цитата(Mefista @ 28 Apr 2025, 04:02)

Цензура из-за лоликонов, они умудряются даже из зажатых до смешного моделей выбивать маленьких девочек в купальниках. Я на Nightcafe сижу, попадались, хотя оно даже слово exposed плохо переваривает.

Если бы только, но там всё гораздо запущеннее. Там цензура во все, какие-то только возможно стороны. Главным прецедентом был скандал после запуска Dall-E 3 со знаменитой картинкой Микки-Мауса и башен-близнецов и еще нескольких, предсказуемо раздутых в последствии прессой. После этого они языковую модель обложили сотнями правил о том, чего нельзя, чтобы уж наверняка. Из-за этого возникали всякие курьёзы типа, когда сетка блокировала запрос о том, как персонаж катается на коньках, кажется, 16-го века. А сетка заявила, что не будет делать картинку, т.к. кататься на спорт-инвентаре такой давности травмоопасно))
Потом, когда хайп улёгся, они снова смягчили со временем цензуру, но в новой версии снова выкрутили на максимум, думаю, тоже потом сбавят обороты.
Мне лично, например, сетка заблокировала запросы о "книжной иллюстрации в которой Крампус в лесу варит грибы в котелке", объяснив это "изображение определённых мифологических существ в сочетании с определёнными действиями могут конфликтовать с правилами." и запрос в котором присутствовала дриада, покрытая мхом, мицелием и лишайником. Сетку не Дриада смутила, а лишайник с мицелием на её теле, типа, "Decaying body and unsettling imagery"

Но лоли тоже проблема, из-за которой ни одна крупная сетка не рискует разрешить обнаженку даже в формате, скажем, античных статуй или классической живописи.

Mefista

28 Apr 2025, 01:06

Это еще может быть с рассчетом на китайцев, недолюбливающих торчащие кости и скелеты.

Кстати, о скелетах, мне аишка (на найткафе разные модели, не помню детали) отказала в скелете, покрытом блестками

Хоботов

28 Apr 2025, 03:35

Цитата(KypaToP_HM @ 06 Aug 2024, 17:31)

Нейросетевое геройское. Современные технологии не перестают удивлять.

https://t.me/edvardwolfchannel/385

Башня плохо, Оплот хорошо вышел. Может ли это быть признаком того что экран Оплота очень качественно сделан авторами изначально?...

laViper

28 Apr 2025, 06:36

Цитата

Там еще раз пробили потолок в плане понимания запросов, и в том числе в плане работы с объектными референсами

Ну вот это только надежда, что можно ему конкретно объяснить что хочешь дать в руки персонажу.
С другой стороны сейчас встречал 3D анимации по геройским юнитам, и там арбалетчик тоже стыдливо свой "ствол" прячет под экраном.

Axolotl

28 Apr 2025, 11:38

Цитата(laViper @ 28 Apr 2025, 10:36)

Цитата

Там еще раз пробили потолок в плане понимания запросов, и в том числе в плане работы с объектными референсами

Ну вот это только надежда, что можно ему конкретно объяснить что хочешь дать в руки персонажу.
С другой стороны сейчас встречал 3D анимации по геройским юнитам, и там арбалетчик тоже стыдливо свой "ствол" прячет под экраном.

Так вот же, объектные референсы. В смысле, что, возможно, не придётся ничего объяснять, а можно прямо дать сетке картинку с любым интересующим тебя оружием и сказать, чтобы она вставила его в руки существу. Само существо тоже можно дать референсом, если нужно.
Вот сейчас сделал два теста с простеньким описанием.

Fantasy image of a centaur holding a Bhuj in his hand
Результат:

(Раскрыть)

Выбрал специально довольно экзотическое оружие – бхудж. И, кстати, кентавры раньше тоже были проблемными для сеток.
Как видим, бхудж получился весьма далёким от аутентичности.

Ок, вторая попытка.
Я загружаю эту картинку

(Раскрыть)

И даю запрос: fantasy image of a centaur holding a weapon from reference image in his hand

Результат

(Раскрыть)

На мой взгляд, справилась вполне неплохо. Может, не 100% идентичность если прям в детали вглядываться, но это все равно прям огромный скачок для нейросеток, раньше такого никто не умел.

Midjourney тоже обещают вскоре фичу "Omni reference" для тех же целей, но хз как там у них будет работать.

P.S. Тест, конечно, простенький: и само оружие простое, и то, как его полагается держать – очевидно. Возможно, для чего-то более инженерно-сложного или того, что нужно держать особым образом, результаты будут хуже, или потребуется больше референсов, но тут только пробовать.

Axolotl

28 Apr 2025, 12:10

По поводу рефов персонажей, вот еще тест. Дал сетке картинки Джелу и Катерины и запрос:
Take characters from reference images and make a painting of them drinking a coffee in a street cafe. Both of them are enjoying the hot coffee. You can see gryphons flying far in the distance.

Вот что вышло:

Ну, я бы сказал, что узнаваемость средненькая, но тем не менее есть, особенно учитывая, что рефы джелу очень трудночитаемые (а, может, сетка побоялась точно передавать его БДСМ наряд))).

laViper

28 Apr 2025, 12:35

Как бы да, но вопрос насколько это работает со сложными предметами - пока это лишь переделанное копьё, где меняется часть после древка. Если ИИ научился его крутить как копьё/топор, то проблем нет.
Здесь же надо научить изначально ИИ работать с чем-то похожим на арбалет, тогда и не будет проблем делать на него "скины". В лучшем случае должна быть большая пачка рефов, чтобы с нуля обучить ИИ новому сложному предмету.

Axolotl

28 Apr 2025, 13:00

Цитата(laViper @ 28 Apr 2025, 16:35)

Как бы да, но вопрос насколько это работает со сложными предметами - пока это лишь переделанное копьё, где меняется часть после древка. Если ИИ научился его крутить как копьё/топор, то проблем нет.
Здесь же надо научить изначально ИИ работать с чем-то похожим на арбалет, тогда и не будет проблем делать на него "скины". В лучшем случае должна быть большая пачка рефов, чтобы с нуля обучить ИИ новому сложному предмету.

Так попробуй, там зарегаться – дело пары минут. Я бы и сам сейчас попробовал, но сегодняшний лимит генераций уже исчерпал. Если будешь пробовать, скидывай сюда результаты, мне тоже интересно будет посмотреть.

Цитата

В лучшем случае должна быть большая пачка рефов

Ну вот подход 4o показывает, что, возможно, классическое обучение уже не так уж нужно, если сетка будет хорошо справляться с предоставленными рефами, ты ведь ей можешь сразу пачку рефов показать.
Да, я уверен, что чем сложнее по форме объект, тем больше будет погрешностей, но тут только тестировать, чтобы понять насколько у неё там потолок.

IQUARE

28 Apr 2025, 21:40

Цитата(Axolotl @ 28 Apr 2025, 12:10)

По поводу рефов персонажей, вот еще тест. Дал сетке картинки Джелу и Катерины и запрос:
Take characters from reference images and make a painting of them drinking a coffee in a street cafe. Both of them are enjoying the hot coffee. You can see gryphons flying far in the distance.

У Джелу уши неправильные)

Axolotl

28 Apr 2025, 21:57

Цитата(IQUARE @ 29 Apr 2025, 01:40)

Цитата(Axolotl @ 28 Apr 2025, 12:10)

По поводу рефов персонажей, вот еще тест. Дал сетке картинки Джелу и Катерины и запрос:
Take characters from reference images and make a painting of them drinking a coffee in a street cafe. Both of them are enjoying the hot coffee. You can see gryphons flying far in the distance.

У Джелу уши неправильные)

Если честно, это моя вина, это была вторая итерация, в первой версии сетка сделала его с более женскими чертами лица, и я сказал повторить, но проследить за тем, что персонаж с рефа Джелу – это elf male

Etoprostoya

29 Apr 2025, 10:57

Второе ухо ещё может быть правильным. А вот третьему блюдцу некуда спрятаться.

tolich

29 Apr 2025, 17:52

Каравай-каравай, обе кружки наливай!

laViper

17 May 2025, 20:54

А кто ещё разбирается в ИИ-генерации, насколько сложно заставить сделать только контур с минимумом деталей?

Axolotl

17 May 2025, 21:57

Цитата(laViper @ 18 May 2025, 00:54)

А кто ещё разбирается в ИИ-генерации, насколько сложно заставить сделать только контур с минимумом деталей?

Не уверен, Что правильно понял. Что значит контур? Контур чего?

hippocamus

18 May 2025, 00:37

Цитата(Axolotl @ 17 May 2025, 21:57)

Цитата(laViper @ 18 May 2025, 00:54)

А кто ещё разбирается в ИИ-генерации, насколько сложно заставить сделать только контур с минимумом деталей?

Не уверен, Что правильно понял. Что значит контур? Контур чего?

Я так понимаю, это детализированный контур

а это - нет

laViper

18 May 2025, 08:44

Да, но наверное лучше первый вариант. В некоторых случаях просто слишком много деталей бывает и с учётом ЧБ варианта не ясно - это идёт как контур или просто рисунок.

Проще говоря - как детская раскраска. При слишком большом обилии деталей оно выглядит уже перегруженным.

Axolotl

18 May 2025, 10:23

Цитата(laViper @ 18 May 2025, 12:44)

Да, но наверное лучше первый вариант. В некоторых случаях просто слишком много деталей бывает и с учётом ЧБ варианта не ясно - это идёт как контур или просто рисунок.

Проще говоря - как детская раскраска. При слишком большом обилии деталей оно выглядит уже перегруженным.

Я лично таким не занимался, но раскраски народ постоянно генерит. Да, некоторые слишком детальные, но, думаю, в зависимости от сетки, можно подобрать правильные слова в промпте или правильные референсы, чтобы добиться более менее стабильного нужного стиля.

Вот чисто навскидку сгенерил.

tolich

12 Jul 2025, 20:05

Bing Image Creator.

Промпт 1: "анекдот картина голод"
Результат меня не удовлетворил.

Промпт 2: "анекдот картина голод паутина"
Результат меня опять не удовлетворил, но я забил.

Результаты на моём ЯДе.
Я так и не понял, ни почему это голод, ни почему это анекдот.

Axolotl

22 Jul 2025, 11:37

Цитата(tolich @ 13 Jul 2025, 00:05)

Bing Image Creator.

Промпт 1: "анекдот картина голод"
Результат меня не удовлетворил.

Промпт 2: "анекдот картина голод паутина"
Результат меня опять не удовлетворил, но я забил.

Результаты на моём ЯДе.
Я так и не понял, ни почему это голод, ни почему это анекдот.

Бинг не очень хорошо умеет в то, что называется "vibey prompt", хотя результат все равно странный.

Вот то, что мне MJ сгенерила.

(Раскрыть)