Sie sind nicht angemeldet.

Lieber Besucher, herzlich willkommen bei: Panorama Community. Falls dies Ihr erster Besuch auf dieser Seite ist, lesen Sie sich bitte die Hilfe durch. Dort wird Ihnen die Bedienung dieser Seite näher erläutert. Darüber hinaus sollten Sie sich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutzen Sie das Registrierungsformular, um sich zu registrieren oder informieren Sie sich ausführlich über den Registrierungsvorgang. Falls Sie sich bereits zu einem früheren Zeitpunkt registriert haben, können Sie sich hier anmelden.

1

Freitag, 22. November 2024, 19:45

Comfy mit Flux equirectangulares 360° KI Panorama, kompletter 1 Klick Workflow

In CivitAI habe ich das hier gefunden:
https://civitai.com/models/745010?modelVersionId=833115

Update: Eine bearbeitete und erweiterte Version gibts jetzt in diesem Thread als Anhang.

Der Entwickler "SeanScripts" hat einen kompletten Workflow zur Erstellung von 360° KI Panoramen in Comfy gebaut. Sozusagen eine 1 Klick-Version.

Flux Equirectangular 360° Panorama Workflow in Comfy:

Der Workflow beinhaltet:
360° KI Panorama Erzeugung mit Flux und einem speziellen 360° equirectangularen Lora in 2048x1024 Pixeln
Erstellen einer um 180° verschobenen Version
Retusche der Naht ("fixed" Version)
(Schlechtes temporäres Upscalen der "fixed" Version auf 4096x2048 Pixel)
An dieser Stelle des Workflows geht es auf Mac nicht weiter. Ansonsten würde noch passieren:
...Highres Fix Version 4096x2048 Pixel mit gefixter Naht
...Erstellen einer Stereo-Version

Zenith und Nadir brauchen oft keine Retusche mehr, und die Naht ist gefixed.
Der Horizont sitzt aber nicht unbedingt richtig, da ist ggf. wieder etwas Stauchen und Schieben in der Höhe nötig.
Sozusagen ein komplett fertiges equirectangulares KI Panorama, allerdings nur 2048x1024 Pixel (auf meinem Rechner). Upscalen kann man dann z.B. auf Automatic1111.

Zeit:

Auf Mac Studio M2 Max 32Gb:
Das Basispanorama erscheint nach ca. 15 Minuten. Die gefixte 2048ger-Version braucht weitere 5 Minuten, dann ist die Naht repariert
Nach jeweils ca. 4 Std. würde es eine Hi Res Fix Version in 4096x2048 Pixel geben, das Rendern bricht aber auf Mac mit einer Fehlermeldung nach ca. 2 Std ab.
Update PC:
Auf PC mit einer RTX 4060 Grafikkarte mit 16 GB VRAM dauert die gefixte Version 3 Minuten, der gesamte Workflow mit gefixtem 4096 Pixel Ergebnis ca. 15 Minuten.

Installation des Workflows:

Für Comfy-Kenner ist die Installation dieses Workflows vermutlich problemlos. Hier die nötigen Schritte für Anfänger wie mich:

1. Comfy für Browser installieren. Es gibt dazu viele Anleitungen im Netz
(Auf Mac kann das tricky sein, hab ich nur mit Hilfe von ChatGPT geschafft. Durcheinander von Python-Versionen und Aliassen)
In den Settings von Comfy dann am besten "New Menu" abschalten für die Standard Comfy Oberfläche.

2. Den Manager installieren, quasi unabdingbar zur Arbeit mit Comfy. Infos zur Installation im Netz. Damit kann man auch in Sekunden Comfy neu starten, was man oft braucht.

3. Hier den Workflow laden:
https://civitai.com/models/745010?modelVersionId=833115
Dazu kann man einfach eines der beeindruckenden beiden Waldpanoramen herunterladen und auf das Comfy-Browserfenster ziehen. Der Workflow ist in Comfy PNGs enthalten. Das ist dann ein riesiger Wust an Boxen und Kabeln.

4. Es gibt dabei viele Nodes die fehlen (rot markiert). Im Manager kann man die fehlenden Nodes (Erweiterungen) anzeigen lassen und dann installieren. Es fehlen ca. 10 Erweiterungen. Das sind relativ kleine Dateien.

5. Die fehlenden Modelle dagegen werden erst angezeigt, wenn man versucht das Rendern zu starten.
Richtig viel Zeug ist manuell zu laden und in die richtigen Ordner in "models" zu verteilen.
Das sind
der Flux Checkpoint 23 GB
eine unet Flux .gguf Datei 13GB
zwei Clip Safetensors, zusammen ca. 10GB
das Lora 360° Equirectangular 400MB
die vae Datei ae.safetensors, die man in ae.sft umbenennen muss 400MB
der Upscaler 4x-UltraSharp mit 70MB

Die angezeigten fehlenden Modelle kann man durch Googeln recht leicht finden bei CivitAI und Huggin Face. Unbedingt namensidentische Versionen laden, bis auf ae.sft, die heißt im Download ae.safetensors

Damit die Modelle mit insgesamt ca. 50GB nicht mein Startvolumen verstopfen, hab ich den "models" Ordner per Alias auf eine externe Platte umgeleitet.

6. Flux will zwei Versionen vom Prompt, eine kurze und eine Langversion. Wenn man kein Schriftsteller ist, lohnt es sich, eine KI wie ChatGPT zumindest mit der Erstellung der Langversion zu beauftragen. Lange Texte sind anscheinend günstig für Flux.

7. Ich habe als erste Modifikationen als kompletter Comfy-Dau die beiden RandomNoise Nodes von "fixed" auf "randomize" umgeschaltet, sonst kriegt man immer wieder sehr ähnliche Bilder.

8. Nach Klicken auf Queue Promt läuft es los. Den Fortschritt sieht man jeweils in den rosa SamplerCustomAdvanced Nodes und im Terminal. Es erscheinen nacheinander in den Save Image Nodes das 2048 Basispanorama, die 180° Version, die Version mit gefixter Naht, die upgescalte 4096 Version mit gefixter Naht und eine Stereoversion - auf PC.


Die Comfy Oberfläche dieses Workflows nach ca. 20min Rendern. Der Workflow läuft von links nach rechts ab. Die Erstellung der Hi Res Fix Versionen ist auf meinem Mac nicht möglich, auf meinem PC problemlos.


Resultate 2048x1024 Pixel ohne jede Bearbeitung:

Wald:




Barock:



2

Sonntag, 24. November 2024, 22:05

Interessant, aber wenn du schon alles richtig zusammengesucht hast, wären Links doch schon sehr hilfreich. Viele der von dir kurz erwähnten Dateien konnte ich nicht aufstöbern.
Ich habe Comfy UI früher schon genutzt, aber die langen Wartezeiten auf ein Bild gefallen mir nicht. Den neuen Workflow würde ich gern mal testen.

3

Montag, 25. November 2024, 21:35

Das ist ja komisch. Bei der Suche nach den Dateinamen stehen bei mir die Downloadseiten alle direkt an erster Stelle beim googeln. Das ist alles absolut einfach zu finden.
Hab ich jetzt noch mal gemacht. Hier die Liste:
vae
ae.safetensors (zu ae.sft umbenennen)
https://huggingface.co/black-forest-labs…/ae.safetensors

clip
clip_l.safetensors
https://huggingface.co/comfyanonymous/fl…p_l.safetensors
t5xxl_fp8_e4m3fn.safetensors
https://huggingface.co/comfyanonymous/fl…3fn.safetensors

checkpoints: (Wird anscheinend nicht gebraucht)
flux1-dev-fp8.safetensors
https://huggingface.co/Kijai/flux-fp8/bl…fp8.safetensors

unet:
https://huggingface.co/city96/FLUX.1-dev…1-dev-Q8_0.gguf

upscale_models
4x-UltraSharp.pth
https://huggingface.co/lokCX/4x-Ultrasha…-UltraSharp.pth

Vielleicht müsste man etwas weniger heftige Models verwenden.
https://civitai.com/models/647237?modelVersionId=743342
Dann statt dem gguf Q8 Model ein Q6 oder Q4 Model verwenden - wenn ich das alles richtig verstehe.
Ansonsten will ich jetzt in meinen PC eine RTX 4060 TI mit 16GB VRAM einbauen. Das sollte im Bereich Faktor 10x so schnell sein wie mein Mac Studio.

4

Montag, 25. November 2024, 22:40

Danke, die Downloads und Installationen (Manager über eine bat.Datei) habe ich nun geschafft.
Das eine sehr schöne Wald-Pano in das Browserfenster gezogen und mit Hilfe des Managers weitere Dateien installiert.
Trotzdem kommt nach Klick auf "Queue" diese Fehlermeldung:





Muss ich da noch im Windows-Explorer Dateien in die richtigen Ordner schieben?

5

Dienstag, 26. November 2024, 09:50

Du musst die Dateien per Hand in die richtigen Ordner in "models" verteilen. Der Ordner steht ja in meinem Post über dem Link.
Es ist oft auch nötig, Comfy richtig zu beenden oder den Worflow erneut ins Browserfenster zu ziehen. Das unbedingt probieren.
Ich bin totaler Comfy Anfänger, niemand, der Dir bei Problemen wirklich helfen kann.

Es gab schon alle Arten von Schweinereien und Bugs in den wenigen Tagen, die ich mich mit Comfy beschäftige.
Ich probiere momentan, einen Flux Upscale-Workflow zu finden, der funktioniert - bisher erfolglos. Ein einziges Chaos von veralteten Informationen, Nodes, die nicht mehr angeboten werden, Runtime-Verbindungen, die nicht klappen, sonstigen Bugs mit kryptischen Fehlermeldungen...
Die ganze Comfy Flux Welt ist momentan derartig schnell in Entwicklung, dass Infos von vor einem Monat jetzt schon obsolet sein können.

ChatGPT 4.0 (nur als registrierter User! Nicht die Mini-Version, die kann gar nichts) kann sehr gut helfen bei diesen Problemen. Ich hätte die Installation bei mir ohne ChatGPT nicht hingekriegt, nie im Leben.

6

Dienstag, 26. November 2024, 11:04

Ich habe gerade die Beta von Comfy Desktop installiert. Dasselbe Chaos. Witzig: Das Template mit der lila Flasche. Die 512x512 Px Größe wird gut gerendert. Größere Auflösungen erzeugen nur Strukturengewirr.
Ich würde mal gern den Panorama-Checkpoint testen. Die beiden Waldbilder sehen ja schön scharf und detailreich aus.

7

Dienstag, 26. November 2024, 14:39

Ich finde es gerade nicht mehr, einen Bericht mit allen möglichen Bildfehlern, die in Flux auftauchen können.
Sorge unbedingt dafür, dass die VAE geladen wird. Klick noch mal auf den Dateinamen in Comfy und checke, ob die VAE da wirklich aktiv ist. Wenn nach dem Klick das Feld leer ist, gibt es ein Problem.
Ich erinnere mich auch, dass manche Step-Zahlen zu kaputten Ergebnissen führen können, zu hohe oder auch zu niedrige.

Ob ein zu schwaches System nur kaputte größere Bilder rendern kann weiß ich nicht.
Du könntest als gguf - Datei mal einen Q2 Checkpoint probieren.
https://civitai.com/models/843551/fluxdev-dedistilled
Der braucht nicht so viel RAM.

Leider kommt man ohne diesen Comfy Workflow mit Flux nicht richtig weiter. Das ist ein anderes System als Stable Diffusion, da kann es keine Möglichkeit geben, mit einer Erweiterung die Naht zu vermeiden.
Die Naht kann richtig heftig sein, kaum zu reparieren, kennen wir ja von SD. Da braucht man diesen 180° Switch. Kannst Du den Workflow in Comfy Desktop laden? Gibts für den Mac nicht.

8

Mittwoch, 27. November 2024, 13:25

Hier ein weiteres Ergebnis mit Flux und Comfy, der Geigenbauer.

Der Entwickler des Workflows und Equi-Loras weist darauf hin, dass Innenräume nicht gut trainiert sind im Model.
Immerhin werden Räume viereckig, was sich in Stable Diffusion per Prompt nicht erreichen lässt.

Weiterhin habe ich noch keinen funktionierenden Upscale-Workflow mit Kacheln gefunden für Flux.
Die Zeiten, die das Upscalen brauchen würde, wären dabei auf meinem Mac vermutlich inakzeptabel - mehrere Stunden.
Deshalb hab ich den Geigenbauer mit Automatic1111 und dem bewährten SD Ultimate Upscale Prozess auf 8192 Pixel hochskaliert, inkl. 180° Durchgänge, um die Naht zu retuschieren.

Die Anmutung und Qualität der Flux Bilderstellung ist ganz gut erhalten geblieben. Vielleicht muss man nicht mit Flux upscalen, das spart jedenfalls viel Zeit.
Die Instrumente haben leider nicht die erwartete Qualität. Da müsste man verschiedene Flux Modelle testen, ob sich das verbessern läßt.
Außer der ausgetauschten Naht gibt es keine Retusche. Zenith und Nadir sind beim Upscalen ganz gut vom Original erhalten geblieben.

Der Kurz-Prompt (mit ChatGPT Hilfe):
equirectangular 360 degree panorama, An old luthier sits in his overcrowded, dusty workshop, surrounded by chaos, polishing an old violin. The floor is not visible, too much clutter, shavings, old wood, old tools, old violins and cellos, and undefinable clutter. Finished violins and cellos hang vertically in tight rows from the ceiling and everywhere on the walls, their scrolls aligned perfectly, their varnished bodies dangling straight down. The workshop is crammed with piles of wood scraps, unfinished instruments, antique furniture, and tools scattered everywhere.

Der gewünschte völlig vollgestellte Raum ließ sich mit den wenigen Versuchen nicht erreichen (15-20 min pro Durchgang).
Da müsste man noch einiges am Prompt rumschrauben.


Geigenbauer:



9

Samstag, 30. November 2024, 13:35

"die vae Datei ae.safetensors, die man in ae.sft umbenennen muss 400MB"

Hier steht es umgekehrt:

https://huggingface.co/black-forest-labs…/ae.safetensors



10

Sonntag, 1. Dezember 2024, 14:08

safetensors oder sft - man findet beide Benennungen für die Flux VAE Datei. Spielt eigentlich keine Rolle. Im Equi-Workflow oben muss die Datei .sft heißen, oder man ändert das im VAE Node.

Mac vs. PC (haha)

Ich hab jetzt meinen 8 Jahre alten PC mit Intel i7 8700 Prozessor für 50 € auf 64 GB Ram aufgerüstet, und dann eine NVIDIA RTX 4060 Grafikkarte mit 16 GB VRam für ca. 450 € eingebaut. Die erreicht immerhin ca. 40 % KI Leistung einer RTX 4090 - zu einem fünftel des Preises. Sweet Spot momentan.

Das schlägt meinen Mac Studio NM2 Max mit 32 GB um den Faktor 10 - 30 in Sachen Geschwindigkeit. Statt einer Stunde jetzt 3 Minuten, krass. KI Bildgenerierung auf dem Mac kann man also absolut vergessen, vor allem wenn es um größere Bilder geht. Außerdem laufen viele Nodes in Comfy gar nicht auf dem Mac. Nach 3 Std Renderzeit auf dem Mac eine Fehlermeldung mit Abbruch macht keinen Spaß.

Flux mit Depth Maps für Panoramen

Hier ein Vergleich von verschiedenen Herangehensweisen für Depth Maps. Ausgangspunkt ist ein 3D Modell eines Leuchtturms in einer Landschaft.
Die Bilder sind die 2048ger Resultate direkt vom Rendern ohne Bearbeitung.

1. Automatic1111 mit SDXL: Macht immer noch eine gute Figur, wenn es um die Umsetzung von Depth Maps geht.
Das Model war Mohawk, der Depth Preprocessor leres++. Das Bild bräuchte natürlich diverse Upscale-Vorgänge zur Verbesserung. Das Bild wirkt aber gerade wegen des Schmutzes am echtesten.

2. Comfy Flux mit Depth Map: Es gibt es ja die neuen Flux-Tools für Depth Maps seit einer Woche. Leider sieht das Ergebnis nach Spielzeuglandschaft aus. Ich habe sehr viel probiert, den Eindruck konnte ich bisher nicht beseitigen. Die Depth-Funktionalität ist da im Checkpoint eingebaut, dem entkommt man also nicht.

3. Comfy Flux mit Depth Lora: ergibt auch denselben Spielzeug-Effekt. Man kann versuchen, mit zusätlichen Loras Schmutz ins Bild zu bringen - im Beispiel unten mit Zavy's Dark Atmospheric Lora von Civitai. Bisher waren alle meine Versuche mit Flux und Depth Maps so weit von einem akzeptablen Resultat entfernt, dass ich erst einmal aufgegeben habe.

4. Comfy Flux ohne Depth Map: Wenn man einen entsprechenden Prompt ohne Depth Map in dem Equi-Workflow eingibt, ist der Spielzeug-Effekt direkt weg.

Der Promt war:
Equirectangular 360 degree panorama, hyperrealistic photo, closeup photo of a Red and white striped lighthouse on a rock in the center of a snowy rocky cove with steep cliffs and trees, a dark starry winter night with a frozen sea and piled ice floes, auroras fill the sky, colorful lights illuminate the snow. Houses with smoking chimneys stand on the cliffs, mist drifts between the rocks, creating a serene and magical atmosphere. The lighthouse is in the center of the image. (teils ChatGPT generiert)

Automatic1111 Depth mit SDXL:


Comfy Flux mit Depth Checkpoint:


Comfy Flux mit Depth Lora und Zavy's Dark Atmospheric Lora:


Comfy Flux mit Equi-Workflow ohne Depth:




11

Samstag, 7. Dezember 2024, 14:44

Echtere Bildqualität mit zusätzlichen Loras

Bei der Verwendung von Depth Maps für 360° Panoramen bin ich noch nicht weitergekommen, dafür hier einige Ergänzungen zum Equi-Workflow wie oben vorgestellt.

"Verschlechterung" des Bildes mit Loras und Nodes

Der anfänglich vorgestellte equirectangulare Workflow in Comfy mit dem Equi-Lora erzeugt zwar erstaunlich gute Ergebnisse was die equirectangulare Entzerrung angeht, aber die Ergebnisse sind meist zu clean und steril.

Hier einige Taktiken, um den Bildern mehr Echtheit zu geben - neben unzähligen anderen, vielleicht besseren Möglichkeiten.
Für das Leuchtturm-Projekt sollte außerdem die Nacht verstärkt werden. Der Prompt ist dabei im Prinzip gleich geblieben, wie weiter oben.

a. Loras: Von mir getestete Style-Loras sind Dark Cinematic und Dark Atmospheres, neben anderen, die nicht zielführend für das Leuchtturm-Projekt waren. Diese Loras sollten im Workflow hinter das equirectangulare Lora geschaltet werden. Im Equi-Workflow gibt es schon vorbereitete Lora Nodes, die nur noch eingeschaltet werden müssen.
Leider tendieren diese Loras dazu, die equirectangulare Entzerrung zu stören. Nach meine Erfahrungen kann man den strength_clip Regler im Equi-Lora herunterschalten auf 0,5 oder 0, dafür in den Style Loras den strength_model Regler auf 0 oder 0,5 heruntersetzen. Dann bleibt die equirectangulare Entzerrung erhalten.

b. Zusätzliche Nodes. Ich habe teils den "Detail Demon Sampler" verwendet, der das Bild mit Details vollpackt. Der Schnee in Beispiel 2 bekommt Struktur und Schmutz, viel mehr Sterne werden erzeugt usw. Dafür wurde der Leuchtturm als Detail eckig gemacht, war nicht rund zu kriegen.

Neues Inpainting:

Das neue Inpainting mit dem Flux-Tools schlägt so ziemlich alles am Markt, inkl. z.b. PSD Generative Fill. Dauert allerdings deutlich länger. Unbedingt Testen!

Die Links zu den verwendeten Tools:

Equi-Workflow mit Link zum Equi-Lora (nochmal)
https://civitai.com/models/745010?modelVersionId=833115

Flux Tools
https://blackforestlabs.ai/flux-1-tools/
Hier sind die relevanten Links zu finden. Download der teils riesigen safetensor-Dateien nur mit (unkomplizierter) Registrierung bei Hugging Face

Flux Tools Workflows
https://huggingface.co/datasets/stabledi…flows/tree/main

Der verwendete Upscale-Workflow
https://openart.ai/workflows/fish_intent…0ZgPRBBqAkYRaek
Upscaler: 4x_foolhardy_Remacri oder (besser) 4x-UltraSharp

Dark Landscapes Lora
https://civitai.com/models/702293/dark-landscapes

Dark Cinematic Style Lora
https://civitai.com/models/702854/dark-c…ow-key-lighting

Detail Daemon Sampler Node
https://github.com/Jonseed/ComfyUI-Detail-Daemon

Ergebnisse:

1. (8196 Pixel) Equi-Lora 1/0, dahinter Dark Cinematic mit 0/1. Das erzeugt eine Oberflächenstruktur auf den Flächen, das Ganze wirkt nicht mehr so glatt. Die Änderung ist aber dezent. 2x Upscale Vorgang auf 8192 Pixel. Mit Inpainting sind Treppe hinten und Weg nachträglich eingesetzt. Sonst keine Retuschen.




2. (4096 Pixel) Equi-Lora 1/0,5, Dark Cinematic dahinter mit 0,5/1. Zusätzlich Node "Detail Daemon Sampler" verwendet mit Detail Amount 1.
Den Leuchtturm mit dem neuen Flux Tool Inpaint ausgetauscht, damit er rund wird.





3. (4096 Pixel) Hier war das Lora "Dark Landscapes" hinter dem Equi-Lora (1/1) geschaltet, mit den Werten 1/1, also richtig kräftig.
Bei vielen Durchläufen gab es interessante Bilder, die aber kein bißchen equirectangular waren. "Dark Landscapes" mit dem strength_model Wert 1 zerstört meist die Equi-Entzerrung. Dieses Bild ist also ein Ausrutscher. 1x Upscale Vorgang, wenige Retuschen und eine leichte Stauchung des Himmels.
Die Resultate gehen durch das Lora eher in Richtung Illustration, weg vom Fotografischen.




12

Donnerstag, 12. Dezember 2024, 15:56

Bessere erste Bildkomposition mit dem Equi-Workflow

Nachdem ich jetzt eine Menge Bilder mit dem Equi-Workflow generiert habe, gibt es mehrere Erkenntnisse.

1. 1536x768 Pixel erzeugen
Statt 2048x1024 Pixel besser 1536x768 Pixel Größe erzeugen. Statistisch sind da durchweg die besseren Bildkompositionen entstanden. Da später immer Upgescaled werden sollte ist das kein größeres Problem. Flux erzeugt so scharfe Bilder, das selbst 1536 Breite schon ansehnlich ist. Die HiRes-Version im Workflow ist dabei abgeschaltet.

2. Detail-Loras verwenden
Der pure Equi-Workflow generiert eher flache Bilder ohne viel Abwechslung. Es gibt diverse Detail-Loras, die aber auch Unsinn ins Bild packen können.

3. Realism-Loras verwenden
Verringert den Illustrations-Eindruck teils deutlich.

4. Detail Daemon Sampler Node
erzeugt die ganz kleinen Strukturen.


Bewährt hat sich z.B. diese Reihenfolge für das Dschungel-Panorama unten:

1. Lora:
equirectangular_flux_lora_v3_000003072.safetensors
wie im Workflow

2. Detail-Lora
Flux Detailer_epoch_3.safetensors
oder
Detailer2K.safetensors

3. Realismus-Lora
realism_lora_comfy_converted.safetensors

Alle Loras auf 1/1 eingestellt.

Außerdem:
Detail Daemon Sampler (mit einem Wert unter 0,5, sonst wird das Bild zu wirr). Kann ungewollt Elemente vervielfachen, ggf. sehr niedrigen Wert einstellen oder auf doch Bypass setzen. Es gibt unten z.B. etwas zu viele Affen.

Im Anhang unten eine .zip-Datei mit einem PNG-Bild, was das Panorama unten als .png inkl dem Comfy-Workflow zur Bildverbesserung enthält. In dem Workflow ist die Vergrößerung per Hires abgeschaltet.

--------
A hyperrealistic 360 degree panorama shows A lively, dense tropical jungle in a in a mountainous landscape alive with thousands of monkeys—swinging on thick lianas, leaping between branches, and scurrying across the vibrant forest floor. The thick foliage and towering trees dominate the scene, with sunlight filtering through the lush green canopy. In the distance, partially obscured by nature's grip, lies an ancient, crumbling temple overtaken by massive roots and vines. The focus remains on the exuberant activity of the monkeys and the thriving jungle, with the temple lending a mysterious backdrop. Photorealistic, captured in vivid detail with a professional DSLR camera, emphasizing the life and energy of the scene. Evening twilight, no visible sun ((cloudy day::3)), high resulution, 8k, hyperdetailed, best quality, midjourneyv6.1

2048x1024 ohne Style-Loras oder Detail Daemon, unbearbeitet, so unbrauchbar:



1536x768, mit Flux Detailer, realism_lora und Detail Daemon, unbearbeitet:

»Malum« hat folgende Datei angehängt:

13

Sonntag, 15. Dezember 2024, 10:39

Panoramen mit Depth-Vorlage in Comfy mit Flux erzeugen

Nach ersten erfolglosen Versuchen hier jetzt ein Ergebnis mit einer Panorama Depth-Vorlage. Ein PNG mit dem Workflow ist zum Download unten angehängt.

Östlich von Königs-Wusterhausen gibt es die Wolziger Wurzelkiefer. Die sieht von allen Seiten sehr unterschiedlich aus, so dass man in einer Panoramamontage in PSD einen Wurzelkiefer-Wald zusammenbauen kann.

Depth Map optimieren

Die Depth-Map daraus habe ich in Automatic1111 mit leres++ erzeugt. leres++ erzeugt m.E. die besten Depth Maps für Landschaften. Ich hab noch nicht rausfinden können, wie man leres++ in Comfy installiert bekommt.

Wichtig ist, unbedingt die Naht schon in der Depth-Map zu reparieren. Dazu am besten mit einer um 180° verschobenen Vorlage eine zweite Depth-Map erzeugen, und dann in PSD die beiden Depth Maps zusammenmontieren zu einer Version ohne sichtbare Naht, per Verschieben-Filter mit halber Bildbreite.

Besser Flux Tools Depth-Model als Depth-Lora verwenden

Der Depth-Workflow basiert dann auf den Flux-Tools. Hier habe ich deutlich bessere Resultate bei Verwendung des 23GB Flux Tools Depth-Models bekommen als mit dem Depth-Lora. Da als Vorlage schon eine fertige Depth-Map verwendet wird, muss man den Preprocessor ausschalten. Außerdem sind die beiden Loras Flux Detailer_epoch_3.safetensors und realism_lora_comfy_converted.safetensors eingebaut. Das Equi-Lora ist nicht notwendig, die equirectangulare Verzerrung entsteht ja durch die Depth Map.

4x Upscale mit Flux

Beim 2048 Pixel Ergebnis ist dann die Naht in PSD grob retuschiert, und dann 2x ein 4-fach Upscale-Vorgang auf 8192 Pixel in Comfy durchgeführt (ca. 30 min), der zweite Durchgang mit 180° verschobenem Bild für die Naht-Retusche. Das Upscalen bleibt ein Schwachpunkt bei Flux, einen richtig guten Workflow habe ich weiterhin nicht gefunden. Das Upscalen mit SDXL wäre möglich und bietet deutlich mehr Optionen, wird aber nicht so scharf und plastisch.

Zenith und Nadir im Resultat sind nicht bearbeitet, da müsste man eigentlich leicht eingreifen. Der Förster ist noch mit Flux Tools Inpaint und PSD optimiert.
(Wer findet den zweiten Förster?)

So einen langen Text kriegt man nur mit ChatGPT-Hilfe hin, Promt:

Equirectangular 360 degree panorama, deep winter, deep show everywhere, an awe-inspiring forest covered in deep snow at dawn, dominated by a a snow-covered colossal tree in the center. This tree is unlike any other, with its massive trunk beginning 3 meters above the ground, supported by an extraordinary root structure resembling a gordian knot. The roots twist, curl, and overlap chaotically, forming an intricate labyrinth beneath the tree, with gaps and hollow spaces large enough for a person to walk through, a hollow root mesh. The gnarled roots create natural tunnels and chambers, stretching outward in a wild, sprawling network. The chaotic structure is both mesmerizing and otherworldly, evoking a sense of ancient mystery. A forester in dark green uniform stands next to the tree root, wearing a gun above his shoulder. Surrounding the central tree, an enchanting dense forest covered in deep snow at dawn in a hilly surrounding, where towering root trees dominate the landscape. Their roots grow chaotically in all directions—twisting, crossing, and curling into a dense, gnarled lattice. These massive, exposed roots lift the tree trunks about 2 meters above the forest floor, forming expansive hollow spaces underneath, large enough to walk through. The tangled network resembles mangroves but with a more wild, irregular structure, as roots curve, overlap, and spiral in unpredictable patterns. The atmosphere is bathed in a soft, ambient light created by dense fog that blankets the forest, illuminating the scene even in the dim light of dawn. Ethereal beams of light filter through the trees, casting faint rays across the twisted roots and mist. An autumn mist clings to the ground, weaving through the root structures and amplifying the magical, otherworldly mood. Above, the faint twinkle of a starry sky contrasts with the warm glow of the awakening day. Fallen autumn leaves scatter across the forest floor, their earthy hues blending with the soft light and thick roots, completing the surreal, dreamlike setting. ((cloudy day::3)), ((high snow::5)), ((deep winter::3)) high resulution, 8k, hyperdetailed, best quality, midjourney v6.1

Vorlage, Montage aus 5 Panoramen:



8192 Pixel Resultat mit dem Flux Depth Tool:




»Malum« hat folgende Datei angehängt:

14

Sonntag, 15. Dezember 2024, 11:48

Wieder sehr stimmungsvoll und auch außergewöhnlich. Zwei Stellen (Nadir und Zenit mal so erstmal belassen) passen nicht so recht. Die zweite Person im Hintergrund lenkt ab und der seltsame braune Zylinder fügt sich nicht in die Waldszenerie ein und hat keine erkennbare Funktion. Den Anschlussfehler konnte die generative Füllung ausbessern.



Solche Baumwurzeln sind immer ein Hingucker:




15

Sonntag, 15. Dezember 2024, 15:53

Sehr hübsche Wurzeln hast Du da. Stammt das aus Panoramen vor Dir? Wo ist denn die zweite Wurzel genau?

Das Ergebnis sollte erst mal ohne Retusche zeigen, was direkt rauskommen kann beim Rendern. Die Qualität von Zenith und Nadir ist out of the box verhältnismäßig super im Vergleich zu dem, was wir bei Stable Diffusion hatten. Etwas Nacharbeit ist da vermutlich aber immer nötig.

Mit Flux-Tools Inpaint ließen sich solche Probleme wie der Baumstumpf, der zum Zylinder mutiert ist, ganz schnell beheben. In Brandenburger Wäldern steht an altem Russen-Militärkram sehr merkwürdiges Zeug rum, da passt der Zylinder eigentlich. Vielleicht muss noch ein Guckloch rein.

16

Sonntag, 15. Dezember 2024, 17:27

Nr.1 :53°47'56.63"N 10°15'41.23"E

Nr. 2: 53°43'26.46"N 10°11'56.18"E

17

Dienstag, 15. April 2025, 21:38

Verschoben in neues KI-Forum