Sie fragen - wir antworten!

Apps & Leitfäden

Fooocus: Überdenken von SD und MJ

Das Aufkommen von Stable Diffusion und MidJourney hat unser Verständnis für das Potenzial generativer neuronaler Netze revolutioniert. Diese Werkzeuge haben uns eine neue Perspektive auf den Prozess der Bilderzeugung und das Ausmaß, in dem wir ihn manipulieren können, eröffnet. Der primäre Ansatz besteht darin, dem System Hinweise auf das gewünschte Ergebnis zu geben. Im Wesentlichen heben wir drei wichtige Aspekte hervor: Objekt, Stil und Umgebung.

Zusätzliche Aufforderungen, die spezifischere Anweisungen geben, wie z. B. die gewünschte Komposition, die Art der Kamera/Objektiv und die Farbgebung, sind ebenfalls wichtig, aber nicht unerlässlich. Je umfassender die Anweisungen sind, desto einfacher ist es für das neuronale Netz, sie zu verarbeiten. Im professionellen Bereich hat sich sogar die Rolle eines Souffleurs herausgebildet. Diese Rolle kann jedoch leicht durch die gleichen generativen neuronalen Netze ersetzt werden. Durch die Kombination von Bild- und Texterstellungsfähigkeiten können wir zusätzliche Prompts generieren, um ein optimales Ergebnis zu erzielen.

Dies ist das grundlegende Konzept von Fooocus. Es integriert das XL Stable Diffusion Modell und einen GPT2-basierten Prompt-Generator, der Ihren einfachen Prompt bereichert und detailliert. Darüber hinaus ist Fooocus mit verschiedenen Verbesserungen und Erweiterungen ausgestattet. Diese Funktionen erleichtern die Erzeugung spektakulärer Bilder über eine einfache Schnittstelle, die keine komplexen Tools enthält. Lassen Sie uns in seine Funktionalität eintauchen und Fooocus auf einem LeaderGPU Dedicated Server installieren.

Voraussetzungen

Beginnen Sie mit den Installationsvoraussetzungen und starten Sie danach neu:

sudo apt update && sudo apt -y upgrade && sudo ubuntu-drivers autoinstall && sudo shutdown -r now

Laden Sie das Shell-Skript herunter, das Anaconda für die Verwaltung virtueller Umgebungen installiert:

wget https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh

Setzen Sie das Ausführungskennzeichen und geben Sie den Datenzugriff frei:

chmod a+x Anaconda3-2023.09-0-Linux-x86_64.sh

Führen Sie das Installationsskript aus:

./Anaconda3-2023.09-0-Linux-x86_64.sh

Nachdem der Prozess abgeschlossen ist, empfehlen wir, die SSH-Sitzung zu trennen und die Portweiterleitung vorzubereiten. Sie müssen Port 7865 vom entfernten Server an eine lokale Loopback-Adresse weiterleiten, 127.0.0.1:7865. Weitere Informationen finden Sie in einem unserer früheren Leitfäden: Stabile Video-Diffusion. Stellen Sie dann die Verbindung wieder her und fahren Sie mit dem Klonen des Projekt-Repositorys auf GitHub fort.

Fooocus installieren

git clone https://github.com/lllyasviel/Fooocus.git

Wechseln Sie in das Verzeichnis Fooocus:

cd Fooocus

Erstellen Sie eine virtuelle Umgebung mit Anaconda und der vom Projektautor vorbereiteten YAML-Konfiguration:

conda env create -f environment.yaml

Lassen Sie uns unsere Basisumgebung in eine neu erstellte Umgebung ändern:

conda activate fooocus

Der nächste Schritt ist die Installation der Python-Bibliotheken:

pip install -r requirements_versions.txt

Nun ist alles bereit für den Start:

Fooocus starten

python entry_with_update.py

Der erste Start kann einige Zeit in Anspruch nehmen, da die Anwendung alle für den Betrieb erforderlichen Dateien prüft und herunterlädt. Sie sollten in der Zwischenzeit eine Tasse Kaffee trinken. Sobald der Vorgang abgeschlossen ist, öffnen Sie Ihren Browser und geben Sie die folgende URL in die Adressleiste ein:

http://127.0.0.1:7865

Geben Sie Ihre einfache Eingabeaufforderung ein und klicken Sie auf die Schaltfläche Generate. Wenn Sie mehr Kontrolle wünschen, kreuzen Sie Advanced an und wählen Sie die erforderlichen Optionen:

Fooocus WebUI

Der eigentliche Zauber spielt sich hinter den Kulissen ab. In dem Moment, in dem Sie auf die Schaltfläche Generate klicken, wird Ihre Eingabeaufforderung an das GPT2-basierte Sprachmodell übertragen. Dieses Modell wandelt Ihre kurze Eingabeaufforderung in eine Mischung aus elaborativen positiven und negativen Aufforderungen um. Diese Mischung wird anschließend in das Stable Diffusion XL-Modell eingegeben, das auf die Nachahmung des MidJourney-Stils abgestimmt ist. Auf diese Weise kann selbst eine kurze Aufforderung beeindruckende Ergebnisse erzielen.

Natürlich gibt es keine Beschränkung für das Schreiben eigener Prompts. Nach mehreren Durchläufen wird jedoch deutlich, dass die generierten Inhalte auch ohne diese Einschränkung faszinierend und vielfältig bleiben.

Siehe auch:



Aktualisiert: 12.08.2025

Veröffentlicht: 21.01.2025