PyTorch: Eigene Bildgenerierungs-KI mit Python bauen

Künstliche Intelligenz muss nicht kompliziert sein. Mit der PyTorch-Bibliothek bauen Sie Ihren eigenen KI-Bildgenerator in Python. Wir erklären, wie das geht.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen

Erstellt mit Midjourney durch heise online.

Lesezeit: 16 Min.
Von
  • Lea Reinhart
Inhaltsverzeichnis

Mithilfe von KI-Bildgeneratoren kann jeder zu einem digitalen Monet oder Picasso werden. Dienste wie Midjourney, Dall-E und Adobe Firefly erzeugen nach einem Kommandozeilenbefehl (Prompt) Bilder, die teils sogar die eigene Vorstellungskraft sprengen. All diese Tools haben etwas gemeinsam: Sie sind an eine Rechen-Cloud angebunden, benötigen folglich zwingend einen Internetzugang.

Mehr zum Thema Künstliche Intelligenz (KI)

Aber auch auf dem eigenen Rechner lassen sich Modelle trainieren und Bilder erzeugen. Gleichsam lernt man dadurch, wie solch ein System arbeitet, welche Parameter ein Bild beeinflussen und wie die Technik hinter dem oft genutzten Schlagwort "Künstliche Intelligenz" tatsächlich aussieht.

In diesem Artikel zeigen wir Ihnen, wie Sie Ihr eigenes generatives Modell mithilfe der PyTorch-Bibliothek in Python trainieren können: ein Deep Convolutional Generative Adversarial Network (DCGAN). Diese Modelle kombinieren die Architektur von Generative Adversarial Networks (GANs) mit der Leistungsfähigkeit von Convolutional Layers. Wir erklären beide Konzepte im Detail und implementieren sie anschließend Schritt-für-Schritt mit PyTorch. Mit dem resultierenden Modell können Sie am Ende etwa Entwürfe von Designerkleidung erzeugen.