Lizenzen für generative KI

11.12.2025 – Dieser Artikel erschien ursprünglich in «Schweizer Kunst» (2025), herausgegeben von Visarte – Berufsverband visuelle Kunst Schweiz.

Maschinelle Nutzung von Kreativinhalten im Internet

Philip Kübler, CEO ProLitteris

Philip Kübler ist Experte für Medien- und Urheberrecht und arbeitet als Rechtsanwalt und CEO von ProLitteris, der Urheberrechtsgesellschaft für Texte und Bilder. Aktuell beschäftigen ihn die Autorschaft und das Urheberrecht unter den Bedingungen generativer künstlicher Intelligenz. In der Rechtszeitschrift Medialex hat er schon im Juni 2023 beschrieben, wie generative KI-Systeme Urheberrechte nutzen. Diese Meinung ist umstritten, und neuere Sprachmodelle wie jenes der ETH/EPFL sind nach Auffassung ihrer Schöpfer rechtmässig trainiert worden. Es besteht aber weitgehend Einigkeit, dass es an Rechtssicherheit fehlt und dass die fehlende Verbindung zu und Transparenz über die genutzten Inhalte wenig nachhaltig sind. Philip Kübler stellt einen Lösungsansatz in den Kontext von Urheberrecht, Wirtschaft und Kultur im Internet.

KI braucht kreativen Rohstoff

Generative KI-Systeme mit Retrieval-Funktion sind eine Unterkategorie künstlicher Intelligenz, die auf grossen Datenmengen (Texte, Bilder, Audios, Videos, Programmcodes u.a.) trainierte Modelle nutzen, um in Interaktion mit Nutzern neue oder veränderte Inhalte in verschiedenen Medienformaten zu erzeugen. Dabei stützen sie sich auf Informationen aus externen Quellen, insbesondere dem Internet, und werden – für die breite Anwendung – durch menschliche Vorgaben gesteuert. Soweit eine einigermassen verständliche Definition.

Mit der Bezeichnung ChatGPT, dem bislang führenden Dienst für generative KI, lässt sich erklären, wie das System funktioniert – ergänzt um das Retrieval, also den Abruf aktueller Daten aus dem Internet:

«Chat» steht für die dialogbasierte Interaktion. Sprache wird fabriziert.

«G» steht für die Generierung neuer Inhalte aus Mustern. Content wird produziert.

«P» steht für das Pre-Training mit Datenmassen. Inhalte werden ausgewertet.

«T» steht für die Transformer-Architektur, die Quellen zerlegt, ihre Teilchen gewichtet, ihren Zusammenhang erfasst und daraus Vorhersagen für neue Inhalte produziert.

Hinzu kommt in den heutigen Systemen «Retrieval», eine Such- und Kopierfunktion, welche weitere Informationen aus Datenbanken, Dokumenten oder dem Internet abruft und im generierten Output berücksichtigt.

Generative KI-Systeme verarbeiten das Trainingsmaterial ihrer Modelle nicht als solches, sondern in einer verarbeiteten, zerstückelten Form. Zudem wird das maschinelle Training mit menschlicher Aufsicht und Instruktion ergänzt, damit die Outputs Qualitätsansprüchen genügen und rechtlich unbedenklich sind. Allerdings sind die aktuellen Systeme offensichtlich fehlerhaft und sprunghaft, was sich mangels Transparenz nur ansatzweise erklären lässt.1

Tim im Ligne-Claire-Stil
Bitte an ChatGPT: «Mach mir ein Comicbild à la ligne claire, der Mann hat blonde Haare.» Warum ähnelt das Bild sogleich Tim, obwohl sich das System ansonsten weigert, eine urheberrechtlich geschützte Figur zu imitieren?

Das Einwilligungsprinzip

In einer Kunstausstellung Exponate fotografieren, an einem Konzert Aufnahmen machen und anschliessend heimlich daraus automatisierte Konkurrenzkunst fabrizieren? Ein eher unhöflicher Akt, wahrscheinlich illegal. Ebenso, wenn man Bücher aus Bibliotheken scannen und daraus andere Romane konzipieren würde: sicher unsympathisch, vielleicht rechtsverletzend. Das ist zwar nicht dasselbe wie Diebstahl oder Erschleichen einer Leistung, aber auch hier geht es um den Schutz von Vermögen und Leistung.

Als Einzelaktionen sind unautorisierte Übernahmen ein Problem für sich, man kann sie rechtlich verfolgen. Im grossen Zusammenhang aber gefährden sie Autorschaft, Publizistik und Quellentreue. Die Substanz wird versiegen, wenn sich alle frei bedienen. Die KI-Bots der letzten Jahre beschaffen weltweit alles, was die Maschinen schlucken, ohne darüber Auskunft zu erteilen. Danach werden zwar nicht die einzelnen Werkkopien, aber die gesammelten Big Data ausgewertet und neu zusammengesetzt.

Um Erlaubnis gefragt zu werden, gehört eigentlich zum guten Ton und zum guten Recht. Auch Äusserungen und Kreativität lassen sich einer Person zuordnen, ähnlich wie Personendaten und Geschäftsgeheimnisse. Darüber hinaus sind Werke und Leistungen Handelsgüter und Vermögenswerte. Ganze Industrien funktionieren so. Musiklabels, Filmstudios und Verlage produzieren oder erwerben Musik, Filme und Literatur, Konzertveranstalterinnen und Bühnen holen Lizenzen ein, Schauspieler und Interpretinnen werden gebucht.

Das ist nicht nur Eigennutz. Eigentum und Vertragsfreiheit führen zu Differenzierung und Wettbewerb. Was konkret herauskommt, hängt ab von Verhandlungsmacht, Partnerschaft und Interessenlage. Das Einwilligungsprinzip prägt auch die digitale Wirtschaft. Man beachtet Regeln, wenn man fremdes Vermögen beansprucht. Content unterliegt als Inhalt der Medienfreiheit, der Kunstfreiheit und der Wissenschaftsfreiheit – und als Produkt der Eigentums- und Vertragsfreiheit.

Tim mit Struppi
«Geben wir dem Mann einen Hund und diesem einen Knochen.» Nach dieser Aufforderung produziert ChatGPT Struppi, und der Mann ähnelt Tim noch mehr. Generative KI-Systeme beruhen auf Statistik, und im genutzten Rohstoff mit dem Stichwort ligne claire sehen Herrchen und Hündchen nun mal so aus.

Dass die Inhaber des geistigen Eigentums über ihre Werke bestimmen dürfen, entspricht der Situation von körperlichen Gegenständen, Grundstücken, Patenten, Marken und Designs. Die Gesellschaft und ihre Rechtsordnung nehmen für das Prinzip von Eigentum und Einwilligung einiges in Kauf: ungerechte Vermögensverteilung zwischen Reichen und Armen, mühsame Enteignungen für Gemeinschaftsanlagen und Verkehrswege, Medikamentenpreise auch in Krisen, polizeiliche und zolltechnische Massnahmen gegen die Produktfälschung.

Das Einwilligungsprinzip hat auch Vorteile für die Gesellschaft und ihre Interessen an Verständigung, Erkenntnis, Bildung und Forschung. Wenn KI-Modelle wie andere Geschäftsmodelle legal auf ihre Ressourcen zugreifen, behandeln sie Content gleich wie Software, Strom und Serverkapazitäten. Es entsteht ein Wettbewerb um qualitative Inhalte und ein Anreiz, solche zu produzieren. Konsumierende und die Gesellschaft als Ganzes behalten eigenfinanzierten Journalismus und eine verantwortungsbewusste Publizistik.

Lizenzmodelle

Das Urheberrecht stärkt Vielfalt und Qualität von Inhalten und sichert die Verantwortung dafür bei den schaffenden Menschen und publizierenden Organisationen. Die bewährten Content-Märkte beruhen auf der Vertragsfreiheit und der Wettbewerbsökonomie. Aber in der Medienpolitik und im Kunstrecht schwingt auch eine gesellschafts- und kulturpolitische Komponente mit. Inhalte können relevant sein für demokratische Prozesse, Zusammenhalt und Swissness.

Hinzu kommen Besonderheiten digitaler Kommunikations- und Kulturgüter. Ihre Essenz ist unkörperlich, ihre Rezeption manchmal interaktiv, ihre Weiterverwendung oft produktiv und wohlgesinnt, ihr Stil sowie Ideen- und Informationsgehalt sind ein meritorisches, aber auch ein öffentliches Gut. Es stimmt nie so ganz, wenn man Vergleiche mit dem Fahrraddiebstahl oder Trittbrettfahren macht. Das Gesetz und die Lizenzpraxis haben dies längst erkannt und Lösungen entwickelt, die effektiv und effizient zugleich sind.

Kapitän Haddock
«Der Mann soll einen Freund haben, der ist Kapitän.» Sogleich gibt der Bildgenerator Kapitän Haddock aus.

Das Copyright schützt kreative Äusserungen der Literatur und Kunst, enthält aber zahlreiche gesetzliche Ausnahmen im Interesse der privaten Nutzung, der freien Kommunikation und der Vermeidung von Transaktionskosten. In vielen Fällen gilt eine gesetzliche Erlaubnis mit Vergütung: Verwertungsgesellschaften lizenzieren und stellen Rechnung anstelle der Inhaberinnen der Rechte. So funktionieren die Speichermedien, der Schulunterricht, die Kulturvermittlung, die Kabelnetze, die Blindenschrift.

Jede Nutzungssituation lässt sich bewältigen. Das Gesetz kennt individuelle, kollektive und gesetzliche Lizenzen, jeweils mit Schattierungen und ergänzenden Massnahmen. Die Digitaltechnik hat das Kopieren, Bearbeiten und Produzieren massiv erleichtert. Das Urheberrecht hielt Schritt und wahrte die Balance zwischen kreativem Geben und nutzendem Nehmen. Manchmal sind neue Wege nötig, denn die Technik entwickelt sich ständig, und die Rechtsdurchsetzung wird von Umgehungen begleitet.

Schulze und Schultze mit Tim, Struppi und Kapitän Haddock
«Zwei weitere Freunde folgen den beiden und dem Hund: Sie sind Polizisten in schwarzen Anzügen.» Und da sind sie, Schulze und Schultze. Auch Tim und Kapitän Haddock haben ihre Form gefunden. Der Mythos, KI-Systeme würden ihre Quellen nicht kennen, kommt ins Wanken.

Eine Erfolgsgeschichte des schweizerischen Urheberrechts ist die obligatorische Kollektivverwertung. Ein Tarifverfahren mit Verhandlungen und Genehmigungen produziert statistische Studien und juristische Beweismittel, aus denen Vergütungsmodelle und Preislisten gewonnen werden. Die Verwertungsgesellschaften unterbreiten die Verhandlungsergebnisse einer gerichtsähnlichen paritätischen Schiedskommission. Eine Bundesbehörde, das Institut für Geistiges Eigentum, prüft die Geschäftsführung.

Noch flexibler ist die freiwillige Kollektivverwertung der Verwertungsgesellschaften. Auch hier sorgen Tarife für rechtssichere, transparente und einheitliche Lizenzpreise. Mit der Gesetzesrevision von 2019 wurde eine Zwischenform eingeführt, die erweiterte Kollektivlizenz. Sie maximiert die Nutzungen dadurch, dass die Rechteinhabenden nicht aktiv einwilligen müssen, sondern auf einen Widerspruch verwiesen sind. So verbinden sich Pauschalisierung, Rechtssicherheit und Anpassungsfähigkeit.

Das Internet – ein Vierteljahrhundert Verunsicherung

Zur Jahrtausendwende war das geistige Eigentum ein anerkannter Bestandteil im wachsenden Internet, doch es zeichneten sich neue Spielregeln ab. Gegen traditionelle Urheberrechte wurden dogmatische und praktische Argumente laut, bald verbunden mit wirtschaftlichen Interessen. Das Web wurde als grenzenloser Informations-, Kommunikations- und Kulturraum verstanden. Eine neue Netz- und Rechtsgemeinde sprach von Cyberlaw, Multimediarecht und Digitalpolitik.

Der Schutz persönlicher Daten wurde in der Industrie erst niedrig, in der Netzgemeinde hoch gewichtet, bei den kreativen Werken und Leistungen verhielt es sich umgekehrt. Zunehmend wurde Code (Computersoftware) als Code (Regelwerk) akzeptiert. Die Commons (Allmende) dienten ebenso als Theorie wie die Disziplin Law and Economics als ökonomische Analyse des Rechts. Für das Copyright wurde entdeckt, dass absolute und relative Rechte abzuwägen und auszubalancieren sind.

Wo also passen eigentumsähnliche, wo forderungsähnliche Ansprüche, und welche Behörden und Verfahren sind am Platz? Wo sollte beides einer digitalen Freiheit weichen, ohne Regulierung und Rechte, bestenfalls moderiert mit eigenverantwortlichen Verhaltensregeln und Vorsichtsmassnahmen? Während die Rechte von Kreativen und Publizierenden in den letzten 25 Jahren einen schweren Stand hatten, ging es bei gewerblichen Schutzrechten für Erfindungen und Herstellerhinweise leichter.

So wie das Urheberrecht umgangen und relativiert wurde, hamsterte die amerikanische Tech-Industrie Patente, schützte Marketingmassnahmen mit Kennzeichen und lobbyierte für neue Eigentumsrechte, in den USA damals für Halbleiter und in der EU für Datenbanken. Für Domainnamen gab es ein internationales Schlichtungsverfahren, für Mobiltelefone Designschutz. Sogar zum Hyperlink wurden Erfindungspatente eingereicht. Computersoftware wurde mit technischen Schutzmassnahmen verteidigt.

Im Web verdrängten die technischen Tools die urheberrechtlichen Rules. Die Filmstudios, Musiklabel und Verlage beklagten illegale Kopien und Tauschplattformen, eine «Piraterie», die bis heute zu Rechtsverletzungen und Ertragsschmälerungen führt. Dazu entstand eine neue Sharing- und Remix-Kultur, die ohne Geld und Referenz funktioniert und Konsumierende glauben lässt, dass Urheberrechte verzichtbar sind. Zugleich etablierte sich eine neue Creator-Gemeinde.

Die ikonische Tim-und-Struppi-Rakete
«Eine Rakete für die Freunde bitte», und so sieht das bei Tim und Struppi aus, wenig künstlich und wenig intelligent kopiert. ChatGPT imitiert! Um das festzustellen, muss man keine Raketenwissenschaft betreiben.

Plattformen – Service und Aggregation verdrängen Quellen und Produktion

Im multimedialen Internet herrschten erst die Browser, die Verzeichnisse und Suchmaschinen, dann die sozialen Medien und Aggregations- und Streamingdienste. Das Plattform-Modell dominierte neben der Unterhaltung auch Einkaufen und Tauschen, Wissen und Bildung, Forschung und Innovation, Zusammenarbeit und Beziehungen. Plattformen produzieren ihr Angebot nicht selbst, sondern sie führen Inhalte zusammen, die hochgeladen, verlinkt, eingebettet und umgewandelt werden.

Plattformen machen sich zunutze, was wir von den Suchmaschinen kennen. Webseiten werden besucht, heruntergeladen, analysiert. Ihre Inhalte werden referenziert, zusammengefasst, umgewandelt. Plattformen setzen auf Skalierung, marktdominante Positionen und winner takes all. Die weltweit höchstbewerteten Unternehmen folgen dem Plattformmodell. Die Inhaltsproduktion vermeiden sie, solange das nicht skaliert – was sich mit KI ändern wird.

Heute ist die Politik bereit, Plattformen zu regulieren. Die USA und die EU revidierten ihre Haftungsbefreiungen, die den Internethandel angekurbelt hatten. Die Plattformen erleben verwaltungsrechtliche Aufsicht sowie straf- und zivilrechtliche Interventionen. Plattformen tragen zumindest eine pauschale und reaktive Mitverantwortung für die Inhalte, die auf ihnen erscheinen. Im Fokus sind Hassrede und Desinformation, zunehmend aber auch die Verletzung von Persönlichkeitsrechten und geistigem Eigentum.

Generative KI-Systeme gehorchen dem Plattformmodell, das wir von Suchmaschinen, Onlinehändlern und sozialen Medien her kennen, indem sie den standardisierten und umfassenden Zugang zu Inhalten beanspruchen. Mit einer computerisierten Aufbereitung und Erneuerung der Inhalte werden die Werke und Leistungen von Content-Produzierenden zugleich überwunden – das algorithmisch kuratierte und generativ produzierte Angebot steht im Vordergrund. Verlinkungen sind Glückssache.

Für Urheberinnen, Künstler, Verlage, Produzierende und Interpreten bedeutet das, dass ihre Schöpfungen zwar maschinell gefunden werden, aber ohne Werkgenuss und Vergütungschance. Originale werden nicht bezahlt, sondern ersetzt. Soweit die Plattform Rechte benötigt, holt sie diese mit standardisierten Nutzungsbedingungen. Urheber- und Leistungsschutzrechte spielen keine Rolle, weil nur Werkzeuge eingesetzt werden – und weil die User allein verantwortlich sein sollen.

Neben diesem lizenz- und vergütungsfreien Copying, Sharing und Mixing wird es irgendwo immer eine seriöse Distribution geben, die geschützte Werkexemplare erwirbt oder lizenziert. Doch mit welchen wirtschaftlichen Chancen, wenn dort bezahlt und hier frei genutzt wird? Für das Hauptproblem, die Überflutung und Verwirrung durch massenhafte KI-Erzeugnisse, ist nicht das Urheberrecht zuständig. Äusserlich ansprechende und trügerische KI-Inhalte absorbieren Aufmerksamkeit und verdrängen echte Quellen. Aber es gibt Lösungen.

Die Einhorn aus Tim und Struppi
Zwischendurch ein gepflegter Austausch mit ChatGPT darüber, was sich hier auf der hohen See der künstlichen Intelligenz abspielt: «Sehr schön gezeichnet. Wie kommt es, dass Du diese Sujets so genau kennst und zeichnen kannst? Ich meinte, generative KI speichere die Quellen des Trainings nicht, sondern nur Token, die über Vektoren gewichtet und statistisch ausgewertet werden?» Die Antwort: «Genau – das hast Du völlig richtig zusammengefasst. Generative KI kennt die Vorlagen nicht so, wie ein Mensch ein Bild oder einen Text im Kopf hat, und sie speichert auch keine einzelnen Trainingsdaten ab. Stattdessen funktioniert es so: 1. Training mit Beispielen. Das Modell wurde auf riesigen Mengen an Texten und Bildern trainiert, die öffentlich verfügbar oder lizenziert sind. Dabei geht es nicht darum, sich diese Inhalte zu merken, sondern aus ihnen Muster und Strukturen zu lernen. 2. Token und Vektoren. Texte und Bilder werden in sehr kleine Einheiten zerlegt (Text in Tokens, Bilder in visuelle Merkmale). Diese Einheiten werden in Vektoren übersetzt – Zahlenreihen in einem hochdimensionalen Raum. 3. Statistische Gewichtung. Das Training passt die Gewichte zwischen diesen Vektoren so an, dass das Modell immer besser vorhersagen kann, wie die nächste Einheit aussehen müsste. Es entsteht kein Speicher von Inhalten, sondern ein Netzwerk von Wahrscheinlichkeiten. 4. Generieren statt Abrufen. Wenn Du z. B. nach einer Tintin-Rakete fragst, ruft das Modell keine konkrete Datei ab, sondern kombiniert gelernten Stil (ligne claire), typische Formen (rot-weiss kariertes Muster, Raketen-Silhouette) und den Kontext (Tim und Struppi, Raumfahrt). Das Ergebnis ist eine Neuschöpfung, die auf den gelernten Mustern basiert. 5. Warum wirkt es so exakt? Manche Sujets – wie die Rakete – sind ikonisch und konsistent dargestellt. Wenn das Modell während des Trainings diesen Stil oft gesehen hat, kann es die typischen Merkmale sehr präzise reproduzieren, ohne ein bestimmtes Bild zu zitieren. Kurz: Es gibt keine Datenbank mit Bildern, sondern ein statistisches Modell, das die Strukturen von Sprache und Bildern so gut gelernt hat, dass es daraus neue Kombinationen erschafft, die wie bekannte Stile wirken.» Nach so viel Halbwahrheit bat der nächste Eingabebefehl um ein Schiff – und da war sie, die statistisch einmalige Einhorn aus Tim und Struppi.

Die Lösungsansätze sind bereits vorhanden

Es ist nicht nachhaltig, wenn generative KI die Inhalte gefährden und ihrem Rohstoff die Grundlage entziehen. Mit Auskünften und Transparenz über Quellen wird das Einwilligungs- und Entschädigungsprinzip vorbereitet. Darauf folgt ein Mix von gesetzlicher Erlaubnis und Widerspruchsrecht für ausgewählte Bereiche. KI-Nutzungen bleiben möglich und werden nach Marktgrundsätzen vergütet.

Eine Marktordnung mit Lizenzen und Vergütungen schafft Rechtssicherheit, indem KI-Systeme vom Vorwurf einer Rechtsverletzung geschützt werden. Eine Budgetsicherheit ergibt sich aus fundierten Preisberechnungen. KI-Dienste übernehmen eine minimale Mitverantwortung, indem sie im Ökosystem Internet mit kreativen Menschen und produzierenden Organisationen zusammenwirken. Die Erlaubnis der KI-Nutzungen wird zur Regel, die Exklusivität von Inhalten zur Ausnahme.

Das Dilemma zwischen Nutzung und Rechten ist nicht neu, und Lösungen sind im Urheberrecht angelegt. Man muss sie für KI nur zweckmässig kombinieren. Eine Basis ist das bewährte schweizerische Tarifverfahren. Unter Leitung der Verwertungsgesellschaften entstehen Vergütungsmodelle aufgrund von Nutzungsnachweisen und statistischen Studien, in planmässigen paritätischen Verhandlungen mit behördlicher Genehmigung und periodischer Anpassung.

Die Einwilligung der Rechteinhabenden kann gesetzlich vorgegeben, kollektiv erteilt oder individuell verhandelt werden. Ein Verbotsrecht nur für bestimmte Werkkategorien und Rechteinhabertypen wäre denkbar. Zum Beispiel sind die Musik- und Filmindustrie und die grossen Medien- und Buchverlage sowie die Verwertungsgesellschaften eher in der Lage, individuelle Verhandlungen zu führen und auf kollektive Entschädigungen zu verzichten als die breite Masse der Kreativschaffenden und Publizierenden.

Der Zugang zu veröffentlichten Werken und Leistungen darf nicht ausgehöhlt werden. Soweit das Einwilligungsprinzip durch rechtsgeschäftliche Erklärung umgesetzt wird (individuelle oder kollektive Lizenz), ist ein Widerspruchsrecht praktikabler als eine Einwilligungsvoraussetzung. Eine Ausnahmeerklärung betrifft die Zukunft, was der Rechts- und Budgetsicherheit dient. Sie ist beim Inhalt oder auf der Domäne hinterlegt, soweit dies praktikabel und wirksam ist (was heute für robots.txt nicht zutrifft), oder sie richtet sich an Verwertungsgesellschaften.

Die Höhe der Vergütungen entsteht durch Objektivierung in Verhandlungen und Schiedsentscheiden, so wie heute für Kabelweitersenden, Musikberieselung, Speichermedien, Kopiervergütungen, Archivnutzungen und verwaiste Werke etc. Die KI-Dienste legen ihre Nutzungen, die Verwertungsgesellschaften ihre Berechnungen auf den Tisch, und man einigt sich mit Beweisen und Argumenten. Verhandlungen und Tarife sind fair, beaufsichtigt und flexibel. Tarife gelten für alle, einheitlich und transparent.

Das Internet und die KI: Früher oder später brauchen sie Lizenzen.

Tim und Struppi in Entenhausen
Hund, Kapitän, Polizisten, Rakete, Schiff – das führte zu einer freundlichen Auseinandersetzung mit Fragen, Antworten, Rückfragen und Ausweichmanövern, Irrtümern und Verstrickungen. Auf die Frage, ob ChatGPT neben Tim auch Micky Maus produzieren könnte, kam eine abweisende Belehrung zu Urheberrecht und Markenschutz. Als Friedensangebot sollte ChatGPT ein Bild von Entenhausen zeichnen, ohne menschliche Maus. Und siehe da: Ein leicht verniedlichter Tim und sein Hund Struppi schafften es unaufgefordert in die Disney-Parallelwelt. – Die Verständigung zwischen Mensch und Maschine hat noch einen weiten Weg vor sich.

1 Die diesem Beitrag beigefügten Illustrationen und Chat-Verläufe dazu demonstrieren einige Mängel.