Kann künstliche Intelligenz als solche rechtlich geschützt werden? Die Frage ist keineswegs trivial – und von erheblicher wirtschaftlicher Bedeutung: Die rechtliche Problematik und Notwendigkeit des Schutzes von Datensätzen in diesem Zusammenhang liegt auf der Hand.
In einer digitalisierten Wirtschaft, in der Daten zunehmend als wertvolles Wirtschaftsgut betrachtet werden, ist der rechtliche Schutz z.B. von Datenbeständen, aber auch von Software, die mit diesen Daten arbeitet, von entscheidender Bedeutung. Nur so kann aus hiesiger Sicht die Frage der Schutzfähigkeit von KI durch eine getrennte Betrachtung von Datenbeständen und Software beantwortet werden.
Warum ist der Rechtsschutz einer Datensammlung wichtig?
Eine Sammlung von Rohdaten („Datenpool“) kann einen erheblichen wirtschaftlichen Wert haben, da er es Unternehmen ermöglicht, innovative Analysen durchzuführen, effizientere Entscheidungen zu treffen und neue Geschäftsmodelle zu entwickeln.
Der Schutz dieser Daten vor unbefugtem Zugriff und unbefugter Nutzung ist daher unerlässlich, um Investitionen in die Datenerhebung und -analyse zu schützen und wettbewerbsfähig zu bleiben. Solche Datensammlungen in Form von „Rohdaten“ haben zudem in Zeiten künstlicher Intelligenz erhebliche Bedeutung erlangt, da große Sprachmodelle hiermit trainiert werden müssen.
Ist eine Sammlung von Rohdaten rechtlich geschützt?
Im deutschen Recht bietet derzeit wenn, dann wohl (nur) das Gesetz zum Schutz von Geschäftsgeheimnissen (GeschGehG) einen Rahmen, um solche Datenpools unter bestimmten Voraussetzungen als Geschäftsgeheimnisse zu schützen. Voraussetzung für einen solchen Schutz ist, dass die Daten
- nicht allgemein bekannt oder leicht zugänglich sein
- einen wirtschaftlichen Wert haben, der sich gerade aus ihrer Geheimhaltung ergibt
- durch angemessene Geheimhaltungsmaßnahmen des rechtmäßigen Inhabers geschützt werden.
Hierbei zeigt sich, dass es zwar kein absolutes Recht an Daten gibt, dass aber unter Beachtung der gesetzlichen Vorgaben und durch strategische Maßnahmen wie Geheimhaltungsvereinbarungen und technische Schutzmaßnahmen ein wirksamer rechtlicher Schutz von Datensammlungen von „Rohdaten“ erreicht werden kann. Das GeschGehG ermöglicht durchaus den Schutz von Daten als Geschäftsgeheimnisse, was deren wirtschaftliche Nutzung ohne die Gefahr des Verlustes dieser wertvollen Ressourcen ermöglicht.
Anders, wenn es um den Schutz eines Datenpools nach dem Urheberrechtsgesetz (zum Beispiel nach den §§ 87a ff. UrhG für Datenbanken) geht: In Deutschland bieten das Urheberrecht und das Datenbankherstellerrecht Schutz für die Struktur einer Datenbank und teilweise für die Daten selbst, wenn eine signifikante Investition in deren Auswahl, Koordination oder Arrangement nachweisbar ist. Dieser Schutz ist jedoch begrenzt und bezieht sich nicht auf die Daten als solche, sondern auf die Investition in die Datenbankstruktur. Im Fazit sollte man an dieser Stelle (derzeit) wohl festhalten:
- Schutz unter GeschGehG: Der Schutz eines Datenpools unter dem GeschGehG hängt davon ab, ob die Datenbestände als Geschäftsgeheimnisse betrachtet werden können. Dies setzt voraus, dass die Informationen nicht allgemein bekannt oder leicht zugänglich sind, einen wirtschaftlichen Wert haben, durch angemessene Geheimhaltungsmaßnahmen geschützt sind und ein berechtigtes Interesse an der Geheimhaltung besteht.
- Rechtliche Herausforderungen: Da es kein spezifisches Recht an Daten gibt, ist derzeit zu konstatieren, dass die aktuelle Rechtslage hauptsächlich auf einem Flickenteppich verschiedener Regelungen basiert, die nicht immer ausreichenden Schutz bieten. Das GeschGehG bietet hier dann die Möglichkeit, Datenbestände effektiv zu schützen, insbesondere wenn diese im Geschäftskontext genutzt und als wertvoll angesehen werden.
- Vertragliche Vereinbarungen: Zusätzlich zum Schutz durch das GeschGehG ist die Bedeutung von vertraglichen Vereinbarungen hervorzuheben. Diese sind besonders wichtig, um den Schutz von Daten gegenüber Dritten zu sichern, die nicht durch das GeschGehG abgedeckt sind.
Schutz neuronaler Netze
Gibt es einen rechtlichen Schutz für neuronale Netzwerke
Der urheberrechtliche Schutz von neuronalen Netzen ist vor allem in § 69a UrhG geregelt, der den Schutz von Computerprogrammen umfasst. Was die Frage aufwirft, ob man neuronale Netzwerke überhaupt als solche Software verstehen kann.
Neuronale Netzwerke als Software
Tatsächlich können Neuronale Netze, als eine Art Software verstanden werden womit sie grundsätzlich unter diesen Schutz fallen – sofern sie bestimmte Voraussetzungen erfüllen, als da wären:
- Schutz des Programmcodes: Der Programmcode neuronaler Netze kann geschützt werden, wenn er als Computerprogramm im Sinne des § 69a Abs. 1 UrhG anzusehen ist. Dies setzt voraus, dass der Code eine Folge von Befehlen darstellt, die es einem Computer ermöglichen, bestimmte Aufgaben zu erfüllen, wie z.B. Bilderkennung oder Textübersetzung. Der Programmcode muss also funktionsfähig sein und seine Ausführung muss das Ergebnis einer eigenen geistigen Schöpfung des Entwicklers sein.
- Kein Schutz für abstrakte Strukturen und Algorithmen: Während der Programmcode schutzfähig sein kann, sind die dahinter stehenden abstrakten Strukturen und Algorithmen von diesem Schutz ausgeschlossen. Das Urheberrecht schützt keine Ideen, Verfahren oder Methoden als solche, sondern nur deren konkrete Ausgestaltung oder Darstellung.
- Gewichtungsinformationen: Die spezifischen Gewichtungsinformationen, die in neuronalen Netzen während des Trainings entstehen, sind ebenfalls nicht gesondert urheberrechtlich geschützt. Diese Daten werden technisch als eine Sammlung von Informationen betrachtet, die selbst keine computergesteuerten Prozesse ausführen.
Jedenfalls lässt sich wohl festhalten, dass neuronale Netze und ihre Programmierung unter bestimmten Umständen urheberrechtlichen Schutz genießen können – und zwar insbesondere dann, wenn der Code spezifische Befehlsfolgen enthält, die als Ergebnis einer persönlichen geistigen Schöpfung anzusehen sind. Nicht schutzfähig sind hingegen die grundlegenden Ideen, Methoden oder Algorithmen, die zur Erstellung des Netzes verwendet werden.
Es gibt einen Schutz von KI – aber man muss ganzheitlich denken! Ein Gesamtkonzept ist am Ende einem Schutz zugänglich. Wer aber nur auf einzelne Daten, Ideen oder einfache Software-Codes setzt, hat ein erhebliches Risiko.
Schutz von neuronalen Netzen als Datenbanken?
Der urheberrechtliche Schutz von Neuronalen Netzen als Datenbanken ist eine komplexe Frage, die den Schutz der Struktur und Organisation einer Datenbank betrifft. In Deutschland ist hierfür das Urheberrechtsgesetz (UrhG), insbesondere die §§ 87a ff. einschlägig, die den Schutz von Datenbankwerken regeln.
Schutz von Datenbanken nach § 87a UrhG
Eine Datenbank im Sinne des UrhG ist eine Sammlung von Werken, Daten oder anderen unabhängigen Elementen, die systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind. Um als Datenbankwerk geschützt zu sein, muss die Datenbank das Ergebnis einer wesentlichen Investition in die Beschaffung, Überprüfung oder Darstellung ihres Inhalts sein.
Anwendbarkeit auf neuronale Netze
Neuronale Netze könnten unter bestimmten Umständen als Datenbanken angesehen werden, insbesondere wenn sie große Datenmengen speichern und organisieren, die für das Training des Netzes verwendet werden. Es gibt jedoch einige wichtige Überlegungen:
- Unabhängigkeit der Elemente: Die in neuronalen Netzen verwendeten Daten müssen voneinander unabhängig sein, so dass der Wert ihres Informationsgehalts nicht beeinträchtigt wird, wenn sie getrennt werden. Dies kann bei neuronalen Netzen problematisch sein, da die Daten oft in einer Weise verknüpft sind, die ihre Unabhängigkeit ausschließt.
- Investition in die Erstellung der Datenbank: Der Schutz als Datenbank setzt voraus, dass erhebliche Investitionen in die Erstellung der Datenbank geflossen sind. Bei neuronalen Netzen könnte dies die Zeit und die Ressourcen umfassen, die für die Sammlung und Verarbeitung der Trainingsdaten aufgewendet wurden.
- Kein Schutz der Daten selbst: Der Schutz als Datenbank erstreckt sich nicht auf die Daten selbst, sondern nur auf die Struktur, Auswahl oder Anordnung der Daten. Das bedeutet, dass die in der Datenbank enthaltenen Informationen von anderen frei verwendet werden können, solange die spezifische Struktur der Datenbank nicht kopiert wird.
In der Praxis ist der Schutz von neuronalen Netzen als Datenbanken eher unwahrscheinlich, insbesondere wenn es um interne Strukturen wie Gewichtungsinformationen geht, die während des Trainingsprozesses generiert werden. Diese werden typischerweise nicht als „unabhängige Elemente“ angesehen, was eine wesentliche Voraussetzung für den Datenbankschutz ist.
Zusammenfassend lässt sich sagen, dass der urheberrechtliche Schutz von neuronalen Netzen als Datenbanken aufgrund der engen Definition und Anforderungen des Gesetzes begrenzt ist. Der Schwerpunkt liegt eher auf dem Schutz der Struktur und Organisation der Datenbank als auf dem Schutz des Inhalts oder der darin verwendeten Algorithmen.
Urheberrechtlicher Schutz von Algorithmen?
Der urheberrechtliche Schutz von Algorithmen richtet sich nach den speziellen Regelungen des deutschen Urheberrechts für Computerprogramme gemäß § 69a UrhG. Danach sind Computerprogramme in jeder Form, also auch als Entwurf und Quellcode, urheberrechtlich geschützt. Dies umfasst auch die spezifische Ausdrucksform eines Programms, nicht aber die Ideen, Grundsätze, Verfahren oder mathematischen Konzepte, die seiner Funktionsweise zugrunde liegen.
Ein Algorithmus als solcher, verstanden als Methode oder Verfahren zur Lösung eines Problems, ist nicht automatisch urheberrechtlich geschützt, da abstrakte Ideen und Methoden vom Urheberrechtsschutz ausgenommen sind. Es ist jedoch möglich, dass bestimmte Ausdrucksformen eines Algorithmus, wie z.B. detailliert formulierte Computerprogramme oder bestimmte Formen des Quellcodes, unter die Schutzvorschriften des § 69a UrhG fallen, sofern sie die erforderliche Schöpfungshöhe aufweisen und in einer von einem Computer ausführbaren Programmiersprache vorliegen.
Urheberrechtlicher Schutz kann demnach für Algorithmen bestehen, wenn sie in einer Form vorliegen, die hinreichend konkret ist, um als Ausdrucksform eines Computerprogramms angesehen zu werden. Reine mathematische Formeln oder allgemeine Prinzipien sind jedoch nicht schutzfähig. Der Schutz bezieht sich auf die spezifische Art und Weise, in der der Algorithmus in einem Programmcode niedergelegt ist, und nicht auf den Algorithmus selbst als abstrakte Methode.
Fazit: Alles anspruchsvoll
Im Kern gilt: Alter Wein in neuen Schläuchen. Die aufzuwerfenden Fragen drehen sich heute wie früher um die stets gleichen Streitpunkte: Rechte an Daten, Schutz von Software – und das Bemühen, durch den Betriebsgeheimnisschutz möglichst viel zu schützen. Im Kern kann jedenfalls festgestellt werden, dass es ohne eigene Arbeit nichts wird: Urheberrechtlicher Schutz verlangt nach Arbeit (sei es mal in Form wirklicher Schöpfung oder wenigstens eigener Leistung) und Geschäftsgeheimnisse können schon qua Definition nur dort existieren, wo man Vorsorge getroffen hat, dass sie auch geheim sind. Jedenfalls wird man ein Geschäftsmodell, dass auf einer KI basiert, durchaus schützen können – sofern besagte Arbeit auch investiert wurde.
- Open Source AI Definition 1.0 - Oktober 31, 2024
- Überblick über das Softwarerecht in Deutschland: Wichtige rechtliche Probleme bei der Softwareentwicklung und -vermarktung - September 21, 2024
- Vertragliche Auswirkungen behördlicher Warnung vor Virenschutzsoftware - August 4, 2024