KI-Unternehmen, die behaupten, Open Source zu sein, wie etwa Musks neuestes KI-Unternehmen, veröffentlichen zwar die Gewichte, aber nicht die Daten, auf denen sie trainiert werden, oder den Trainingsprozess.
Elon Musks Chatbot Grok mit künstlicher Intelligenz (KI) ist nicht so Open Source wie er sagt, und auch nicht die vielen Unternehmen, die dies behaupten, so der Verwalter der Definition.
Die 1998 gegründete Open Source Initiative (OSI) ist eine gemeinnützige Organisation, die den Open-Source-Begriff verteidigt. Derzeit wird daran gearbeitet, seine Definition zu aktualisieren, um Open-Source-KI einzubeziehen.
Open Source bedeutet im Allgemeinen, dass der Quellcode der Software für jedermann im öffentlichen Bereich zur Nutzung, Änderung und Verbreitung verfügbar ist.
Die OSI-Definition besagt, dass es außerdem zehn Kriterien erfüllen muss, darunter die Möglichkeit, den Quellcode zu einem angemessenen Preis oder kostenlos zu erhalten, und dass es nicht diskriminierend ist und dass die Lizenz andere Software nicht einschränkt.
Aber KI-Systeme sind anhand der 10 Punkte des OSI schwieriger zu beurteilen.
„Die Definition von Open-Source-Software, die wir für Software verwendet haben, lässt sich nicht wirklich eindeutig auf KI-Systeme anwenden“, sagte Stefano Maffulli, Geschäftsführer des OSI, gegenüber Euronews Next.
KI-Unternehmen, die behaupten, Open Source zu sein, wie etwa Musks jüngstes KI-Projekt, geben die Gewichte – die numerischen Parameter, die die Leistung eines KI-Modells beeinflussen – als Open Source an, nicht jedoch die Daten, auf denen es trainiert wird, und auch nicht den Trainingsprozess.
Maffulli sagte, dies bedeute, dass es sich nicht um Open Source handeln könne, da nicht transparent sei, welche Daten zum Trainieren des Gewichts verwendet würden, was zu Urheberrechtsproblemen und ethischen Fragen führen könne, wenn die Daten voreingenommen seien.
„Diese (die Gewichte) sind neue Dinge, und es ist eine ganz neue Zeit in der Geschichte, in der wir ein neues Artefakt haben, das immer noch das Produkt menschlichen Einfallsreichtums, Intelligenz und Kreativität ist“, sagte er.
„Gleichzeitig erfolgt aber auch die Ausarbeitung halbzufälliger Berechnungen, die von großen Computern durchgeführt werden.“
„Auf der Suche nach der Wahrheit“
Musk hatte zuvor in einem Beitrag auf seiner Social-Media-Plattform gibt nicht bekannt, auf welchen Daten das Gewicht trainiert wurde.
Tatsächlich besteht für Unternehmen kaum ein Anreiz, dies zu tun, da der Moment, in dem Sie bekannt geben, worauf Sie Ihre Daten aufbauen, der Moment ist, in dem Sie sich Urheberrechtsklagen aussetzen.
„Solange wir an dieser rechtlichen Front nicht ein wenig Klarheit haben, werden wir meiner Meinung nach immer noch mit solchen Problemen konfrontiert sein“, sagte Maffulli.
Ein weiterer Grund, warum sogenannte Open-Source-KI-Unternehmen möglicherweise nicht vollständig transparent sein möchten, ist die Wahrung von Geschäftsgeheimnissen.
Das OSI steht daher vor einer schwierigen Aufgabe, wenn es darum geht, Open-Source-KI zu definieren. Die Organisation begann ihre Suche vor zwei Jahren, nachdem ChatGPT von OpenAI im November 2022 auf den Markt kam.
Die größte Hürde bei der Definition von Open-Source-KI bestehe laut Maffulli darin, die Abhängigkeit zwischen den Daten in den Trainingssätzen und den Modellgewichten zu verstehen.
So definieren Sie Open-Source-KI
Das OSI begann mit der Zusammenstellung einer Gruppe erster Experten aus Organisationen wie der Mozilla Foundation und Wikipedia, aber auch aus zivilgesellschaftlichen Gruppen, Universitäten und Big-Tech-Unternehmen wie Microsft und Meta.
Anschließend bewerteten die Arbeitsgruppen drei generative KI-Modelle – Meta’s Llama, Illusion AI und Bloom – sowie ein nicht generatives KI-Modell, das maschinelles Lernen nutzt.
Die Arbeitsgruppen stimmten über die Mindestanforderungen ab, damit ein KI-System Open Source sein muss.
Maffulli sagte, dass die Arbeitsgruppen „alle gesagt haben, dass es zumindest eine Mindestanforderung an Datentransparenz geben muss“.
Das OSI verfeinert derzeit diesen Definitionsentwurf und erwartet, ihn im Laufe des Sommers der Öffentlichkeit zugänglich zu machen.
Dies bedeutet jedoch nicht, dass das OSI nach der endgültigen Festlegung der Definition hinter Musk oder anderen selbsternannten Open-Source-KI-Unternehmen her sein wird.
„Wir sind die Verwalter und Bewahrer der Definition, aber wir haben nicht wirklich starke Befugnisse, um sie durchzusetzen“, sagte Maffulli.
Er fügte hinzu, dass Richter und Gerichte auf der ganzen Welt allmählich erkennen, dass die Open-Source-Definition wichtig ist, insbesondere wenn es um Fusionen, aber auch um Regulierung geht.
Länder auf der ganzen Welt entscheiden gerade darüber, wie sie vorgehen wollen KI regulieren und Open-Source-Software war ein umstrittenes Thema.
„Die Open-Source-Definition dient als Barriere zur Erkennung falscher Werbung“, sagte Maffulli.
„Wenn ein Unternehmen sagt, dass es Open Source ist, muss es die Werte vertreten, die die Open Source-Definition beinhaltet. Sonst ist es einfach verwirrend.“