Dezentrale Physical Infrastructure Networks (DePINs), insbesondere Data Curation Networks (DCNs), ermöglichen Nutzern die Kontrolle über ihre Daten und deren Monetarisierung, während sie gleichzeitig hochwertige Datensätze für das Training von KI-Modellen bereitstellen. Dies fördert eine demokratischere und vielfältigere Datenlandschaft für KI-Entwicklung, im Gegensatz zur aktuellen Zentralisierung bei großen Tech-Unternehmen. Der wachsende Marktwert von DePINs unterstreicht das enorme Potenzial dieses Ansatzes für eine menschenzentrierte KI.
Die Kontrolle über nutzergenerierte Daten liegt aktuell hauptsächlich bei wenigen großen Technologieunternehmen. Diese Zentralisierung behindert Wettbewerb und Innovation, wie auch Cryptonews.net berichtet. Dezentrale Physical Infrastructure Networks (DePINs) bieten eine Alternative, indem sie die Datenerfassung dezentralisieren und den Nutzern die Souveränität über ihre Daten zurückgeben.
Data Curation Networks (DCNs), ein neuer Zweig der DePINs, konzentrieren sich speziell auf die Erfassung und Kuratierung von Daten direkt von den Nutzern. DCNs bieten eine vielversprechende Möglichkeit, Datensilos aufzubrechen und den Zugang zu vielfältigen Datensätzen zu demokratisieren. Dies ist besonders wichtig für den wachsenden KI-Markt, der auf qualitativ hochwertige und einzigartige Daten angewiesen ist, um Modelle zu trainieren und Systeme zu verbessern. Wie Cryptonews.net hervorhebt, können DCNs auch Bedenken hinsichtlich KI-Voreingenommenheit adressieren, indem sie vielfältige und offene, von Menschen generierte Datensätze erstellen.
Der Marktwert von DePINs hat bereits die 50-Milliarden-Dollar-Marke überschritten und wird bis 2028 voraussichtlich 3,5 Billionen Dollar erreichen. Dies verdeutlicht das Potenzial dezentraler Netzwerke, die Datenhoheit an die Nutzer zurückzugeben und ihnen die Möglichkeit zu bieten, von ihren Beiträgen zu profitieren. Im Gegensatz zu unternehmenskontrollierten Datensätzen, die oft durch die Nutzerbasis der Plattform oder die Reichweite des Unternehmens begrenzt sind, können DePIN-Netzwerke Daten aus einer Vielzahl von Quellen beziehen. Dies führt zu umfassenderen und vielfältigeren Datensätzen, die für den Aufbau leistungsfähigerer und inklusiverer KI-Modelle unerlässlich sind.
Ein Anwendungsbeispiel für DCNs ist die Entwicklung selbstfahrender Autos. Autonome Systeme benötigen riesige Mengen an Echtzeitdaten über Verkehrsmuster, Straßenbedingungen und Fahrerverhalten. Traditionell wurden diese Daten von großen Unternehmen mit Zugang zu vernetzten Fahrzeugen und Straßensensoren gesammelt. Kryptonetzwerke können jedoch Anreize für Einzelpersonen schaffen, ihre eigenen Geräte in Datensammler zu verwandeln und so passiv im Alltag wertvolle Daten zu generieren. Dies ermöglicht die effiziente Kuratierung geografisch vielfältiger Daten und führt zu organischen Datensätzen, die sich ideal für das KI-Training eignen. Ähnliche Anwendungen sind in Bereichen wie dem Gesundheitswesen denkbar, wie im Artikel der Charité – Universitätsmedizin Berlin über KI-gestützte Datenkuratierung in der klinischen Forschung beschrieben.
KI-Modelle, die den Bedürfnissen der Menschen gerecht werden sollen, müssen auf von Menschen generierten Daten als Grundlage für das Modelltraining basieren. Mit der zunehmenden Verbreitung von IoT- und Wearable-Geräten, die mit Rechenleistung und KI-beschleunigten Chips ausgestattet sind, sowie Milliarden von vernetzten Geräten wie Smartphones, haben Edge-betriebene DCNs das Potenzial für eine massive Skalierung. Commodity-basierte DCNs nutzen Geräte, die bereits Teil des täglichen Lebens sind, wie Smartphones und Laptops. Dies senkt die Hürden für die Teilnahme der Nutzer erheblich und ermöglicht eine nahtlose Beteiligung mit minimalen Einstiegskosten. Wie Vipender Mann auf LinkedIn betont, ist die Verfügbarkeit hochwertiger Daten entscheidend für die Zukunft der KI, und Indien könnte durch Initiativen wie die IndiaAI Datasets Platform eine führende Rolle bei der Lösung dieser Herausforderung spielen.
In diesem neuen Paradigma erhalten die Nutzer die Kontrolle über ihre Daten zurück und profitieren finanziell von ihren Beiträgen zu dezentralen Netzwerken. Dies schafft nicht nur ein gerechteres digitales Ökosystem, sondern fördert auch eine breitere Beteiligung an der Datenwirtschaft und stellt sicher, dass KI-Fortschritte von den Bedürfnissen und Beiträgen der Menschen und nicht von den Profitinteressen weniger großer Unternehmen angetrieben werden. Die Bedeutung der Datenqualität wird auch in anderen Bereichen hervorgehoben, wie beispielsweise im Artikel von MSP Channel Insights über die Kunst der Datenkuratierung und im NeurIPS Poster "ImageNet++: A Large-Scale Benchmark of Data Curation Strategies". Die Notwendigkeit einer sorgfältigen Datenkuratierung wird auch im Artikel von Crowe über die Nutzung von KI zur Revolutionierung unstrukturierter Daten und im Artikel der New York Times über die Datenerhebungspraktiken von Tech-Giganten für KI-Modelle deutlich.
Quellen: