Hier ist ein besseres Problem
HeimHeim > Blog > Hier ist ein besseres Problem

Hier ist ein besseres Problem

Aug 14, 2023

KI-generierte Inhalte beginnen, das Internet, Unternehmen und Schulen in einem beispiellosen Ausmaß zu verschmutzen. In manchen Fällen kann es einfacher sein, menschlichen Text zu erkennen, als generative KI-Inhalte zu kennzeichnen. Zumindest könnten sie einander ergänzen.

Das schnelle Wachstum von KI-generierten Inhalten treibt die Diskussion darüber voran, wie KI-Anbieter ihre Tools zur Erkennung von KI-generierten Inhalten verbessern können. Dies ist ein wichtiges Ziel, aber solche Ansätze sind für Text bereits unzureichend. Und das nicht nur für „Black Hats“, die versuchen, die KI-Sicherheit zu durchbrechen oder Demokratien zu destabilisieren. Faule Studenten, überforderte Mitarbeiter, skrupellose Produktvermarkter und Datenkennzeichnungs-Sweatshops werden mit leichter Bearbeitung leicht gegen die meisten Sicherheitsvorkehrungen verstoßen. Ein viel besserer Ansatz könnte darin bestehen, Menschen mithilfe einer Kombination aus paralinguistischen Metadaten und Public-Key-Kryptographie zu erkennen.

Und es entstehen Werkzeuge, die dabei helfen können, eine Herkunftskette dafür zu etablieren. Wie ich bereits auf Diginomica geschrieben habe, könnten KI-Inhaltsdetektoren für Video, Audio und Bilder auf eine lange Geschichte digitaler Wasserzeichen-Tools und des Schutzes geistigen Eigentums zurückgreifen. Tools zur automatischen Erkennung von KI-generiertem Text sind jedoch ein viel schwieriger zu lösendes Problem. Digitale Wasserzeichen lassen sich wesentlich schwieriger in Klartext einbetten. Bei der Einbettung statistischer Muster, ungewöhnlicher Grammatikverwendung und sogar Zeichensetzungskonventionen in Text werden einige interessante Fortschritte erzielt. Ein Beispiel war der Versuch von Genius, ein seltsames Muster in seine Musiktexte einzubetten, um zu beweisen, dass Google seinen Inhalt direkt kopiert hatte. Dieser Fall konnte das Gerichtsverfahren jedoch nicht gewinnen.

Schulsysteme auf der ganzen Welt befürchten, dass die jüngsten Fortschritte bei der generativen KI, die auf dem Large Language Model (LLM) basiert, die Betrugsversuche der Schüler beschleunigen werden. Auf lange Sicht könnte der Erfolg dieses Unterfangens zu einer großen Zahl inkompetenter Arbeitskräfte führen, die nicht in der Lage sind, Unternehmen, Regierungen und, nun ja, zu unterrichten. Aber das ist nicht nur ein akademisches Problem. Regierungen beginnen mit der Verabschiedung von Gesetzen gegen skrupellose Produkt- und Dienstleistungsbewertungspraktiken. Das Vereinigte Königreich arbeitet derzeit an einem Gesetzentwurf zu digitalen Märkten, Wettbewerb und Verbrauchern, der den Austausch von Geld oder kostenlosen Waren für das Verfassen von Produktbewertungen verbietet. Es ist nur eine Frage der Zeit, bis ähnliche Gesetze auf automatisiertere Ansätze ausgeweitet werden, etwa auf skrupellose Vermarkter, die eine Schar falscher Menschen aufstellen, um die Wunder ihrer Produkte zu preisen, oder um wettbewerbsfähige Angebote zu verunglimpfen.

Und Datenkennzeichnungsunternehmen beginnen, sich mit einem verstreuten Netzwerk von Menschen auseinanderzusetzen, die dafür bezahlt werden, Inhalte mit Kennzeichnungen zu versehen, um die nächste Generation der KI zu trainieren. Diese sind unerlässlich, um sicherzustellen, dass zukünftige KI-Tools Objekte in Bildern besser identifizieren, giftige Inhalte überprüfen oder die Leistung einer neuen Generation von KI-Apps für Unternehmen verbessern können. Eine Sorge besteht darin, dass überarbeitete Datenkennzeichner möglicherweise auf ChatGPT und andere LLMs zurückgreifen. Dies kann sich jedoch positiv auf die Datenproduktivität und einige Datenkennzeichnungsaufgaben auswirken. Ein Nachteil besteht darin, dass das Training von LLMs mit KI-generierten Inhalten zum Zusammenbruch des KI-Modells führen könnte, bei dem auch die neuen Modelle nicht mehr funktionieren.

Vor einigen Jahren kämpfte die Bankenbranche mit zunehmendem Betrug, der durch neue Online-Dienste ermöglicht wurde. Unterdessen hatte die wachsende Abonnementwirtschaft Probleme mit der Passwortfreigabe, bei der Einzelpersonen ihre Passwörter für hochgeschätzte Informationsdienste mit Freunden und Familienangehörigen teilten. Es wurde beobachtet, dass viele Informationen nicht nur im Text des Passworts, sondern auch in den Metadaten darüber, wie das Passwort eingegeben wird, eingebettet sind. Aufgrund unterschiedlicher Tippstile, Trittfrequenzen und Rhythmen neigen Menschen dazu, die eigentlichen Buchstaben auf völlig unterschiedliche Weise zu tippen. Verschiedene Teams nennen dies Verhaltensbiometrie, Tastendynamik oder paralinguistische Metadaten. Verschiedene Varianten dieser Techniken können das Konzept auch auf Maustechniken und Spracheingabe erweitern.

Im akademischen Bereich wäre es sinnvoll, Messungen dieser Verhaltensmetriken in eine neue Generation von Textverarbeitungsprogrammen einzubetten. Möglicherweise ist es auch nicht notwendig, völlig neue Apps zu entwickeln. Sie könnten einfach in eine Open-Source-Bibliothek integriert werden, die von vorhandenen Textverarbeitungsprogrammen, Web-Apps und anderen Tools genutzt werden könnte.

Es wäre auch wichtig, eine Herkunftskette einzurichten, um das Risiko einer nachträglichen Manipulation dieser Metadaten zu verringern. Ältere Tools wie der PGP-Ansatz zur Kryptografie mit öffentlichen Schlüsseln könnten die Kombination aus Text und zugehörigen paralinguistischen Metadaten kryptografisch signieren. Ändern Sie das eine oder andere, und das Ganze würde nicht beweisen, dass Sie es geschrieben haben.

Damit dies auf lange Sicht klappt, müssten mehrere offensichtliche Herausforderungen angegangen werden. Datenschutzbedenken sind ein großes Thema. Für akademische Einrichtungen kann es hilfreich sein, zu erkennen, ob eine Arbeit von Ihnen oder Ihren übermäßig hilfsbereiten Eltern geschrieben oder aus ChatGPT ausgeschnitten und eingefügt wurde. Diese müssten jedoch gegen Datenschutzbedenken abgewogen werden. In einigen digital überwachten Testszenarien sind Studierende möglicherweise bereit, unter den wachsamen Augen eines Dienstes zu leiden, der alle ihre Plugins vollständig sperrt und sicherstellt, dass sich niemand sonst und keine Telefone im Raum befinden. Das ist in der Hektik des Alltags nicht praktikabel.

Ein damit zusammenhängendes Problem besteht darin, dass Befürworter des Datenschutzes und Browserhersteller bereits gegen Browser-Fingerprinting-Techniken protestieren. Diese erfassen Informationen über die eindeutigen Kombinationen von Plugins, Versionen, Standorten und anderen Arten von Metadaten, um in Abwesenheit von Cookies manchmal Personen eindeutig zu identifizieren. Bei Ansätzen zur Verfolgung menschlicher Herkunft müsste ein sorgfältiges Gleichgewicht zwischen der zunehmenden Erkennung von Menschen und Datenschutzbedenken hergestellt werden.

Es ist auch wichtig zu beachten, dass einige interessante menschliche Techniken zwar am ersten Tag funktionieren, kreativ faule Studenten, neugierige Hacker und „Black Hats“ jedoch beginnen, Workarounds für die ersten Implementierungen zu finden. Wie bei allen Sicherheitsaspekten gilt auch bei einem System, dass es am ersten Tag seiner Einführung vollkommen sicher ist.

Im verwandten Bereich der KI-Bilddetektoren sucht die neueste Generation von Werkzeugen nach biometrischen Artefakten von echten Menschen. Beispielsweise hat das MIT vor einigen Jahren einige interessante Algorithmen entwickelt, die subtile Farbveränderungen und physische Vibrationen erfassen konnten, um Ihre Herzfrequenz zu ermitteln. Ich habe im Laufe der Jahre mit einigen Versionen davon gespielt und es funktioniert irgendwie, wenn man ganz ruhig bleibt. Anbieter wie Intel beginnen, ähnliche Prinzipien zu übernehmen, um zu prüfen, ob Ihr Video zumindest einen Puls hat, und nicht, ob es perfekt kalibriert, wie schnell es für medizinische Zwecke schlägt.

Die Herausforderung besteht jedoch darin, dass viele Fake-People-Generatoren generative kontradiktorische Netzwerke nutzen, bei denen ein Algorithmus im Training mit einem separaten Algorithmus zur Erkennung von Fakes verglichen wird. Traditionell erkennen diese Dinge, die für Menschen unecht aussehen, und der Puls war kein Problem, da die meisten von uns die subtilen Farbveränderungen oft nicht genau erkennen. Sobald die neuen Fake-Erkennungsalgorithmen auf den Markt kommen, werden diese einfach zu den GANs hinzugefügt, um auch die Fake-Detektoren erfolgreich auszutricksen.

Aus den oben genannten Gründen wird der Bau menschlicher Detektoren nicht einfach sein. Auf lange Sicht könnte es jedoch einfacher sein und ein ergänzendes Werkzeug zu KI-Ansätzen für Fake-Detektoren darstellen. Open-Source-Ansätze werden es einer größeren Gemeinschaft von Sicherheitsexperten, Datenschutzforschern, akademischen Einrichtungen und Unternehmen erleichtern, mithilfe modularer, austauschbarer Bibliotheken Fehler zu beheben. Jedes Mal, wenn kreative Studenten beginnen, ihre cleveren Hacks zu veröffentlichen, müssen neue Updates entwickelt werden, ähnlich wie die Kia Boys eine eklatante Sicherheitslücke in Kia-Autos auf TikTok bekannt machten und eine Kriminalitätswelle auslösten.

Außerdem müssen diese Tools nicht nur darauf ausgerichtet sein, Menschen dafür zu erwischen, dass sie KI-Arbeit als menschlich ausgeben. Vor ein paar Jahren interessierte ich mich erneut für meine Tippfehler, nachdem mir auf zwei verschiedenen Tastaturen die Taste „P“ kaputtgegangen war. Eine sorgfältige Beobachtung meiner Tipptechnik offenbarte die seltsame Angewohnheit, mit dem Ringfinger über die Tastatur zu greifen und sie anzuschlagen, statt mit dem besser positionierten kleinen Finger. Das und ich hämmerte ziemlich heftig auf alle Tasten, obwohl meine Finger und Hände nach einem langen Tag dieser Folter protestierten. Ein wenig Zeit, mit der Keyboard Hero-App eine entspanntere und ergonomischere Form zu erkunden, hat mir geholfen, einige meiner ungeheuerlicheren Gewohnheiten zu mildern. Verbesserte Tools zur Analyse der verschiedenen Aspekte der Tastaturform, einschließlich Verzögerungen, Schallpegel und Fluss, könnten einen großen Beitrag zu einem entspannteren und flüssigeren Arbeitserlebnis leisten.

Ich unterhielt mich kürzlich mit einem Freund, der zwei Pflasterer beim Hören klassischer Musik beobachtet hatte. Sie sagte, wenn sie arbeiteten, sei es so gewesen, als würde man einen sanften, sanften Tanz von Menschen und Geräten beobachten, während sie ihre Bewegungen auf den langsamen, rhythmischen Takt der Musik koordinierten. Sie hatte vor, sie zu engagieren, wenn sie das nächste Mal ihre Auffahrt machen würde. Wäre es nicht großartig, wenn wir alle so arbeiten könnten?

Bildquelle: Pixabay