Projekte in REVISE

ChARM: Chat Control, Age Verification and Resilience for Minors

Das Projekt untersucht den technischen Schutz von Minderjährigen im Internet und die Herausforderungen bei der Erkennung illegaler Inhalte wie CSAM und Cybergrooming, insbesondere im Kontext der geplanten EU-Vorschriften. Die Diskussion über Maßnahmen wie das Scannen von Online-Kommunikation wirft Fragen zur Privatsphäre und zur Genauigkeit der Tech­no­logien auf, deren Fehlerraten bisher hoch sind. ATHENE bietet ein Umfeld, in dem technologische Lösungen entwickelt und bewertet werden können, um den Schutz Minderjähriger zu verbessern und EU-Vorgaben zu erfüllen. Im Projekt CHARM werden dazu der Stand der Technik analysiert, Demonstratoren erstellt und neue Schutzmethoden entwickelt, um Politik, Wirtschaft und Gesellschaft besser zu informieren.


CRISIS: Cross-Domain Disinformation Analysis

Nachrichten werden heutzutage immer häufiger über die sozialen Medien verbreitet und konsumiert. Da Beiträge vor der Veröffentlichung nicht geprüft werden, befinden sich darunter auch viele Falschinformationen. Im Projekt CRISIS werden Beiträge in den sozialen Medien nachträglich auf Desinformationen hin untersucht, wobei hierbei sowohl Informationen in Texten als auch in anderen Multimedia Daten, wie Bildern, Videos und Ton betrachtet werden. Dabei kommen verschiedene Analysemethoden des maschinellen Lernens zum Einsatz, die

  1. es ermöglichen, Verbreitungswege von (Des-) Informationen nachzuvollziehen,und die in den Nachrichten vorherrschenden Themen und Trends zu ermitteln (Social Media Analytics),
  2. ggf. böswillig „recycelte“ Inhalte wiedererkennen und auf ihre ursprüngliche authentische Quelle zurückverfolgen oder Sachverhalte bereits durchgeführter Faktenprüfungen zuordnen (Semantic Similarity Analysis), und
  3. eine manuelle Faktenprüfung unterstützen, indem besonders prüfenswerte Medien vorselektiert werden (Check-Worthiness Analysis).

Die Ergebnisse fließen in einen Demonstrator ein, der Bedarfsträger*innen, wie Journalist*innen und Faktenprüfer*nnen, bei der Untersuchung und Identifizierung von Desinformationen unterstützen soll.


DREAM: Deepfake REcognition and Artificial Media

Im Projekt DREAM werden Methoden zur Erkennung von Medieninhalten erforscht, die mittels  künstlicher Intelligenz erzeugt oder manipuliert wurden. Hierbei liegt ein spezieller Fokus auf der Erkennung von Manipulationen im Bild-, Video- und Audiobereich, die zum Ziel haben, die Identität einer Person nachzustellen. Sogenannte Deepfakes sind in der Lage, in Bildern oder Videos auftretende Gesichter mit Gesichtern beliebiger Personen mithilfe von “Deep Learning” automatisiert zu ersetzen. Bilder können durch Text-to-Image-Synthese Verfahren wie DALL-E, StableDiffusion oder Midjourney, erzeugt werden. Für Videos können hierzu Face Swapping oder Facial Reenactment Techniken wie “Lip-Sync Angriffe” zum Einsatz kommen. Bei Audiodaten hingegen wird die Stimme einer bestimmten Zielperson z.B. durch Voice Conversion oder Text-to-Speech Synthese nachgeahmt, so dass dieser Worte in den Mund gelegt werden können. Um multimodale Manipulationen besser zu verstehen, sollen diese Fälschungen im Rahmen des Projekts auch selbst erstellt werden.


TXAITD: Trustworthy and Explainable AI-generated Text Detection

Die beispiellosen Fähigkeiten neuer Large Language Models (LLMs) wie ChatGPT und Bard machen sie zu attraktiven Schreibassistenten. Da diese Modelle jedoch Texte produzieren, die oft nur schwer von menschlichen zu unterscheiden sind, werden LLMs zunehmend auch für böswillige Zwecke eingesetzt, z. B. für das automatische Schreiben von Lernaufgaben, das Verfassen von KI-generierten wissenschaftlichen Arbeiten, die Verbreitung von Fake News und für Social-Engineering-Angriffe. Um diese Probleme zu bekämpfen, konzentriert sich dieses Projekt auf die Entwicklung von vertraunswürdiger und erklärbarer KI-generierter Text Identification (TXAITD -- Trustworthy and Explainable AI-generated Text Detection). TXAITD soll die KI-Nutzung in Texten genau lokalisieren und Erklärungen zu ihrer etwaigen bösartigen Verwendung aufführen. Dieser Ansatz hilft, den gutartigen Einsatz von KI als Schreibassistent von ihrem bösartigen Gebrauch zu unterscheiden. Im Gegensatz zu früheren Tech­no­logien macht TXAITD den Erkennungsprozess transparent, damit menschliche Nutzer und Entscheidungsträger fundierte Urteile über digitale Inhalte fällen können. Letztlich trägt TXAITD zur sicheren digitalen Transformation und zur Regulierung von KI in der Textgestaltung bei.