Das Fairness-Dilemma im EU AI Act:

Warum KI-Fairness immer eine Frage von Zielkonflikten bleibt

1. Der Countdown läuft

Der Countdown läuft unaufhaltsam: Am 2. August 2026 treten zentrale Anforderungen des EU AI Acts für zahlreiche Akteure verbindlich in Kraft. Was für viele Unternehmen lange Zeit wie eine abstrakte Regulierung aus Brüssel klang, wird nun zur operativen Realität. Wer KI-Systeme in Europa entwickelt, vertreibt oder einsetzt, muss sich künftig an umfangreiche Compliance-, Risiko- und Governance-Anforderungen halten, wie wir sie bislang vor allem aus stark regulierten Branchen wie dem Finanz- oder Gesundheitswesen kennen.

Wenn Sie wie wir seit Jahren Machine-Learning-Systeme in regulierten Umgebungen entwickeln und betreiben, sind Ihnen viele der Grundprinzipien des AI Acts allerdings nicht neu. Themen wie Nachvollziehbarkeit, Modellrisiken, menschliche Aufsicht und reproduzierbare Trainingsprozesse gehören bereits heute zu unserem Alltag.

Für mich persönlich ist Ethik seit jeher ein zentraler Leitbegriff bei meiner Arbeit. Aus dieser tiefen Überzeugung heraus habe ich die Tragweite dieser Entwicklung und die daraus resultierenden strategischen Schritte bereits im Jahr 2025 gemeinsam mit dem Aufsichtsrat der KENBUN IT AG intensiv behandelt. Uns war damals schon bewusst: AI Governance ist kein nachgelagerter Compliance-Prozess, sondern ein zentraler Bestandteil moderner Softwarearchitektur.

Mit Blick auf die nun unaufhaltsam näher rückenden Termine im August 2026 habe ich mir die Verordnung in den letzten Wochen noch einmal gezielt vorgenommen. Die EU nennt in diesem Rahmen eine Reihe unverbindlicher ethischer Grundsätze, die als Fundament dienen sollen. Zu diesen sieben Prinzipien gehören:

  • Menschliches Handeln und menschliche Aufsicht
  • Technische Robustheit und Sicherheit
  • Privatsphäre und Daten-Governance
  • Transparenz
  • Vielfalt, Nichtdiskriminierung und Fairness
  • Soziales und ökologisches Wohlergehen
  • Rechenschaftspflicht

Bei meiner erneuten tieferen Analyse kristallisierte sich vor allem ein Begriff aus dieser Liste als die wohl größte regulatorische und technische Bruchstelle heraus: das Konzept der „Fairness“. Während Werte wie Transparenz oder IT-Sicherheit klare technische Standards erlauben, bleibt Fairness im Kern ein extrem diffuser Begriff.

Ich begleite seit mehreren Jahren Finanzinstitute und andere Unternehmen bei der Einführung und dem Betrieb KI-gestützter Systeme. Dabei habe ich immer wieder beobachtet, daß die größten Herausforderungen selten durch die Algorithmen selbst entstehen. Viel komplexer ist meist die Frage, wie wir Entscheidungen nachvollziehbar dokumentiert, Risiken kontrolliert und Verantwortlichkeiten klar geregelt bekommen. Genau an dieser Stelle treffen nun regulatorische Anforderungen auf mathematische Grenzen. Und diese Grenzen sind entscheidend für das Verständnis dessen, was Sie in Ihrem Unternehmen im Rahmen des AI Acts tatsächlich leisten können.

 

 

2. Was fordert das Gesetz? Die Herausforderung fairer Datengrundlagen

Ich sehe im EU AI Act, dass die Verordnung das Konzept der Fairness vor allem über die Vermeidung diskriminierender Auswirkungen definiert. Ein zentraler Bezugspunkt für Entwickler und Betreiber findet sich in Artikel 10, der die Anforderungen an Daten und Data Governance festlegt.

 

Für sogenannte Hochrisiko-KI-Systeme – etwa im Personalwesen, bei Kreditentscheidungen oder im Bereich kritischer Infrastrukturen – verlangt der Gesetzgeber, dass die verwendeten Datensätze angemessenen Governance-Prozessen unterliegen. Wir müssen sie auf mögliche Verzerrungen (Biases) untersuchen, die zu einer nach europäischem Recht unzulässigen Diskriminierung führen könnten. Darüber hinaus fordert der AI Act, dass Trainings-, Validierungs- und Testdaten relevant, repräsentativ sowie soweit möglich fehlerfrei und vollständig sein müssen.

Aus regulatorischer Sicht ist dieses Ziel absolut nachvollziehbar. Niemand möchte, dass ein KI-System Bewerberinnen oder Bewerber benachteiligt, weil historische Daten gesellschaftliche Ungleichgewichte widerspiegeln. Aus Sicht des Machine Learnings stellt sich jedoch eine anspruchsvollere Frage: Was bedeutet Fairness überhaupt konkret – und lässt sie sich mathematisch eindeutig definieren? In meiner täglichen Praxis sehe ich hier erhebliche Zielkonflikte.

 

 

Praxis-Case SCHUFA: Wenn Regulierung auf Kernprozesse trifft

Wie tiefgreifend diese Anforderungen die Wirtschaft schon heute verändern, habe ich kürzlich am Beispiel der SCHUFA beobachtet. Nach wegweisenden Urteilen des Europäischen Gerichtshofs (EuGH) zur automatisierten Entscheidungsfindung unter der DSGVO musste Deutschlands bekannteste Auskunftei ihr Bewertungssystem grundlegend überprüfen und anpassen. Das zeigt: Regulatorischer Druck ist keine theoretische Gefahr für die Zukunft, sondern verändert schon heute reale Geschäftsmodelle.

Offen bleibt jedoch die Frage, ob die neue Systematik auch den kommenden Anforderungen des EU AI Acts standhalten wird. Da Systeme zur Kreditwürdigkeitsprüfung dort als Hochrisiko-Anwendungen eingestuft sind, rückt die Frage nach der algorithmischen „Fairness“ ins Zentrum. Die SCHUFA steht damit stellvertretend vor einer Herkulestat, vor der viele Finanzinstitute und Unternehmen in den kommenden Monaten stehen werden. Denn der Versuch, ein historisch gewachsenes Scoring-Modell per Dekret „völlig diskriminierungsfrei“ zu gestalten, scheitert in der Praxis oft nicht am Willen der Beteiligten – sondern an den unerbittlichen Gesetzen der Statistik.

3. Die mathematische Realität: Warum Fairness nicht eindeutig definierbar ist

Wenn wir uns mit den mathematischen Grundlagen des Machine Learnings beschäftigen, stoßen wir schnell auf ein zentrales Problem: Fairness ist kein einheitlicher mathematischer Begriff. Es existieren mehrere etablierte Fairness-Kriterien, die unterschiedliche Vorstellungen von Gerechtigkeit abbilden – und die wir unter bestimmten Bedingungen mathematisch nicht gleichzeitig erfüllen können.

Einen wichtigen Beitrag zu diesem Verständnis lieferten Jon Kleinberg und seine Mitautoren von der Cornell University in ihrer Arbeit „Inherent Trade-Offs in the Fair Determination of Risk Scores“. Sie zeigten mathematisch, dass wir bestimmte Fairness-Kriterien bei unterschiedlichen Basisraten zwischen Bevölkerungsgruppen unmöglich gleichzeitig erfüllen können.

In der ML-Praxis kollidieren dabei meist drei etablierte Kernmetriken miteinander:

  1. Predictive Parity (Kalibrierung): Die Aussagekraft eines Risikoscores soll für alle Gruppen identisch sein. Wenn ein Score beispielsweise eine Eintrittswahrscheinlichkeit von 80 % prognostiziert, sollte diese Wahrscheinlichkeit unabhängig von der Gruppenzugehörigkeit dieselbe Bedeutung haben.
  2. Equalized Odds (Gleichheit der Fehlerraten): Die Raten von False Positives und False Negatives müssen über verschiedene Gruppen hinweg vergleichbar sein.
  3. Demographic Parity: Positive Entscheidungen des Systems müssen über unterschiedliche Gruppen hinweg mit derselben Häufigkeit auftreten.

Sobald sich Gruppen jedoch in relevanten statistischen Merkmalen unterscheiden, entstehen unlösbare Zielkonflikte zwischen diesen Anforderungen. Eine Optimierung zugunsten einer Fairness-Metrik führt rechnerisch zwingend dazu, dass andere Fairness-Kriterien schlechter erfüllt werden.

Um diese mathematischen Trade-offs plastisch zu verdeutlichen, habe ich nachfolgend eine interaktive Simulation vorbereitet. Sie zeigt ein klassisches Kredit-Scoring für zwei Gruppen (A und B) mit statistisch unterschiedlichen historischen Basisraten und macht die unerbittlichen mathematischen Wechselwirkungen direkt sichtbar:

Kredit-Scoring Fairness-Simulator

Dieses Modell simuliert zwei Bevölkerungsgruppen mit unterschiedlichen historischen Basisraten (Kredit-Scores). Verschieben Sie den Schwellenwert, um zu sehen, wie sich die Bewilligungsquoten (Demographic Parity) verschieben.


Gruppe A (Historisch höhere Quote)

Bewilligungsquote: --%

Gruppe B (Historisch niedrigere Quote)

Bewilligungsquote: --%

4. Länderfokus: Unterschiedliche Akzente in Deutschland und Frankreich

 

Diese Frage beschäftigt mich und mein Team nicht nur aus regulatorischer Sicht. Als Unternehmen, das seit Jahren Finanzinstitute und andere Organisationen in mehreren Ländern bei der Entwicklung, Einführung und dem Betrieb von KI-Systemen unterstützt – unter anderem im Bereich der Betrugs- und Fraud-Detection –, erleben wir regelmäßig, wie unterschiedlich Anforderungen in verschiedenen Märkten interpretiert werden. Mit unseren Aktivitäten in Deutschland und einer wachsenden Präsenz in Frankreich beobachte ich dabei interessante Unterschiede in der Herangehensweise.


Deutschland: Fokus auf Governance und Nachweisbarkeit

In Deutschland stehen strukturierte Prozesse, Risikomanagement und nachvollziehbare Dokumentation besonders im Vordergrund. Institutionen wie die Bundesnetzagentur (BNetzA) und das Bundesamt für Sicherheit in der Informationstechnik (BSI) tragen dazu bei, ein Umfeld zu schaffen, das stark auf Compliance und Nachweisbarkeit ausgerichtet ist. Gerade für kleine und mittlere Unternehmen stellt dies eine erhebliche Herausforderung dar. Neben juristischen Fragestellungen müssen sie auch statistische und technische Entscheidungen nachvollziehbar dokumentieren – häufig mit begrenzten personellen Ressourcen.

Frankreich: Fokus auf Innovation und praktische Erprobung

Frankreich setzt in der öffentlichen Diskussion stärker auf die Verbindung von Regulierung und Innovationsförderung. Unterstützt durch nationale KI-Initiativen und Unternehmen wie Mistral AI wird intensiv darüber diskutiert, wie Europa technologische Souveränität aufbauen kann, ohne Innovationspotenziale unnötig einzuschränken. Die französische Datenschutzbehörde CNIL hat früh begonnen, Unternehmen durch Leitlinien, Empfehlungen und Sandbox-Initiativen zu unterstützen. Solche regulatorischen Testumgebungen ermöglichen es Organisationen, neue KI-Anwendungen unter kontrollierten Bedingungen zu erproben und regulatorische Fragestellungen frühzeitig zu adressieren.

Beide Ansätze verfolgen letztlich dasselbe Ziel, vertrauenswürdige KI-Systeme zu fördern. Die Gewichtung der Mittel unterscheidet sich jedoch spürbar.

5. Erkenntnisse und Maßnahmen: Wie Unternehmen reagieren sollten

In meinen Projekten beobachte ich regelmäßig, dass wir Fairness-Fragen selten durch technische Optimierung allein lösen können. Gerade in der Betrugsprävention oder anderen risikobehafteten Anwendungsfeldern gibt es keine Konfiguration, die gleichzeitig maximale Genauigkeit, minimale Fehlerraten und absolute Fairness garantiert.

Unternehmen sollten die verbleibende Zeit bis zur vollständigen Anwendbarkeit der relevanten AI-Act-Anforderungen nutzen, um tragfähige Governance-Strukturen aufzubauen.

Aus meiner Erfahrung haben sich dabei insbesondere vier Handlungsfelder bewährt:

  • Realistische Erwartungen an Fairness entwickeln: Verabschieden Sie sich von der Vorstellung einer universell fairen KI, die alle Fairnesskriterien gleichzeitig erfüllt. Weder technisch noch organisatorisch ist dieses Ziel erreichbar. Unser primäres Ziel sollte nicht die theoretische Eliminierung jedes denkbaren Bias sein, sondern ein bewusster, transparenter Umgang mit den mathematischen Risiken und Zielkonflikten.
  • Interdisziplinäre Entscheidungsstrukturen etablieren: Fairness-Fragen lassen sich nicht ausschließlich durch Code beantworten. Juristen, Data Scientists, Compliance-Verantwortliche und Fachbereiche müssen gemeinsam definieren, welche Fairness-Kriterien in einem konkreten Anwendungskontext die höchste Priorität besitzen.
  • Dokumentation als strategisches Nachweisinstrument verstehen: Damit machen wir die Dokumentation von der lästigen Pflichtübung zum Schutzschild. Wenn Sie lückenlos darlegen können, welche Daten verwendet, welche Risiken identifiziert und warum bestimmte Modellentscheidungen getroffen wurden, verbessert dies Ihre Position gegenüber Aufsichtsbehörden erheblich.
  • Human-in-the-Loop dort einsetzen, wo Risiken hoch sind: Insbesondere bei Hochrisiko-Anwendungen sollte die KI nicht isoliert entscheiden. Die menschliche Überprüfung und Letztentscheidung bleiben ein unverzichtbarer Bestandteil verantwortungsvoller Systeme.

6. Der oft übersehene Vorteil: Regulierung als Exportfaktor

In der europäischen Diskussion betrachten viele den AI Act ausschließlich als regulatorische Belastung. Unsere praktische Erfahrung zeigt jedoch: Diese Sichtweise greift zu kurz.

Aktuell begleitet eines unserer Teams bei KENBUN ein Unternehmen in Thailand bei der sicheren Einführung von Agentic-AI-Lösungen. Besonders interessant ist dabei, dass sich zahlreiche bestehende und geplante regulatorische Vorgaben in Thailand stark an europäischen Standards orientieren. Dies gilt sowohl für Datenschutzthemen im Umfeld des dortigen Personal Data Protection Act (PDPA) als auch für die entstehenden Regelwerke rund um den Einsatz von KI, die unter anderem von der Electronic Transactions Development Agency (ETDA) vorangetrieben werden.

Natürlich unterscheiden sich die gesetzlichen Anforderungen im Detail. Dennoch zeigt das Projekt deutlich: Unternehmen, die bereits nach den Prinzipien der DSGVO und des EU AI Acts arbeiten, besitzen in vielen Bereichen einen erheblichen Vorsprung. Prozesse für Governance, Dokumentation, Risikobewertung, menschliche Aufsicht und Nachvollziehbarkeit lassen sich häufig mit vergleichsweise geringem Anpassungsaufwand auf andere Rechtsräume übertragen.

Dabei gerät oft aus dem Blick, dass europäische Regulierung nicht nur Kosten verursacht, sondern einen handfesten, langfristigen Wettbewerbsvorteil darstellt. Wer heute robuste und nachvollziehbare AI-Governance-Strukturen aufbaut, schafft damit nicht nur die Grundlage für Compliance innerhalb Europas, sondern verbessert gleichzeitig essenziell seine Fähigkeit, KI-Systeme international sicher und skalierbar auszurollen.

7. Ausblick: Was kommt nach 2026?

Der August 2026 markiert keinen Endpunkt, sondern einen wichtigen Meilenstein auf dem Weg zu einem langfristigen europäischen KI-Regulierungsrahmen. In den Folgejahren treten weitere Anforderungen in Kraft. Dazu gehören zusätzliche Verpflichtungen für Anbieter von General-Purpose-AI-Modellen im Jahr 2027 sowie die schrittweise Integration der AI-Act-Anforderungen in bereits bestehende sektorale Regulierungen bis 2028.

Der EU AI Act verfolgt das berechtigte Ziel, den Einsatz von KI-Systemen transparenter, sicherer und vertrauenswürdiger zu gestalten. Die Umsetzung dieser Anforderungen erfordert jedoch mehr als die reine Auseinandersetzung mit Gesetzestexten. Wer KI-Systeme verantwortungsvoll entwickeln und betreiben möchte, muss verstehen, dass Fairness kein eindeutig definierter mathematischer Zustand ist. Vielmehr handelt es sich um eine Reihe von Zielkonflikten, die wir bewusst bewerten, dokumentieren und steuern müssen.

Genau darin liegt die eigentliche Herausforderung moderner AI Governance: Nicht die Suche nach perfekter Fairness, sondern der transparente und nachvollziehbare Umgang mit ihren unvermeidbaren Zielkonflikten.

Wie bereitet sich Ihr Unternehmen auf die Anforderungen des EU AI Acts vor? Diskutieren Sie mit uns oder kontaktieren Sie das Expertenteam der KENBUN IT AG für einen fachlichen Austausch rund um AI Governance, Compliance und verantwortungsvolle KI-Systeme.

8. Quellen und weiterführende Literatur

EU-Regulierung

Wissenschaftliche Arbeiten zu Fairness in Machine Learning

  • Kleinberg, J., Mullainathan, S., Raghavan, M. (2016): Inherent Trade-Offs in the Fair Determination of Risk Scores. https://arxiv.org/abs/1609.05807
  • Kearns, M., Roth, A. (2019): The Ethical Algorithm: The Science of Socially Aware Algorithm Design.

Interaktive Demonstrationen

Michael Scheuner, Co-Founder, AI Engineer

KENBUN IT AG
Haid-und-Neu-Straße 7
76131 Karlsruhe
+49 721 781 503 02
office@kenbun.de

×