In der Forensik und speziell im noch jungen Forschungsfeld der DNA-Phänotypisierung könnte sich eine Revolution anbahnen. Chinesische Wissenschaftler konnten mittels Künstlicher Intelligenz erstmals Gesichter aus DNA-Proben rekonstruieren.
Die internationale forensische DNA-Analyse hat sich in den letzten vier Jahrzehnten seit der Entdeckung des sogenannten genetischen Fingerabdrucks durch den britischen Genetiker Alec John Jeffrey 1984 mit zunehmender Sensitivität, Standardisierung der Methodik und einer Erweiterung der Auswertungsverfahren zu einem ganz zentralen Bestandteil der Strafverfolgung entwickelt. Ein weiterer Meilenstein war 1985 die Entdeckung der PCR-Technologie, auch als Polymerase-Kettenreaktion bekannt, durch den US-amerikanischen Biochemiker Kary Banks Mullis. Denn dank der neuen PCR-Methode konnten aus kleinsten Mengen von DNA Millionen von Kopien hergestellt werden. Brauchte man davor für eine erfolgreiche Analyse von Spurenmaterial noch große Mengen an gut erhaltener DNA, genügen inzwischen kleinste Teilchen wie Hautschuppen. Selbst stark beschädigtes DNA-Material aus Cold-Case-Fällen oder sehr alten Knochenfunden kann inzwischen mithilfe von PCR typisiert werden.
International gesetzliche Regelungen nötig
Seitdem konnte das Spektrum der Untersuchungen enorm vergrößert werden, vor allem dank neuer molekulargenetischer Verfahren, die als sogenannte erweiterte DNA-Analyse oder als sogenannte DNA-Phänotypisierung bekannt sind und Rückschlüsse auf äußerlich sichtbare Merkmale, biogeografische Herkunft sowie das Alter eines unbekannten Spurenverursachers, seinem individuellen Phänotyp, erlauben. Auch Erkenntnisse über das persönliche Risiko für die Ausbildung bestimmter Krankheiten lassen sich mittels der DNA-Phänotypisierung gewinnen. Das allein macht schon die erweiterte DNA-Analyse zu einem hochsensiblen Feld. Weshalb international gesetzliche Regelungen für die Einführung und den erlaubten Umfang dieses Verfahrens beim Vorliegen schwerster Straftaten etabliert werden mussten. Die Niederlande führten 2003 als erstes Land die Rechtsgrundlage für die DNA-Phänotypisierung ein, die Slowakei zog 2018 nach. Ein Jahr später wurde das Verfahren in die Strafprozessordnung der Bundesrepublik Deutschland aufgenommen, wobei die hiesigen Ermittler beim DNA-Profiling aus dem Genom eines unbekannten Täters über die bis dahin erlaubte Geschlechtsbestimmung hinaus ausschließlich Informationen über die Augen-, Haut- und Haarfarbe sowie das Alter ableiten dürfen, nicht aber die biogeografische Herkunft. Allerdings darf die erweiterte DNA-Analyse hierzulande nur durchgeführt werden, wenn bei Schwerverbrechen kein Treffer bei der vom Bundeskriminalamt gespeicherten DNA-Analyse-Datei (DAD) aufgefunden werden kann.
Der hinlänglich bekannte Begriff „genetischer Fingerabdruck“ ist leider etwas missverständlich. Weil er sich auf Bereiche der menschlichen DNA bezieht, die keine Gene repräsentieren und daher auch keine Rückschlüsse auf Aussehen oder genetische Veranlagungen wie Krankheiten beinhalten. Dieser Teil der DNA wird daher als „nicht-kodierend“ bezeichnet, bildet aber die Basis der soeben genannten DAD des Bundeskriminalamtes. Anhand des am Tatort gesicherten Spurenmaterials wie Blut, Speichel, Sperma, Haare oder Hautpartikel werden nach molekulargenetischer Analyse sogenannte DNA-Typisierungsmuster oder DNA-Profile erstellt. Die können anschließend mit dem DNA-Muster einer verdächtigen Person oder mit dem DAD-Datenbestand abgeglichen werden. Bei einem unbekannten oder in der DAD nicht registrierten Täter können zwangsläufig keine Ergebnisse und Erkenntnisse über die äußeren Merkmale erzielt werden.
„Kodierender“ Bereich des DNA-Moleküls
Dafür braucht es den Zugriff auf den „kodierenden“ DNA-Bereich, der laut dem Bundeskriminalamt rund drei Prozent der menschlichen DNA ausmacht, während rund 97 Prozent als „nicht-kodierend“ anzusehen sind. Die DNA befindet sich im Kern aller Zellen des menschlichen Körpers (mit Ausnahme der roten Blutkörperchen), besteht aus vier Grundbausteinen, den sogenannten Basen, und aus mehreren Milliarden von Einzelbausteinen, die leiterartige Doppelstränge in unterschiedlicher Abfolge ausbilden. „In den ‚nicht-kodierenden‘ Bereichen der DNA existieren Abschnitte“, so das Bundeskriminalamt, „bei denen bestimmte Bausteinabfolgen unterschiedlich oft wiederholt auftreten. Man bezeichnet sie als kurze Tandemwiederholungen (Short Tandem Repeats, STRs). Diese werden während der Analyse im Labor mithilfe von kommerziell erhältlichen Reagenzien tausendfach kopiert (Polymerase Chain Reaction, PCR) und dann als DNA-Muster sichtbar gemacht. Die Bestimmung der Anzahl der STRs an bestimmten Orten auf dem DNA-Strang ist das Ergebnis der DNA-Analyse. Diese weisen nämlich zwischen verschiedenen Menschen Unterschiede auf und ermöglichen daher eine Identifizierung.“ In der DAD sind laut Bundeskriminalamt über 1,18 Millionen Datensätze gespeichert, davon sind rund 805.000 Personendatensätze und rund 379.000 Spurendatensätze.
Der Zugriff auf den „kodierenden“ Bereich des DNA-Moleküls, der für das individuelle Erscheinungsbild einer Person verantwortlich ist, ist Gegenstand der erweiterten DNA-Analyse. Dabei konnten auf Basis von DNA-Spurenmaterial bereits verlässliche Ergebnisse bezüglich der Bestimmung von Haar-, Augen- und Haarfarbe, des biologischen Alters und der biogeografischen Herkunft des ansonsten unbekannten Spurenlegers gewonnen werden. Die Bundesländer Bayern und Baden-Württemberg haben daher im Frühjahr 2025 eine Initiative zur gesetzlichen Ausweitung der DNA-Phänotypisierung auf die biogeografische Herkunft ergriffen. „Unsere Ermittler brauchen gerade zur Aufklärung schwerer Verbrechen alle zur Verfügung stehenden Instrumente“, so Baden-Württembergs Justizministerin Marion Gentges. „Hier geht es nicht darum, jemanden anhand seiner Nationalität, seiner ethnischen Herkunft oder seiner Religion unter Verdacht zu stellen. Es geht darum, den Kreis möglicher Tatverdächtiger bei schwersten Verbrechen anhand möglichst vieler Indizien so weit einzugrenzen, dass zielgerichtete Ermittlungsmaßnahmen möglich sind“, so der bayerische Justizminister Georg Eisenreich. Dass man auch wirklichkeitsnahe Phantombilder allein auf Basis von DNA-Spuren im Rahmen einer erweiterten DNA-Analyse erstellen könnte, galt bislang als wenig wahrscheinlich. Auch wenn es in jüngster Zeit bereits einige vielversprechende Studien in dieser Richtung mit letztlich aber wenig verlässlichen Resultaten gegeben hatte.
Spezielle Software „Difface“
Doch nun kommt ausgerechnet aus China, wo laut Human Rights Watch die Behörden speziell im Siedlungsraum der Uiguren jede Menge an biometrischen Daten und DNA-Proben unter gehörigem Druck zu sammeln pflegen, eine Studie heraus, die eine erstaunlich präzise Gesichtskonstruktion allein auf Basis von DNA mithilfe von Künstlicher Intelligenz für machbar erklärt. Die Untersuchung eines Teams der Chinesischen Akademie der Wissenschaften wurde im Mai 2025 unter Federführung von Prof. Luonan Chen, der am Shanghai Institute of Biochemistry and Cell Biology lehrt, im Fachmagazin „Advanced Science“ veröffentlicht. Für seine Arbeit, die angeblich von „Techniken der Künstlichen Intelligenz in der Text-Bild-Synthese“ inspiriert war, konnte das Team 9.674 Probanden zur Mitwirkung gewinnen, die alle der Han-chinesischen Bevölkerungsgruppe angehörten, die mit einem Anteil von 90 Prozent die größte Ethnie im Reich der Mitte darstellt.
Zu jeder Person lagen den Forschern sowohl genetische Daten als auch ein hochauflösender 3D-Gesichtsscan vor. Mit dieser Kombination trainierte das Team eine spezielle Software namens „Difface“. Diese wertete zunächst die Scans aus und erstellte aus der räumlichen Position bestimmter Punkte des Gesichts eine Art von dreidimensionaler „Gesichtswolke“. Danach verband die KI die Punkte der Gesichtswolke mit sogenannten Einzelnukleotid-Polymorphismen (Single Nucleotide Polymorphisms, SNPs), Variationen von DNA-Basenpaaren, auf der jeweils dazugehörigen DNA.
Der Algorithmus analysierte daraus, welche DNA-Unterschiede oder SNPs mit welchen Gesichtsstrukturen verknüpft waren. Im nächsten Schritt musste „Difface“ dann 3D-Gesichter aus DNA-Daten erstellen, die zuvor nicht Bestandteil des Trainingsprozesses gewesen waren. Der anschließende Abgleich mit den originalen Kontrollbildern der jeweiligen Person ergab gerade mal eine minimale Abweichung von maximal 3,5 Millimetern, was der Größe eines Stecknadelkopfs entspricht. Wurden dem System weitere Parameter wie Alter, Geschlecht und Body-Mass-Index zur Verfügung gestellt, sank die Abweichung sogar auf 2,9 Millimeter. Laut Angaben der Forscher kann die KI zusätzlich sogar das Aussehen einer Person in verschiedenen Altersstufen vorhersagen.
Allerdings lässt sich laut den Wissenschaftlern nicht jeder Teil des Gesichts gleich gut konstruieren. Am besten gelang es bei der Berechnung der Nase: Ihre Form und der Abstand zur Stirn waren vergleichsweise treffsicher, während bei der Wangenform oder der Position der Augen leichte Abweichungen registriert werden konnten. Auch verschlechterte sich das Ergebnis, wenn nicht das vollständige Erbgut zur Verfügung stand. Wenn nur ein Teil der DNA-Daten abgelesen werden konnte – beispielsweise nur 70 Prozent der SNPs – stiegen die Abweichungen leicht an. Bei einem Anteil von unter 50 Prozent der SNPs wichen die Resultate erheblich vom zum Vergleich herangezogenen Originalbild ab. Da die KI variable Merkmale wie Frisur oder Bartwuchs nicht berücksichtigen konnte, wirken die konstruierten Gesichter sehr maskenhaft. Um die Ergebnisse zu testen, sprich um zu überprüfen, ob die Computer-Bilder vom menschlichen Auge wegen einer ausreichend großen Ähnlichkeit einer bestimmten Person zugeordnet werden konnten, luden die Forscher zehn Freiwillige ein.
Aussehen in zukünftigen Altersstufen
Sie sollten aus einer Reihe von fünf, zehn oder 20 echten Gesichts-Bildern das dazu passende Computer-Bild zuordnen. Am höchsten war die Trefferquote mit 75,6 Prozent bei fünf Vergleichsbildern, bei zehn sank sie bereits auf 53,3 Prozent, bei 20 lag sie nur noch bei 51,1 Prozent. Was aber immer noch ein recht gutes Resultat bedeutete. Die chinesischen Wissenschaftler attestierten ihrem System daher „eine hervorragende Leistung bei der DNA-zu-3D-Bildausrichtung“. Und weiter: „Difface kann 3D-Gesichtsbilder von Personen ausschließlich aus ihren DNA-Dateien generieren und ihr Aussehen in verschiedenen zukünftigen Altersstufen projizieren. Diese Arbeit stellt Pionierforschung in der De-novo-Generierung menschlicher Gesichtsbilder aus individuellen Genominformationen dar.“
Weil für das Training nur Daten von Han-Chinesen verwendet wurden, müsste die KI bei einem Einsatz in anderen Kulturkreisen zunächst mit einem entsprechenden DNA-Datensatz gefüttert werden. Sollte sich die neue Technik bewähren, könnte sie fraglos die Forensik revolutionieren, beispielsweise, um wirklichkeitsnahe Täterprofile erstellen oder das Aussehen unidentifizierter Verbrechensopfer rekonstruieren zu können. Auch für die Archäologie könnte sie bei Skelettfunden eine wesentlich bessere Hilfe sein als die bislang zur Imagination des Gesichts eingesetzte Weichteilrekonstruktion. Die Medizin nicht zu vergessen, etwa um angeborene Fehlbildungen im Gesicht besser erkennen und Operationen besser planen zu können sowie den Alterungsprozess frühzeitig vorhersehen und gegebenenfalls punktuell stoppen zu können.
Allerdings werfen „Difface“ und die DNA-Phänotypisierung auch jede Menge heikle Fragen auf, vor allem in Bezug auf Datenschutz, Privatsphäre und Ethik, was die chinesischen Wissenschaftler auch selbst bereitwillig eingeräumt hatten: „Über die akademische Forschung hinaus sind die gesellschaftlichen Auswirkungen der DNA-Phänotypisierung weitreichend und berühren sensible Bereiche wie Forensik, Gesundheitswesen und Versicherungswesen. In der Forensik bietet die Technologie zwar potenzielle Vorteile bei der Identifizierung von Personen anhand genetischen Materials, doch ein unsachgemäßer Einsatz kann zu erheblichen Schäden führen, darunter Fehlurteile und ethnisches Profiling. Im Gesundheits- und Versicherungswesen besteht das Risiko, dass genetische Informationen zur Diskriminierung von Personen aufgrund vermeintlicher Gesundheitsrisiken genutzt werden.“