Eigennamenerkennung (NER): Von der klassischen NLP zur KI-gestützten Extraktion

16. Juni 2026

Eigennamenerkennung (NER) und KI-Datenextraktion Illustration

Die Eigennamenerkennung (Named Entity Recognition, kurz NER) ist ein Eckpfeiler der natürlichen Sprachverarbeitung (Natural Language Processing, NLP). Es handelt sich dabei um den Prozess, bei dem wichtige Elemente in unstrukturiertem Text automatisch identifiziert und in vordefinierte Kategorien eingeteilt werden – wie etwa Personennamen, Organisationen, Orte, Daten, Geldbeträge und Produktnamen.

Ohne NER würden Suchmaschinen, Empfehlungsdienste und automatisierte Dokumentenanalysesysteme Schwierigkeiten haben zu verstehen, wer, was, wo und wann in einem Text gemeint ist.

Hier ist ein umfassender Leitfaden zum Verständnis von NER, wie sich die Technologie entwickelt hat und warum die moderne generative KI die Entitätsextraktion komplett revolutioniert hat.

1. Die Entwicklung der NER-Techniken

Um zu verstehen, warum die KI-basierte NER so revolutionär ist, müssen wir uns ansehen, wie sich die Entitätsextraktion in den letzten Jahrzehnten entwickelt hat.

Phase 1: Regelbasierte und wörterbuchbasierte Systeme

Die frühe NER beruhte auf regulären Ausdrücken (Regex) und kuratierten Wörterbüchern (Gazetteers).

Funktionsweise: Wenn ein Wort in einer Datenbank von Orten vorkam oder einem Muster wie [3 Ziffern]-[3 Ziffern]-[4 Ziffern] (Telefonnummer) entsprach, wurde es extrahiert.
Einschränkungen: Äußerst fehleranfällig. Es konnte keine falsch geschriebenen Wörter, neue Entitäten oder Kontext erfassen. Beispielsweise konnte es nicht unterscheiden, ob sich „Apple“ auf die Frucht oder das Technologieunternehmen bezog.

Phase 2: Klassisches maschinelles Lernen (CRF & SVM)

In den 2000er Jahren wurden statistische Modelle des maschinellen Lernens wie Conditional Random Fields (CRFs) und Support Vector Machines (SVMs) zum Standard.

Funktionsweise: Ingenieure erstellten manuelle Merkmale (z. B. Präfixe, Suffixe, Groß- und Kleinschreibungsmuster) und trainierten Modelle auf annotierten Daten, um die Wahrscheinlichkeit vorherzusagen, dass ein Token Teil einer Entität ist.
Einschränkungen: Erforderte riesige annotierte Datensätze und eine mühsame manuelle Merkmalsentwicklung.

Phase 3: Deep Learning (BiLSTM-CRF & BERT)

Mit dem Aufkommen von Deep Learning revolutionierten bidirektionale Long Short-Term Memory-Netzwerke (BiLSTM) in Kombination mit CRFs und später Transformer-Modelle wie BERT die NLP.

Funktionsweise: Wort-Embeddings erfassten die semantische Bedeutung, und tiefe neuronale Netze verstanden den Kontext. BERT-basierte Modelle konnten „Apple“ in „Apple hat ein neues iPhone auf den Markt gebracht“ anhand des umgebenden Kontextes als Organisation identifizieren.
Einschränkungen: Erforderte immer noch überwachtes Fine-Tuning auf domänenspezifischen Datensätzen und bot nicht die Flexibilität, neue, undefinierte Kategorien ohne erneutes Training zu extrahieren.

Phase 4: Generative KI und LLM-basiertes NER

Heute bewältigen große Sprachmodelle (LLMs) wie Gemini, GPT-4 und Llama 3 die NER mithilfe von semantischem Verständnis und dem Befolgen von Anweisungen.

Funktionsweise: Mithilfe von Zero-Shot- oder Few-Shot-Prompting kann ein Benutzer ein LLM anweisen, jeden beliebigen Entitätstyp zu extrahieren und in einem strukturierten Format (wie JSON) zurückzugeben.
Warum es gewinnt: Es versteht komplexe Syntax, korrigiert Rechtschreibfehler, löst mehrdeutige Kontexte auf und benötigt keine Trainingsdaten für den Start.

2. Vergleich: KI-basiertes NER vs. Klassisches NER

Merkmal	Klassisches NER (BERT / CRF)	KI-basiertes NER (LLMs)
Benötigte Trainingsdaten	Hoch (Tausende annotierte Beispiele)	Keine bis sehr gering (Zero-Shot / Few-Shot)
Flexibilität	Starr (Extrahiert nur vortrainierte Kategorien)	Extrem hoch (Beliebige Entitäten im Prompt definieren)
Kontextverständnis	Moderat (Lokales Kontextfenster)	Tief (Versteht den globalen Dokumentenkontext & Absichten)
Umgang mit unbekannten Wörtern (OOV)	Schlecht (Probleme mit unbekannten Wörtern)	Exzellent (Verwendet semantisches Denken)
Ausführungslatenz & Kosten	Schnell & Günstig (Läuft lokal auf kleinen CPUs/GPUs)	Langsamer & Höhere Kosten (Erfordert Inferenz großer Modelle)

3. Hauptanwendungen von KI-basiertem NER

KI-basierte Eigennamenerkennung geht über das einfache Hervorheben von Text hinaus. Durch die Umwandlung von unstrukturiertem Text in strukturierte, nutzbare JSON-Daten ermöglicht sie eine leistungsstarke Automatisierung:

Dokumentenanalyse & Informationsextraktion

Unternehmen verarbeiten täglich Tausende von Rechnungen, Lebensläufen, Verträgen und Ausschreibungen. KI-basiertes NER kann Folgendes extrahieren:

Rechnungen: Steuernummern, Einzelposten, Gesamtbeträge, Rechnungsadressen.
Lebensläufe: Kandidatennamen, Jahre an Erfahrung, spezifische Fähigkeiten, Universitäten.
Verträge: Kündigungsfristen, Haftungsgrenzen, geltendes Recht, Namen der Unterzeichner.

Aufbau von Wissensgraphen

Durch das Extrahieren von Entitäten und den Beziehungen zwischen ihnen (z. B. [Jennifer Lee] -> [arbeitet bei] -> [Acme Innovations]) dient KI-basiertes NER als grundlegende Ingestions-Engine für Wissensgraphen (Knowledge Graphs), die zunehmend mit GraphRAG für fortgeschrittene Unternehmenssuchen kombiniert werden.

Erweitertes RAG & Metadaten-Tagging

In RAG-Systemen (Retrieval-Augmented Generation) verbessert die Indexierung von Dokumenten mit Metadaten-Tags (wie Autor, Produktversion, Land und Technologie) die Abrufgenauigkeit erheblich. KI-basiertes NER generiert diese Tags automatisch im großen Stil während der Dokumentenverarbeitung.

Klinische & Medizinische NLP

Gesundheitsdienstleister nutzen NER, um Patientensymptome, Dosierungen von Medikamenten, Krankengeschichten und Diagnosen aus ärztlichen Notizen zu extrahieren, während persönliche Gesundheitsdaten (PHI) automatisch geschwärzt werden, um Datenschutzbestimmungen einzuhalten.

4. Funktionsweise von KI-basiertem NER (Der Workflow)

Modernes KI-basiertes NER basiert auf dem Prompting eines LLMs mit einer Systemanweisung und einem Zielschema, um strukturierte Ausgaben zu erzwingen.

[Unstrukturierter Text] ──> [LLM + Systemanweisungen + JSON-Schema] ──> [Strukturierte JSON-Ausgabe]

Eingabetext: Der zu verarbeitende Rohtext.
System-Prompt & Schema: Wir definieren die zu extrahierenden Entitäten (z. B. Name, Unternehmen, Datum) und das genaue Format, das wir benötigen (z. B. JSON).
LLM-Extraktion: Das Modell führt eine semantische Analyse durch, identifiziert die Entitäten, löst Mehrdeutigkeiten auf und formatiert die Ausgabe.
Strukturiertes JSON: Die Ausgabe kann direkt in einer Datenbank gespeichert oder an eine API übergeben werden.

5. Implementierungsbeispiel: KI-basiertes NER in Python

Hier ist ein einfaches Python-Beispiel für die Durchführung von KI-basiertem NER unter Verwendung strukturierter JSON-Ausgabeschemata:

import json
from google import genai
from google.genai import types
from pydantic import BaseModel

# Gemini-Client initialisieren
client = genai.Client()

# Zielstruktur mit Pydantic definieren
class EntityExtraction(BaseModel):
    people: list[str]
    organizations: list[str]
    locations: list[str]
    dates: list[str]

text_content = """
Am 14. März 2024 wurde Jennifer Lee zur neuen VP of Engineering bei 
Acme Innovations Inc. mit Sitz in Kyoto, Japan, ernannt. Sie wird die Nachfolge von David Miller antreten.
"""

# Strukturierte Ausgabe von Gemini anfordern
response = client.models.generate_content(
    model='gemini-2.5-flash',
    contents=text_content,
    config=types.GenerateContentConfig(
        system_instruction="Extrahiere alle Personen, Organisationen, Orte und Daten aus dem Text.",
        response_mime_type="application/json",
        response_schema=EntityExtraction,
    ),
)

# Sauberes JSON-Ergebnis parsen und drucken
entities = json.loads(response.text)
print(json.dumps(entities, indent=2))

Ausgabe:

{
  "people": ["Jennifer Lee", "David Miller"],
  "organizations": ["Acme Innovations Inc."],
  "locations": ["Kyoto", "Japan"],
  "dates": ["14. März 2024"]
}

Fazit

Die Eigennamenerkennung hat sich von statischen Wörterbuchabfragen zu einer dynamischen, semantischen Fähigkeit entwickelt, die durch KI gestützt wird. Heute können Unternehmen komplexe domänenspezifische Entitäten aus unübersichtlichen Dokumenten ohne Trainingsdaten extrahieren. Indem Sie KI-basiertes NER in Ihre Workflows integrieren, können Sie unstrukturierte Textdateien in strukturierte Datenbankeinträge verwandeln und so neue Ebenen der Automatisierung und Business Intelligence erschließen.

Erkunden Sie weitere KI-Einblicke im Ghaznix-Blog →