SupraTix Logo
Benchmarking simultaner Fachübersetzung in Echtzeit

Benchmarking simultaner Fachübersetzung in Echtzeit

Öffentlich
Es sind noch 0 von 1 Plätzen verfügbar.

Bis Ende Q3 2025 ein publikationsreifes, ganzheitliches Benchmarking-Framework etablieren, das simultane Übersetzungssysteme in kritischen Fachdomänen anhand messbarer KPIs zu Qualität, Latenz und Terminologietreue objektiv vergleicht.

Key Results

Kern-KPIs spezifizieren und implementieren
Definiere und dokumentiere fünf KPIs (BLEU, chrF, Average Lagging, Average Token Delay, Terminologie-Konsistenz-Index) mitsamt mathematischer Formeln und Python-Referenzcode; >90 % Reviewer-Zustimmung im internen Audit.


Automatisiertes Evaluations-Toolkit bereitstellen
Entwickle ein End-to-End-Toolkit, das 30-minütige Testsets auf einer Standard-GPU in <5 Minuten auswertet (Qualität + Latenz) und reproduzierbare Reports erzeugt.


Domänenspezifisches Benchmark-Dataset veröffentlichen
Kuratiere ≥10 Stunden gesprochene Daten (Medizin, Recht, Technik) inkl. Terminologie-Annotations-Dateien; alle Datenschutz- und Lizenzanforderungen sind dokumentiert.


Vergleichsstudie durchführen
Bewerte 1 menschlichen Referenzdolmetscher und 2 führende KI-Simultanübersetzer; Abweichung der menschlichen Qualitätsbewertung gegenüber BLEU ≤ ±5 Punkte; Ergebnisbericht ≥10 Seiten.


Forschungsergebnis publizieren
Reiche ein Full Paper bei ACL 2026 oder gleichwertiger Top-Konferenz fristgerecht ein und erziele mindestens „accept with minor revisions“.

Watch-Party

Session wird geladen ...

Viewer: 0