SupraTix Logo
Benchmarking

Benchmarking

Öffentlich
Es sind noch 0 von 1 Plätzen verfügbar.

Guten Morgen an alle,

ich selbst habe noch nie ein Benchmark vorbereitet. So, wie ich das verstehe haben wir zwei Möglichkeiten: 1) die Erhebung gleich mit unseren ersten Kunden einfließen lassen oder 2) ein simuliertes Fachgespräch erzeugen. Ich tendiere zu 2. Hier können wir schnell und unkompliziert die Daten erheben. Die Simulation sollte inhaltlich gut gewählt werden.

DimensionKPIMessmethodeEinheit / SkalaZiel / Schwelle
QualitätBLEU, COMET, MQMAutomatisierte Metriken / Experten-BewertungPunktzahl (0–100)> 75
VerständlichkeitHuman Rating durch FachexpertenLikert (1–5)≥ 4
KorrektheitAnzahl korrekt übertragener Inhalte% korrekt> 90 %
LatenzAverage Lagging (AL)Differenz zwischen Eingang & AusgabeZeit (Sekunden/Wörter)< 2 Sek.
Real-Time Factor (RTF)Verhältnis Verarbeitungszeit zu AudiozeitFaktor (z. B. 0.8x)≤ 1.0
First Word LagZeit bis zum ersten übersetzten WortZeit (ms)< 500 ms
TerminologietreueTerm AccuracyKorrektheit fachspezifischer Terminologie% korrekt verwendeter Begriffe> 95 %
Term ConsistencyEinheitlichkeit terminologischer VerwendungKonsistenzrate> 90 %
Term CoverageAbdeckung definierter Fachtermini% abgedeckt> 95 %

Vielleicht wäre auch ein VPL-ANÜ-Gespräch eine interessante Version? @tobias.goecke @lukas.ranft @marcus.schaefer @daniel.doebling @thomas.bienek

Watch-Party

Session wird geladen ...

Viewer: 0