SupraTix Logo
Gebärdensprach-Integration

Gebärdensprach-Integration

Öffentlich
Es sind noch 0 von 1 Plätzen verfügbar.

Überblickend zielt dieser Feature Request darauf ab, die Gebärdensprach-Übersetzung in SpeakSphere vollständig on-premise verfügbar zu machen. Alle KI-Modelle (ASR, Gloss-Mapper, Gestenerkennung, Avatar-Rendering) werden lokal in einem air-gapped Kubernetes-Cluster ausgeführt, beschleunigt durch GPU-/INT8-Optimierungen. Dadurch bleiben Audio-/Video­daten im Rechenzentrum, die Latenz sinkt unter 150 ms und Vorgaben aus European Accessibility Act, WCAG 2.2 AAA sowie ISO 27001 Annex A.11 werden eingehalten.

1 Problemstellung & Nutzen

  • Hörende und gehörlose Mitarbeitende können in on-premise-Installationen bislang nur über externe Dolmetscher kommunizieren.

  • Regulatorische Vorgaben (EAA 2025, WCAG 2.2 AAA) verlangen native Sign-Unterstützung in Unternehmens-Kommunikation.

  • Datenschutz-kritische Branchen (Finanz, KRITIS) lehnen Cloud-Dienste ab und fordern ISO 27001-konforme, physisch abgesicherte Verarbeitung.

2 Ziel & Scope

Implementierung einer bidirektionalen Echtzeit-Gebärdensprach-Übersetzung in SpeakSphere, die ausschließlich auf Kundensystemen läuft, offline funktionsfähig ist und weniger als 150 ms End-to-End-Latenz erreicht.

3 Funktionale Anforderungen

Nr.AnforderungDetails on-prem
F-1Speech-to-SignWhisper-INT8 (OpenVINO) übersetzt Audio in Text-Gloss und triggert Avatar-Animation. (How to install and use Whisper offline (no internet required) #1463, OpenVINO/whisper-large-v3-int8-ov - Hugging Face)
F-2Sign-to-Speech/TextGPU-beschleunigte MediaPipe-Pose + YOLO/LSTM erkennen Gesten; Ausgabe als Untertitel oder TTS. ([GPU Support
F-3Avatar-Rendering3-D-SignAvatars laufen als Unity-Container; lokaler Asset-Cache. (SignAvatar - Generate Sign Language from Speech using AI)
F-4UI-Toggle & APIAktivierbar per Shortcut oder REST; User-Präferenz persistiert.
F-5Fallback DolmetscherMenschliche Dolmetscher können per SIP-Bridge zugeschaltet werden.

4 Nicht-funktionale Anforderungen

KategorieZielwertQuelle/Begründung
Latenz≤ 150 ms 95-PerzentilOpenVINO INT8 beschleunigt Whisper um >30 %. (OpenVINO/whisper-large-v3-int8-ov - Hugging Face)
Genauigkeit≥ 95 % WER / ≥ 92 % F1 (Gesten)Benchmark Jetson-Orin YOLO-v5. (Deploying YOLOv5 on NVIDIA Jetson Orin with cuDLA)
SicherheitISO 27001 Annex A.11 & GDPR Data-SovereigntyKeine Daten außerhalb. (ISO 27001:2013 – Annex A.11: Physical & Environmental Security, GDPR Data Sovereignty: Guide to Storage Location Rules)
VerfügbarkeitOffline-Betrieb > 48 hAir-gapped K8s-Cluster-Guide. (Running EKS in an Air-Gapped Environment - AWS Tip - Medium)
BarrierefreiheitWCAG 2.2 AAA 1.2.6, EAA(Ultimate Guide to the European Accessibility Act (EAA) for Video, Understanding Success Criterion 1.2.6: Sign Language (Prerecorded))

5 Architektur

  • ASR Offline: Whisper-Modelle werden als signierte OCI-Images aus interner Registry geladen.

  • Sign-Recognition: Jetson AGX Orin Nodes liefern 90 fps bei 18 W.

  • Messaging: NATS garantiert <10 ms Intra-Cluster Delivery.

6 Deployment & Betrieb

  1. Helm Air-Gap Bundle exportieren → USB-Transfer → helm install signsuite --set global.registry=registry.local.

  2. GitOps-Updates via ArgoCD; Images mit Cosign signiert.

  3. HorizontalPodAutoscaler skaliert GPU-Pods >70 % Utilisation.

  4. Wartung: Quartalsweise Modell-Refresh; Offline-Benchmark-Suite prüft Accuracy.

7 Akzeptanzkriterien

  • Aktivierung per UI-Toggle oder API-Flag <200 ms.

  • Fehlquote Gestenerkennung ≤ 5 % bei Standard-DGS-Korpus.

  • Pen-Test bestätigt keine ausgehenden Verbindungen.

  • Interner Accessibility-Audit bestätigt WCAG/EAA-Konformität.

8 Risiken & Gegenmaßnahmen

RisikoAuswirkungMaßnahme
GPU-EngpässeVerzögerungenINT8-Fallback auf CPU, zusätzliche Nodes.
Modell-PoisoningSicherheitslückeCosign-Verifikation + SBOM-Scan.
Dialekt-VarianzVerständnisfehlerFederated Fine-Tuning mit Nutzerfeedback.

9 Roadmap (kalenderwoche 2025)

PhaseKWDeliverable
POC27-33Demo Offline-ASR & Avatar
Alpha34-42Bidirektional DGS/ASL, Helm-Chart
Beta43-52Admin-Dashboard, GDPR-DPIA
GAQ1/26KRITIS-Zertifizierung, Roll-out

10 Referenzen

  1. Whisper Offline Install (How to install and use Whisper offline (no internet required) #1463)

  2. OpenVINO INT8 Whisper Model (OpenVINO/whisper-large-v3-int8-ov - Hugging Face)

  3. YOLO Deployment on Jetson Orin (Deploying YOLOv5 on NVIDIA Jetson Orin with cuDLA)

  4. ISO 27001 Annex A.11 (ISO 27001:2013 – Annex A.11: Physical & Environmental Security)

  5. GDPR Data Sovereignty Guide (GDPR Data Sovereignty: Guide to Storage Location Rules)

  6. Air-Gapped Kubernetes Best Practices (Running EKS in an Air-Gapped Environment - AWS Tip - Medium)

  7. MediaPipe GPU Support Docs (GPU Support | Google AI Edge - Gemini API)

  8. Helm Air-Gap Bundles Docs (Package Air Gap Bundles for Helm Charts - Replicated Docs)

  9. SignAvatar Project (SignAvatar - Generate Sign Language from Speech using AI)

  10. NATS Server Docs (Installing, running and deploying a NATS Server)

  11. SignAll Realtime Translator (SignAll | AI Sign Language Translation)

  12. European Accessibility Act Guide (Ultimate Guide to the European Accessibility Act (EAA) for Video)

  13. WCAG 2.2 1.2.6 Understanding (Understanding Success Criterion 1.2.6: Sign Language (Prerecorded))

  14. OpenVINO Gesture Demo (Gesture Recognition Python* Demo - OpenVINO™ documentation)

Watch-Party

Session wird geladen ...

Viewer: 0