Hauptinhalt

BITV 2.0 kommentiert Teil 6 – Vorgaben für Audiodeskription: die Quadratur des Kreises

9. Oktober 2011 von Kerstin Probiesch in: Allgemein, BITV, WCAG

Die deutsche BITV 2.0 wartet in ihren Bedingungen zur Audiodeskription mit einigen bemerkenswerten Unterschieden zu den international abgestimmten Web Content Accessibility Guidelines (WCAG 2.0) auf. Ursache dieser Unterschiede ist zum einen, dass die Konformitätsstufen A und AA in der BITV 2.0 zur Priorität I zusammengefasst wurden und zum anderen, dass die BITV 2.0 – sagen wir mal – “sturer” ist als es die WCAG 2.0 sind. Aber von Anfang an:

Erfolgskriterien für Audiodeskriptionen in den WCAG 2.0

Die Web Content Accessibility Guidelines (WCAG 2.0) befassen sich vor allem in zwei Erfolgskriterien der Konformitätsstufen A bzw. AA mit Audiodeskriptionen:

  • “1.2.3 Audiodeskription oder Medienalternative (aufgezeichnet): Eine Alternative für zeitbasierte Medien oder eine Audiodeskription des aufgezeichneten Videoinhalts wird für synchronisierte Medien bereitgestellt, außer die Medien sind eine Medienalternative für Text und als solche deutlich gekennzeichnet. (Stufe A) und”
  • “1.2.5 Audiodeskription (aufgezeichnet): Eine Audiodeskription wird für alle aufgezeichneten Videoinhalte in synchronisierten Medien zur Verfügung gestellt. (Stufe AA)”

Mit jeder Stufe steigen – wie in anderen Bereichen – auch hier die Anforderungen an die Konformität. Ist auf A noch eine Medienalternative ausreichend, reicht sie auf Stufe AA nicht mehr. Wie aber soll mit Videoinhalten umgegangen werden, wenn die Sprechpausen für eine benötigte Audiodeskription nicht lang genug sind? Für diesen gar nicht so ungewöhnlichen Fall halten die WCAG 2.0 ein Erfolgskriterium der Konformitätsstufe AAA bereit, das es Anbietern ermöglicht Videoinhalte zur Verfügung zu stellen, ohne dass der Benutzer auf eine Audiodeskription verzichten muss: die Erweiterte Audiodeskription.

“1.2.7 Erweiterte Audiodeskription (aufgezeichnet): Wenn die Pausen im Vordergrund-Audio nicht ausreichend sind, um Audiodeskriptionen zu ermöglichen, die den Sinn des Videos vermitteln, dann wird eine erweiterte Audiodeskription für alle aufgezeichneten Videoinhalte in synchronisierten Medien bereitgestellt. (Stufe AAA)”

Bedingungen zur Audiodeskription in der BITV 2.0

In der BITV 2.0 dagegen wird in Bedingung 1.2.3 (Priorität I) gefordert:

“1.2.3 Audio-Deskription oder Volltext-Alternative: Für aufgezeichnete synchronisierte Medien ist eine Volltext-Alternative einschließlich aller Interaktionen oder eine Audio-Deskription bereitzustellen. Dies gilt nicht für Medien-Alternativen für Text, die klar als solche gekennzeichnet sind”

dann in Bedingung 1.2.5 (Priorität I):

“1.2.5 Audio-Deskription: Für alle vorab aufgezeichneten Video-Inhalte synchronisierter Medien ist eine Audio-Deskription bereitzustellen. Dies gilt nicht für Medien-Alternativen für Text, die klar als solche gekennzeichnet sind.”

Dies bedeutet im Prinzip, dass eine “Volltext-Alternative” für Videoinhalte, die erklärt werden müssen, nie ausreicht; es bedeutet aber auch – dies geht aus der Begründung hervor und ist entscheidender, dass eine erweiterte Audiodeskription nicht verwendet werden darf. In der Begründung (zum Entwurf, die offizielle ist noch nicht da) heißt es:

“Zu Bedingung 1.2.7 der Anlage 1
Die Bedingung der WCAG 2.0, dass eine Audio-Deskription nur bereitzustellen ist, wenn hierfür ausreichende Pausen zur Verfügung stehen, wurde nicht in die Anlage 1 übernommen. Eine Audio-Deskription ist grundsätzlich bereitzustellen, zumal das Kriterium „ausreichende Pausen“ in der Praxis nicht bewert- und prüfbar ist.”

Damit wird in der BITV 2.0 ein Zustand festgeschrieben, der noch vielen Audiodeskriptionswilligen Kopfschmerzen bereiten wird. Interessant sind gleich mehrere Aspekte: Zunächst wäre es für mich logischer, wenn sich dieser Kommentar nicht auf Bedingung 1.2.7 (Priorität II) sondern auf 1.2.5 bezogen hätte. Entscheidender ist jedoch, dass die WCAG 2.0 in ihr Gegenteil verkehrt werden. Denn dort heißt es:

“Anmerkung: Diese Technik (gemeint ist die erweiterte Audiodeskription, kp) wird nur benutzt, wenn der Sinn des Videos ohne die zusätzliche Audiodeskription verloren gehen würde und die Pausen zwischen den Dialogen/der Schilderung zu kurz sind.”

Interessant ist zudem, dass die BITV 2.0 auf der einen Seite Nicht-Prüfbares enthält (vgl. Einfache Sprache, sowie Anforderungen für Leichte Sprache und einige für Gebärdensprachinhalte), hier nun aber auf die Nicht-Prüfbarkeit eines Kriteriums der WCAG 2.0 abgestellt wird.

Auflösung der strikten Trennung von normativ und nicht-normativ

Irritierend ist auch, dass in Bedingung 1.2.3 eine Audiodeskription oder eine “Volltext-Alternative” fordert, denn in den WCAG 2.0 ist von “Medien-Alternative” die Rede. Die “Volltext-Alternative” ist kein normatives Erfolgskriterium der WCAG 2.0. Möglicherweise wurde sie aus Technik G69 abgeleitet. Eine andere Möglichkeit ist, dass die “Volltext-Alternative” aus dem Dokument “Erfolgskriterium 1.2.3 Verstehen” abgeleitet wurde, das jedoch ebenfalls weder in der deutschen noch der englischen Fassung ein normatives Dokument ist.

Damit wurde in der BITV 2.0 die Trennung von normativen Dokumenten und nicht-normativen Dokumenten der WCAG 2.0 an dieser Stelle aufgelöst. Für dieses Vorgehen gibt es in der BITV 2.0 mindestens zwei weitere Beispiele: Bedingung 3.1.5 “Einfache Sprache” (Priorität II), die im Unterschied zum WCAG 2.0-Pendant nur aus Techniken besteht, wobei eine (“die einfachste und klarste Sprache, die angemessen ist”) nicht prüfbar ist und entsprechend in den WCAG 2.0 nur Advisory-Charakter hat sowie Bedingung 1.2.8, in der wiederum statt “Medien-Alternative” die Volltext-Alternative gefordert wird.

Exkurs: Die WCAG 2.0 und die Sache mit den Techniken

Es mag auf den ersten Blick kleinlich aussehen. Werfen wir aber dennoch einen Blick auf die Techniken der WCAG 2.0:
Das Technikdokument wird turnusmäßig durch die zuständige Arbeitsgruppe des W3C ergänzt; die Techniken selber sind unterteilt in:

  • Sufficient Techniques (mit denen zuverlässig das Erfolgskriterium erfüllt werden kann) und
  • Advisory Techniques (die nicht ausreichend sind, um das Erfolgskriterium erfüllen zu können)

Dabei liegt die Betonung auf “kann”, denn im Prinzip ist das so zu verstehen: “Wenn Du diese Technik für die Erfüllung des Erfolgskriteriums verwendest, dann mache es so wie in der Technik beschrieben.” Das Verwenden einer bestimmten Technik ist jedoch vor allem immer eines: optional. Es geht immer und grundsätzlich um das Erfüllen des Erfolgskriteriums und nicht darum, eine bestimmte, festgelegte Technik verwenden zu müssen. Eine Ausnahme sind die Advisory Techniques mit denen allein das Erfolgskriterium nicht erfüllt werden kann.

Da ja das Technikdokument ausgebaut wird, wird in den WCAG 2.0 logischerweise der Begriff “Medienalternative” als übergeordneter Begriff verwendet und so Raum für weitere Techniken gelassen. Nicht so die BITV 2.0, denn immerhin heißt es in der Begründung aus Seite 5: “Die Standards mit der Priorität I sind zwingend einzuhalten.”

Audiodeskription zwingend – Sprechpausen egal?

Zur Volltext-Alternative ist nun nichts weiter zu sagen, außer dass diese Technik zwei Bedingungen später – jedoch noch innerhalb von Priorität I – sogleich wieder aufgehoben wird, es sei denn z.B. ein Video enthält keine zu beschreibenden Aktionen. Sind hingegen solche nötig, darf nur die Audiodeskription und – wie oben ausgeführt – nicht die erweiterte Audiodeskription verwendet werden.

Tatsächlich ist “nicht-ausreichend” eine weiche Formulierung, die jedoch verständlicher wird, wenn man den internationalen Charakter der WCAG 2.0 berücksichtigt. Die zahlreichen Sprachen dieser Welt sind nun einmal nicht nur unterschiedlich, sondern benötigen für das Sprechen von Sätzen auch unterschiedlich viel Zeit – ein höchst relevanter Faktor für die Audiodeskription. In der einen Sprache kann eine Audiodeskription in die Sprechpausen passen und in einer anderen evtl. nicht. Kein Wunder also, dass in den WCAG 2.0 keine nähere Festlegung erfolgte.

Statt sich nun quasi “stur” auf den Standpunkt zu stellen: “Egal wie kurz Dialogpausen sind – quetsche deine Audiodeskription hinein” wäre es auch an dieser Stelle sinnvoller gewesen, die WCAG 2.0 so zu lassen wie sie ist und zusammen mit deutschen Experten für diesen Bereich testbare Kriterien zu entwickeln. Die in der BITV 2.0 geforderte “Lösung” ist nun zwar in der Praxis prüfbar, aber nicht in der Praxis realistisch umsetzbar und verbietet auf Priorität I eine Technik (G8) mit der man nach WCAG 2.0 immerhin drei Erfolgskriterien (1.2.3, 1.2.5, 1.2.7) erfüllen kann. Was hat die erweiterte Audiodeskription nur Böses getan, um dieses Schicksal zu verdienen?

Ein Beispiel aus den WCAG 2.0:

“Beispiel 1. Video einer Vorlesung. Ein Physik-Professor hält eine Vorlesung. Er macht Handskizzen auf dem Whiteboard und spricht schnell während er zeichnet. Sobald er mit der Erörterung einer Problemstellung fertig ist, wischt er die Zeichnung weg und macht einen neuen Sketch, während er weiterhin spricht und mit seiner anderen Hand gestikuliert. Das Video wird zwischen den Problemstellungen angehalten und es wird eine erweiterte Audiodeskription der Zeichnungen und Gesten des Professors bereitgestellt; das Video wird dann fortgesetzt.”

Unser Video mit dem Physik-Professor wäre völlig WCAG A und AA-konform, wäre jedoch wegen der fehlenden Audiodeskription nicht BITV 2.0-konform, obwohl diese nicht in die Sprechpausen passen würde? Die Quadratur des Kreises scheint mir demgegenüber noch ein leichtes Unterfangen. Oder was übersehe ich?

Kommentare und Pings sind derzeit nicht erlaubt.

Kommentarfunktion ist deaktiviert