Interactive Voice Response (IVR)
Deprecated: preg_replace(): The /e modifier is deprecated, use preg_replace_callback instead in /www/htdocs/w0096a5b/cms/wp-includes/formatting.php on line 82
Bei einem Sprachdialogsystem (interactive voice response, IVR) können Anrufer über das Telefon teil- oder vollautomatisierte Dialoge führen.
Eingaben können entweder durch natürliche Sprache oder über die Telefontastatur (#DTMF) erfolgen.
Beide Varianten haben unterschiedliche Vorteile und lassen sich oft sinnvoll kombinieren.
DTMF ist robust gegen Störungen wie Hintergrundgeräusche. Vor allem Zahlen wie Kundennummern oder ähnliches lassen sich effizient und schnell über die Telefontastatur eingeben. Die Erkennung gesprochener Sprache (Natural language understanding, NLU) spielt vor allem dann ihre Vorteile aus, wenn es darum geht, unter einer Vielzahl von Optionen auszuwählen, zum Beispiel, wenn nach dem Namen eines Mitarbeiters gefragt wird.
Heutige Spracherkenner erkennen verblüffend zuverlässig Spracheingaben beliebiger Personen (sprecherunabhängig) und es ist nicht mehr nötig, Sprechpausen zwischen einzelnen Wörtern zu machen.
In Ausnahmefällen wie z. B. bei Stimmproblemen oder lauten Hintergrundgeräuschen sollte eine alternative Eingabemöglichkeit per DTMF ermöglicht werden.
In Fällen, wo Anrufer mit der Bedienung überfordert sind oder ihre Kooperation verweigern, sollte ein Mensch als Ausweichlösung bereit stehen.
IVR-Systeme bieten den Vorteil, dass sie rund um die Uhr verfügbar sind und erhebliche Personalkosten sparen können.
Sie spielen vor allem dann ihre Vorteile aus, wenn Anrufer häufig mit dem System arbeiten, zum Beispiel um im mobilen Einsatz Messwerte an eine Zentrale zu übermitteln.
In solchen Fällen können IVR-Systeme die Daten sofort auf Plausibilität prüfen.
Benutzer, die im Umgang mit einem System geübt sind, können durch vorzeitiges Antworten (Barge in), also noch bevor die Frage komplett abgespielt wurde, sehr effizient Dialoge führen.
Vor allem in Anwendungsgebieten mit ungeübten Benutzern, zum Beispiel bei der Fahrplanauskunft, entscheidet die Qualität des Dialogdesigns über die Akzeptanz bei der Zielgruppe.
Sprachausgaben können in automatisierten Dialogsystemen entweder durch Abspielen vorher aufgezeichneter Aufnahmen (Prompts) oder durch Sprachsynthese (Text to Speech, TTS) erfolgen. Synthetische Stimmen sind mittlerweile kaum noch von Sprachaufnahmen zu unterscheiden und bieten sich immer dann an, wenn Inhalte nicht im Voraus produziert werden können, z. B. bei Verkehrsmeldungen, Börsenkursen oder der Wiedergabe von beliebigen Texten, wie zum Beispiel aus SMS oder Emails. Da eine Sprachsynthese-Software immer auf eine bestimmte Sprache ausgelegt ist, erzeugt sie bei Fremdwörtern oder für die Sprache ungewöhnlichen Namen schwer verständliche Aussprachen.
IVR-Dialoge werden häufig in der Beschreibungssprache VXML formuliert und von einem VXML-Interpreter ausgeführt.
Dieser führt auch die weiteren benötigten Ressourcen wie Spracherkenner, Sprachgenerator (Text to speech, TTS) und Telefonie zusammen.
Spracherkenner und Sprachsynthese werden meist für die Anzahl der Telefonkanäle lizenziert und machen einen nicht unerheblichen Teil der Anschaffungskosten aus.
Vergleich der Telefonanlagen
Hier eine Übersicht, welche Anbieter von Telefonanlagen interactive voice response (IVR) bieten:
Anbieter | Feature |
---|---|
Alcatel | nein |
Asterisk/open source | ja |
Avaya | nein |
Cisco | nein |
Clarity | ja (CSE) |
Siemens | ja (expressions) |
Swyx | nein |