Login

Maschinelles Lernen, Sprache und Text – Amazon Alexa

Am vergangenen Montag fand in den Räumlichkeiten der Ryte GmbH in München das erste “Ryte Tech Meetup” statt. Die Veranstaltung startete mit einer interessanten Keynote des Vice President and Chief Technical Officers von Amazon.com: Werner Vogels”

In guten 30 Minuten ging er dabei auf die Entwicklung “Voice and Tech” ein, die Amazon als das “nächste große Dinge” beschreibt und nicht nur an Amazon Echo Geräten und der Sprachassistentin Amazon Alexa arbeitet.

ioncube official logo

Der Umgang mit echter Sprache, Dialekten, die Reaktion auf das Verhalten des Anwenders, das korrekte Auswerten und Vorlesen von digitalen Inhalten über die Sprache (z.B. die phonetisch korrekte Aussprache, Betonung, Pausen etc.) ist für Entwickler eine neue Herausforderung im Vergleich zur reinen Softwareentwicklung der vergangenen Jahrzehnte.

Dafür hat Amazon Teile der Software bereits öffentlich freigegeben, die im Cloud-Angebot bei AWS zur Verfügung stehen. Das Ziel dahinter ist die Auseinandersetzung der Benutzer mit der Software und den Anforderungen sowie der Möglichkeit eigene Tools und Apps zu entwickeln. Natürlich ist das daraus resultierende Feedback zurück an Amazon nicht ganz uneigennützig 😉

Lex, Polly und Rekognition

Lexhttps://aws.amazon.com/de/lex/
Die Software ist in verschiedene Pakete geteilt: Mit Hilfe von Amazon Lex können Entwickler Anwendungen erstellen, die Sprachbefehle von Nutzern verstehen können. Damit können bestehende Messenger integriert oder auch Web-Anwendungen gebaut werden, die auf Befehle des Anwenders reagieren.

Pollyhttps://aws.amazon.com/de/polly/
Amazon mit Polly ist der eigentliche Text-to-Speech-Dienst. Die eingangs erwähnten Eigenheiten der Sprachsynthese werden von diesem Bestandteil bearbeitet. Für die Anbindung an die eigene Software steht die sog. Speech Synthesis Markup Language (SSML) zur Verfügung, womit neue Wörter eingelernt und auch ein Sprachwechel innerhalt eines Textes eingebaut werden kann. Weiterhin stehen verschiedenste männliche und weibliche Stimmen in derzeit 24 Sprachen zur Verfügung.

Rekognitionhttps://aws.amazon.com/de/rekognition/
Der dritte Teil ist nicht direkt für die Sprachsoftware erforderlich, erweitert diese jedoch um Bilderkennung. Somit können Objekte, Szenen und Gesichter analysiert, eine Unterscheidung von Menschen anhand unterschiedlicher Gesichter, Tiere, Objekte etc. getroffen und auch wiedererkannt werden.

Die Erweiterungen für die Produkte Echo und Echo Dot werden Skills genannt und alle Informationen zur Programmierung etc. finden sich auf der Webseite zum Alexa-Skill-Kit.

Alexa ist nicht allein

Auch andere Anbieter sind beim Thema des maschinellen Lernens und der Umwandlung von Sprache in Text sowie zurück ganz vorne dabei:

– Die Software von Google für die automatische Spracherkennung ist unter dem Namen “Cloud Speech API” erhältlich und unterstützt bereits 110 Sprachen und Varianten: https://cloud.google.com/speech/

– Cortana von Microsoft sowie die Erweiterung Dictate für die Office-Produkte. Das sog. Microsoft Cognitive Toolkit ist die Softwarebasis darunter: https://www.microsoft.com/en-us/cognitive-toolkit/

– Auch Apple hat eine Diktierfunktion und für Siri steht das SiriKit bereit: https://developer.apple.com/sirikit/

1 Kommentare;

  1. Alex - 21. November 2018 von 9:30

    Ist schon echt klasse, was man zwischenzeitlich alles mit Alexa machen kann. Kein Wunder, dass immer mehr Menschen darauf zurückgreifen.

    Antworten

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *
Bitte beachte, dass sich Dein Kommentar auf den Artikel beziehen sollte. Wenn Du ein persönliches Kundenanliegen besprechen möchtest, wende Dich bitte an unseren Kundenservice auf Facebook, Twitter oder über unsere Support-Seite.

Datenschutz-Übersicht
SpaceHost - Webhosting, Domains, Server auf SSD

Diese Website verwendet Cookies, damit wir dir die bestmögliche Benutzererfahrung bieten können. Cookie-Informationen werden in deinem Browser gespeichert und führen Funktionen aus, wie die Wiedererkennung von dir, wenn du auf unsere Website zurückkehrst. Cookies helfen unserem Team zu verstehen, welche Abschnitte der Website für dich am interessantesten und nützlichsten sind.

Erforderliche Cookies

Unbedingt notwendige Cookies für wesentliche Funktionen zur Sicherstellung der Servicekontinuität und Standortsicherheit, sowie zur Speicherung deiner Auswahl für die Cookie-Einstellung.

Analyse-Cookies

Diese Website verwendet Google Analytics, um anonyme Informationen wie die Anzahl der Besucher der Website und die beliebtesten Seiten zu sammeln.

Diesen Cookie aktiviert zu lassen, hilft uns dabei, unsere Produkte, Dienstleistungen und das Benutzererlebnis zu verbessern.

Zusätzliche Cookies

Diese Website verwendet die folgenden zusätzlichen Cookies:

- VG Wort (Session-Cookie)

Dieses Cookie hilft, die Vergütung von gesetzlichen Ansprüchen von Autoren und Verlagen zu ermitteln und hilft, eine rechtmäßige Vergütung sicherzustellen.