GLT11 - v1.9-aep

Grazer Linuxtage 2011

Referenten
Peter Grasch
Programm
Tag Grazer Linuxtage 2011 - 2011-04-09
Raum HS 4
Beginn 13:00
Dauer 00:25
Info
ID 23
Veranstaltungstyp Vortrag
Track Entwickler
Sprache der Veranstaltung deutsch

Freie Spracherkennung mit simon

Dieser Vortrag gibt einen kurzen Überblick über die Spracherkennungssoftware simon, ihren aktuellen Entwicklungsstand und die Möglichkeiten die das System eröffnet.

simon ist eine Spracherkennungslösung basierend auf Julius und HTK.

Das Projekt entstand aus der Idee heraus behinderten Personen die aufgrund einer körperlichen Einschränkung keinen anderen Zugang zur Schriftsprache haben eine Möglichkeit zu geben mit Ihre Sprache zu schreiben. Allerdings mussten wir in der Praxis feststellen, dass derzeit verfügbare kommerzielle Lösungen zu sehr an das "Standarddeutsch" gebunden ist, um mit begleitenden Sprachbeeinträchtigungen umzugehen.

Anders als kommerzielle Lösungen bietet simon deshalb die Möglichkeit das komplette Sprach- und Akustikmodell des Systems frei zu gestalten. simon ist somit komplett Sprach- und Dialektunabhängig. simon arbeitet außerdem nicht mit fix definierten Reaktionen auf ein gewisses Erkennungsergebnis sondern lässt sich auch hier komplett frei konfigurieren.

Die verschiedenen Typen von Aktionen sind über Plug-Ins realisiert und können so jederzeit erweitert werden.

Die aktuelle Version 0.3 inkludiert bereits das neue Szenariosystem bei dem verschiedene simon Benutzer Ihre Konfiguration online direkt über simon austauschen können. Diese Sammlung an speziellen simon Konfigurationen für Anwendungsfälle beinhaltet bereits fertige Pakete zur Steuerung von Firefox, XBMC, OpenOffice, Amarok und vieles mehr.

Eine kleine Demonstration der aktuellen stabilen Version kann auf Youtube gefunden werden: http://www.youtube.com/watch?v=bjJCl72f-Gs

Dieser Vortrag gibt einen Einblick in die Architektur und die Funktionen von simon und zeigt wie das System in der Praxis verwendet werden kann.