000529330 001__ 529330
000529330 005__ 20240927184632.0
000529330 0247_ $$aG:(GEPRIS)260050394$$d260050394
000529330 035__ $$aG:(GEPRIS)260050394
000529330 040__ $$aGEPRIS$$chttp://gepris.its.kfa-juelich.de
000529330 150__ $$aBayessches Lernen einer hierarchischen Repräsentation von Sprache aus gesprochener Eingabe$$y2014 - 2018
000529330 371__ $$aProfessor Dr.-Ing. Reinhold Häb-Umbach
000529330 450__ $$aDFG project G:(GEPRIS)260050394$$wd$$y2014 - 2018
000529330 5101_ $$0I:(DE-588b)2007744-0$$aDeutsche Forschungsgemeinschaft$$bDFG
000529330 550__ $$0G:(GEPRIS)172415596$$aSPP 1527: Autonomes Lernen$$wt
000529330 680__ $$aDas Ziel dieses Projekts ist das Erlernen einer hierarchischen Repräsentation von Sprache alleine aus dem akustischen Sprachsignal. Auf der untersten Ebene werden die akustischen Elementareinheiten, d.h. Phoneme oder ähnliche Wortuntereinheiten, entdeckt und Modelle dafür trainiert, während auf der nächsten Ebene die lexikalischen Einheiten, d.h. die Wörter, segmentiert und Wahrscheinlichkeiten für sie gelernt werden sollen. Schließlich sollen semantisch interpretierbare Wortkategorien gefunden werden. Besondere Aufmerksamkeit wird darauf gelegt, dass der Wortschatz im Prinzip unbegrenzt ist und dass gesprochene Sprache eine extreme Variabilität besitzt. Beiden Umständen wird durch Verwendung eines Bayesschen Ansatzes Rechnung getragen. Um zu ermöglichen, dass das Vokabular mit der Menge der Eingangssprache wachsen kann, werden nichtparametrische Bayes'sche Methoden verwendet, insbesondere solche, die auf Dirichlet und Pitman-Yor Prozessen basieren, bei denen die Anzahl der Parameter vorab nicht festgelegt werden muss sondern mit der Menge der zur Verfügung stehenden Daten wachsen kann. Die Variabilität der gesprochenen Eingabe führt zu Mehrdeutigkeiten und Fehlern bei der Entdeckung der Wortuntereinheiten. Diesen wird dadurch begegnet, dass vorschnelle Entscheidungen über die Phonemidentität vermieden werden und Phonem- und Worterkennung in einem gemeinsamen probabilistischen Modell erfolgen, für das effiziente Inferenzverfahren entwickelt werden sollen. Neben Anwendungen in der Sprachverarbeitung sind die zu entwickelnden Methoden auch für andere Lernprobleme aus sequentiellen, hochvariablen Sensordaten mit einer unbekannten Anzahl von zu lernenden Modellen von Interesse.
000529330 909CO $$ooai:juser.fz-juelich.de:955061$$pauthority$$pauthority:GRANT
000529330 909CO $$ooai:juser.fz-juelich.de:955061
000529330 980__ $$aG
000529330 980__ $$aAUTHORITY