DFG project G:(GEPRIS)555465011

Das Verschmelzen von formalen Methoden und Lerntechniken für die Strategiesynthese in partiell beobachtbaren Markov-Entscheidungsprozessen

CoordinatorProfessor Dr. Joost-Pieter Katoen
Grant period2025 -
Funding bodyDeutsche Forschungsgemeinschaft
 DFG
IdentifierG:(GEPRIS)555465011

Note: In diesem Projekt befassen wir uns mit dem Problem der Strategiesynthese für teilweise beobachtbare Markov-Entscheidungsprozesse (POMDPs). Obwohl dieses Problem im Allgemeinen unentscheidbar ist, gibt es in der Literatur Teillösungen unter Verwendung von semi-Algorithmen. Diese Ansätze stammen entweder von formalen Methoden, die sich auf eine partielle Entfaltung des typischerweise unendlichen Glaubensraums des POMDP stützen, oder von Lerntechniken, die Stichprobenverfahren verwenden. Formale Methoden bieten starke Garantien, lassen sich aber nicht gut auf große Systeme skalieren, während Lerntechniken größere Systeme handhaben können, aber keine robusten Korrektheitsgarantien bieten. In diesem Projekt wollen wir beide Ansätze zu einem umfassenden Rahmenwerk verschmelzen, das auf große Systeme angewendet werden kann und gleichzeitig die starken Garantien der formalen Methoden beibehält. Unsere neuen Algorithmen werden Techniken der Modellprüfung und des Lernens integrieren, einschließlich Techniken des Automatenlernens, der probabilistischen Modellprüfung, der Analyse von Gegenbeispielen, der probabilistischen Programmverfeinerung und der Monte Carlo Baumsuche mit symbolischen Hinweisen. Außerdem werden wir spezielle Fälle untersuchen, in denen die Entscheidbarkeit wiederhergestellt werden kann, insbesondere indem wir zeigen, wie Multi-Environment-MDPs und parametrische MDPs als entscheidbare Unterklassen von POMDPs betrachtet werden können.
   

Recent Publications

There are no publications


 Record created 2025-03-20, last modified 2025-03-20



Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)