Compressed Suffix Trees: Design, Construction, and Applications
Coordinator
Professor Dr. Enno Ohlebusch
Grant period
2012 - 2020
Funding body
Deutsche Forschungsgemeinschaft
DFG
Identifier
G:(GEPRIS)206825075
Note: Wenn ein Text (z.B. die DNA-Sequenz eines Chromosoms) oder eine Sammlung von Texten (z.B. mehrere Chromosomen oder Genome) nicht oder nur selten verändert wird, dann lohnt es sich in vielen Anwendungen den Text in einem Vorverarbeitungsschritt zu indizieren. Die erstellte Index-Datenstrukutur wird dann benutzt, um Anwendungen (z.B. den Vergleich zweier Genome) zu beschleunigen. Ein wesentliches Problem tritt bei der automatischen Verarbeitung von großen Datenmengen auf: Wenn der Index nicht mehr vollständig in den Hauptspeicher des benutzten Rechners passt, müssen Teile in den Sekundärspeicher ausgelagert werden. Da dies zu erheblichen Effizienzverlusten führt, ist es das Ziel des Projektes, eine Bibliothek von grundlegenden Algorithmen zur Konstruktion von „sehr kleinen“ Index-Datenstrukturen zu erstellen, die auch bei sehr großen Texten noch im Hauptspeicher gehalten werden können. Die Bibliothek soll auch Anwendungsalgorithmen auf diesen Index-Datenstrukturen zur Verfügung stellen. Weiterhin sollen die Algorithmen und Datenstrukturen in einem Kooperationsprojekt integriert werden.
Recent Publications
There are no publications
Record created 2023-02-02, last modified 2024-09-27