Die Identifizierung der längsten gemeinsamen Teilsequenz (LCS) biologischer Sequenzen hat bedeutende Anwendungen in der Bioinformatik. Aufgrund des zunehmenden Wachstums von Bioinformatik-Anwendungen werden neue biologische Sequenzen mit größerer Länge für die Verarbeitung verwendet, was eine große Herausforderung für sequenzielle LCS-Algorithmen darstellt. Es wurden zwar einige parallele LCS-Algorithmen vorgeschlagen, deren Effizienz und Effektivität sind jedoch angesichts der zunehmenden Komplexität und Größe biologischer Daten nicht zufriedenstellend. Um die Einschränkungen bestehender LCS-Algorithmen zu überwinden und unter Berücksichtigung des MapReduce-Programmiermodells als vielversprechende Technologie für kostengünstiges, leistungsstarkes Parallelcomputing wurde ein MapReduce-basierter Parallelalgorithmus für LCS entwickelt. Dieser Ansatz nutzt die Konzepte von Nachfolgertabellen, identischen Zeichenpaaren, Nachfolgerbäumen und der Durchquerung von Nachfolgerbäumen, um die längste gemeinsame Teilsequenz zu finden. Zur Realisierung des MapReduce-Modells wird das Hadoop-Framework verwendet.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







