Please use this identifier to cite or link to this item: http://hdl.handle.net/11452/12512
Title: A new automata based approximate string matching approach and web interface for bioinformatics algorithms
Other Titles: Başlıca biyoinformatik algoritmaları için web ara yüzü ve yeni otomat tabanlı yaklaşık desen eşleştirme yaklaşımı
Authors: Koca, Burak
Bursa Uludağ Üniversitesi/Mühendislik Fakültesi/Bilgisayar Mühendisliği Bölümü.
Özcan, Gıyasettin
Keywords: Bioinformatics
A-BOM
Interface
Approximate pattern matching
Biyoinformatik
Ara yüz
Yaklaşık desen eşleştirme
Issue Date: 16-Oct-2018
Publisher: Bursa Uludağ Üniversitesi
Citation: Koca, B. ve Özcan, G. (2018). "A new automata based approximate string matching approach and web interface for bioinformatics algorithms". Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 23(3), 91-102.
Abstract: In this study, we present a new web interface for major bioinformatics algorithms and introduce a novel approximate string matching algorithm. Our web interface executes major algorithms on the field for the use of computational biologists, students or any other interested researchers. In the web interface, algorithms come under three sections: Sequence alignment, pattern matching and motif finding. In each section, we introduce algorithms in order to find best fitting one for specific dataset and problem. The interface introduces execution time, memory usage and context specific results of algorithms such as alignment score. The interface utilizes emerging open source languages and tools. In order to develop light and user-friendly interface, all parts of the interface coded with Python language. On the other hand, Django is used for web interface. Second contribution of the study is novel A-BOM algorithm, which is designed for approximate pattern matching problem. The algorithm is approximate matching variation of Backward Oracle Matching. We compare our algorithm with popular approximate string matching algorithms. Results denote that A-BOM introduces %30 to %80 short runtime improvement when compared to current approximate pattern matching algorithms on long patterns.
Bu çalışmada temel biyoinformatik algoritmaları için yeni bir web ara yüzü ve özgün bir yaklaşık desen eşleştirme algoritması sunmaktayız. Web ara yüzümüz biyologlar, öğrenciler ve ilgili araştırmacılar için bu alandaki temel algoritmaları çalıştırmaktadır. Web ara yüzünde algoritmalar üç bölüm altında toplanmaktadır: Dizilim hizalama, desen eşleştirme ve motif bulma. Her bir bölümde, özgül veri seti ve problemlere en iyi uyan algoritmanın bulunabilmesi için sonuçlarını karşılaştırabilecekleri algoritmalar sunulmaktadır. Web ara yüzü çalışma süreleri, hafıza kullanımı ve hizalama skoru gibi konuya özel sonuçları sunmaktadır. Ara yüz yeni geliştirilen açık kaynak kodlu dilleri ve araçları kullanmaktadır. Hafif ve kullanıcı dostu bir ara yüz olması amacıyla ara yüzün tüm kısımları Python dili ile kodlanmıştır. Diğer yandan web ara yüzü için Django kullanılmıştır. Çalışmanın ikinci katkısı, yaklaşık desen eşleştirme için tasarlanmış yeni A-BOM algoritmasıdır. Bu algoritma Backwards Oracle Matching algoritmasının yaklaşık varyasyonudur. Algoritmamızı popüler yaklaşık desen eşleştirme algoritmaları ile kıyasladık. Sonuçlar, A-BOM algoritmasını güncel yaklaşık desen eşleştirme algoritmaları ile uzun desenler üzerinde karşılaştırdığımızda, çalışma süresinde %30 ile %80 arasında kısalma gelişimi olduğunu göstermektedir.
URI: https://dergipark.org.tr/tr/download/article-file/562051
http://hdl.handle.net/11452/12512
ISSN: 2148-4147
2148-4155
Appears in Collections:2018 Cilt 23 Sayı 3

Files in This Item:
File Description SizeFormat 
23_3_8.pdf1.09 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons