Detail publikace
pqsfinder: an exhaustive and imperfection-tolerant search tool for potential quadruplex-forming sequences in R
Martínek Tomáš, doc. Ing., Ph.D. (UPSY FIT VUT)
Zendulka Jaroslav, doc. Ing., CSc. (UIFS FIT VUT)
Lexa Matej, Ing., Ph.D. (UPSY FIT VUT)
Motivace: G-kvadruplexy (G4) jsou jedny z netypických DNA struktur, které byly pozorovány in vitro a pravděpodobně se utváří in vivo. Nedávné experimenty tuto hypotézu potvrzují. Ukazuje se, že kvadruplexy ovlivňují celou škálu molekulárních procesů v živých buňkách. Aby bylo možné kvadruplexy detailněji studovat, je potřebné přesně určit jejich možnou pozici v DNA sekvencích, kde by se mohly formovat.
Výsledky: V tomto článku prezentujeme nový softwarový balíček pro prostředí Bioconductor, který slouží k identifikaci potenciálních kvadruplexů. Výsledný software je jednoduše použitelný, ale zároveň flexibilní a rozšiřitelný. Umožňuje identifikaci nejen kanonických kvadruplexů, ale i takových, které se odlišují od běžných forem. Jednou z hlavních předností prezentovaného nástroje je kvalitní skórovací model, který byl natrénován na experimentálních datech a vykazuje vyšší přesnost než srovnatelné konkurenční programy. Náš nástroj pqsfinder dosahuje přesnosti 96 % na datové sadě 392 experimentálně charakterizovaných sekvencí. Navíc jsme jej otestovali na datové sadě z G4-seq experimentu, abychom ověřili, jak dobře dokáže identifikovat kvadruplexy nalezené touto technologií. Korelace predikcí našeho nástroje s G4-seq daty byla 0,618, nejvyšší ze všech současných nástrojů.
Softwarový balíček pqsfinder slouží k rychlé identifikaci sekvencí DNA, které pravděpodobně tvoří intramolekulární G-kvadruplex. G-kvadruplexy mají vliv na řadu důležitých molekulárních procesů v buňkách, nejčastěji jako pozitivní či negativní regulátor transkripce, nebo negativní regulátor replikace.
Od svého zveřejnění v roce 2016 byl pqsfinder každý rok stažen více než 1600 krát (podle veřejně dostupných statistik systému Bioconductor).
Software pqsfinder podporuje výzkum v oblasti buněčných regulačních procesů tím, že přesněji identifikuje oblasti DNA, které mohou tvořit tzv. intramolekulární G-kvadruplexy. G-kvadruplexy ovlivňují regulaci řady důležitých molekulárních procesů v buňkách
V budoucnu tak může pqsfinder pomoci objevit nové souvislosti mezi G-kvadruplexy v regulačních oblastech genů a některými nemocemi, a tím umožnit rychlejší nalezení nových léčebných postupů.
Od svého zveřejnění v roce 2016 byl pqsfinder každý rok stažen více než 1600 krát.
Související odborný článek byl dosud citován 12 mezinárodními časopiseckými publikacemi.
@ARTICLE{FITPUB11434, author = "Ji\v{r}\'{i} Hon and Tom\'{a}\v{s} Mart\'{i}nek and Jaroslav Zendulka and Matej Lexa", title = "pqsfinder: an exhaustive and imperfection-tolerant search tool for potential quadruplex-forming sequences in R", pages = "3373--3379", journal = "Bioinformatics", volume = 33, number = 21, year = 2017, ISSN = "1367-4803", doi = "10.1093/bioinformatics/btx413", language = "english", url = "https://www.fit.vut.cz/research/publication/11434" }