Система поиска кластеров регуляторных элементов

в длинных геномных последовательностях

(демонстрационная версия)

Алгоритм

    Кластеры регуляторных элементов определяются как сгущения предсказанных сайтов связывания. Для предсказания сайтов предполагается использовать различные подключаемые модули, впрочем, специфика задачи не предъявляет высоких требований к точности предсказания сайтов, что позволяет использовать простые и быстрые алгоритмы. Так для поиска сайтов применяется выборка сайтов из базы TRRD, сравнение фрагментов последовательности с образцом производится с биномиальной функцией расстояния (без вставок и делеций), порог определяется исходя из требования, чтобы ожидаемое число случайных ответов на последовательности заданной характерной длины было меньше 1.

Тестовая задача

    Для тестирования системы выбрана последовательность бета-глобинового кластера человека (EMBL: HSHBB). На данной последовательности известны позиции 21-го регуляторного района в пяти генах и локус-контролирующем районе.

    При выбранных параметрах кластеризации, мы получили 34 предсказанных района, структуру которых, включая имена гомологов предсказанных сайтов, имена их факторов связывания и обратные ссылки на базу TRRD, можно визуализировать в Java - апплете:

predictionViewer/out_picker_out-e0.10_r100_30-560.html

predictionViewer/out_picker_out-e0.10_r100_670-1620.html

predictionViewer/out_picker_out-e0.10_r100_3420-4070.html

predictionViewer/out_picker_out-e0.10_r100_5340-5940.html

predictionViewer/out_picker_out-e0.10_r100_6440-7580.html

predictionViewer/out_picker_out-e0.10_r100_8000-8900.html

predictionViewer/out_picker_out-e0.10_r100_9010-10460.html

predictionViewer/out_picker_out-e0.10_r100_10610-11560.html

predictionViewer/out_picker_out-e0.10_r100_11660-12540.html

predictionViewer/out_picker_out-e0.10_r100_14060-14730.html

predictionViewer/out_picker_out-e0.10_r100_14840-15510.html

predictionViewer/out_picker_out-e0.10_r100_15610-16120.html

predictionViewer/out_picker_out-e0.10_r100_16820-17450.html

predictionViewer/out_picker_out-e0.10_r100_19380-20760.html

predictionViewer/out_picker_out-e0.10_r100_20870-22030.html

predictionViewer/out_picker_out-e0.10_r100_22150-22820.html

predictionViewer/out_picker_out-e0.10_r100_25140-25770.html

predictionViewer/out_picker_out-e0.10_r100_28940-29560.html

predictionViewer/out_picker_out-e0.10_r100_29900-30470.html

predictionViewer/out_picker_out-e0.10_r100_32810-33640.html

predictionViewer/out_picker_out-e0.10_r100_34530-35840.html

predictionViewer/out_picker_out-e0.10_r100_39560-40170.html

predictionViewer/out_picker_out-e0.10_r100_40270-40780.html

predictionViewer/out_picker_out-e0.10_r100_41760-42280.html

predictionViewer/out_picker_out-e0.10_r100_45140-46010.html

predictionViewer/out_picker_out-e0.10_r100_49570-50420.html

predictionViewer/out_picker_out-e0.10_r100_50540-51090.html

predictionViewer/out_picker_out-e0.10_r100_52120-52760.html

predictionViewer/out_picker_out-e0.10_r100_53680-54280.html

predictionViewer/out_picker_out-e0.10_r100_55880-56400.html

predictionViewer/out_picker_out-e0.10_r100_57930-58560.html

predictionViewer/out_picker_out-e0.10_r100_58660-59250.html

predictionViewer/out_picker_out-e0.10_r100_61050-61680.html

predictionViewer/out_picker_out-e0.10_r100_67470-68010.html

     В дальнейшем планируется подключить к программе поиск в TRRD и визуализацию гомологов предсказанных регуляторных районов, что позволит экспертам - биологам сравнивать предсказания с реальными регуляторными районами.


Institute of Cytology and Genetics

This resource has been developed in Institute of Cytology and Genetics. Novosibirsk, Russia

Authors: Alexander Poplavsky
Contributors: Mihail Pozdniakov, Nikolay Podkolodny
Leader: N.A. Kolchanov