![]() |
ИСТИНА |
Войти в систему Регистрация |
ИСТИНА ФИЦ ПХФ и МХ РАН |
||
Разработка новых методов анализа геномных разметок. Кому этот текст нужен. Анализ сепульки в сепулькарии. Примепнеие Фурье-анализа для поиска корреляций везде, где только можно. Бюрократия заела. Я потратил час времени на эту ерунду, вместо того, чтобы работать. Новый метод анализа позволяет быстро (за несколько секунд) вычислять корреляции полногеномных разметок. Полноценные заявка и отчет представлены тому, кто давал финансирование - РФФИ.
Development of new methods for analyzing genomic markings. To this text is needed. Analysis sepulka in sepulkarii. Primepneie Fourier analysis to find correlations wherever possible. Bureaucracy devoured. I spent an hour on this stuff, rather than to work. A new analysis method allows fast (a few seconds) to calculate the correlation of genome-layouts. Complete the application and the report presented to the person who gave funding - Russian Federal Property Fund.
Промежуточные результаты - представлены в отчете РФФИ Аннотация (не более 1 стр.; описать содержание фактически проделанной работы и полученные результаты за 2014 год) На данном этапе было сделано дальнейшее развитие программы сравнения геномных разметок. В программу добавлено несколько новых функций — построение автокорреляционных функций, работа со сглаженными производными, анализ взаимных корреляций. Для визуализации результатов программа выдает скрипт для отрисовки графики в пакете R. Проведены сравнения для 40 типов разметок и 387 типов клеток — всего 34609 сравнений. Разработан веб-ресурс с представлением результатов по тканям и меткам. Объявленные ранее цели проекта на 2014 год К концу 2014 года, предполагается: 1. Провести массовое сравнение всех доступных эпигеномных профилей, полученных в результате проекта ENCODE (около 15 000 сравнений). 2. Разработать способ визуализации и сравнения результатов. 3. Создать соответствующий веб-ресурс. 4. Опубликовать статью с описанием метода и основных результатов массового анализа. 5. Добавить к методу StereoGene возможность анализировать производные профилей. Степень достижения поставленных в проекте целей Цели достигнуты полностью за исключением публикации статьи. Можно было бы эту работу опубликовать в журнале второго эшелона (например в журнале Bioinformatics), Однако для публикации в более рейтинговом журнале необходимо иметь более яркие примеры, поиском которых мы и занимались. Полученные в 2014 году важнейшие результаты Отчетный год был посвящен усовершенствованию программы сравнения геномных разметок StereoGene, и проведению массовых расчетов. Программа была дополнена следующей функциональностью: вычисление построение взаимной корреляционной функции, которая показывает степень дальнодействия взаимной корреляции разметок. Построение автокорреляционных функций для разметок. Построение корреляций для сглаженных производных профилей. Построение корреляций на подпространстве, ортогональном заданному профилю. Этот прием позволяет исключить корреляцию двух профилей, обусловленную тем, что они сами по себе скоррелированы с третьим профилем. Возможность использовать линейные комбинации профилей в качестве входных данных. Формирование R-скрипта для построения графиков Возможность отдельного рассмотрения хромосом. Применение программы для различных типов входных данных позволил, во-первых, подтвердить известные взаимодействия, такие как корреляции мест связывания когезинов и фактора CTCF, перепредставленность метки H3K36me в генах и особенности поведения этой метки на границах генов, структура профиля промоторной (H3K3me3) и энхансерной (H3K3me1) меток в окрестностях стартов генов (рис.1). Обнаружено отличие распределений на хромосомах, по-видимому, связанное с различием плотности генов, в частности, конститутивных. В целом ряде случаев обнаружено странное поведение взаимной корреляционной функции — странный пик в середине провала, как это видно, например, на рис. 1Г. Появление этого пика скорее всего говорит о систематической ошибке эксперимента, связанной либо с неоднозначным картированием, либо с неспецифическим узнаванием антителами. Было проведено сравнение меток стартов транскрипции, полученных методом CAGE из базы данных FANTJM4 с геномной разметкой. Обнаружено странное явление — есть статистически значимая фракция CAGE-кластеров, ассоциированных со стартами интронов. Детальный анализ показал, что по координатам эта ассоциация весьма точная — CAGE-кластеры с точностью до нуклеотида совпадают с донорными сайтами сплайсинга. Природа этого явления не ясна. Разработана форма представления данных в виде веб-ресурса. Основные результаты сведены по адресу http://makarich.fbb.msu.ru/lena/tissue_feature/html/main_table.html. А Б В Г Рис.1. Распределение коэффициентов корреляции (верхний рисунок) и взаимной корреляции (нижний рисунок) Красная линия отвечает фоновому распределению для перемешанных окон, синяя — наблюдаемое распределение . А — распределение метки H3K36me3 относительно концов генов; Б - Распределение «энхнсерной» метки H3K4me1 относительно стартов генов; В — распределение «промоторной» метки H3K4me3 относительно стартов генов; Г — сравнение распределений по всему геному (синяя линия) и по хромосоме 13 (зеленая линия). Степень новизны полученных результатов. Разработанная программа StereoGene является новой как по алгоритму, так и по типу получаемой информации. Полномасштабное сравнение эпигенетических профилей проведено впервые. Сопоставление полученных результатов с мировым уровнем Разработанная программа StereoGene является новой как по алгоритму, так и по типу получаемой информации. Ресурсов, показывающих полномасштабное сравнение геномных разметок для различных типов меток и тканей в интернете не обнаружено. Для тех случаев, когда взаимодействие разметок ожидается или известно наш метод позволяет получить аналогичные результаты. Обнаружен ряд новых феноменов, в частности перепредставленность CAGE-кластеров н адонорных сайтах интронов. Программа StereoGene показывает высокую скорость работы — одно полногеномнгое сравнение требует менее одной минуты на стандартном компьютере. Методы и подходы, использованные в ходе выполнения проекта (описать, уделив особое внимание степени оригинальности и новизны) Использован подход вычисления корреляций с ядром, который позволяет учитывать не только значения профилей в одной точке, но также позволяет учитывать окрестности. Для оценки статистической значимости использовано разбиение исходных данных на окна фиксированного размера. Перемешивание окон позволяет получить фоновое распределение. Вычисление корреляций основано на быстром преобразовании Фурье. Предложенный подход является новым. Участие в 2014 году в научных мероприятиях по тематике Проекта (указать названия мероприятий) Vinogradova SV RNASurface: comprehensive reconstruction of RNA structural profile. Poster, ISMB Бостон(США). Ставровская Е.Д., Фаворов А.В., Миронов А.А. Выявление эффекта транскрипции интронов с помощью корреляционного анализа (доклад). «Информационные технологии и системы — 2014», 1 - 5 сентября, Нижний Новгород. Адреса (полностью) ресурсов в Интернете, подготовленных авторами по данному проекту, например, http://makarich.fbb.msu.ru/lena/tissue_feature/html/main_table.html Цели на 2015 год, связь с основной задачей Проекта В 2015 году предполагается продолжить работу с программой StereoGene. В частности, предполагается: более детально исследовать CAGE-кластеры, ассоциированные с интронами. В частности проверить есть ли предпочтение типов генов, в которых это явление встречается, связано ли явление с уровнем экспрессии, воспроизводимо ли явление в разных экспериментах (например, для разных тканей) и тп. провести анализ корреляций сайтов связывания транскрипционных факторов из базы данных ENCODE между собой. проанализировать корреляции наблюденных сайтов связывания ТФ с эпигенетическими метками. проанализировать корреляции предсказанных сайтов связывания ТФ с эпигенетическими метками. планируется применить нашу программу для анализа других животных, в частности дрозофил с использованием базы modENCODE. Существующий ресурс основан на использовании большого количества файлов с результатами и может рассматриваться как пилотный. Поэтому перевести весь ресурс на СУБД. Опубликовать статью с описанием метода и основных результатов. Ожидаемые в конце 2015 г. научные результаты Новый веб-ресурс по результатам сравнения разметок Результаты анализа интрон-ассоциированных CAGE-кластеров. Результаты сравнения разметок сайтов связывания ТФ — наблюденными и предсказанными Результаты поиска корреляций разметок в модельных организмах (дрозофила) и сравнение с корреляциями, полученными для человека Опубликованная статья с описанием метода и основных результатов анализа. Объем финансирования на 2015 г. запрашиваемый в РФФИ (с предварительной расшифровкой затрат) 500000 Вознаграждения сотрудникам организации (с учетом НДФЛ и страховых взносов) - 221340 вознаграждения исполнителям по гражданско-правовым договорам (работы, услуги), которые одновременно являются получателями гранта (с учетом НДФЛ и страховых взносов) - 127100 Пополнение материальных запасов и приобретение запасных частей - 51560 Организационно-техническое сопровождение проекта - 100000 Перечень оборудования и материалов, которые необходимо дополнительно приобрести, изготовить или отремонтировать для успешного выполнения Проекта; обосновать необходимость его приобретения Дополительные диски к серверу; Картриджи для принтеров. Планируемая численность участников Проекта в 2015 году (цифрой) 7 Полный список членов коллектива на 2015 год (не более 10 человек, указать ФИО и должность) Артемов Артем Владимирович асп Виноградова Светлана Владимировна ст.преп. Журавлева Екатерина Владимировна асп Миронов Андрей Александрович Проф. Солдатов Руслан Андреевич Инж. Ставровская Елена Дмитриевна ст.преп. Фаворов Александр Владимирович н.сотр
грант РФФИ |
# | Сроки | Название |
1 | 1 января 2014 г.-31 декабря 2014 г. | Сравнительный анализ эпигеномных профилей |
Результаты этапа: На данном этапе было сделано дальнейшее развитие программы сравнения геномных разметок. В программу добавлено несколько новых функций — построение автокорреляционных функций, работа со сглаженными производными, анализ взаимных корреляций. Для визуализации результатов программа выдает скрипт для отрисовки графики в пакете R. Проведены сравнения для 40 типов разметок и 387 типов клеток — всего 34609 сравнений. Разработан веб-ресурс с представлением результатов по тканям и меткам. Интересно, а кто это прочитает. | ||
2 | 1 января 2015 г.-31 декабря 2015 г. | Сравнительный анализ эпигеномных профилей |
Результаты этапа: | ||
3 | 1 января 2016 г.-31 декабря 2016 г. | Сравнительный анализ эпигеномных профилей |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".