Самостоятельный проект-Анализ транскриптома c помощью R studio
2 000 руб. за проект
Самостоятельный проект. Анализ транскриптома
Задание основано на материалах статьи Ryu HY et al., "Distinct adaptive mechanisms drive recovery from aneuploidy caused by loss of the Ulp2 SUMO protease.", Nat Commun, 2018 Dec 21;9(1):5417 . PMID: 30575729 , PMCID: PMC6303320 , DOI: 10.1038/s41467-018-07836-0
Вам для анализа необходимо взять только данные секвенирования РНК для штаммов после 50 поколений; у каждого свой набор данных (WT --- три повторности для штамма с нормальной копией гена ULP2, del --- три повторности для штамма с делецией):
WT: SRR8126634, SRR8126640, SRR8126643; del: SRR8126661, SRR8126666, SRR8126668
Вам необходимо провести следующий набор анализов:
А. Первичный анализ данных секвенирования с помощью Galaxy.
Оцените качество “сырых” прочтений с помощью FastQC, подберите параметры для фильтрации.
Отфильтруйте прочтения с помощью fastp (при необходимости).
Повторно оцените качество прочтений после фильтрации.
Выровняйте отфильтрованные прочтения на геном S.cerevisiae.
Рассчитайте покрытия CDS генома дрожжей прочтениями с помощью htseq.
Б. Анализ дифференциальной экспрессии генов.
Объедините информацию о прочтениях в единую таблицу.
Проверьте сходимость повторностей с помощью анализа главных компонент.
Проведите поиск генов, экспрессия которых изменяется при делеции гена ULP2 по сравнению с штаммом дикого типа. В качестве уровня значимости выбирайте 5%, в качестве порогового значения для изменения экспрессии возьмите 2 раза. Обязательно введите корректировку для logFoldChange методом apeglm.
Проиллюстрируйте полученные результаты. Обязательно постройте диаграммы Венна и Volcano Plot. Если сочтёте нужным, приведите дополнительные иллюстрации.
Сформулируйте гипотезы о возможных причинах наблюдаемых эффектов на основании информации из литературы и баз данных.
Решение задания должно быть включать в себя три файла:
Файл с информацией о количествах прочтений для разных генов, который был использован для анализа дифференциальной экспрессии (формат .csv или .tsv).
Комментированный скрипт для обработки результатов в R.
PDF файл с отчётом и иллюстрациями. Отчёт должен содержать следующие разделы:
Цель: самостоятельно сформулируйте биологически осмысленную цель всей работы.
Материалы: кратко опишите использованные данные (найдите по описанию SRR в соответствующей базе данных). Укажите, какой геном был использован в качестве референсного.
Методы: опишите основные этапы анализа (постарайтесь сформулировать своими словами), поясните выбор конкретных параметров обработки данных (например, фильтрации прочтений). Вставьте необходимые иллюстрации. Обязательно приведите список файлов из папки Results (см. выше) и кратко опишите содержимое этих файлов (например: файл a.fastq -- прочтения после фильтрации).
Результаты и обсуждение: опишите и прокомментируйте проведённый вами анализ дифференциальной экспрессии генов и полученные результаты. Обязательно проиллюстрируйте результаты графически. Предложите гипотезы, объясняющие полученные результаты.
Выводы.
Задание основано на материалах статьи Ryu HY et al., "Distinct adaptive mechanisms drive recovery from aneuploidy caused by loss of the Ulp2 SUMO protease.", Nat Commun, 2018 Dec 21;9(1):5417 . PMID: 30575729 , PMCID: PMC6303320 , DOI: 10.1038/s41467-018-07836-0
Вам для анализа необходимо взять только данные секвенирования РНК для штаммов после 50 поколений; у каждого свой набор данных (WT --- три повторности для штамма с нормальной копией гена ULP2, del --- три повторности для штамма с делецией):
WT: SRR8126634, SRR8126640, SRR8126643; del: SRR8126661, SRR8126666, SRR8126668
Вам необходимо провести следующий набор анализов:
А. Первичный анализ данных секвенирования с помощью Galaxy.
Оцените качество “сырых” прочтений с помощью FastQC, подберите параметры для фильтрации.
Отфильтруйте прочтения с помощью fastp (при необходимости).
Повторно оцените качество прочтений после фильтрации.
Выровняйте отфильтрованные прочтения на геном S.cerevisiae.
Рассчитайте покрытия CDS генома дрожжей прочтениями с помощью htseq.
Б. Анализ дифференциальной экспрессии генов.
Объедините информацию о прочтениях в единую таблицу.
Проверьте сходимость повторностей с помощью анализа главных компонент.
Проведите поиск генов, экспрессия которых изменяется при делеции гена ULP2 по сравнению с штаммом дикого типа. В качестве уровня значимости выбирайте 5%, в качестве порогового значения для изменения экспрессии возьмите 2 раза. Обязательно введите корректировку для logFoldChange методом apeglm.
Проиллюстрируйте полученные результаты. Обязательно постройте диаграммы Венна и Volcano Plot. Если сочтёте нужным, приведите дополнительные иллюстрации.
Сформулируйте гипотезы о возможных причинах наблюдаемых эффектов на основании информации из литературы и баз данных.
Решение задания должно быть включать в себя три файла:
Файл с информацией о количествах прочтений для разных генов, который был использован для анализа дифференциальной экспрессии (формат .csv или .tsv).
Комментированный скрипт для обработки результатов в R.
PDF файл с отчётом и иллюстрациями. Отчёт должен содержать следующие разделы:
Цель: самостоятельно сформулируйте биологически осмысленную цель всей работы.
Материалы: кратко опишите использованные данные (найдите по описанию SRR в соответствующей базе данных). Укажите, какой геном был использован в качестве референсного.
Методы: опишите основные этапы анализа (постарайтесь сформулировать своими словами), поясните выбор конкретных параметров обработки данных (например, фильтрации прочтений). Вставьте необходимые иллюстрации. Обязательно приведите список файлов из папки Results (см. выше) и кратко опишите содержимое этих файлов (например: файл a.fastq -- прочтения после фильтрации).
Результаты и обсуждение: опишите и прокомментируйте проведённый вами анализ дифференциальной экспрессии генов и полученные результаты. Обязательно проиллюстрируйте результаты графически. Предложите гипотезы, объясняющие полученные результаты.
Выводы.
В заказе есть исполнитель
При переводе заказа из архивного в актуальный, текущий исполнитель будет снят с задачи.
Выберите тип сделки
С безопасной сделкой вы всегда сможете вернуть средства, если что-то пойдет не так. С простой сделкой вы самостоятельно договариваетесь с исполнителем об оплате и берете на себя решение конфликтов.