Шпаргалка по "Геномике"

Автор: Пользователь скрыл имя, 20 Мая 2013 в 19:30, шпаргалка

Описание работы

Вопрос № 1. Молекулярные базы данных, их структура и подходы к поиску в них информации.
Вопрос № 2. Разнообразие геномов прокариот. Характерные особенности геномов, обеспечивающие адаптации к специфическим экологическим нишам (на примере: Dienococcus, Aquifex, Thermotoga).
Вопрос № 3. Молекулярные маркеры, используемые при картировании геномов (RFLP, SSLP, SNP, STS).
...
Вопрос № 15. Молекулярные механизмы транспозиции мобильных генетических элементов бактерий.

Работа содержит 1 файл

ответы по геномике.doc

— 1.74 Мб (Скачать)

Ответы  по ГЕНОМИКЕ (2010):

Вопрос  № 1. Молекулярные базы данных, их структура и подходы к поиску в них информации.

Основными задачами молекулярных  баз данных является: идентификация кодирующих последовательностей, идентификация регуляторных последовательностей, идентификация функций геномов. В аннотации геномных последовательностей существуют компьютерные методы и экспериментальные подходы.

Сейчас мы имеем большой  набор компьютерных программ, которые с разной эффективностью занимаются предсказанием кодирующих последовательностей. Здесь представлены основные программы.

 

Genebuilder - интересная программа т.к пытается без учета экспериментальных данных, на основании наших представлений по организации кодирующих последовательностей, искать некое подобие с этими доменами. Работает менее точно, зато позволяет найти те гены, которые не могут найти большинство программ и построена для эукариотических организмов.

Для того чтобы все эти программы работали, необходима информация. Информация организована в базы данных. Без базы данных невозможно работать с геномом т.к. это связано, во-первых, с лавинообразным родом информации, и её много, и человек не способен с этим разобраться. База данных дает не только необходимую информацию, но и инструмент для доступа к информации.

 

 

 

 

Краткий обзор биологических баз данных. Их можно разбить на нуклеотидные и белковые.

 

 

 

Нуклеотидные: EMBL( в Европе); GenBank( в Америке); DDBJ( в Японии)

Genbank - является нуклеотидной базой данных, создана давно, в 1979году. Чуть попозже в Европе.

Белковые бызы данных представлены 2-мя типами: 1) просто АК последовательности, является самой старой и первой – в 1965г. – PIR

 2) SWISS – PROT, является базой данных первичных структур белковых молекул, является наиболее информативной:

 

Базы данных можно идентифицировать по другому типу: на первичные и вторичные. Под первичными понимаются базы данных, куда заносятся экспериментально определенные базы. В соответствие с данной классификацией, под первичные попадают все нуклеотидные базы данных и PIR т.е. это база с экспериментально определенными белковыми последовательностями. Потом с появлением технологий ДНК, перестали это делать т.к. ДНК секвенировать гораздо дешевле, быстрее и это стало вторичным, т.е. запросы трансляции из нуклеотидной базы данных. В некоторых случаях секвенирование идет с N- конца т.к. начало ДНК для эукариотических белков не всегда можно определить и во многих случаях процессируются с N- конца и начало не соответствует старт-кодону и это для небольшого количества белка и это было отмечено в базе данных (вторичных).

Очень важный фактор, который нужно принимать во внимание – любая информация, как и в  базе данных, имеет достаточно много ошибок.

 

 

 Какого рода  ошибки: в аннотации (неточности, неполнота написанного). Как появляется ошибка: идет сравнение между собой и если найдена охарактеризованная последовательность и если есть высокое сходство с этой последовательностью – приписывается та же характеристика (к примеру, есть фермент пероксидаза и если при анализе последовательностити наблюдается высокое сходство, то делается вывод, что это пероксидаза). Еще одна ошибка: когда сбой в алгоритме т.е указывается кодирующая последовательность и указывает промотор с которого и идет инициация данной кодирующей последовательности. Но иногда так бывает! Чаще всего это просто ошибка. Но есть и экспериментальные ошибки в определении нуклеотидной последовательности (очень много замены нуклеотидов), но это не столь значительно! Гораздо хуже сдвиг рамки считывания (утрата буквы). И мы получаем либо часть рамки вообще не детектирована, либо как отдельный ген. Это проблема т.к при моделировании информации полной кодирующей последовательности, две последовательности вместо одной или на оборот. Это важно т.к мы изначально с этого стартуем. Другая проблема – при секвенировании эукариотических геномов т.к. некоторые участки могут вообще отсутствовать из-за ошибок организации геномного проекта. От этого никуда не денешься т.к. часть ДНК, к примеру, может вообще не клонироваться либо теряется при составлении нуклеотидной последовательности. В результате в базе данных представлены, как непрерывная последовательность, хотя на самом деле здесь отсутствуют фрагменты.

Еще один фактор, который необходимо принимать во внимание – это избыточность базы данных.

 

К примеру, одна и та же последовательность может быть представлена по-разному в различных базах данных. Источником такой проблемы являлось то, что различные лаборатории по- разному определяли нуклеотидную последовательность какого- либо гена и сразу в базу данных (к примеру, изначально половина генома E.coli была определена различными лабораториями). Вторая проблема: современные технологии секвенирования значительно меньше делает ошибок, чем старые и именно эти последовательности отличаются намного.

Вторая ситуация, когда геномные фрагменты частично перекрываются, здесь проблема связана с концами (инвертированные концы, неполный фрагмент и т.д.). Это так и попадает в базу данных, и когда вы делаете поиск, и если сюда попадает гомология, то вам выдают все эти последовательности. Это были основные причины избыточности базы данных.

Помимо основных баз данных, можно получить информацию используя специализированные базы данных.

 

Сайты Prints и Prodom, содержит информацию о консервативных участках белковой последовательности. Характеризуются белковые домены, а потом на основе баз данных этого сайта появилась информация о коротком мотиве, который детальным образом характеризует фермент.

Очень кратко разберем принципы, которые лежат в основе  работы различных программ, которые связывают данные последовательности между собой.

 

В 60-ых годах, одна из первых,  Маргарита Дайхофф сделала очень важное открытие для развития вот этой отрасли исследований. Т.е это биохимик, которая работала с консервативными белками и пыталась строить генетические деревья, следить пыталась за молекулярной эволюцией. И на основании анализа белков, она поняла, что отсутствует белковых последовательностей у различных цитохромах, выявила как происходит замена у различных оснований друг на друга у АК остатков и составила матрицы замещения. Т.е это таблица, где показано, с какой вероятностью одна АК меняется на другую. АК в таблице сгруппированы по группам: отрицательные, положительные, заряженные, гетеротрофные и т.д. Обычно замена одной из образования АК остатков сходной с той же самой группой, считается консервативной и с высокой вероятностью не меняет белок, а если замена с другой группы, то меняет структуру белка. Здесь представлены значения алгоритма замены на другую и все наглядно видно. Если является полярным и меняется АК состав, то получается отрицательное значение.

 

Когда были выявлены все закономерности, были предложены алгоритмы для сравнения этих последовательностей между собой. Очень простой принцип лежит  при сравнение этих последовательностей. При сравнение последовательностей, принцип схож с этим текстом, вот он (стих).

 

 Если есть  сходство между нуклеотидными  белковыми после-ми, то значит  у нас есть функциональная  информация. Т.е у бактерий происходят  сдвиги влево, вправо, сдвиги могут  быть очень длинными и это можно сопоставить друг с другом.

 

Самый простой  и наглядный способ сравнения  между собой – это написать одну последовательность здесь, а другую здесь и просто поставить точки, где совпадают буквы. Когда речь идет о белковой последовательности, то здесь сложнее т.к. кроме точек здесь еще расставляются коэффициенты. Получается сложность, много диагоналей, но за счет коэффициентов можно получить критерий, который называется главной диагональю. И вот её окончательный вид. Это фрагменты АК последовательности, где действительно традиционно родственны друг другу.

 

Вопрос  № 2. Разнообразие геномов прокариот. Характерные особенности геномов, обеспечивающие адаптации к специфическим экологическим нишам (на примере: Dienococcus, Aquifex, Thermotoga).

Сейчас несколько примеров, которые существенно отклоняются от стандартного бактериального генома(Слайд – особенности геномов экстремофилов – НЕТ!!!). Т.е. как правило это организмы, которые существуют в экстремальных экологических нишах. Несмотря на экстремальность вот этих ниш условия получаются достаточно стабильными, соответственно им не нужен такой крупный геном, поскольку нет необходимости иметь большое количество генов, ниша константная со стабильными условиями и геном получается компактным.

 Ну, во-первых, вот очень интересный огранизм  Dienococcus radiodurens

 его открытием связано даже несколько анекдотов. Факт в том, что относительно небольшой геном бактерии буквально нашпигован системами репарации и рекомбинации, причем содержит абсолютно все  известные гены, которые связаны с таким аварийным метаболизмом ДНК и значительную часть этих генов он содержит в нескольких копиях, так что это абсолютный чемпион по такому метаболизму ДНК. Дополнительные свойства, которые позволяют этим бактериям быть значительно менее чувствительными ко всяким воздействиям, во-первых, высокое содержание ГЦ-пар – 67%, то есть это достаточно много, очень мало бактерий имеют такое высокое, потому что сложнее реплицировать ГЦ богатые геномы, возникает ряд проблем. Больше бактерий имеет низкое содержание ГЦ пар.

Также интересная вещь касаемая вот этой бактерии, заключается  в том, как организован геном. Здесь стандартный геном это 4 репликона, два из них  называются хромосомами, хотя с некоторой точки  зрения такую хромосому можно было бы рассматривать как плазмиду потому, что по размерам она соответствует некоторым плазмидам. Но эта хромосома содержит абсолютно необходимые для жизни гены и более того вот эта хромосома, она сходна с хромосомой бактерии ТЕРМУС. Вот эта является достаточно обособленно ни на что не похожей, вот эта есть сходство с геномом термус акватикус, ну и вообще с другими видами термусов. Т.е поэтому ДЕАНОКОККУС и термусы  даже объединяются  в 1 группу, которая стоит обособленно от всех прочих бактерий. Ну и 2 вот этих кольцевых молекулы это уже однозначно плазмиды, которые выгодно можно удалить из этой клетки. Вот такой достаточно интересный геном, если говорить о  системах репликации вот таких вот репликонов, то вод здесь вот стандартной длины зависимая система инициации реполикации как у E.coli, а вот здесь плазмидного типа система репликации, есть ПАР локус, который обеспечивают сегрегацию, т.е. фактически, когда то была какой-то плазмидой, но накопила достаточно большое количество генов, необходимых для обеспечения жизнеспособности и теперь вот уже абсолютно необходимый репликон.

Ну вот также  характерная цифра, которая характерна для большинства свободно живущих организмов, более 90% ДНК является кодирующая, т.е. стандартная ситуация для патогенов.

Следующий зверь. Эта бактерия Aquatex aeolicus

океаническая. По способу получения энергии они являются хемолитоавтотрофами. То есть она автротрофная, но не за счет фотосинтеза, а за счет хемосинтеза получает энергию. Из  всех свободно живущих организмов эта бактерия интересна тем, что у инее минимальный геном. Который, 1,5миллиона нуклеотидных пар, т.е. минимум, меньшего генома у свободноживущих бактерий пока не обнаружено. Т.е  все более компактные геномы характерны для паразитов. Вот это абсолютный минимум, который встречается у автономно живущего организма.

 Прочие показатели  генома стандартны. Чуть меньше 50% содержания ГЦ пар, около 1,5 тыс. рамок считывания, 93% кодирующей ДНК. Вот очень интересная цифра: 16% генов показывает гораздо более высокое сходство с генами архей, чем с генами других бактерий. Археи и бактерии это 2 разных царства, даже надцарства организмов, т.е. это очень эволюционно очень сильно разделеннве группы и тем не менее имеют такое сходство. Откуда оно могло взяться? Оно могла взяться из горизонтального переноса генетической информации между вот этой бактерией и другими бактериями. Вернее археями которые населяют туже экологическую нишу. Глубоководная бактерия в зонах черных курильщиков, это глубоководные горячие минеральные источники, которые в ложе океана располагаются и там достаточно интересная экосистема получается: такие батерии, трубчатвые черви которыми они питаются, беспозвоночные и рыбы, которые питаются этими червями и беспозвоночными. Большая часть океана пустыня, а где есть источник энергии получаются такие микрооазисы, которые очень очень плотно заселены, в частности такими бактериями.

 

Другой организм который тоже там встречается Thermatora moritima

 является чемпионом в плане горизонтального переноса, 24% генов, которые имеют максимальную гомологию с археями. Тоже достаточно компактный геном, менее 2млн н.п. интересен этот геном, ну почему вообще взялись за эту Бактрию, в свое время она была 1 из первых секвинированных, потому что в геноме этой бактерии располагается достаточно большое количество генов отвечающих за метоболизм сахаров(7%), и сиквенс проводился для того, чтобы выяснить  где эти гены,  что это за гены, для использования в биотехнологии потому, что это термофил, в зоне горячих источников, следовательно, все эти ферменты являются термофильными и удобны для использования в промышленности. После того как выяснили гены этих ферментов, часть из них уже внедрена в практику.

Информация о работе Шпаргалка по "Геномике"