Шпаргалка по "Геномике"

Автор: Пользователь скрыл имя, 20 Мая 2013 в 19:30, шпаргалка

Описание работы

Вопрос № 1. Молекулярные базы данных, их структура и подходы к поиску в них информации.
Вопрос № 2. Разнообразие геномов прокариот. Характерные особенности геномов, обеспечивающие адаптации к специфическим экологическим нишам (на примере: Dienococcus, Aquifex, Thermotoga).
Вопрос № 3. Молекулярные маркеры, используемые при картировании геномов (RFLP, SSLP, SNP, STS).
...
Вопрос № 15. Молекулярные механизмы транспозиции мобильных генетических элементов бактерий.

Работа содержит 1 файл

ответы по геномике.doc

— 1.74 Мб (Скачать)

Чтобы последовательно  приближаться к решению проблемы картирования генов человека, было сформулировано пять основных целей: 1) завершить составление детальной  генетической карты, (1 млн оснований  принято называть 1 мегабаза, сокращенно Мб, от англ. слова base - основание), 2) составить физические карты каждой хромосомы (разрешение 0,1 Мб), 3) получить карту всего генома в виде охарактеризованных по отдельности клонов (5 тыс. оснований в клоне, или 5 килобаз, Кб), 4) завершить к 2004 году полное секвенирование ДНК (разрешение 1 основание) и 5) нанести на полностью завершенную секвенсовую карту все гены человека (к 2005 году).

В ходе проекта  создают последовательно три  типа карт хромосом: генетические, физические и секвенсовые (от англ. слова sequence - последовательность). Выявление всех генов, присутствующих в геноме человека, и установление хотя бы примерного расстояния между ними позволят локализовать каждый ген в хромосомах. В 1995 году степень изученности положения генов была такова, что в среднем расстояние между двумя изученными генами составляло около 10 Мб (говорят, что разрешение на этой карте достигло 10 Мб). Второй тип карт - это физические карты хромосом. Еще в 60-е годы цитогенетики использовали методы окрашивания хромосом для выявления так называемых бэндов (поперечных полосок) на хромосомах. Полосы можно было физически заметить в микроскоп.

Наконец, разработка методов изучения точных последовательностей  нуклеотидов в ДНК, или методов  секвенирования, открыла путь к созданию секвенсовых карт, на которых степень разрешения доведена до своего максимального значения: на этих картах должно быть указано положение всех нуклеотидов в ДНК.

ДВА ПОДХОДА  К КАРТИРОВАНИЮ ГЕНОМОВ

 

Были предложены два кардинально различающихся по методологии подхода для картирования генов, их условно назвали "сверху вниз" и "снизу вверх". Первый, когда начинали работу со всей ДНК сразу и шли вниз (разрезали геномную ДНК на небольшое число кусков и анализировали их по отдельности, а затем воссоздавали всю начальную структуру), с успехом применили для генетического картирования малых по размеру геномов. Второй подход стали использовать для длинных геномов. В последнем случае нельзя было надеяться взять всю ДНК и нарезать ее на небольшое число кусков. Число их было бы столь большим, что путаница в последовательностях была бы неразрешимой. Поэтому шли снизу вверх: сначала секвенировали как можно более длинные, произвольно выбранные куски, затем прикладывали их друг к другу в надежде найти перекрывающиеся концевые участки. Как только находили перекрытие, куски объединяли в один (его называли контиг). С применением компьютерных и математических методов искали перекрытие все более крупных контигов и постепенно шли вверх выше и выше. Эту стратегию, в частности, успешно применили для 3-й хромосомы дрозофилы.

КРАТКИЙ АНАЛИЗ ОСНОВНЫХ ТЕХНИЧЕСКИХ ПОДХОДОВ К  КАРТИРОВАНИЮ ГЕНОМОВ

В последние 4-5 лет, исключительно благодаря проекту "Геном человека", были развиты  новые методы (так называемого  второго поколения), которые включают как главный компонент автоматизацию большинства процессов (табл. 1). Почему это направление стало центральным? Самая маленькая хромосома клеток человека содержит ДНК длиной 50 Мб, самая большая (хромосома 1) - длиной 250 Мб. При существовавших до 1996 года методах самый большой участок ДНК, выделяемый препаративно из хромосом, имел длину 350 тыс. оснований, и на самом лучшем оборудовании можно было секвенировать от 50 до 100 Кб в год при стоимости 1-2 доллара за основание. С такой скоростью можно было ожидать завершения работы по полному секвенированию ДНК человека за 30 тыс. дней непрерывной работы при стоимости только секвенирования (без учета всех остальных операций по выделению и обработке ДНК до секвенирования) 3 млрд долларов.

Улучшение к  началу 1998 года технологии позволило  аккуратно секвенировать 100 Кб в  день при стоимости около полудоллара  за основание. Таким образом, за год, если работать без выходных, можно  узнавать последовательности ДНК длиной 36,5 Мб.

БАНКИ ДАННЫХ О ГЕНОМЕ ЧЕЛОВЕКА

Любой специалист в мире может практически беспрепятственно войти банки данных и воспользоваться  для исследовательских целей  собранной там информацией. Решение  о доступности информации не было принято сразу, и потребовалась  значительная работа как ученых, так юристов и законодателей, чтобы воспрепятствовать первоначальному желанию многих фирм, особенно коммерческих, патентовать все получаемые последовательности генов, закрыть их для доступа и коммерциализировать эту научную область.

КРАТКАЯ ХАРАКТЕРИСТИКА РЕЗУЛЬТАТОВ ВЫПОЛНЕНИЯ ПРОГРАММЫ

Изученные гены человека. С января 1995 до января 1996 года длина участков ДНК человека, для  которых была установлена полная последовательность оснований, увеличилась  почти в 10 раз. Но хотя прогресс был  налицо, однако все, что было сделано за год, составляло менее одной тысячной процента человеческого генома. Но уже к июлю 1998 года было секвенировано почти 9% всего генома , а затем каждый месяц приносил новые замечательные результаты. Параллельно изучили большое числе копий генов в виде сДНК, их последовательности сопоставили с участками хромосомной ДНК, и стало ясно, что к 23 октября 1998 года установлены последовательности 30 181 гена человека. К 11 ноября того же года число секвенированных генов достигло 30 261. Тем самым получена информация примерно для половины всех генов человека.

Была получена исключительно интересная информация о вовлеченности генов в образование  и функционирование отдельных органов  и тканей человеческого тела (рис. 3). Оказалось, что самое большое число генов необходимо для формирования мозга и поддержания его активности, а самое маленькое для создания эритроцитов - всего 8 генов.

 

вот цифры,  которые к сожалению постоянно «плавают», ну вот эухромотиновая часть генома, которая секвенирована, она около 2,2 млрд. нуклеотидных пар, полный размер генома будет чуть-чуть больше 3 миллиардов. Вот это цифра – количества генов – она к сожалению варьирует достаточно часто, когда я последний раз смотрел, это было около года назад, было 22-23 тысячи, оценка приблизительная, фактически за полгода перед этим 25 тысяч было написано, зависит от того как программа перенастроена.  Средняя длина гена – 50 тысяч нуклеотидных пар, это очень крупные гены, большинство других организмов имеют гораздо меньшие размеры. В том числе и многие позвоночные, но большинство млекопитающих такой размер имеет. Средний ген состоит из 10 экзонов, т.е. экзонов много, но встречаются гены и без интронов, на удивление много – около 8% генов, вообще не имеют интронов. Вот важная цифра – средняя длина кодирующей последовательности – около полутора тысяч кодонов, т.е. получается, что генов не так много, но их продуктами являются достаточно крупные белки, если вот сравнить с бактериями, то стандартный белок бактерии это 300 аминокислотных остатков. Т.е. у нас в пять раз больше чем бактериальный белок по размерам. Ещё две цифры, которые достаточно важны: около 40 % генома это интроны, ну соответственно гены занимают чуть больше 40 % во всём геноме, но большая часть этих последовательностей не кодирующая(самому интересно – спросить на консультации). Относительно не большое количество сегментов дупликации, а вот всё остальное около 70 % это транспозоны.  Интересным является то, что нуклеотидный состав является очень не однородным, по геному, и можно выявить несколько тенденций при анализе нуклеотидного состава. Ну вот в частности, вообще геном человека А-Т богатый, т.е. среднее Г-Ц содержание около 40 %, это не очень высокое значение. Если взять кодирующую часть генома, т.е. фактически гены посмотреть, то мы получаем совсем другое распределение, вот оно: имеется существенный сдвиг в Г-Ц богатую область. Это связано с тем, что кодирующая часть имеет гораздо более высокий Г-Ц состав. Ну вот среднее для генома содержание Г-Ц пар в местах, где максимальная плотность генов, и там уже хорошо за 60% Г-Ц пар, т.е. чем выше содержание Г-ц пар, тем больше вероятность встретить ген в соответствующей части генома. Теперь посмотрим на размеры экзонов и интронов. Сначала экзоны: здесь сравнивается человек, нематода (си элеганс) и дрозофила. У человека получается, если сравнивать эти три организма, самые короткие экзоны, т.е. у нас получаются компактные короткие экзоны с пиком где-то в районе 130 пар оснований и очень узкое, плотное распределение, т.е. длинных экзонов практически нет. Если сравнивать с беспозвоночными, то пик приблизительно там же, но может быть чуть-чуть сдвинут, где-то около 150 пар оснований, но зато получается относительно длины шире. У позвоночных можно встретить достаточно длинные экзоны, чего у человека практически никогда не встречается. С интронами другая ситуация: т.е. она противоположная. Чётко видно, что у нематод очень короткие получаются интроны, у мухи они чуть крупнее, но всё равно получаются до 100 нуклеотидных пар, а у человека есть небольшой пик интронов в районе 100 нуклеотидных пар, но получается очень длинный шлейф, который уходит туда далеко-далеко, поскольку этот график из чернового генома, то тут они ещё не могли оценить, на сколько далеко уходит туда вот этот хвост. Оказывается, он уходит достаточно далеко. Т.е. получается, что значительная часть интронов, у человека имеет средний размер несколько тысяч нуклеотидных пар, ну сравните меньше чем с сотней для беспозвоночных. Т.е. вот сразу видна разница между беспозвоночными и позвоночными животными.Наверно, сразу надо сказать, почему оно так получается, потому что у позвоночных животных есть специальный механизм сплайсинга, который предназначен для работы с крупными интронами, в норме аппарат сплайсинга плохо распознаёт длинные интроны, потому что сами сайты сплайсинга получаются не очень консервативными.

(более подробная  история работы над геномом  человека – лекция 12, начало)

Ну теперь давайте  немножко о цифрах, которые касаются последовательности. Значит, вот эти цифры они к сожалению постоянно плавают, ну вот эухромотиновая часть генома, которая секвенирована, она около 2,2 млрд. нуклеотидных пар, полный размер генома будет чуть-чуть больше 3 миллиардов. Т.е. если вы запомните цифру 3, это будет хорошая цифра, легко запоминается. Вот это цифра – количества генов – она к сожалению варьирует достаточно часто, ходит то туда то сюда, вот когда я последний раз смотрел, это было около года назад, было 22-23 тысячи, оценка приблизительная, фактически за полгода перед этим 25 тысяч было написано, зависит от того как программа перенастроена, как что подсчитано и некоторые гены добавляются, снова убираются, но где-то порядка 25 тысяч тоже такая статистическая оценка по разным публикациям сейчас являются общепринятыми.  Средняя длина гена – 50 тысяч нуклеотидных пар, это очень крупные гены, большинство других организмов имеют гораздо меньшие размеры. В том числе и многие позвоночные, но большинство млекопитающих такой размер имеет. Средний ген состоит из 10 экзонов, т.е. экзонов много, но встречаются гены и без интронов, на удивление много – около 8% генов, вообще не имеют интронов. Вот важная цифра – средняя длина кодирующей последовательности – около полутора тысяч кодонов, т.е. получается, что генов не так много, но их продуктами являются достаточно крупные белки, если вот сравнить с бактериями, то стандартный белок бактерии это 300 аминокислотных остатков. Т.е. у нас в пять раз больше чем бактериальный белок по размерам. Ещё две цифры, которые достаточно важны: около 40 % генома это интроны, ну соответственно гены занимают чуть больше 40 % во всём геноме, но большая часть этих последовательностей не кодирующая. Относительно не большое количество сегментов дупликации – это 5,3 (?????) сегментов дупликации, а вот всё остальное около 70 % это транспозоны, про это мы уже говорили, и ещё немного про транспозоны будем по позже говорить.  Интересным является то, что нуклеотидный состав является очень не однородным, по геному, и можно выявить несколько тенденций при анализе нуклеотидного состава. Ну вот в частности, вообще геном человека А-Т богатый, т.е. среднее Г-Ц содержание около 40 %, это не очень высокое значение, и вот синие столбики показывают распределение по всему геному. Т.е. вот этот пик, будет около 40 процентов показывать, но если взять кодирующую часть генома, т.е. фактически гены посмотреть, то мы получаем совсем другое распределение, вот оно: имеется существенный сдвиг в Г-Ц богатую область. Это связано с тем, что кодирующая часть имеет гораздо более высокий Г-Ц состав, если посмотреть на вот этот график, то он показывает плотность генов в участках генома с разным содержанием Г-Ц пар. Ну вот среднее для генома где-то вот здесь вот содержание Г-Ц пар, и вы видите где максимальная плотность генов, где уже хорошо за 60% Г-Ц пар, т.е. чем выше содержание Г-ц пар, тем больше вероятность встретить ген в соответствующей части генома. Давайте теперь посмотрим на размеры экзонов и интронов. Здесь у нас сегодня будут несколько графиков, которые немножко друг другу будут противоречить, т.е. более поздние – более верные. Сначала экзоны: здесь сравнивается человек, нематода (си элеганс) и дразофила. У человека получается, если сравнивать эти три организма, самые короткие экзоны, т.е. у нас получаются компактные короткие экзоны с пиком где-то в районе 130 пар оснований и очень узкое, плотное распределение, т.е. длинных экзонов практически нет.

если вы помните  с позапрошлой лекции, стандартный  размер генов для беспозвоночных, там они не более 5000 нуклеотидных пар, у нас с вами 50 тысяч, т.е. в 10 раз и даже более крупные гены. Наверно, сразу надо сказать, почему оно так получается, потому что у позвоночных животных есть специальный механизм сплайсинга, который предназначен для работы с крупными интронами, в норме аппарат сплайсинга плохо распознаёт длинные интроны, потому что сами сайты сплайсинга получаются не очень консервативными. Так давайте запишим:

- Только писать  я буду, а диктовать вы будете! Назовите 4 буквы сайтов сплайсинга? – Пока правильной версии не  слышал (там Я (Сечеников) и  Сашка Носова всякий бред выкрикивали). – НУ КАК САЙТЫ СПЛАЙСИНГА НАЙТИ, ЕЛКИ ПАЛКИ??? Как вы определите где экзон, а где интрон? Эй, биотехнологи! – Ну ну, уже близко ( там опять кто-то что-то выкрикивал). – Короче, это будет ГТ……….АГ – т.е. это будет собственно говоря, чётко консервативны, есть ещё несколько букв в середине, не сто % консервативны, пару букв вот здесь и пару вот здесь. Потом ещё есть вокруг точки ветвления несколько букв, и ещё вот здесь несколько перемидинов получается. Т.е. вот эти последовательности вместе обозначают интроны, когда они огромные, случайным образом вот эти буквы встречаются слишком часто, чтобы аппарат сплайсинга мог узнать правильные границы точно, и не перепутать с тем, что случайным образом встречается в середине, соответственно у позвоночных животных с такими огромными интронами, должен быть аппарат, который гарантирует правильное распознавание, и  аппарат этот называется – экзонным определением интронов, суть сводится к тому, что вот у нас экзон, и он туда куда-то далеко далеко уходит ( ОЧЕНЬ ДАЛЕКО). И клетка вместо того чтобы искать где-то там второй конец, она ищет не только конец вот этого интрона, а ищет вот этот конец  (рисует на доске что-то). Значит, связывются компоненты сплайсосомы, сначала с донорным сайтом сплайсинга, а затем  перебрасывается мостик вот  здесь. Так называемые тэта-белки(?)  Значит таким вот образом компоненты сплайсосомы связываются с донорным сайтом спласинга, связываются с акцепторным сайтом сплайсинга, но это не правильный сайт. Это по границам разных интронов. Потом когда все эти сайты заняты происходит изомеризация, т е вот эти вот связавшиеся компоненты сплайсосомы изомеризуются и тот который вот где-то там взаимодействует с этими частицами и получаются уже нормальные сплайсосомы, то есть таким вот образом просто клетка гарантирует распознавание акцепторного сайта который значительно менее консервативен, чем донорный сайт. Он ненадёжно (либо «они  надёжно») распознаётся потому, что экзон то коротенький всего 150 пн и наличие такого механизма позволяет иметь такие вот огромные интроны. Мало того он делает геном толерантным к инсерции транспозонов, потому что у других организмов (не позвоночных)  инсерция транспозонов в интрон… ген почти наверняка выключен и геномы беспозвоночных, геномы растений они очень чувствительны к инсерции транспозонов – нам  с вами по барабану, столкнётся какой-нибудь транспозон в интрон – экспрессии генов это не повредит. Это сделало геном менее чувствительным  к транспозонам, позволило увеличить их размер, позволило ускорить  комбинационную эволюцию за счёт рекомбинации экзонов различных генов потому, что транспозоны дают область гомологии и это ускорило эволюцию позвоночных и нас с вами скорее всего без этого не было бы – болтыхались бы в океане. Ещё несколько достаточно простых слайдов, которые показывают аномалии. Если вот посмотреть здесь, то оказывается, что размеры экзонов не меняются в соотвествии с тем, в какой части генома они располагаются - ГЦ богатой или АТ. Экзоны приблизительно одинакового размера около 30 пар оснований. А вот с интронами происходит интересная вещь – резко падает размер интронов с увеличением ГЦ содержания пар в геноме. Ну понятно почему  - там больше генов  и там они получаются покороче потому что туда не лезут транспозоны и насчёт транспозонов я должен был вам уже говорить. Когда мы беседовали насчёт транспозонов, но там мы говорили о картинке из книжки Льюина, а это  из статьи по геному человека. Т е цифры поэтому будут немного различаться, Льюин 2004 года. А это всё-таки 2000 года информация… Давайте ещё раз вспомним: я вам говорил когда рассказывал транспозоны, я говорил, что  ДНК транспозонов  у нас практически нет, но тем не менее около 3% генома их остатки занимают, они тут так и называются ископаемые остатки ДНК транспозонов. И вот если посмотреть на размер. То слишком короткие транспозоны получаются. Стандартные транспозоны эукариот не менее 5000 нп, ни один  из ДНК транспозонов больше 3000 нп не имеет размера несмотря на то, что их много они занимают очень  небольшой процент генома. Ретровирусоподобные транспозоны – их по количеству немного побольше, но  по процентам генома так же не очень большой получается, опять же возможно потому, что слава богу ни одного такого функционального транспозона не обнаружено. А вот неретровирусоподобные транспозоны это основной мобильный компонент нашего с вами генома и вот эти элементы единственные транспозоны, для которых точно показано, что они способны перемещаться  - элементы под названием  L1. он один и прыгает, т е продемонстрировано, что  перемещение этого элемента происходит и ферменты которые кодируют этот элемент   обеспечивают перемещение AU последовательности. Ну собственно говоря два элемента которые есть  лай-элемент или  L1 и его последовательность конца N1 которые действительно скачут в нашем с вами геноме. Есть несколько патологий связанных с инсерцией этих транспозонов, ну и большую часть генома если говорить о каких-то фрагментах ДНК, то они и занимают большую часть нашего генома, никакой другой элемент так много места не занимает.  Вот этот слайд показывает в принципе, что геном человека является нетипичным среди секвинированных геномов. В том плане, что большинство транспозонов в нём уже неактивны, ну вот здесь, чем темнее цвет, тем старше мобильные генетические элементы, и вот столбик  для человека – он самый тёмный. Если брать другие геномы, такие как  Sevelians или Arabidopsis, то здесь гораздо моложе транспозоны. А чемпионом является муха дрозофила, потому что геном дрозофилы меланогастер многие транспозоны инфицировали полностью пару десятков лет назад,  в частности вот P-элементы про которые я должен был чё-то вам рассказывать, в природных популяциях дрозофил до 40-ых годов он не встречался, начался…  его обнаружили в сороковых. А после пятидесятых он уже обнаруживался у всех природных популяций. Т е это вот транспозон, который вот только  что инфицировал геном, причём даже показано каким образом   происходит внедрение транпсозона, вот внедрение транспозона в случае D. Melanogaster:  наездники за это дело отвечают. Наездники, которые прокалывают яйцо и откладывают яйцо, они одновременно из другого яйца чуть-чуть цитоплазмы могут перенести и этого  хватает, чтобы с невысокой вероятностью транспозон перенести. Достаточно проколоть, если  яйца не развиваются. Но процесс маловероятный. Но возможный.

Информация о работе Шпаргалка по "Геномике"