Моделирования связи «структура химических соединений –молекулярные свойства и биологическая активность»

Автор: Пользователь скрыл имя, 11 Апреля 2011 в 08:21, реферат

Описание работы

Цель данной работы состоит в разработке эффективных методов математического и компьютерного моделирования связи «структура химических соединений –молекулярные свойства и биологическая активность» на основе стратегии формирования базы данных и знаний из имеющихся примеров, а также в создании компьютерных технологий поддержки профессиональных химико-структурно-биологических баз данных и знаний. Для достижения указанной цели по поиску эффективных препаратов с заданными свойствами требуется углубленный анализ и теоретические исследования первичных экспериментальных данных с использованием современных информационно - компьютерных технологий и методов математического моделирования

Работа содержит 1 файл

Глава I.doc

— 423.50 Кб (Скачать)

Введение

    В настоящее время в органической химии синтезировано более 20 миллионов  химических веществ, набор сведений о которых весьма обширен. Активное использование в химических исследованиях этой огромной информации невозможно без привлечения средств вычислительной техники. Компьютерные технологии и математическое моделирование позволяют отказаться от традиционного метода поиска химических веществ с заданными свойствами путем экспериментов, которые являются чрезвычайно сложными, длительными и дорогостоящими. Так, разработка единственного лекарственного препарата требует в среднем от 8 до 20 лет, а затраты составляют до 100 миллионов долларов. Согласно статистике, удачным оказывается приблизительно одно из 10 тысяч испытаний возможных лекарственных препаратов. Исключительно большое число структур, которые необходимо исследовать, может быть проиллюстрировано тем фактом, что одна структура и 20 заместителей, присоединенных в шести различных положениях, будут приводить к полному числу исследуемых структур, равному . В связи с этим многие фирмы связывают успех в разработке новых препаратов с внедрением в химические исследования компьютерного и математического моделирования, резко сокращающего сроки создания физиологически активных веществ, путем отсеивания заведомо неактивных и высокотоксичных соединений. Поэтому неудивительно, что в настоящее время для достижения такой заманчивой цели прилагаются значительные усилия. Например, расходы фирмы «Pfizer» на научные исследования по поиску фармацевтических препаратов в 1990 году возросли более чем на 20% и составили 640 миллионов долларов. По оценке «International Resource Development Inc» особенно быстро растет объем финансирования работ по созданию компьютерных систем для моделирования различных свойств химических веществ – от 66 миллионов долларов в 1983 голу до 8,5 миллиардов долларов в 1993 году. При создании таких систем возникают сложные, выходящие за рамки информационного поиска задачи, решение которых требует разработки специальных методов и моделей, оригинальных алгоритмов и соответствующего программного обеспечения. При этом подобные системы будут обладать рядом преимуществ, обусловленных мощной информационной поддержкой в виде фактографических баз данных, наличие которых позволит наряду с задачами информационного характера, решать и такие важные в научном и практическом отношении проблемы, как установление эмпирических закономерностей для моделирования связи между строением вещества и его физико-химическими и биологическими свойствами. Такого рода системы позволят более объективно использовать накопленный экспериментальный материал в виде разнообразных зависимостей «структура соединения – физико-химические и биологические свойства».

    Таким образом, проблемы создания информационно-математической инфраструктуры системы научных химических исследований, в первую очередь комплекса проблемно-ориентированных баз данных, по полноте адекватных нуждам пользователей, является в настоящее время ключевой для интенсификации научных исследований. Изложенное выше определяет актуальность, научную и практическую значимость проведенных в монографии исследований в одной из наиболее важных областей химической информатики – разработке компьютерных средств и математических методов для моделирования связи между строением вещества и его свойствами. Вряд ли необходима более развернутая аргументация в пользу актуальности и важности компьютерно – моделирующих систем с обучением для таких предметных областей, как химия, биология, медицина и другие науки о жизни, где постановка реального или лабораторного эксперимента либо изрядно затруднена, либо вообще невозможна по тем или иным соображением. Хотелось бы отметить, что поиск новых высокоактивных и безопасных для человека и окружающей среды химических препаратов с заранее заданными свойствами является важнейшей фундаментальной проблемой мировой науки, так как создание таких веществ есть одно из основных условий роста технологической мощи современного общества.

    Цель  данной работы состоит в разработке эффективных методов математического и компьютерного моделирования связи «структура химических соединений –молекулярные свойства и биологическая активность» на основе стратегии формирования базы данных и знаний из имеющихся примеров, а также в создании компьютерных технологий поддержки профессиональных химико-структурно-биологических баз данных и знаний.  Для достижения указанной цели по поиску эффективных препаратов с заданными свойствами требуется углубленный анализ и теоретические исследования первичных экспериментальных данных с использованием современных информационно - компьютерных технологий и методов математического моделирования.

Постановка  задачи

      Современное развитие общества связано с перевооружением  всех отраслей народного хозяйства на основе современных достижений науки и техники. Особенно важную роль в решении этой задачи будет иметь внедрение новой информационной технологии, реализуемой в прикладных информационных системах на базе средств вычислительной техники. Автоматизированные информационные системы (информационно-поисковые, управляющие, диагностические, моделирующие) предназначены для оперирования особо интенсивными потоками информации, отсутствие или недостаток которой ведет к неэффективным решениям, сопровождаемым различными негативными последствиями. Их техническая и программная части должны обеспечивать выполнение специальных процедур автоматизированного сбора, хранения и обработки. В области науки большое значение имеет также создание математического обеспечения (методов, моделей, алгоритмов и программ) для моделирования, анализа и прогнозирования зависимостей типа структура объектов – его свойства, в частности, молекулярная структура – физико-химические свойства и биологическая активность. Таким образом, можно говорить о необходимости создания информационно – математической инфраструктуры в конкретных областях научных исследований. С этой глобальной задачей тесно связаны более локальные задачи создания автоматизированных систем научных исследований (АСНИ) по поиску препаратов с заданными свойствами в области органической химии, в которой огромный объем информации, принципиальная сложность и новизна решаемых научных проблем как раз и выдвигают в качестве одной из первоочередных задач разработку высокоэффективных средств информационно – компьютерной поддержки. Следует также подчеркнуть, что помимо прикладной роли, разработка таких систем имеет большое самостоятельное значение. Более того, можно утверждать, что без разработки эффективных АСНИ в органической химии, успешное решение проблемы поиска препаратов с заданными свойствами будет вообще невозможно, потому что возникают различные проблемы, в том числе, проблема оценки адекватности результатов моделирования при изучении явлений, экспериментальный анализ которых обычными средствами, как правило, невозможен. Так, при исследованиях по химическому канцерогенезу обычными лабораторными средствами, характерное время эксперимента – около трех лет, а стоимость изучения одного соединения – около 12 миллионов долларов США. Если учесть, что к настоящему времени известны более 15 миллионов химических веществ, число которых ежегодно увеличивается на 500 тысяч вновь созданных, то утверждение о затрудненности экспериментального анализа всего потока обычным путем становится просто очевидным [5]. Аналогично, эффективность работ по поиску новых химических средств защиты растений (ХСЗР) обычными средствами (путем синтеза и массовых испытаний большого числа самых различных химических соединений) чрезвычайно мала, так как для создания конкурентноспособного нового действующего вещества необходим синтез и биологические испытания от 30 до 100 тысяч химических соединений [6], причем, стоимость разработки нового продукта без затрат на создание промышленного производства составляет 10 – 35 миллионов долларов, а время, затрачиваемое на разработку, составляет около 10 лет. Поэтому, применение математических методов и АСНИ для установления количественных соотношений структура – активность и их использование для прогнозирования потенциально активных соединений становятся одними из важных и основных путей изыскания препаратов с заданными свойствами, так как они приведут к существенному сокращению времени и объема поисковых работ, а следовательно, и затрат на разработку.

      Основными функциями АСНИ являются: сбор, автоматизированная обработка экспериментальных данных или другой информации, получение и исследование математических моделей, изучаемых объектов, явлений, процессов, с целью использования их в дальнейшем для получения новых знаний. Характерной тенденцией развития автоматизированных информационных систем является соединение в них средств удовлетворения чисто информационных потребностей (поиск в базах данных) и средств переработки информации (получение нового знания), создание которых связано с программной реализацией существующих и разработкой новых математических моделей и алгоритмов обработки данных.

      Ядром АСНИ является информационно – математическое обеспечение, включающее информационно – вычислительные системы и системы математического моделирования и обработки данных на основе средств вычислительной техники. В состав информационного обеспечения научных химиико - биологических исследований в глобальном аспекте должны входить [7-14]:

  • библиография по проблеме поиска химических веществ с заданными свойствами;
  • результаты биологических испытаний в системах скрининга химических соединений;
  • химико-структурно-биологическая информация из патентных и литературных источников;
  • данные по метаболизму, токсикологии и экологии органических соединений;
  • экономика производства и применения, мировой ассортимент действующих веществ;
  • межотраслевая информация (почвы, климатические условия, культуры, площади, вредители и т.д.);
  • сырье и реактивы;
  • физико – химические свойства органических веществ;
  • спектральные и структурные данные химических соединений;
  • химизм процессов, технологические параметры, схемы и материальные балансы;
  • аппаратура.

      Современный этап развития информационного обеспечения  работ по поиску препаратов с заданными свойствами характеризуется созданием и эксплуатацией автоматизированных баз данных (БД) по некоторым из перечисленных аспектов, однако по большинству аспектов разработка БД ведется в стране недостаточно интенсивно. В первую очередь это связано с отсутствием должной координации работ, их недостаточным финансированием, значительной трудоемкостью и рутинным характером.

      Математическое  обеспечение разработок в химических и биологических исследованиях  по поиску препаратов с заданными свойствами требует создания методов, моделей. Алгоритмов и программного обеспечения по следующим основным аспектам [4, 15 - 43]:

  1. Ввод структурной информации в ЭВМ (рисование молекулярной структуры на дисплее и порождение ее машинного представления).
  2. Унификация биологических данных (моделирование индексов активности типа из исходных показателей биологической активности).
  3. Порождение описания молекулярной структуры, исходя из матрицы смежности.
  4. Конформационные и квантовохимические расчеты (расчеты пространственного и электронного строения молекул).
  5. Анализ и прогнозирование биологической активности (реализация различных методов, моделей и алгоритмов моделирования связи структура – активность).
  6. Генерация химических веществ исходя из заданных базисных структур и/или фрагментов и ограничений на их модификацию.
  7. Оптимизация скрининга (информационно – вычислительная поддержка и управление системой скрининга химических соединений на биологическую активность).
  8. Планирование и обработка эксперимента методами многомерного статистического анализа и моделирования данных.
  9. Расчет свойств веществ (прогнозирование физико – химических, в том числе пожаровзрывоопасных и токсикологических, характеристик индивидуальных органических соединений).
  10. Расчет процессов, аппаратов, технологических схем (оптимизация способов получения продуктов и аппаратурного оформления процессов).
  11. Технико – экономические исследования (прогнозная технико – экономическая оценка научно – исследовательских и опытно – технологических работ, промышленного производства и продуктов, оптимизация ассортимента).
  12. Оформление и документация (средства подготовки выходных документов в удобном для пользователей виде).

      Данная работа направлена на решение вышеперечисленных задач по пунктам 1, 2, 3, 5, 6, 8, 9, 12 в рамках автоматизированной системы научных исследований в органической химии. АСНИ подобного рода позволят радикально интенсифицировать научные исследования в этой области. Эффект от создания АСНИ возникает за счет [4, 10, 12, 15 – 16, 21 – 25, 27, 30, 38 - 43]:

    • уменьшения трудозатрат на поиск нужной информации;
    • сокращения объема пустых синтезов и биологических испытаний на основе использования математических методов анализа и прогнозирования биологически активных соединений (отказ от синтеза и биологических испытаний химических веществ, с высокой вероятностью являющихся неактивными или высокоопасными);
    • использования системы компьютерной генерации потенциально – активных структур для планирования синтеза, исходя из прототипов и их возможных структурных модификаций;
    • сокращения экспериментов, связанных с поисковым синтезом в рядах химических соединений;
    • сокращения затрат на изучение токсикологии, экотоксикологии, экологии путем использования компьютерной системы моделирования токсических свойств органических веществ;
    • сокращения объема экспериментальных исследований на основе компьютерной оценки физико–химических характеристик исследуемых соединений.

Основные  этапы и ожидаемые  результаты.

  1. Разработка  непараметрического подхода к моделированию  зависимости «доза - эффект».

Проблема  исследования зависимости проявления эффекта от дозы яда, лекарственного препарата, проникающей радиации или другого повреждающего фактора является основополагающей в токсикологии, фармакологии, радиобиологии, биохимии, микробиологии, эпидемиологии и в других областях медицины и биологии.

На современном  этапе токсикометрии используются величины эффективных доз, вызывающих появление учитываемого эффекта в экспериментальной группе тест - объектов с заданной вероятностью: 0,05; 0,016; 0,5; 0,84; 0,95. Такие дозы получили название эффективных доз: ED5, ED16, ED50, ED84, ED95. Общая зависимость вероятности появления эффекта от воздействия заданной дозы определяется как функция эффективности. В качестве единого показателя для сравнения тестируемых препаратов принята среднеэффективная доза (ED50), определяемая из функции эффективности. Трудность заключается в нахождении статистически обоснованных расчетно-экспериментальных значений категорий эффективных доз, которые представляют собой случайные величины. Проблема вероятностной оценки токсического и других эффектов рассматривается как одна из важнейших в токсикометрии и других разделах биологии и широко разрабатывается исходя из задач экспериментальной практики.

Информация о работе Моделирования связи «структура химических соединений –молекулярные свойства и биологическая активность»