Главная > Разное > Математическая биофизика клетки
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава одиннадцатая. ВОССТАНОВЛЕНИЕ ЛИНЕЙНОЙ СТРУКТУРЫ БИОПОЛИМЕРОВ

11.1. Анализ первичной последовательности нуклеиновых кислот

В настоящее время считается общепризнанным, что молекулы нуклеиновых кислот представляют запись всей или почти всей наследственной информации, определяющей жизнедеятельность клетки [106—108]. Однако ряд вопросов не может быть решен без накопления экспериментальных данных о первичной структуре нуклеиновых кислот, т. е. последовательности нуклеотидов. Установление нуклеотидных последовательностей прошло путь работы, выполненной на тРНК из дрожжей, имевшей всего 78 нуклеотидов [109], до расшифровки первичных структур высокомолекулярных вирусных и рибосомальных РНК, состоящих из сотен и даже тысяч нуклеотидов [110—114].

Практически во всех работах использовался так называемый блочный метод, основанный на расщеплении молекулы РНК на блоки различной длины, расшифровке последовательностей в коротких блоках и восстановлении последовательности всей молекулы на основе перекрывания блоков, полученных в разных разбиениях. Другой метод определения первичной структуры путем последовательного отщепления (или наращивания) концевых нуклеотидов и концевого анализа на каждом шаге оказывается эффективным лишь для последовательностей малой длины мономеров) [115]. Вариант такого подхода применялся также как дополнительный способ получения блоков [110, 116]. Метод определения первичной последовательности путем отщепления концевых нуклеотидов требует большую дополнительную информацию и пока не может конкурировать с блочным методом [117].

Для ускорения процесса расшифровки последовательностей необходимы либо разработка новых методов, либо усовершенствование блочного метода и переведение его в рамки ординарных процедур. В последнем случае необходимо решение вопросов, касающихся анализа возможностей блочного метода и создания эффективных алгоритмов, позволяющих планировать эксперимент. Значительное число возникающих при этом задач может быть решено при помощи математических методов. Кратко опишем свойства биохимической информации, используемые в блочном методе.

Большинство молекул РНК представляют собой последовательности четырех типов нуклеотидов: гуанина урацила цитозина и аденина В молекулах некоторых РНК

встречаются редкие «минорные» нуклеотиды. Молекула РНК полярна, ее концы не эквивалентны друг другу, поэтому принят определенный порядок записи нуклеотидной последовательности. Блочный метод основан на возможности разрыва цепи РНК при помощи ферментов — нуклеаз, каждый из которых рвет цепь только в определенном месте. Например, для разрыва РНК обычно используются панкреатическая рибонуклеаза и рибонуклеаза Первый из этих ферментов разрывает цепь РНК непосредственно справа от пиримидиннуклеотидов а второй — справа от пуриннуклеотида Если расщепление проводится так, что молекула РНК рвется после каждого нуклеотида, к которому специфична данная рибонуклеаза, то такое расщепление называется полным, или исчерпывающим, гидролизом данной нуклеазой. Если условия расщепления подобраны так, что молекула рвется лишь после части нуклеотидов, то такое расщепление называется неполным, или частичным, гидролизом. Информация о продукте частичного гидролиза задается обычно продуктами его полных гидролизов. Если есть возможность разрывать цепь с помощью разных ферментов, то можно выявить совпадающие при наложении участки фрагментов и «составить из кусочков» всю последовательность.

Поясним метод следующим сравнением: представим себе, что предыдущее предложение написано несколько раз в виде одной строки на различных полосках бумаги, а затем эти полоски разрезаны разными способами. Например, в одном случае на отдельном кусочке бумаги оказываются три слова: «если есть возможность», а на другом — следующие за ними два слова: «разрывать цепь». В другом случае слова «возможность» и «разрывать» находятся вместе, а слово «цепь» — отдельно. Тогда можем сделать вывод, что группа с концевым словом «возможность» и группа, начинающаяся со слова «разрывать», составляют непрерывную последовательность слов. Принцип очень прост. На практике для восстановления длинных цепей требуется множество заключений такого типа.

В первых работах [118, 119] на основе последовательности случайных чисел строилась одна или несколько статистических последовательностей четырех символов. Исследовалась возможность однозначной реконструкции нуклеотидных последовательностей по перекрывающимся фрагментам, полученным расщеплением четырьмя, тремя или двумя ферментами, специфичными к одному символу каждый.

Были предприняты попытки создания компьютерных алгоритмов для построения нуклеотидных и белковых 1

последовательностей из перекрывающихся продуктов полных гидролизов [122— 125]. Построение нуклеотидной последовательности осуществляется в этих алгоритмах путем полного перебора всех возможных последовательностей перекрывающихся продуктов, что требует очень больших затрат машинного времени.

Еще в 1959 г. Розен обратил внимание на то, что первичная структура биополимеров может быть описана в виде слова в определенном алфавите, и указал на возможность применения здесь понятий теории свободной полугруппы [120, 121]. Эта идея была использована в работе [126]. Задача о построении последовательности перекрывающихся продуктов двух полных гидролизов может быть интерпретирована также в терминах теории графов, (задача о построении эйлерова пути) [127].

Ниже рассмотрен математический подход к установлению первичной структуры нуклеиновых кислот.

<< Предыдущий параграф Следующий параграф >>
Оглавление