Главная > Разное > Математическая биофизика клетки
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

10.2. Определение морфометрических параметров клеток и клеточных структур

Алгоритм определения геометрических параметров выпуклых фигур

Актуальность развития математических методов исследований геометрии фигур выпуклой формы (круги, эллипсы) не вызывает сомнения. К этой задаче сводится анализ морфологии эритроцитов, клеток паренхиматозных органов и других однослойных биологических объектов (одноклеточных водорослей, дрожжевых клеток, колоний бактерий и т. д.).

В табл. 7 дана сводка одиннадцати алгоритмов для получения количественных параметров двумерных фигур [50].

Алгоритмы описания клеточных структур сложной формы

Важными задачами клеточной биологии, имеющими большое прикладное значение, являются задачи построения лейкоцитарной формулы крови, диагностики раковых клеток и построения кариотипа.

Последняя, по-видимому, наиболее сложная из задач такого типа. Основная трудность состоит в том, что морфология метафазной хромосомы чрезвычайно разнообразна и во многом определяется процессами, протекающими при приготовлении препаратов, которые невозможно учесть.

На примере анализа изображений метафазных хромосом человека рассмотрим основные аспекты методов опознавания и измерения параметров биологических структур.

Прогресс анализа может быть разделен на четыре этапа. На первом осуществляется выделение изолированных объектов, и вся совокупность точек изображения разделяется на связанные области. Это можно осуществить путем прослеживания внешних

(см. скан)

(см. скан)

и внутренних границ всех объектов с помощью алгоритма прослеживания контура или с помощью алгоритмов, основанных на проверке перекрытия хорд соседних строк матрицы изображения.

На втором этапе осуществляется анализ изолированных объектов с целью определения и описания их существенных особенностей, позволяющих идентифицировать их в качестве объектов, подлежащих исследованию.

На третьем этапе для объектов, подлежащих исследованию, измеряются их информативные параметры.

Четвертый этап представляет собой статистическую обработку результатов измерений и классификацию объектов во всей исследованной выборке объектов.

Основная задача при исследовании изображений биологических структур состоит в разработке алгоритмов, выполняющих описание структуры, инвариантное к трансляции и поворотам объектов. Кроме того, алгоритмы должны учитывать нормальную либо довольно значительную вариабельность биологических структур.

В качестве примера рассмотрим алгоритмы для описания изображения хромосом. Условно их можно разделить на абстрактные, которые не опираются на специфику исследуемой структуры, и конкретные — эвристические, которые учитывают особенности морфологии объектов.

Абстрактные алгоритмы анализа изображений можно рассматривать как аппроксимацию функции с определенным критерием точности. В качестве подобного алгоритма рассмотрим описание изображений хромосом с помощью моментных инвариантов [51].

Идея метода была выдвинута в работе [52], где показано, что можно составить алгебраические комбинации двумерных моментов, которые будут инвариантны по отношению к размерам объектов и их ориентации в поле зрения.

Двумерное изображение может быть довольно полно охарактеризовано набором двумерных моментов вида

где функция распределения оптической плотности изображения.

От обычных моментов легко осуществить переход к центральным моментам:

где

Центральные моменты инвариантны относительно сдвига изображения. Из них с помощью алгебраических операций можно скомбинировать моментные инварианты, не зависимые от изменения размеров фигур и их поворота на плоскости изображения.

Чем более высокие порядки моментов используются для составления описания образа, тем более тонкие различия в изображении объектов можно улавливать. Однако определение моментов требует большого объема вычислений, а с ростом порядка момента пропорционально падает точность вычислений. Поэтому ограничиваются комбинациями из центральных моментов не выше третьего порядка.

Для описания хромосомы с целью ее опознавания используются семь абсолютных ортогональных моментов инвариантов, скомбинированных из центральных моментов первого, второго и третьего порядков, например:

Набор из семи подобных выражений составляет описание каждой хромосомы. Таким образом, это описание является вектором в семимерном пространстве признаков. В этом пространстве вводится мера, которая характеризует степень близости исследуемых объектов:

где абсолютный ортогональный момент (один из семи), характеризующий первую хромосому, абсолютный ортогональный момент (также один из семи), характеризующий вторую хромосому. Очевидно, что величина является нормированным расстоянием, определяющим сходство двух объектов (гомологичных хромосом).

Применение метода моментных инвариантов ограничивается тем что инвариантные моменты существенно зависят от относительных перемещений частей объекта. Кроме того, результаты анализа, выраженные в виде конкретных значений набора моментных инвариантов, не поддаются морфологической интерпретации.

В качестве примеров разработки морфологических языков описания рассмотрим эвристические алгоритмы анализа хромосом.

Описание объектов секущими плоскостями и линиями. При пересечении изображения объекта секущей плоскостью, нормальной

к поверхности изображения в сеченди, получается одномерная функция

которую называют профилем сечения Если исследуется бинарное изображение, то профиль представляет собой разрывную функцию.

Идея метода описания изображения объекта, например хромосомы, секущими состоит в определении ее продольной оси с последующим нахождением поперечных профилей сечений или хорд. Поскольку выделение продольной оси хромосомы сопряжено с большими трудностями, то, как правило, применяют способы различного ее приближенного определения.

В первом алгоритме такого типа [53] продольная ось хромосомы аппроксимируется большей стороной описанного прямоугольника минимальной площади. Специфическая морфология хромосом описывается в терминах числа пересечений ее внешнего контура с линиями, проведенными перпендикулярно к продольной оси объекта. Такое описание позволяет выделить секущую линию, проходящую через центромеру хромосомы.

Дальнейшее развитие эта идея получила в работе [54], где использованы восемь фиксированных направлений для аппроксимации продольной оси.

Рассмотрим два более поздних метода нахождения продольной оси хромосомы [55, 56]. Пусть найдена продольная ось в виде Проведя секущие плоскости в каждой точке оси перпендикулярно к ней, получим набор профилей где общее число точек на оси. Поставив каждой точке продольной оси в соответствие интеграл от функции профиля можно получить кривую изменения суммарной оптической плотности вдоль продольной оси хромосомы:

Минимум функции где соответствует центромерному участку, а точка — центромере. Главная трудность в рассмотренной процедуре состоит в достаточно точном определении продольной оси.

В работе [56] предлагается рассматривать две функции — аналогичные функции (10.9), но представляющие собой суммы оптических плотностей точек, лежащих соответственно справа и слева от продольной оси хромосомы. Тогда появляется возможность сформулироватькритерий для определения точности нахождения продольной оси хромосомы по степени схожести

функций а сама задача нахождения продольной оси объекта может рассматриваться как минимизация функционала

Алгоритм, предложенный в работе [57], состоит в определении такой продольной оси, для которой правый и левый плотностные профили были бы одинаковы по расположению максимумов и минимумов. В качестве первого приближения к такой линии выбирается ось инерции объекта, соответствующая минимуму второго центрального момента. Итерационная процедура определения продольной оси обеспечивает аппроксимацию только одного изгиба хромосомы с помощью дуги окружности.

Выделение остова (скелета) объекта. Эти методы позволяют представлять объекты в виде совокупности линий (точек), соответствующих максимальной плотности изображения. Описание и анализ получившегося таким образом «скелета» основаны на общих идеях лингвистического подхода [37] и используют результаты из теории графов.

Остановимся на одном из таких методов [47], предложенном специально для анализа хромосом. Он основан на последовательном отбрасывании граничных точек хромосомы, приводящем к ее «утоныпению». При этом отбрасываются только такие точки фигуры, которые не нарушают ее связности. Процедура многократно применяется к объекту, пока не останется ни одной точки, чье отбрасывание не нарушило бы связности.

Все точки полученного скелета разделяются на три класса: «точки дуги», имеющие соседние точки; «точки концов», имеющие только одну соседнюю точку; «точки пересечения», имеющие больше двух соседних точек. Эти три типа точек и соотношение между ними можно представить в виде графа или его матрицы смежности. Опознавание хромосом осуществляется путем сравнения графа исследуемого объекта с графами эталонных хромосом.

Описание контура (границы) объекта. Эти методы представляются достаточно универсальными для широкого круга задач анализа изображений.

Их идея состоит в выработке языка, описывающего границу объекта, и последующей синтаксической идентификации предъявляемых изображений (один из вариантов лингвистического подхода к распознаванию изображений [37]).

Чаще всего в качестве описания контура используется кривизна, так как она инвариантна к трансляции, вращениям объекта с точностью до циклических сдвигов контура, отражает глобальные и локальные особенности контура. Использование аналитического метода вычисления кривизны сопряжено с трудностями,

вызванными дискретным заданием границы объекта. Поэтому чаще используют эвристические аналоги кривизны [46, 57, 58].

В Институте биологической физики АН СССР начиная с 1968 г. ведутся исследования морфологии клеточных структур математическими методами [60, 61] и был разработан алгоритм для анализа хромосом, использующий контур как первичное описание объекта [62—64]. Работу алгоритма анализа внешнего контура можно разделить на три этапа:

1) формальное описание контура кривизной;

2) нахождение характерных точек контура;

3) опознавание хромосом путем сравнения с эталоном.

Контур хромосомы представляет собой чередующиеся определенным образом участки различной степени выпуклости и вогнутости. Характер этого чередования, длины соответствующих дуг и расстояния между ними задают как форму, так и геометрические параметры хромосомы. Для описания кривизны контура используется эвристический аналог понятия кривизны, обеспечивающий сглаживание локальных изменений контура и достаточно просто реализуемый вычислительной процедурой. Для определения кривизны в точке А о дискретного контура рассмотрим участок контура, состоящий из точек: такой,что А0 находится в его середине (рис. 116). Соединим векторами со всеми точками и построим суммарные вектора Угол у между векторами очевидно, характеризует поведение контура в окрестности точки А о (величина окрестности определяется выбором значения параметра к), а величина х дает нам искомый эвристический аналог кривизны в точке

Из определения кривизны видно, что она может принимать значения от —2 до причем знак ее зависит от того, является ли участок контура, содержащий точку выпуклым или вогнутым.

Хотя хромосомы метафазной пластинки характеризуются нестабильной морфологией, их можно объединить в небольшое число устойчивых типов-эталонов. В зависимости от расстояния между концами плечей хромосомы рассматривались три эталона неискаженных хромосом: 1) с разошедшимися хроматидами (четы-рехплечие); 2) с одной неразошедшейся парой хроматид (трехпле-чие); 3) с неразошедшимися концами хроматид (рис. 117). При автоматическом анализе хромосом необходимо находить точки контура, в которых кривизна принимает экстремальные значения

Рис. 116. Определение кривизны контура

(рис. 118). Для выделения последних вводится понятие сильного экстремума (максимума или минимума). Точка х называется точкой сильного максимума типа если найдутся точки такие, что и для любой точки из интервала будет Аналогично вводится понятие сильного минимума.

Величина в представляет собой функцию вида

где и максимальное и минимальное значения кривизны. Постоянная а выбирается в зависимости от того, какие детали контура учитываются при анализе.

Число экстремальных точек дает представление о типе хромосомы, к которому может принадлежать данный объект Однако оно

Рис. 117. Эталоны хромосом Рис. 118. 3- и 4-плечая хромосомы а — контур 3-плечей хромосомы; б - изменение кривизны контура 3-плечей хромосомы; в — контур 4-плечей хромосомы; г - изменение кривизны контура 4-плечей хромосомы

не является достаточной основой для идентификации объекта. Поэтому используется специальный метрический тест, отражающий естественное представление о симметричном расположении характерных точек на хромосоме. В нем отдельно рассматривается каждый из трех типов хромосом. Если условия теста не выполняются, делается вывод о том, что объект не принадлежит к данному типу хромосомы.

Каждый объект путем последовательного уменьшения числа точек локального экстремума проверяется на соответствие эталонам до тех пор, пока объект не будет признан хромосомой или нехромосомой при числе точек, меньшем четырех.

В заключение следует отметить, что эвристические алгоритмы основываются на выделении существенных признаков биологических объектов. В качестве таких признаков могут выступать отдельные точки или линии на изображении объектов, иногда целые области. Например, для хромосом наиболее важными для распознавания являются: концы плеч и центромера; линии — продольные оси хроматид и линия, проходящая через центромеру и рассекающая хромосому на два плеча (линия центромеры); области — центромерная область, характеризующаяся наименьшей оптической плотностью, и т. д. Очевидно, что все эти существенные морфологические признаки хромосомы связаны между собой и могут быть определены через другие виды описаний изображения, в частности через геометрию границы объектов.

Поскольку основная задача эвристических алгоритмов состоит не в полном описании функции а в описании только ее существенных для распознавания особенностей, то у исследователя имеется относительно большая свобода выбора алгоритма описания (морфологического языка). Этим объясняется обилие различных эвристических алгоритмов анализа изображений биологических структур и, в частности, хромосом. Однако указанная выше особенность накладывает и существенные ограничения на эвристические алгоритмы. Как правило, невозможно доказать полезность алгоритма формальным путем. Эксперимент — единственный критерий качества использованного языка описания. Кроме того, эвристические алгоритмы являются конкретными методами исследования данного класса структур, и нет никаких иных оснований, кроме интуиции и эксперимента, для использования их на другом классе объектов.

Фактически в каждый эвристический алгоритм вкладывается некоторая феноменологическая модель объекта, отражающая наиболее существенные с точки зрения исследователя черты реальной структуры.

Ниже рассмотрим примеры количественного исследования клеточных структур с использованием методов автоматического анализа оптических изображений.

<< Предыдущий параграф Следующий параграф >>
Оглавление