ПРИНЦИП СИГНАТУРЫ

Определение. В каждом процессе происходит взаи­модействие объектов, иными словами — передача инфор­мации. В большинстве реальных случаев передается не все количество информации, содержащейся в каком- либо объекте, а лишь некоторая ее часть, т. е. в данном взаимодействии участвует лишь какая-то часть призна­ков. Назовем эту часть сигнатурой.
Рассмотрим, например, два процесса на очень уда­ленных друг от друга уровнях иерархии биологической
организации — сознательное узнавание и макромолеку- лярную функцию. Человек может узнать знакомого по немногим характерным признакам. Какие именно при­знаки задаются — это определяется ситуацией (напри­мер, знакомый виден с большого расстояния или наблю­датель слышит его голос по телефону); кроме того, это зависит также и от привычного для наблюдателя по­рядка узнавания. Если только наблюдатель не прила­гает специальных усилий, то обычно он вообще не заме­чает различия между объектом и его сигнатурой. В самом деле, люди по большей части сильно преувели­чивают количество информации, которое они используют в процессе узнавания. Вспомним, например, каким ма­лым числом штрихов искусному карикатуристу удается изобразить свою «жертву».
Обратимся теперь к макромолекулярному уровню. Из приведенного выше рассмотрения примеров с химо- трипсином и брадикинином ясно, что в осуществлении функции решающую роль играет лишь какая-то малая доля общего «комплекта» аминокислот, входящих в со­став данного полипептида; именно ее мы и называем сигнатурой. Вообще говоря, сигнатурой молекулы слу­жат все те ее особенности, благодаря которым она ста­новится участником данной реакции; аналогичным образом сигнатурой макромолекулы служат все те осо­бенности расположения мономеров, которые определяют участие этой макромолекулы в данной реакции. В мире нуклеиновых кислот принцип сигнатуры справедлив на молекулярном уровне; об этом свидетельствуют опыты с использованием аналогов оснований. Весьма сомни­тельно, чтобы этот принцип оставался справедливым на макромолекулярном уровне, так как каждый мономер участвует примерно в одинаковой степени во всех функ­циональных взаимодействиях. В мире белков принцип сигнатуры выполняется чрезвычайно строго как на мо­лекулярном, так и на макромолекулярном уровне; о пер­вом свидетельствуют опыты с аналогами аминокислот, о втором — данные того же типа, что и результаты, по­лученные для двух частных случаев — химотрипсина и брадикинина. Легко показать, что принцип узнавания по сигнатурам справедлив также на уровне клетки, кле­точных систем и физиологических функций, т. е. на всех уровнях биологической организации.
Прежде чем приводить формальное определение прин­ципа сигнатуры, следует обсудить два других тесно свя­занных с ним понятия — понятие символа и понятие но­сителя сигнатуры. Символ — это сигнатура информации, содержащейся в реальном событии, записанная при по­мощи некоего кода, который может быть совершенно произвольным. В операции с символом не обязательно должен принимать физическое участие референт, как это происходит, например, при произнесении слова. Сиг­натура подразумевает прямое наличие объекта, а но­ситель сигнатуры — прямое, непосредственное действие этого объекта. Например, антигенный детерминант яв­ляется сигнатурой антигена; антитело несет сигнатуру, но его роль не исчерпывается этим. Субстрат не являет­ся сигнатурой фермента, с которым он вступает во взаи­модействие, хотя он и может нести сигнатуру фермента, участвующего в его образовании.
Перейдем теперь к формальному рассмотрению. Пусть и — некий объект с N различными признаками, Я] — области изменения /-го признака, причем величины ги>] в пределах этого диапазона можно отличить друг от друга качественно или количественно и они либо непре­рывны, либо дискретны, и можно представить в виде вектора в Л^-мерном пространстве. Обозначим сигнатуру и через V, где V содержит некоторое, но не все количе­ство информации, присутствующее в и. V может быть упорядоченной выборкой некоторых признаков, свой­ственных и, и тогда его можно представить в виде про­екции вектора и на некую гиперплоскость с числом измерений, меньшим N. Оно может быть также неупоря­доченной совокупностью значений гю. Области измене­ний переменных, входящих в V, могут оказаться меньше этой области для и, т. е. некоторые изменения при­знаков не входят в сигнатуру, хотя сами признаки вхо­дят в нее. Признаками V могут служить результаты опе­раций с некоторыми (или со всеми) признаками и, например сумма всех значений ги по модулю х или наи­большее из всех значений » и т. д. Носителем сигналу-
ры может служить какой-то объект, часть признаков ко­торого (но не все они) является сигнатурой и.
Двузначность и двусмысленность. Точно так же, как у человека могут быть разные сигнатуры для разных знакомых, макромолекулы обладают разными сигнату­рами для разных функций. Если какой-либо объект об­ладает двумя функционально различными сигнатурами (или же большим их числом), то возникает двузначность эффекта, который он может вызывать. Вместе с тем у объектов, существенно отличающихся друг от друга,

могут оказаться неразличимые в какой-то ситуации сиг­натуры; в таком случае говорят о двусмысленности при­чины эффекта, вызываемого этими объектами. В теории информации условились для неопределенности эффекта, или последствия, применять термин двузначность, а для неопределенности причины — термин двусмысленность.
Пусть С — совокупность молекул (или классов мо­лекул), составляющих данную систему; пусть индекс I означает, что молекула несет сигнатуру, обеспечиваю­щую ее участие в i-й реакции в этой системе; пусть Вг— совокупность всех молекул в С, несущих i-ю сигнатуру. Каждая молекула может принадлежать 0, 1, 2 или боль­шему числу совокупностей В. Фиг. 7 иллюстрирует си­туации, которые могут возникать в тех случаях, когда молекулы принадлежат двум совокупностям В.
В случае I все молекулы, несущие сигнатуру несут также сигнатуру j. В результате появляется двузнач­ность, но отсутствует двусмысленность.
В случае II мы имеем двузначность и ограниченную двусмысленность (если осуществляется реакция, завися­щая от сигнатуры i, то участвующая в ней молекула мо­жет нести сигнатуру j, но может и не нести ее).
В случае III наблюдается как двузначность, так и двусмысленность.
В случае IV нет ни двузначности, ни двусмыслен­ности.
Надежность действия сигнатур. Перекрывание сово­купностей В приводит к двузначности и двусмысленно­сти. Неопределенность означает возможность путаницы, а путаница, касающаяся причин и эффектов, может ока­заться весьма вредной. Следовательно, надежность дей­ствия означает отсутствие неопределенности. Тогда меру надежности можно связать с мерой перекрывания сово­купностей В. Введем удобную меру такого перекры­вания.
Пусть {С} — совокупность молекул, участие которых в ряде реакций обеспечивается их сигнатурами. Рас­смотрим, например, все белковые молекулы системы и множество всех тех реакций с белками, которые могут происходить в данной системе в данный момент време­ни. Эти реакции, а следовательно, и соответствующие сигнатуры можно разбить на функциональные классы (ферментативные, антигенные и т. п.), поскольку входя­щие в исходную систему молекулы так распределены по совокупностям {5г}, что каждая молекула {Вг} обладает сигнатурой г. Определим вероятность того, что какая- либо молекула, принадлежащая к одной совокупности В, принадлежит также какой-нибудь другой или не­скольким другим совокупностям. Если в {С} входят все молекулы, то вероятность того, что данная молекула не принадлежит совокупности {В3}, равнагде
Вз (мера совокупности {В3}) есть вероятность того, что выбранная наудачу молекула принадлежит совокупно­сти {В,}. В этом смысле мера {С} равна 1, но в расчетах величина С записывается в явном виде с целью пока­зать, что размер совокупностей В всегда измеряется от­носительно размера совокупности С. Вероятность того, что какая-либо молекула не несет никакой сигнатуры,
кроме сигнатуры i, равна тогда произведению
где А — общее число сигнатур в исследуе­мом функциональном классе. Величина А может равняться,
например, общему числу различных типов ферментатив­ной активности. Если А не очень мало, а каждое отдель­
ное значение В/С мало,
Если ни одна из вели­чин В3 не вносит существенного вклада в приведенную сумму, то среднее значениеопределяется из
и следовательно, вероятность тоге?, что
какой-либо член совокупностине принадлежит вме­сте с тем другой совокупности, приблизительно равна
. Вероятность того, что он одновременно
принадлежит и другой совокупности,равна единице ми­нус эта величина, т. е. пристановится
равной. Это и есть искомая величина — вероятность
возникающей неопределенности. Отметим, что А слу­жит мерой функциональных потребностей системы (на­пример, числа различных типов ферментативной актив­ности), тогда какопределяет максимальное число различимых сигнатур, т. е. функциональную емкость, Итак, вероятность возникающей неопределенности задается отношением функциональных потребностей к функциональной емкости данной системы. Это согла­суется с нашим интуитивным представлением—чем бли­же к пределам возможностей системы, тем больше опас­ность путаницы и ошибки.
Обобщим полученный выше результат на случай дву­смысленности. Пусть—совокупность всех объектов какого-то класса, интересующего нас в данной ситуации. Будем рассматривать каждый объект и в {С} как упо­рядоченную систему признаков. Пусть имеетсятаких признаков, причем первый может иметьзначений, вто­рой—значений и т. д. Тогда каждый объект выра­жается Л^-кратным или просто Л/шабором чисел, а коли-
ло возможных типов М-наборов в {С} равноКо­
личество информации, требуемое для спецификации одно­го признака,равно в среднем при условии,что все
признаки равновероятны. Если они не равновероятны, то величинунужно заменить какой-то информа­ционной функцией. Здесь вводится предположе­
ние о возможности когерентного считывания всей сово­купности величин Я, хотя в биологических процессах та­кая ситуация, вероятно, осуществляется редко. Однако это обстоятельство не имеет решающего значения, если в качестве вероятностей, участвующих в определении , выбираются некоторые реальные хаоактеоистики процесса считывания. Поэтому, положив мы можем считать, что количество информации, необхо­димое для спецификации данного объекта и в С, имеет вид _. Можно также считать,
что 1есть среднее количество информации в расче­те на один, признак, необходимое для спецификации дан­ного объекта и.
Аналогичным образом пусть функциональные сигна­туры, так же как и совокупности В, определяются при­знаками, варьирующими в ограниченных пределах, Яа и Яь соответственно. Это может означать либо исполь­зование только части области изменения каждой пере­менной, либо использование всей этой области, но лишь для некоторых переменных. Тогда интересующее нас число сигнатур равногдеесть сред­
нее количество информации в расчете на один признак, требуемое для спецификации данной сигнатуры. Анало­гичным образом мы полагаем, что равно средне­
му количеству информации в расчете на один признак, требуемому для спецификацииопределенного члена данной совокупности В. Тогда ,равно также сред­ней двусмысленности объекта при заданной сигнатуре,
аравно уменьшению неопределенности
объекта, если его сигнатура известна.
В теории информации эта величина определяет коли­чество переданной информации в расчете на одну реак­цию и на один признак и обозначается через Т(С; А). Тогда количество информации в расчете на один при­знак, передача которой должна обеспечить успешную функцию, будет равно; разность
есть излишняя информация в расчете на один признак и в среднем на одну реакцию. Отметим, что излишняя информация является избыточной, но не вся избыточная информация оказывается излишней. Сиг­натура должна содержать некоторое минимальное коли­чество избыточной информации, требуемое для преодо­ления описанной выше двузначности.
Окончательно мы получаем вероятность двусмыслен­ности, равную:. Поскольку при выводе предполага­лось, что отнесение объектов к совокупности В носит случайный характер, можно считать, что в оптимальных условиях мы получим, во всяком случае, не худший ре­зультат. При большом N случайный выбор обеспечивает хорошее приближение к оптимальным условиям. Отсю­да следует, что при достаточно большом N (число при­знаков, определяющих сигнатуру) вероятность двусмыс­ленности можно поддерживать пренебрежимо малой до тех пор, пока в системе останется хотя бы ничтожное количество излишней информации.
Сказанное выше совпадает с одним из слабых ре­зультатов основной теоремы теории информации. В ней содержатся и более сильные утверждения, согласно ко­торым двусмысленность фактически становится равной нулю (а не приближается к нему), но они требуют тру­доемких операций и доказательств, что выходит за рам­ки интересующих нас здесь проблем [29].

Источник: Г. Касмлер, «ВОЗНИКНОВЕНИЕ БИОЛОГИЧЕСКОЙ ОРГАНИЗАЦИИ» 1967

А так же в разделе «ПРИНЦИП СИГНАТУРЫ »