ПРИНЦИП СИГНАТУРЫ
Определение. В каждом процессе происходит взаимодействие объектов, иными словами — передача информации. В большинстве реальных случаев передается не все количество информации, содержащейся в каком- либо объекте, а лишь некоторая ее часть, т. е. в данном взаимодействии участвует лишь какая-то часть признаков. Назовем эту часть сигнатурой.
Рассмотрим, например, два процесса на очень удаленных друг от друга уровнях иерархии биологической
организации — сознательное узнавание и макромолеку- лярную функцию. Человек может узнать знакомого по немногим характерным признакам. Какие именно признаки задаются — это определяется ситуацией (например, знакомый виден с большого расстояния или наблюдатель слышит его голос по телефону); кроме того, это зависит также и от привычного для наблюдателя порядка узнавания. Если только наблюдатель не прилагает специальных усилий, то обычно он вообще не замечает различия между объектом и его сигнатурой. В самом деле, люди по большей части сильно преувеличивают количество информации, которое они используют в процессе узнавания. Вспомним, например, каким малым числом штрихов искусному карикатуристу удается изобразить свою «жертву».
Обратимся теперь к макромолекулярному уровню. Из приведенного выше рассмотрения примеров с химо- трипсином и брадикинином ясно, что в осуществлении функции решающую роль играет лишь какая-то малая доля общего «комплекта» аминокислот, входящих в состав данного полипептида; именно ее мы и называем сигнатурой. Вообще говоря, сигнатурой молекулы служат все те ее особенности, благодаря которым она становится участником данной реакции; аналогичным образом сигнатурой макромолекулы служат все те особенности расположения мономеров, которые определяют участие этой макромолекулы в данной реакции. В мире нуклеиновых кислот принцип сигнатуры справедлив на молекулярном уровне; об этом свидетельствуют опыты с использованием аналогов оснований. Весьма сомнительно, чтобы этот принцип оставался справедливым на макромолекулярном уровне, так как каждый мономер участвует примерно в одинаковой степени во всех функциональных взаимодействиях. В мире белков принцип сигнатуры выполняется чрезвычайно строго как на молекулярном, так и на макромолекулярном уровне; о первом свидетельствуют опыты с аналогами аминокислот, о втором — данные того же типа, что и результаты, полученные для двух частных случаев — химотрипсина и брадикинина. Легко показать, что принцип узнавания по сигнатурам справедлив также на уровне клетки, клеточных систем и физиологических функций, т. е. на всех уровнях биологической организации.
Прежде чем приводить формальное определение принципа сигнатуры, следует обсудить два других тесно связанных с ним понятия — понятие символа и понятие носителя сигнатуры. Символ — это сигнатура информации, содержащейся в реальном событии, записанная при помощи некоего кода, который может быть совершенно произвольным. В операции с символом не обязательно должен принимать физическое участие референт, как это происходит, например, при произнесении слова. Сигнатура подразумевает прямое наличие объекта, а носитель сигнатуры — прямое, непосредственное действие этого объекта. Например, антигенный детерминант является сигнатурой антигена; антитело несет сигнатуру, но его роль не исчерпывается этим. Субстрат не является сигнатурой фермента, с которым он вступает во взаимодействие, хотя он и может нести сигнатуру фермента, участвующего в его образовании.
Перейдем теперь к формальному рассмотрению. Пусть и — некий объект с N различными признаками, Я] — области изменения /-го признака, причем величины ги>] в пределах этого диапазона можно отличить друг от друга качественно или количественно и они либо непрерывны, либо дискретны, и можно представить в виде вектора в Л^-мерном пространстве. Обозначим сигнатуру и через V, где V содержит некоторое, но не все количество информации, присутствующее в и. V может быть упорядоченной выборкой некоторых признаков, свойственных и, и тогда его можно представить в виде проекции вектора и на некую гиперплоскость с числом измерений, меньшим N. Оно может быть также неупорядоченной совокупностью значений гю. Области изменений переменных, входящих в V, могут оказаться меньше этой области для и, т. е. некоторые изменения признаков не входят в сигнатуру, хотя сами признаки входят в нее. Признаками V могут служить результаты операций с некоторыми (или со всеми) признаками и, например сумма всех значений ги по модулю х или наибольшее из всех значений » и т. д. Носителем сигналу-
ры может служить какой-то объект, часть признаков которого (но не все они) является сигнатурой и.
Двузначность и двусмысленность. Точно так же, как у человека могут быть разные сигнатуры для разных знакомых, макромолекулы обладают разными сигнатурами для разных функций. Если какой-либо объект обладает двумя функционально различными сигнатурами (или же большим их числом), то возникает двузначность эффекта, который он может вызывать. Вместе с тем у объектов, существенно отличающихся друг от друга,
могут оказаться неразличимые в какой-то ситуации сигнатуры; в таком случае говорят о двусмысленности причины эффекта, вызываемого этими объектами. В теории информации условились для неопределенности эффекта, или последствия, применять термин двузначность, а для неопределенности причины — термин двусмысленность.
Пусть С — совокупность молекул (или классов молекул), составляющих данную систему; пусть индекс I означает, что молекула несет сигнатуру, обеспечивающую ее участие в i-й реакции в этой системе; пусть Вг— совокупность всех молекул в С, несущих i-ю сигнатуру. Каждая молекула может принадлежать 0, 1, 2 или большему числу совокупностей В. Фиг. 7 иллюстрирует ситуации, которые могут возникать в тех случаях, когда молекулы принадлежат двум совокупностям В.
В случае I все молекулы, несущие сигнатуру несут также сигнатуру j. В результате появляется двузначность, но отсутствует двусмысленность.
В случае II мы имеем двузначность и ограниченную двусмысленность (если осуществляется реакция, зависящая от сигнатуры i, то участвующая в ней молекула может нести сигнатуру j, но может и не нести ее).
В случае III наблюдается как двузначность, так и двусмысленность.
В случае IV нет ни двузначности, ни двусмысленности.
Надежность действия сигнатур. Перекрывание совокупностей В приводит к двузначности и двусмысленности. Неопределенность означает возможность путаницы, а путаница, касающаяся причин и эффектов, может оказаться весьма вредной. Следовательно, надежность действия означает отсутствие неопределенности. Тогда меру надежности можно связать с мерой перекрывания совокупностей В. Введем удобную меру такого перекрывания.
Пусть {С} — совокупность молекул, участие которых в ряде реакций обеспечивается их сигнатурами. Рассмотрим, например, все белковые молекулы системы и множество всех тех реакций с белками, которые могут происходить в данной системе в данный момент времени. Эти реакции, а следовательно, и соответствующие сигнатуры можно разбить на функциональные классы (ферментативные, антигенные и т. п.), поскольку входящие в исходную систему молекулы так распределены по совокупностям {5г}, что каждая молекула {Вг} обладает сигнатурой г. Определим вероятность того, что какая- либо молекула, принадлежащая к одной совокупности В, принадлежит также какой-нибудь другой или нескольким другим совокупностям. Если в {С} входят все молекулы, то вероятность того, что данная молекула не принадлежит совокупности {В3}, равнагде
Вз (мера совокупности {В3}) есть вероятность того, что выбранная наудачу молекула принадлежит совокупности {В,}. В этом смысле мера {С} равна 1, но в расчетах величина С записывается в явном виде с целью показать, что размер совокупностей В всегда измеряется относительно размера совокупности С. Вероятность того, что какая-либо молекула не несет никакой сигнатуры,
кроме сигнатуры i, равна тогда произведению
где А — общее число сигнатур в исследуемом функциональном классе. Величина А может равняться,
например, общему числу различных типов ферментативной активности. Если А не очень мало, а каждое отдель
ное значение В/С мало,
Если ни одна из величин В3 не вносит существенного вклада в приведенную сумму, то среднее значениеопределяется из
и следовательно, вероятность тоге?, что
какой-либо член совокупностине принадлежит вместе с тем другой совокупности, приблизительно равна
. Вероятность того, что он одновременно
принадлежит и другой совокупности,равна единице минус эта величина, т. е. пристановится
равной. Это и есть искомая величина — вероятность
возникающей неопределенности. Отметим, что А служит мерой функциональных потребностей системы (например, числа различных типов ферментативной активности), тогда какопределяет максимальное число различимых сигнатур, т. е. функциональную емкость, Итак, вероятность возникающей неопределенности задается отношением функциональных потребностей к функциональной емкости данной системы. Это согласуется с нашим интуитивным представлением—чем ближе к пределам возможностей системы, тем больше опасность путаницы и ошибки.
Обобщим полученный выше результат на случай двусмысленности. Пусть—совокупность всех объектов какого-то класса, интересующего нас в данной ситуации. Будем рассматривать каждый объект и в {С} как упорядоченную систему признаков. Пусть имеетсятаких признаков, причем первый может иметьзначений, второй—значений и т. д. Тогда каждый объект выражается Л^-кратным или просто Л/шабором чисел, а коли-
ло возможных типов М-наборов в {С} равноКо
личество информации, требуемое для спецификации одного признака,равно в среднем при условии,что все
признаки равновероятны. Если они не равновероятны, то величинунужно заменить какой-то информационной функцией. Здесь вводится предположе
ние о возможности когерентного считывания всей совокупности величин Я, хотя в биологических процессах такая ситуация, вероятно, осуществляется редко. Однако это обстоятельство не имеет решающего значения, если в качестве вероятностей, участвующих в определении , выбираются некоторые реальные хаоактеоистики процесса считывания. Поэтому, положив мы можем считать, что количество информации, необходимое для спецификации данного объекта и в С, имеет вид _. Можно также считать,
что 1есть среднее количество информации в расчете на один, признак, необходимое для спецификации данного объекта и.
Аналогичным образом пусть функциональные сигнатуры, так же как и совокупности В, определяются признаками, варьирующими в ограниченных пределах, Яа и Яь соответственно. Это может означать либо использование только части области изменения каждой переменной, либо использование всей этой области, но лишь для некоторых переменных. Тогда интересующее нас число сигнатур равногдеесть сред
нее количество информации в расчете на один признак, требуемое для спецификации данной сигнатуры. Аналогичным образом мы полагаем, что равно средне
му количеству информации в расчете на один признак, требуемому для спецификацииопределенного члена данной совокупности В. Тогда ,равно также средней двусмысленности объекта при заданной сигнатуре,
аравно уменьшению неопределенности
объекта, если его сигнатура известна.
В теории информации эта величина определяет количество переданной информации в расчете на одну реакцию и на один признак и обозначается через Т(С; А). Тогда количество информации в расчете на один признак, передача которой должна обеспечить успешную функцию, будет равно; разность
есть излишняя информация в расчете на один признак и в среднем на одну реакцию. Отметим, что излишняя информация является избыточной, но не вся избыточная информация оказывается излишней. Сигнатура должна содержать некоторое минимальное количество избыточной информации, требуемое для преодоления описанной выше двузначности.
Окончательно мы получаем вероятность двусмысленности, равную:. Поскольку при выводе предполагалось, что отнесение объектов к совокупности В носит случайный характер, можно считать, что в оптимальных условиях мы получим, во всяком случае, не худший результат. При большом N случайный выбор обеспечивает хорошее приближение к оптимальным условиям. Отсюда следует, что при достаточно большом N (число признаков, определяющих сигнатуру) вероятность двусмысленности можно поддерживать пренебрежимо малой до тех пор, пока в системе останется хотя бы ничтожное количество излишней информации.
Сказанное выше совпадает с одним из слабых результатов основной теоремы теории информации. В ней содержатся и более сильные утверждения, согласно которым двусмысленность фактически становится равной нулю (а не приближается к нему), но они требуют трудоемких операций и доказательств, что выходит за рамки интересующих нас здесь проблем [29].
Рассмотрим, например, два процесса на очень удаленных друг от друга уровнях иерархии биологической
организации — сознательное узнавание и макромолеку- лярную функцию. Человек может узнать знакомого по немногим характерным признакам. Какие именно признаки задаются — это определяется ситуацией (например, знакомый виден с большого расстояния или наблюдатель слышит его голос по телефону); кроме того, это зависит также и от привычного для наблюдателя порядка узнавания. Если только наблюдатель не прилагает специальных усилий, то обычно он вообще не замечает различия между объектом и его сигнатурой. В самом деле, люди по большей части сильно преувеличивают количество информации, которое они используют в процессе узнавания. Вспомним, например, каким малым числом штрихов искусному карикатуристу удается изобразить свою «жертву».
Обратимся теперь к макромолекулярному уровню. Из приведенного выше рассмотрения примеров с химо- трипсином и брадикинином ясно, что в осуществлении функции решающую роль играет лишь какая-то малая доля общего «комплекта» аминокислот, входящих в состав данного полипептида; именно ее мы и называем сигнатурой. Вообще говоря, сигнатурой молекулы служат все те ее особенности, благодаря которым она становится участником данной реакции; аналогичным образом сигнатурой макромолекулы служат все те особенности расположения мономеров, которые определяют участие этой макромолекулы в данной реакции. В мире нуклеиновых кислот принцип сигнатуры справедлив на молекулярном уровне; об этом свидетельствуют опыты с использованием аналогов оснований. Весьма сомнительно, чтобы этот принцип оставался справедливым на макромолекулярном уровне, так как каждый мономер участвует примерно в одинаковой степени во всех функциональных взаимодействиях. В мире белков принцип сигнатуры выполняется чрезвычайно строго как на молекулярном, так и на макромолекулярном уровне; о первом свидетельствуют опыты с аналогами аминокислот, о втором — данные того же типа, что и результаты, полученные для двух частных случаев — химотрипсина и брадикинина. Легко показать, что принцип узнавания по сигнатурам справедлив также на уровне клетки, клеточных систем и физиологических функций, т. е. на всех уровнях биологической организации.
Прежде чем приводить формальное определение принципа сигнатуры, следует обсудить два других тесно связанных с ним понятия — понятие символа и понятие носителя сигнатуры. Символ — это сигнатура информации, содержащейся в реальном событии, записанная при помощи некоего кода, который может быть совершенно произвольным. В операции с символом не обязательно должен принимать физическое участие референт, как это происходит, например, при произнесении слова. Сигнатура подразумевает прямое наличие объекта, а носитель сигнатуры — прямое, непосредственное действие этого объекта. Например, антигенный детерминант является сигнатурой антигена; антитело несет сигнатуру, но его роль не исчерпывается этим. Субстрат не является сигнатурой фермента, с которым он вступает во взаимодействие, хотя он и может нести сигнатуру фермента, участвующего в его образовании.
Перейдем теперь к формальному рассмотрению. Пусть и — некий объект с N различными признаками, Я] — области изменения /-го признака, причем величины ги>] в пределах этого диапазона можно отличить друг от друга качественно или количественно и они либо непрерывны, либо дискретны, и можно представить в виде вектора в Л^-мерном пространстве. Обозначим сигнатуру и через V, где V содержит некоторое, но не все количество информации, присутствующее в и. V может быть упорядоченной выборкой некоторых признаков, свойственных и, и тогда его можно представить в виде проекции вектора и на некую гиперплоскость с числом измерений, меньшим N. Оно может быть также неупорядоченной совокупностью значений гю. Области изменений переменных, входящих в V, могут оказаться меньше этой области для и, т. е. некоторые изменения признаков не входят в сигнатуру, хотя сами признаки входят в нее. Признаками V могут служить результаты операций с некоторыми (или со всеми) признаками и, например сумма всех значений ги по модулю х или наибольшее из всех значений » и т. д. Носителем сигналу-
ры может служить какой-то объект, часть признаков которого (но не все они) является сигнатурой и.
Двузначность и двусмысленность. Точно так же, как у человека могут быть разные сигнатуры для разных знакомых, макромолекулы обладают разными сигнатурами для разных функций. Если какой-либо объект обладает двумя функционально различными сигнатурами (или же большим их числом), то возникает двузначность эффекта, который он может вызывать. Вместе с тем у объектов, существенно отличающихся друг от друга,
могут оказаться неразличимые в какой-то ситуации сигнатуры; в таком случае говорят о двусмысленности причины эффекта, вызываемого этими объектами. В теории информации условились для неопределенности эффекта, или последствия, применять термин двузначность, а для неопределенности причины — термин двусмысленность.
Пусть С — совокупность молекул (или классов молекул), составляющих данную систему; пусть индекс I означает, что молекула несет сигнатуру, обеспечивающую ее участие в i-й реакции в этой системе; пусть Вг— совокупность всех молекул в С, несущих i-ю сигнатуру. Каждая молекула может принадлежать 0, 1, 2 или большему числу совокупностей В. Фиг. 7 иллюстрирует ситуации, которые могут возникать в тех случаях, когда молекулы принадлежат двум совокупностям В.
В случае I все молекулы, несущие сигнатуру несут также сигнатуру j. В результате появляется двузначность, но отсутствует двусмысленность.
В случае II мы имеем двузначность и ограниченную двусмысленность (если осуществляется реакция, зависящая от сигнатуры i, то участвующая в ней молекула может нести сигнатуру j, но может и не нести ее).
В случае III наблюдается как двузначность, так и двусмысленность.
В случае IV нет ни двузначности, ни двусмысленности.
Надежность действия сигнатур. Перекрывание совокупностей В приводит к двузначности и двусмысленности. Неопределенность означает возможность путаницы, а путаница, касающаяся причин и эффектов, может оказаться весьма вредной. Следовательно, надежность действия означает отсутствие неопределенности. Тогда меру надежности можно связать с мерой перекрывания совокупностей В. Введем удобную меру такого перекрывания.
Пусть {С} — совокупность молекул, участие которых в ряде реакций обеспечивается их сигнатурами. Рассмотрим, например, все белковые молекулы системы и множество всех тех реакций с белками, которые могут происходить в данной системе в данный момент времени. Эти реакции, а следовательно, и соответствующие сигнатуры можно разбить на функциональные классы (ферментативные, антигенные и т. п.), поскольку входящие в исходную систему молекулы так распределены по совокупностям {5г}, что каждая молекула {Вг} обладает сигнатурой г. Определим вероятность того, что какая- либо молекула, принадлежащая к одной совокупности В, принадлежит также какой-нибудь другой или нескольким другим совокупностям. Если в {С} входят все молекулы, то вероятность того, что данная молекула не принадлежит совокупности {В3}, равнагде
Вз (мера совокупности {В3}) есть вероятность того, что выбранная наудачу молекула принадлежит совокупности {В,}. В этом смысле мера {С} равна 1, но в расчетах величина С записывается в явном виде с целью показать, что размер совокупностей В всегда измеряется относительно размера совокупности С. Вероятность того, что какая-либо молекула не несет никакой сигнатуры,
кроме сигнатуры i, равна тогда произведению
где А — общее число сигнатур в исследуемом функциональном классе. Величина А может равняться,
например, общему числу различных типов ферментативной активности. Если А не очень мало, а каждое отдель
ное значение В/С мало,
Если ни одна из величин В3 не вносит существенного вклада в приведенную сумму, то среднее значениеопределяется из
и следовательно, вероятность тоге?, что
какой-либо член совокупностине принадлежит вместе с тем другой совокупности, приблизительно равна
. Вероятность того, что он одновременно
принадлежит и другой совокупности,равна единице минус эта величина, т. е. пристановится
равной. Это и есть искомая величина — вероятность
возникающей неопределенности. Отметим, что А служит мерой функциональных потребностей системы (например, числа различных типов ферментативной активности), тогда какопределяет максимальное число различимых сигнатур, т. е. функциональную емкость, Итак, вероятность возникающей неопределенности задается отношением функциональных потребностей к функциональной емкости данной системы. Это согласуется с нашим интуитивным представлением—чем ближе к пределам возможностей системы, тем больше опасность путаницы и ошибки.
Обобщим полученный выше результат на случай двусмысленности. Пусть—совокупность всех объектов какого-то класса, интересующего нас в данной ситуации. Будем рассматривать каждый объект и в {С} как упорядоченную систему признаков. Пусть имеетсятаких признаков, причем первый может иметьзначений, второй—значений и т. д. Тогда каждый объект выражается Л^-кратным или просто Л/шабором чисел, а коли-
ло возможных типов М-наборов в {С} равноКо
личество информации, требуемое для спецификации одного признака,равно в среднем при условии,что все
признаки равновероятны. Если они не равновероятны, то величинунужно заменить какой-то информационной функцией. Здесь вводится предположе
ние о возможности когерентного считывания всей совокупности величин Я, хотя в биологических процессах такая ситуация, вероятно, осуществляется редко. Однако это обстоятельство не имеет решающего значения, если в качестве вероятностей, участвующих в определении , выбираются некоторые реальные хаоактеоистики процесса считывания. Поэтому, положив мы можем считать, что количество информации, необходимое для спецификации данного объекта и в С, имеет вид _. Можно также считать,
что 1есть среднее количество информации в расчете на один, признак, необходимое для спецификации данного объекта и.
Аналогичным образом пусть функциональные сигнатуры, так же как и совокупности В, определяются признаками, варьирующими в ограниченных пределах, Яа и Яь соответственно. Это может означать либо использование только части области изменения каждой переменной, либо использование всей этой области, но лишь для некоторых переменных. Тогда интересующее нас число сигнатур равногдеесть сред
нее количество информации в расчете на один признак, требуемое для спецификации данной сигнатуры. Аналогичным образом мы полагаем, что равно средне
му количеству информации в расчете на один признак, требуемому для спецификацииопределенного члена данной совокупности В. Тогда ,равно также средней двусмысленности объекта при заданной сигнатуре,
аравно уменьшению неопределенности
объекта, если его сигнатура известна.
В теории информации эта величина определяет количество переданной информации в расчете на одну реакцию и на один признак и обозначается через Т(С; А). Тогда количество информации в расчете на один признак, передача которой должна обеспечить успешную функцию, будет равно; разность
есть излишняя информация в расчете на один признак и в среднем на одну реакцию. Отметим, что излишняя информация является избыточной, но не вся избыточная информация оказывается излишней. Сигнатура должна содержать некоторое минимальное количество избыточной информации, требуемое для преодоления описанной выше двузначности.
Окончательно мы получаем вероятность двусмысленности, равную:. Поскольку при выводе предполагалось, что отнесение объектов к совокупности В носит случайный характер, можно считать, что в оптимальных условиях мы получим, во всяком случае, не худший результат. При большом N случайный выбор обеспечивает хорошее приближение к оптимальным условиям. Отсюда следует, что при достаточно большом N (число признаков, определяющих сигнатуру) вероятность двусмысленности можно поддерживать пренебрежимо малой до тех пор, пока в системе останется хотя бы ничтожное количество излишней информации.
Сказанное выше совпадает с одним из слабых результатов основной теоремы теории информации. В ней содержатся и более сильные утверждения, согласно которым двусмысленность фактически становится равной нулю (а не приближается к нему), но они требуют трудоемких операций и доказательств, что выходит за рамки интересующих нас здесь проблем [29].
Источник: Г. Касмлер, «ВОЗНИКНОВЕНИЕ БИОЛОГИЧЕСКОЙ ОРГАНИЗАЦИИ» 1967