СПИСОК СОКРАЩЕНИЙ И ТЕРМИНОЛОГИЯ
кДНК...комплементарная ДНК
FcR (Fc-receptor)...(лейкоцитарные) Рс-рецептор(ы)
FcR-подобныйХе)...подобный(е) лейкоцитарным Fc-рецепторам
FcR семейство...семейство лейкоцитарных FcR
IgSF (Immunoglobulin Superlamily...надсемейство иммуноглобулинов
ИГ...иммуноглобулин
АГ...антиген
AT...антитело
ИГ-подобный...принадлежащий к IgSF
TCR (T-cell receptor complex)...Т-клеточный рецепторный комплекс
BCR(B-cell receptor complex)...В-клеточный рецепторный комплекс
KIR (Killer cell immunoglobulin-like feceptors)
...ингибирующий(е) ИГ-подобные рецепторы NK клеток
MHC (Major histocompatibility complex)...главный комплекс гистосовместимости
IT AM (Immunoreceptor fyrosine-based activation motif)
...тирозин-основанный активирующий мотив
ITIM (|mmunoreceptor fyrosine-based Inhibitory motif)
...тирозин-основанный ингибирующий мотив
ТМ...трансмембранный район
IFGP//FGP (IgSF FcR gp42)...IFGP рецептор/ген
FCRL/FCKZ, (FcR-like)...FCRL рецептор/ген
XFL/XFL (Xenopus FcR-like)...XFL рецептор/ген
НТО...нетранслируемая область
ПЦР...полимеразная цепная реакция
ПААГ...полиакриламидный гель
п.о...пар оснований
ПТК...протеин-тирозин киназа
GPI (Glycosilphosdphoditil inositol)...гликозил-фосфадитилинозитольный(е)
АЗЦТ...антителозависимая цитотоксичность
ВВЕДЕНИЕ
Актуальность проблемы. В ходе эволюции многоклеточными организмами были выработаны различные стратегии защиты от патогенов. Бспозвоночным присущ врожденный иммунный ответ, характеризующийся относительно неспецифичными реакциями, основанными главным образом на фагоцитозе и выработке широкого спектра антибактериальных факторов. У позвоночных распознавание и элиминация чужеродных антигенов осуществляется чрезвычайно сложной системой иммунитета, включающей как неспецифичные, так и специфичные механизмы. Становление адаптивного иммунитета в процессе эволюции позвоночных является ярким примером того, как из ограниченного количества предковых генов путем дупликаций и согласованной структурно-функциональной дивергенции возникает чрезвычайно сложная генетическая система. В первую очередь это относится к генам надсемейства иммуноглобулинов (IgSF) - у млекопитающих обнаружено около тысячи генов этого надсемейства, на порядок больше, чем у беспозвоночных. Выяснение последовательности событий в процессе экспансии IgSF молекул важно для понимания фундаментальных принципов формирования и функционирования иммунной системы.
Первоочередным подходом в реконструкции эволюционной истории иммунной системы является выявление филогенетических связей между различными семействами IgSF, а также отдельными молекулами, близкие гомологи которых не были обнаружены. Объектом настоящего исследования является семейство лейкоцитарных Fc-рецепторов (FcR). Эта группа структурно родственных поверхностных белков получила свое название из-за способности связывать константные области тяжелых цепей иммуноглобулинов (Ig). Экспрессия на разных типах лейкоцитов, в том числе и на тех, которые лишены собственных антиген-распознающих рецепторов, делает FcR-семейство важным элементом объединения клеточного и гуморального иммунитета. По своим сигнальным функциям FcR разделяются на ингибирующие и активирующие рецепторы. Первый класс несет в цитоплазматических районах тирозин-основанные ингибирующие сигнальные мотивы (ITIM), второй экспрессируется на поверхности молекул в комплексе с сигнальными субъединицами, несущими тирозин-основанные активирующие мотивы
7
(ITAM). Активирующие рецепторы ответственны за запуск эффекторных функций лейкоцитов, таких как фагоцитоз и антителозависимая цитотоксичность, ингибирующие рецепторы способны подавлять эффекторные реакции и блокировать синтез антител. До настоящего времени FcR были описаны только у млекопитающих, их структурная взаимосвязь с другими семействами IgSF и эволюционное происхождение остаются неясными. К началу настоящей работы было неизвестно также, имеются ли у млекопитающих гены, в структурном отношении родственные генам FcR.
Цели и задачи исследования. Целью данного исследования являлось изучение эволюции генов FcR у наземных позвоночных. Были поставлены две основные задачи:
1. Идентификация и структурный анализ неизвестных FcR-подобных генов у представителей млекопитающих (человека Homo sapiens и мыши Mus musculus).
2. Идентификация и структурный анализ FcR-подобных генов у представителя земноводных, африканской шпорцевой лягушки (Xenopus laevis).
Научная новизна. У человека и мыши впервые идентифицированы две группы генов, гомологичных генам FcR и названных IFGP и FCRL. У африканской шпорцевой лягушки впервые идентифицировано семейство FcR-подобных генов, названных XFL. Установлены взаимное расположение и экзон-интронная организация FcR-подобных генов у человека и мыши. Установлено, что дупликации генов в семействе происходили видоспецифичным образом и сопровождались перетасовкой экзонов, в результате которой у разных видов возникали рецепторы с разной модульной организацией.
Научно-практическая ценность. Идентификация новых генов, принадлежащих к FcR-семейству, вносит вклад в генетику и иммунологию человека, мыши и Xenopus laevis, а также в развитие представлений об эволюции иммунной системы и механизмах филогенетической экспансии IgSF.
8
Апробация работы. Материалы диссертации докладывались на:
1. 11-м Международном иммунологическом конгрессе, Стокгольм, Швеция, 2001;
2. 9-м Международном ISDCI конгрессе, Ст. Андрю, Шотландия, 2003;
3. 2-м Международном симпозиуме "Эволюция жизни на Земле", Томск, 2001;
4. Конференции молодых ученых-грантодержателей биологических институтов СО РАН, Новосибирск, 2001;
5. Семинаре в Департаменте микробиологии и иммунологии Медицинского центра Университета г. Рочестер, США, 2003;
6. Отчетных сессиях аспирантов Института цитологии и генетики СО РАН в 2001, 2002.
9
1. ОБЗОР ЛИТЕРАТУРЫ
1.1. Основные принципы структурной организации лейкоцитарных рецепторов
Аминокислотные последовательности большинства белков содержат участки, схожие с районами, представленными в других белках. Такие последовательности часто соответствуют независимым структурным единицам или доменам. На сегодняшний день выделяется около 20 основных групп доменов со схожей третичной структурой (Doolittle, 1995). В тех случаях, когда третичная структура неизвестна и сравниваются первичные аминокислотные последовательности, для описания сходства между белками используется термин "надсемейство". Например, каждый белок из надсемейства иммуноглобулинов (IgSF) содержит хотя бы один ИГ-подобный домен (рис. 1). Когда в одной молекуле вместе с доменом из одного надсемейства присутствуют домены из других надсемейств, то такую молекулу называют мозаичной. В мозаичных IgSF молекулах вместе с ИГ доменами чаще всего встречаются домены Fn3 (фибронектин третьего типа) надсемейства (Doolittle, 1995; Barclay etal., 1997).
Среди молекул IgSF есть секретируемые или внеклеточные, внутриклеточные, а также ассоциированные с клеточной мембраной формы. Молекулы IgSF выполняют целый спектр функций: у беспозвоночных молекулы IgSF выполняют функции адгезинов, мышечных белков, входят в состав внутриклеточных киназ, а также участвуют в развитии нервной системы (Teichmann et al., 2000). У позвоночных IgSF молекулы участвуют также и в развитии специфичного иммунного ответа. Большинство таких молекул экспрессируется на поверхности лейкоцитов, клеток иммунной системы. На сегодняшний день на лейкоцитах идентифицировано более 200 видов поверхностных рецепторов и более половины их них содержит ИГ-подобные структуры (Barclay et al., 1997; Thomas, 1989). Эти рецепторы инициируют проявление эффекторной функции клетки, на которой они экспрессируются.
Для IgSF белков, экспрессирующихся на поверхности лейкоцитов, характерно (Williams and Barclay, 1988; Barclay et al., 1997):
• наличие хотя бы одного ИГ-домена во внеклеточной части рецептора;
• прикрепление к мембране;
• гликозилирование внеклеточных областей;
• наличие сигнальных мотивов в цитоплазматических участках.
(
1 2
15
соон
соон соон соон
Рис. 1. Некоторые поверхностные рецепторы лейкоцитов, принадлежащие к IgSF. 1-5 - TCR (слева направо: CD3e, CD3y, CD35, ^-ц и TCRap гетеродимеры), 6-7 - BCR (CD79, mlgM), 8-10 - FcsRI (у-у гомодимер, аир субъединицы), 11 - CD90, 12 - CD28, 13 - CD8, 14 - CD7,15 - CD2,16 - CD121a, 17 - MHCI, 18 - МНСП, 19 - IL-1R, 20 - IL-3R, 21 - IL-6R, 22 - CD47. Условные обозначения: 23-25 - Ig-подобные домены V, С1 и С2 типов соответственно, 26 - сайты N- гликозилирования, 27 -сайты О-гликозилирования, 28 - домены надсемейства МНС. 29 - домены надсемейства цитокиновых рецепторов, 30 -домены надсемейства фибронектина III типа, 31 - GPI-якорь, 32 - трансмембранный домен.
11
1.1.1. Структура ИГ-домена
Пептидная цепь каждого ИГ-подобного домена состоит из примерно 100 аминокислотных остатков и свернута в характерную структуру, похожую на "сэндвич" из двух р-слоев (рис. 2). Основу р-слоев составляют антипараллельные р-нити длиной в 5-10 аминокислотных остатков. Третичная структура домена стабилизируется за счет дисульфидной связи между цистеинами из противоположных р-слоев. Выделяют 3 основных типа ИГ-доменов: V, С1 и С2 (Barclay et al., 1997; Smith and Xue, 1997). У домена Cl-типа 4 р-нити в одном и 3 в другом р-слое (ABED/GFC). В доменах С2 и V-типов по 4 Р-нити в каждом р-слое (ABED/GFCC), кроме того, у доменов V-типа есть дополнительная короткая нить, пересекающая верхнюю часть домена (ABED/GFCCC"). V и С1 домены значительно отличаются в средней части: у домена V-типа полипептидная цепь между цистеиновыми остатками содержит 65-75 аминокислот, у С1 — 55-60. С2 домен является промежуточным - с С1-доменом его объединяет сходный размер полипептида между цистеинами, ас V-доменом - высокая гомология последовательностей Р-нитей Е и F (Williams and Barclay, 1988; Barclay et al., 1997). Наибольшей консервативностью отличаются аминокислотные остатки р-слоев, составляющие основу третичной структуры, в том числе цистеины, образующие дисульфидную связь. Однако известно несколько белков надсемейства, чьи ИГ-подобные домены (V- и С-типа) лишены дисульфидной связи. В этих белках стабильность третичной структуры обеспечивается остатками гидрофобных аминокислот, заменяющими цистеиновые остатки.
Основная функция ИГ-подобного домена - это связывание лиганда. Несмотря на схожую третичную структуру всех ИГ подобных доменов, они обладают широким спектром функций и способны связывать различные лиганды как белкового, так и небелкового происхождения. Такое функциональное разнообразие объясняется вариабельностю аминокислотных остатков, смотрящих наружу ИГ-домена, а также остатков в петлях, соединяющих р-нити (Williams and Barclay, 1988; Doolittle, 1995).
II
NH,
G
COOH
^SrS:
A U С C^&D EIf G
А В Ъ D E' ? (л
III
l Г 1
в
NH2
G
U
Рис. 2. Третичная структура ИГ-доменов V- (I) и С-типов (II) легких цепей иммуноглобулинов. (III) -показано соединение р-нитей (A-G) в двух Р-слоях V- (ABED и GFCC'C") и С- (ABED и GFC) доменов. Консервативный S-S мостик соединяет В и F Р-нити.
13
1.1.2. Прикрепление лейкоцитарных поверхностных молекул к клеточной мембране
Описано несколько способов закрепления белков на клеточной поверхности. Белки I и II типа содержат по одному трансмембранному (ТМ) району, в то время как белки III и IV типа - по несколько. Белки V типа не имеют ТМ районов и для закрепления на мембране используют липидные якоря (рис. 3). Следует отметить, что в большинстве случаев экспериментально невозможно соотнести ТМ район трансмембранных рецепторов с конкретными аминокислотными остатками. Обычно границы ТМ района предсказываются на основе анализа гидрофобности аминокислотной последовательности рецептора.
Наиболее распостраненным способом интеграции в мембрану среди лейкоцитарных поверхностных белков (около 70%, Barclay et al., 1997) является I тип прикрепления с одной пронизывающей мембрану гидрофобной последовательностью. С-конец молекул I типа находится в цитоплазме, а N-конец - снаружи клетки. Исходно такие рецепторы содержат на своем N-конце сигнальную или лидерную последовательность, которая отрезается после прохождения молекулы через бислой ЭПР. Поверхностные молекулы I типа содержат ТМ последовательности размером примерно 25 аминокислотных остатков. За ТМ последовательностью обычно идет кластер положительно заряженных остатков, которые, как полагают, участвуют в связывании с фосфолипидами бислоя. Остатки Asn, Asp, Glu, Gin, His, Lys и Arg обычно не встречаются в ТМ районах. Исключением являются ТМ районы белков, входящих в состав мультимерных мембранных рецепторных комплексов. Классическим примером такого комплекса является Т-клеточный рецепторный комплекс, в котором TCR а и (3 цепи, а также CD3 у, 5, с и С, субъединицы в своих ТМ районах содержат заряженные аминокислотные остатки. Обычно лиганд-связывающая субъединица мультимерного рецепторного комплекса содержит положительно заряженные аминокислотные остатки в ТМ районе, в то время как вспомогательные или сигнальные субъединицы - отрицательно заряженные.
Белки II типа имеют обратную ориентацию по сравнению с молекулами I типа: N-конец находится в цитоплазме и С-конец - вне клетки. Обычно они содержат небольшие цитоплазматические районы, а ТМ последовательности представляют собой неотрезанные сигнальные пептиды.
межклеточное пространство
NH2
цитоплазма
Рис. 3. Способы прикрепления белков к липидному бислою клеточной мембраны. Трансмембранные рецепторы I- и Н-типа единожды пронизывают мембрану, различаясь только положением NH2- и СООН- концов. Трансмембранные рецепторы Ш-типа пронизывают клеточную мембрану несколько раз. Белки V-типа прикрепляются к липидам через GPI-якорь с внешней стороны (а) или через ряд группировок с внутренней стороны (Ь). Черными шариками обозначены сайты гликозилирования.
15
В третью категорию собраны молекулы, несколько раз пронизывающие бислой - от 2 до 12. Наиболее крупные группы образуют G белок-связанные рецепторы и молекулы ТМ4 надсемейства. Молекулы первой группы пронизывают мембрану 7 раз, второй - 4 раза. С- и N-концы молекул ТМ4 надсемейства находятся в цитоплазме, кроме того известно, что петля между третьим и четвертым ТМ районами находится вне клетки, так как является внеклеточной антигенной детерминантой.
Белки IV типа отличаются от белков III типа наличием трансмембранного канала, заполненного водой.
Описано два класса белков V типа. Одни, включая поверхностные клеточные рецепторы, соединены с мембраной через гликозил-фосфадитилинозитольный (GPI) якорь. С-концевой аминокислотный остаток таких белков через фосфоэтаноламинный мостик прикрепляется к гликану ((манноза)3-глюкозамин), который, в свою очередь, связан с фосфадитилинозитолом (ФИ). Подобная структура является высококонсервативной. Межвидовые и клетка-специфичные различия могут заключаться в дополнительных боковых ветвях гликана, ацилировании инозитольного кольца и в природе алифатических цепей ФИ. Присутствие GPI якоря можно выявить исходя из предсказанной белковой последовательности молекулы. GPI-заякоренные молекулы содержат на N-конце сигнальную последовательность для секреции, а также на С-конце сигнальную последовательность, которая отрезается и заменяется на GPI-якорь в ЭПР. Отрезаемый пептид является гидрофобным и состоит из 10-20 остатков, поэтому иногда неотличим от ТМ района. В месте гидролиза обычно распологается несколько остатков с малыми радикалами (Gly, Ala, Ser). Для GPI сигнальных последовательностей характерно отсутствие кластера положительно заряженных аминокислотных остатков на С-конце. В случае CD58 антигена существует два альтернативно сплайсируемых варианта - один с ТМ районом, а второй - с GPI якорем. После связывания с GPI заякоренные молекулы проходят пост-трансляционную модификацию в аппарате Гольджи и везикулярно транспортируются к клеточной поверхности. В случае полярных клеток большая часть GPI-заякоренных белков встречается на апикальной стороне клетки (Barclay et al., 1997; Eisenhaber et al., 1998; Ferguson and Williams, 1988; Nosjean et al., 1997).
16
Другие белки V типа ассоциированы с липидным бислоем через остаток миристиловой кислоты на N-конце. Наиболее часто встречаемыми являются внутриклеточные киназы Src семейства.
1.1.3. Гликозилирование лейкоцитарных рецепторов
Отличительная черта клеточной поверхности - это присутствие углеводных структур как на белках, так и на липидах. Большинство лейкоцитарных поверхностных антигенов, в том числе и из IgSF, являются гликопротеинами (рис. 1). N-гликозилирование происходит по Asp остаткам в мотивах Asn-Xaa-Thr или Asn-Xaa-Ser за исключением Asn-Pro-Thr/Ser и Asn-Xaa-Thr/Ser-Pro последовательностей, которые обычно не гликозилируются. О-гликозилирование происходит по Ser и Thr остаткам в последовательностях, богатых Ser, Thr и Pro. Уровень гликозилирования мембранных белков значительно варьирует, среди наиболее гликозилированных лейкоцитарных молекул находятся Thy-1, CD43 и CD45. Немногие мембранные белки совсем не несут углеводов, но зато такие белки (CD3s и CD81) практически всегда ассоциированы с гликопротеинами.
Одна и та же молекула может нести различные олигосахаридные структуры в зависимости от типа и стадии дифференцировки клетки, в которой она экспрессируется. Различия в гликозилировании рецепторов могут вести к функциональным отличиям как за счет маскирования белковой поверхности и скрытия сайтов связывания лиганда углеводными структурами, так и за счет взаимодействия гликопротеинов с другими молекулами через свои углеводные группы, например с лектинами, селектинами или сиалоадгезинами (Barclay et al., 1997).
1.1.4. Сигнальные мотивы в цитоплазматических районах лейкоцитарных рецепторов
Длина полипептидных цепей внутриклеточных частей ИГ-подобных рецепторов варьирует от 3 (у mlgM) до 543 аминокислотах остатков (у рецептора тромбоцитарного фактора роста). Эти части рецепторов не имеют ИГ-подобных структур. Сходство цитоплазматических участков различных рецепторов, даже при значительном сходстве внеклеточных доменов, часто является очень незначительным
.
17
и сводится к сходству сигнальных элементов (мотивов, связывающих внутриклеточные сигнальные белки). Исключением являются белки, содержащие домен с киназной или фосфатазной активностью во внутриклеточной части. Специфические мотивы, ответственные за связывание киназ, фосфатаз, элементов цитоскелета, белков интернализации и т. д., как правило, включают от 4 до 15 аминокислот с некоторой степенью вырожденности.
1.1.4.1. Активирующие ITAM мотивы
Наиболее важными сигнальными мотивами рецепторов IgSF являются ITAM (Immunoreceptor ifyrosine-based Activation Motif) и ITIM (|mmunoreceptor Ijyrosine-based Inhibitory Motif) мотивы (рис. 4). ITAM мотивы имеют структуру вида YxxL/Ix6 . i3YxxL/I (x - любая аминокислота). Кроме того, большинство известных ITAM в -3 положении от первого тирозина содержат полярную аминокислоту (Glu или Asp). Эти мотивы находятся в цитоплазматических частях многих сигнальных мембранных белков, входящих в состав BCR, TCR и FcR рецепторных комплексов (Cambier et al., 1994; Clevers et al., 1988;). Фосфорилирование тирозиновых остатков в ITAM необходимо для инициации процесса сигнальной трансдукции, то есть передачи сигнала о внеклеточном событии, например связывании рецептором лиганда, в ядро клетки. Фосфорилирование ITAM осуществляется различными внутриклеточными протеин-тирозин киназами (ПТК). На сегодняшний день у млекопитающих известно около 30 немембранных ПТК, которые на основе гомологии можно разделить на 11 семейств (Winkel and Capel, 1996). Сравнительный анализ последовательностей ПТК позволил выявить три консервативных домена, названных SH1 (от Src-homology) SH2 и SH3. В то время как SH1 домен является каталитическим, SH2 и SH3 домены отвечают за связывание ПТК с фосфорилированными тирозиновыми остатками и пролин-богатыми мотивами, соответственно (Pelesh, 1993).
Консенсусная 8НЗ-связывающая последовательность пролин-богатого мотива выглядит следующим образом: хрФРРхР, где х - любая аминокислота, р - обычно пролин и Ф - гидрофобный остаток. SH3 домены встречаются во внутриклеточных ПТК, а также в широком спектре адаптерных белков, участвующих в сигнальной трансдукции. Сайты связывания SH3, пролин-богатые мотивы, встречаются в адаптерных белках, а также в цитоплазматических частях трансмембранных |