В основе почти любого действия или события в вашем организме лежит белок. Белки в красных кровяных тельцах обратимо связывают кислород из воздуха, которым вы дышите. Одни белки тянут за собой другие, обеспечивая сокращение ваших мышц. Белки вытягивают и втягивают выпячивания, с помощью которых клетки иммунной системы протискиваются сквозь ваши ткани. Одни белки в ваших глазах улавливают свет и порождают электрические импульсы, а другие открывают и закрывают шлюзы, направляя эти импульсы в ваш мозг. Множество разных белков содержится не только в клетках, но и за их пределами, придавая, например, прочность и эластичность вашим тканям. Но что же такое белки?
Как и ДНК, белок – это молекула, состоящая из выстроенных в цепь простых единиц. В ДНК простейшим звеном может выступать любой из четырех нуклеотидов, а в белке – любая из 20 аминокислот. В каком бы порядке ни располагались нуклеотиды в цепи, двухцепочечная ДНК всегда укладывается в двойную спираль. Структура белков, напротив, определяется их аминокислотной последовательностью. Каждый белок имеет характерное лишь для него расположение аминокислот, а следовательно, и отличную от других трехмерную форму. Схемы и инструменты для постройки белка закодированы в нем же. В белках, пожалуй, ярче всего проявляется принцип самосборки, подразумевающий, что природа кодирует инструкции по организации вещества в самом веществе, затем они активируются и выполняются универсальными физическими силами. Самосборка характерна не только для живых организмов – насыпаемый песок, например, собирается в конусы, наклоненные под определенными углами, а мыльные пузыри оформляются в сферы, – но в биологии она вездесуща. Изучая белки, мы увидим, как силы порождают формы, как этот процесс увенчивается успехом и все же иногда с треском проваливается и как тяжело компьютерам даются геометрические расчеты, с которыми молекулы справляются за микросекунды.
Аминокислотная цепь в воде изгибается, перекручивается и складывается в специфическую форму. Чаще всего в белках встречаются два варианта вторичной структуры: спирали и листы (на рисунке – слева и справа соответственно).
Я не стал рисовать все атомы в этих структурах, а ограничился лишь несколькими показательными точками и связями между ними. Спиральная и листовая структуры в белковых молекулах настолько распространены, что мы часто изображаем стилизованные формы – плавную спираль диаметром около нанометра (одной миллиардной доли метра) и лист (или слегка складчатый слой) из нескольких тяжей шириной примерно треть нанометра.
Раньше всего, в 1958 году, была открыта трехмерная структура белка миоглобина, который переносит кислород в мышцах. Как и в случае ДНК и многих других молекул, это стало возможно благодаря математическому анализу дифракционной картины, полученной в результате облучения вещества рентгеновскими лучами. Структурой миоглобина занималась в Кембриджском университете группа Джона Кендрю. Для проведения рентгенографии белки нужно перевести в твердое состояние, превратив в кристаллы. Но если кристаллы сахара, например, можно получить на любой кухне, то подтолкнуть белки к кристаллизации не так-то просто даже в современной лаборатории. Сотрудники Кендрю безуспешно экспериментировали с миоглобином морских свиней, пингвинов, морских котиков и других животных, пока не наткнулись на мясо кашалота, очень кстати припасенное в морозильной камере на Кембриджской станции низкотемпературных исследований. (Особенное внимание именно к этой группе животных объясняется тем, что мышцы морских обитателей, дышащих воздухом и погружающихся на большую глубину, содержат очень много миоглобина, который позволяет им запасать больше кислорода и реже всплывать на поверхность.) Белок кашалота формировал «поистине изумительные <…> гигантские кристаллы»1. Изучив их, Кендрю и его коллеги определили, что 153-аминокислотная цепь миоглобина складывается в структуру из восьми спиралей и нескольких неспиральных перемычек, прикрепленную к плоскому небелковому комплексному соединению, в котором атом железа связывается с кислородом (см. рисунок).
Пример белка, состоящего главным образом из листов, мы тоже можем найти в морском мире. Зеленый флуоресцентный белок, GFP, – это светоиспускающий белок, впервые обнаруженный в организме биолюминесцентной медузы. GFP представляет собой цепь из 238 аминокислот, сложенную в бочонок из листов шириной около трех нанометров, внутри которого находится фрагмент молекулы, отвечающий за испускание зеленого света (см. рисунок ниже2). Этот белок не остался простой океанической диковиной. Ученые научились внедрять GFP в бактерии, грибы, растения и даже животных, от плодовых мушек до рыбок данио-рерио, превратив его в своеобразный маяк, метку, позволяющую визуализировать нужные типы клеток и наблюдать, как они растут, движутся и делятся. Кроме того, GFP можно cшивать с интересующими белками, создавая так химерные молекулы-репортеры, за которыми легко следить: по свечению можно узнать, в какой части клетки они находятся, как ведут себя, когда клетки выполняют разные задачи, какие связи устанавливают с другими белками при создании более сложных структур[13]. Сегодня существует богатая палитра производных от GFP либо происходящих из кораллов флуоресцентных белков, испускающих свет всех цветов радуги и носящих названия от незамысловатых («красный флуоресцентный белок») до куда более выразительных («мандарин», «вишня», «слива» – целая серия фруктовых имен). Этот ансамбль лег в основу многоцветной визуализации биологических механизмов, сферы применения которой вышли далеко за пределы морской колыбели этих белков[14]3.
Трехмерная структура белка важна в первую очередь потому, что тесно связана с его химическими или физическими задачами. Так, у GFP бочонок защищает светоиспускающий механизм от гашения водой и растворенным в ней кислородом. Однако следующие примеры покажут взаимосвязь строения и функций белков еще нагляднее.
Тонкие мембраны разделяют клетку на отсеки и отгораживают ее внутреннее пространство от окружающей среды. Особые мембранные белки, часто формирующие структуры в виде бочонка или кольца, обеспечивают сквозной транспорт атомов и молекул. Один из классов таких транспортеров составляют ионные каналы, пропускающие те или иные ионы – заряженные атомы калия, натрия и хлора, например – внутрь или наружу клетки через центральную пору, которая может быть открыта или закрыта. Контролировать поток ионов критически важно. Скольжение вашего взгляда по этой странице и бег мыслей у вас в голове определяются электрическим напряжением мембран (мембранным потенциалом), которое возникает при перераспределении ионов через них. Многие токсины животных, включая змей и скорпионов, действуют именно на ионные каналы, блокируя в итоге нервную систему жертв. На рисунке ниже изображен калиевый канал в поперечном разрезе (подразумеваемая мембрана лежит в плоскости листа)4. Центральной точкой обозначен ион калия, движущийся к нам или от нас, то есть входящий в клетку или выходящий из нее. Канал этот состоит из четырех идентичных молекул белка, которые свободно связываются друг с другом, формируя трансмембранную пору.
Если каналы могут только открываться и закрываться, то другие белки способны на более замысловатые упражнения. На следующем рисунке я изобразил димер из двух молекул белка кинезина5. Как подсказывает его название, этот белок участвует в движении. Молекула кинезина представляет собой длинный стебель, соединенный гибким аминокислотным шарниром с основанием в виде луковицы. Спиральные стебли двух молекул переплетаются и верхними частями специфически прикрепляются к грузу, который необходимо переместить внутри клетки. Грузом могут быть, например, мембранные пузырьки с химическими веществами, которые синтезируются в теле нейрона, а ожидать высвобождения должны на его периферии. Сформированный комплекс моторного белка с грузом проходит по внутриклеточным «рельсам», микротрубочкам, причем проходит в прямом смысле: две округлые ножки по очереди прикрепляются к рельсам и открепляются от них, шаг за шагом приближаясь к пункту назначения[15]. (Эти ножки принято называть головками, а шагающее движение со сменой опережающей ноги – перехватывающим. Да-да, терминология не самая очевидная.) Рельсы тоже состоят из белков – на сей раз способных выстраиваться в жесткие трубочки, – и их трехмерная структура тоже позволяет им выполнять свою работу.
Строение белков влияет на их взаимодействие как друг с другом, так и с веществами иной природы – например, с ДНК. В следующих двух главах мы увидим, что многие белки прикрепляются к ДНК, чтобы руководить считыванием генетической информации. Эти ДНК-связывающие белки должны принимать форму, соответствующую изгибам двойной спирали ДНК. В таких белках часто встречаются спиральные мотивы, способные укладываться в бороздки ДНК. Для примера я изобразил гормон-чувствительную молекулу, называемую глюкокортикоидным рецептором6. (Эти белки работают в парах; широкими спиральными лентами я показал прилежащие к ДНК участки такой пары.) Когда к рецептору прицепляется гормон кортизол, его структура меняется, и только тогда он получает возможность связываться с ДНК и запускать последовательность событий, которая среди прочего подавляет воспалительный иммунный ответ[16]. Вероятно, вы знакомы с кортизолом, под названием «гидрокортизон» входящим в состав мазей, и извлекали пользу из его способности активировать рецепторы: у вас уменьшались покраснение, зуд и отечность от укусов насекомых и контакта с ядовитым плющом или другими раздражителями.
Как мы увидели, структура белка тесно связана с его функцией, однако свою конечную форму он приобретает не сразу. Каждый белок создается клеточными машинами, которые последовательно прикрепляют одну аминокислоту к другой, составляя из них цепочку, как из скрепок. Не существует никакого каркаса, который определял бы укладку такой цепочки, организуя ее в стопки листов, клубки спиралей или другие формы из почти бесконечного многообразия. Белок сам моделирует себя, укладываясь в пространстве должным образом: факторы, определяющие его структуру, зашифрованы прямо в его аминокислотной последовательности. Иными словами, белок осуществляет самосборку.
Каждая из 20 аминокислот обладает определенным набором физических характеристик. Одни аминокислоты заряжены положительно, другие – отрицательно, третьи нейтральны. Одни большие, другие маленькие. Какие-то из них гидрофобные (по сути, жирные) и предпочитают не смешиваться с водой, другие – гидрофильные и легко с ней смешиваются. Представьте белок, в котором подряд идут несколько положительно заряженных аминокислот, затем – цепочка нейтральных гидрофильных аминокислот, а после них – несколько отрицательно заряженных (см. рисунок). Разноименные заряды притягиваются, поэтому, предоставленный сам себе, белок укладывается так, что его противоположные концы сближаются.
Теперь представьте белок, состоящий из гидрофобных (квадратики) и гидрофильных (кружочки) аминокислот. Этот белок окружен водой (преобладающим компонентом внутриклеточной среды) и укладывается так, чтобы гидрофобные фрагменты прятались в центре кольца из любителей воды. Ради ясности я нарисовал эту схемку в двух измерениях. На самом же деле вам нужно представить почти сферическое ядро из гидрофобных аминокислот, окруженное оболочкой из гидрофильных.
В любом реальном белке происходит множество таких взаимодействий между аминокислотами, а также между аминокислотами и окружающей их водой, что порождает силы, вынуждающие белок принять определенную конформацию. Каждый белок синтезируется в клетке как цепочка аминокислот, и эта цепочка укладывается в оптимальную трехмерную форму. По-научному этот процесс называется фолдингом белка.
Как почти всегда бывает в биологии, эта грубая картина не совсем верна. Некоторые белки, особенно крупные и склонные к агрегации, не укладываются без доли постороннего участия, и им на помощь приходят белки из класса шаперонов7. В комплексах белков-шаперонов есть полости, защищающие новорожденный белок от сложностей перегруженной клеточной среды и способствующие корректному фолдингу аминокислотной цепи. Несмотря на эпизодическое участие шаперонов, общий принцип содержания в белке плана собственной постройки весьма убедителен и широко распространен в живой природе.
Все белки, описанные выше, и десятки тысяч других за долю секунды укладываются в трехмерные формы, избегая бесчисленного множества неудачных вариантов, которые не вполне соответствуют предпочитаемым компонентами белка взаимодействиям. Такое мастерство удивительно: это как если бы листок бумаги вдруг сам сложился в идеальную фигурку оригами. Более того, форма подавляющего большинства белков однозначно определяется последовательностью аминокислот. Иными словами, одна и та же последовательность всегда укладывается в пространстве одинаково. Каждая молекула зеленого флуоресцентного белка формирует бочонок, а каждая молекула миоглобина – одинаковый набор завитков.
Оценить великолепие такой самоорганизации помогут несколько примеров. Представьте последовательность, в которой, как обычно, есть положительно и отрицательно заряженные аминокислоты, а также гидрофобные и нейтральные гидрофильные аминокислоты. (Кстати, заряженные аминокислоты всегда гидрофильны.) Наша цепочка может уложиться так, как показано на левом рисунке, – и это достаточно хорошо: гидрофобные фрагменты скрыты внутри, а разноименно заряженные – сближены. И структура на правом рисунке по тем же причинам будет не хуже.
Две представленные конформации, несомненно, различаются. Можно предположить, что если этому белку потребуется прикрепиться к какой-нибудь малой молекуле – например, к гормону, – то благодаря «карману» функциональной окажется лишь первая форма.
Оказывается, на удивление сложно понять, как цепочка аминокислот принимает единственную оптимальную форму. Анализ сил, воздействующих на случайную последовательность аминокислот – скажем, составляемую вслепую, вытягиванием аминокислот из шляпы, – и оценка затрат энергии показывают, что «достаточно хороших» конформаций могло бы возникать очень много, слишком много для того, чтобы цепочка в итоге неизменно укладывалась только в одну из них. Природа избегает такой множественности возможных форм: аминокислотные последовательности реально существующих белков не случайны, а отобраны за 4 миллиарда лет эволюции. Организмы, которые кодируют аминокислотные цепи, не укладывающиеся в одну оптимальную форму, страдают от нерабочих, а порой и вредных белков и потому имеют меньше шансов выжить и оставить потомство. Эволюционно устойчивыми оказываются организмы, которые кодируют аминокислотные последовательности с четкой и однозначной инструкцией по формированию трехмерной структуры.
Результатом этого, как мы видели, стало общее правило однозначного соответствия аминокислотной последовательности и пространственной структуры у белков, которые мы сейчас находим в человеческом и других организмах. Если нам известна структура одной молекулы кинезина, то мы знаем и структуру любой другой молекулы кинезина. То же самое и с рецепторами кортизола. Впрочем, не бывает правил без исключений, а исключения из этого правила важны исключительно.
В первую группу нарушителей порядка входят нативно-развернутые белки, которые вообще обходятся без фиксированной формы. Это, например, некоторые белки, образующие поры в мембране клеточного ядра. Считается, что лапша из таких неструктурированных белков обеспечивает необходимую пластичность для перемещения разновеликих объектов между ядром и цитоплазмой.
Но больший интерес, на мой взгляд, представляют белки, имеющие несколько стабильных конформаций – не единственную жесткую форму и не аморфный вид, а парочку архитектур, между которыми они могут переключаться, словно рубильник, который зажигает или гасит свет. В последние десятилетия мы не только обнаружили такие белки, но и выяснили, что они участвуют в развитии диковинных болезней. А еще они способны объяснить – ну, на всякий случай, – почему не следует предаваться каннибализму.
В 1950-х годах в деревнях племени форе в Папуа – Новой Гвинее разразилась эпидемия странной болезни, которая вызывала у людей дрожь и неконтролируемые приступы смеха. Ежегодно она уносила до 200 жизней из примерно 11-тысячного племени. (Чтобы оценить масштаб потерь, представьте, что жуткая смерть постигает 150 тысяч ньюйоркцев в год.) Изучив структуру заболеваемости и возможные способы заражения, антропологи и клиницисты пришли к выводу, что болезнь, получившая название «куру» (на языке форе значит «дрожать»), распространяется путем ритуального каннибализма: семьи поедали тела умерших родственников, демонстрируя так любовь и уважение и помогая душам усопших освободиться8. Примерно в это время австралийское правительство, управлявшее Папуа – Новой Гвинеей, запретило каннибализм, что привело к стабильному снижению заболеваемости куру[17]. Но установить возбудителя болезни удалось лишь спустя десятилетия[18]. Людей форе убивали не бактерии, не вирусы и не паразиты, а белок – белок необычный, способный принимать одну из двух характерных форм. В «нормальной» форме этот белок выполняет свои обычные функции. В «неправильно свернутой» – нет, но еще хуже то, что он подталкивает другие белки принимать некорректную форму и объединяться в волокнистые агрегаты. Таким образом, аномальный белок можно считать инфекционным: часть съеденных молекул неправильной формы попадает в мозг, где запускает структурные изменения в белках с изначально безвредными аминокислотными последовательностями. Эти изменения амплифицируются в нервной системе больного и передаются после его смерти дальше, съевшим его обитателям деревни. Череда событий здесь напоминает о романе Курта Воннегута «Колыбель для кошки», в котором вымышленная форма воды «лед-девять», пребывающая в твердом состоянии при комнатной температуре, при контакте с обычной водой запускает процесс ее кристаллизации и преобразования в лед-девять. Итоговая цепная реакция оказывается еще более смертоносной, чем куру. Впрочем, в отличие от льда-девять, куру существует на самом деле.
Белки, способные сворачиваться в разные формы и выступать инфекционными агентами, называют прионами, и теперь мы знаем, что именно они вызывают некоторые болезни людей и других животных. Одна из них – губчатая энцефалопатия крупного рогатого скота, более известная под броским названием «коровье бешенство». Как и куру, это нейродегенеративное заболевание. Оно тоже вызывает дрожь, повышает возбудимость и нарушает координацию движений, но только у коров, а не у людей. Вспышка болезни в Великобритании в конце 1980-х затронула около 200 тысяч коров, и более 4 миллионов животных пришлось убить, чтобы остановить эпидемию. И все же болезнь успела передаться людям. Больше 100 человек умерли от ее человеческого аналога, нового варианта болезни Крейтцфельдта – Якоба, почти наверняка вызванного употреблением мяса больных животных. Но как же заразились коровы? Снова каннибализм! Фермерским коровам регулярно добавляли в пищу мясокостную муку, которая должна была ускорять рост и повышать продуктивность скота, а заодно служить способом утилизации отходов животноводства9. После вспышек болезни эту форму каннибализма запретили: в 1989 году – в Великобритании, а теперь и почти во всех странах мира (это справедливо для жвачных вроде коров и овец; другим сельскохозяйственным животным, например курам и свиньям, мясокостную муку, как правило, давать разрешено).
Само существование прионов какое-то время оспаривалось. В 1980-х возглавляемая Стенли Прузинером группа исследователей из Калифорнийского университета в Сан-Франциско после 10-летних трудов выделила возбудителя почесухи (скрепи) – овечьего аналога губчатой энцефалопатии коров – и определила его как белок. Заявление ученых встретили с огромным скепсисом: в отличие от бактерий, вирусов и паразитов, в примитивной аминокислотной последовательности не просматриваются черты самостоятельного агента, и потому действительно сложно представить, как она распространяется, амплифицируется и вызывает болезнь. Тем не менее, проведя скрупулезный анализ и исключив другие возможности, ученые доказали состоятельность прионной гипотезы.
Прионные и прионоподобные белки задействованы в развитии не только куру и коровьего бешенства, но и других серьезных заболеваний. В частности, при болезни Альцгеймера наблюдают скопления неправильно свернутых белков, что придает ей сходство с прионными инфекциями. Однако эти белковые агрегаты вряд ли заразны: их пересадкой от больных животных здоровым неврологические симптомы не передаются. Почему происходит и к чему приводит такая агрегация, пока неясно. И вообще, нам еще нужно ответить на массу вопросов о правильном и неправильном фолдинге белков.
Если вернуться к подавляющему большинству белков, которые обладают-таки уникальной трехмерной структурой, то, как ни странно, нам по-прежнему сложно предсказывать, какую именно форму примет аминокислотная последовательность. Такие прогнозы, однако, были бы очень полезны10. Так, нам было бы гораздо легче оценивать параметры связывания потенциального лекарства с разными белками, располагай мы сведениями о трехмерной структуре каждого из них. Хотя теперь нам существенно проще определять структуру белков, чем во времена первого знакомства с миоглобином кашалота, этот процесс остается трудоемким, долгим и капризным. Основной метод рентгеновского изучения белков[19] требует их предварительной кристаллизации, а для этого нужно совершить немало проб и ошибок. Есть и другие методы – например, с использованием электронных микроскопов, – но среди них не найдется ни быстрых, ни простых. Хочется думать, что вместо физического получения и измерения белка мы могли бы просто рассчитать по его аминокислотной последовательности, какую форму он примет. Специфика генетического кода позволяет нам без труда определять порядок аминокислот в белке по последовательности нуклеотидов в ДНК, о чем мы подробнее поговорим в следующей главе. В теории, раз мы понимаем физику электрических сил, гидрофобных и гидрофильных взаимодействий, мы могли бы просто загрузить аминокислотную последовательность в несложную компьютерную программу, которая произведет необходимые вычисления и остановится, обнаружив оптимальную молекулярную укладку. На практике же число возможных конформаций так велико, что даже самым быстрым компьютерам сложно изучить их все.
Для решения этой вычислительной проблемы разрабатывают хитроумные подходы: одни направлены на улучшение алгоритмов расчета сил и энергий, другие прибегают к упрощениям вроде группировки наборов атомов, третьи обращаются к нетрадиционным компьютерным архитектурам. Так, можно сконструировать нестандартный компьютер, интегральные схемы которого изначально созданы не для выполнения общих задач, а для расчета сил, действующих на аминокислоты. По такому пути пошел Дэвид Шоу[20]11, пустивший немалые доходы от управления инвестициями на разработку уникальных суперкомпьютеров для решения биофизической проблемы фолдинга белков. Можно использовать и обычные компьютеры, если они интегрированы в огромный, стихийно организованный массив. Так поступили авторы программы folding@home, которая работает в фоновом режиме на компьютерах добровольцев (войти в их число может любой желающий) и использует периоды простоя, чтобы распределять вычисления по десяткам тысяч устройств12. А можно делать ставку и на человеческий ум. Например, исследователи из Вашингтонского университета создали бесплатную игру foldit, посвященную фолдингу белков: пользователи перемещают на экране аминокислоты, как фрагменты мозаики, а результаты их работы передаются ученым13. Также можно применять искусственный интеллект, обучив компьютерную нейронную сеть выявлять закономерности в известных белковых структурах и применять их для предсказания новых форм. В этом направлении пошла DeepMind, дочерняя компания Google, добившаяся выдающихся результатов и победы в конкурсе «Критическая оценка предсказания структуры белков» в 2020 году14. Эти и другие стратегии доказали свою состоятельность, но быстрый и универсальный метод расчета структуры, которую примет аминокислотная последовательность, все еще не найден.
Человеку даже как-то унизительно признавать, что сами белки без труда решают проблему фолдинга, за долю секунды принимая нужную форму в каждой клетке каждого существа на Земле. Самосборка вызывает восхищение: она позволяет форме возникнуть из элементов и сил, неотъемлемых от самих природных веществ. Мы узнаем, что стоит за стремительностью и надежностью этого процесса, в главе 6, где речь пойдет о молекулярной случайности. Но сначала давайте изучим связь белков и ДНК, дадим определение гену и заложим основы для выяснения того, как самособранные структуры формируют схемы принятия решений в клетках.