Проект Rosetta@Home

Что это за проект?

Принцип работы клиента Rosetta

В чём польза от проекта?

Немного о спорте


Что это за проект?

Цель проекта, разработанного лабораторией доктора Дэвида Бэйкера Университета Вашингтона - вычисление трехмерной структуры белков из их аминокислотных последовательностей. Это одна из самых больших проблем в молекулярной биологии. Подробнее:

Белок - основа всех живых организмов на Земле. Белок как бы является строительным материалом, или, если угодно, “основой” для всех живых существ. Разнообразные формы белков принимают участие во всех процессах, происходящих в живых организмах. В теле человека из белков формируются мышцы, связки, сухожилия, все органы и железы, волосы, ногти; белки входят в состав жидкостей и костей. Ферменты и гормоны, катализирующие и регулирующие все процессы в организме, также являются белками.

Каждый белок в организме уникален и выполняет специфические функции, т. е. белки не являются взаимозаменяемыми. В дальнейшем станет понятно, насколько это важно.

Белок состоит из аминокислот.

Для разных организмов, конечно, количество белков и их длина заметно отличается – чем сложнее устроен организм, тем больше количество и сложность белков – но это и понятно – у человеческого организма гораздо больше функций, чем у какой-нибудь инфузории.

Благодаря недавно завершенному проекту "Геном человека" стали известны аминокислотные последовательности всех белков в человеческом организме. Ранее были изучены многие белки других живых организмов. Процесс пополнения этой информационной базы продолжается до сих пор, ведь природа живых существ так многообразна!

Если вдруг организм, в результате какой-либо причины перестает вырабатывать белок - организм слабеет, что приводит к появлению различных болезней (не исключен даже летальный исход).

Исследования по данному проекту помогут всему человечеству в проектировании новых, не существующих белков. В случае успешного решения данных проблем мы сможем бороться с такими болезнями как рак, малярия, болезнь Альцгеймера, сибирская язва и многими другими генетическими и вирусными заболеваниями.

Более подробно об исследованиях можно прочитать здесь.

Принцип работы клиента Rosetta

Одно из самых важных открытий в молекулярной биологии – то, что в пространстве белковая структура (связка аминокислот) стремится занять такое положение, чтобы энергия этой структуры была минимальна (представьте шар в трубе - шар будет всегда катиться вниз к основанию трубы, потому что это - самое устойчивое состояние).

Итак, задача программы – посчитать наименьшую энергию белковой системы, если известны составляющие этой системы (аминокислоты) – при этой минимальной энергии это и будет искомый белок! Одна из сложностей заключается в том, что последовательностей аминокислот, из которых состоит белок много, в пространстве их можно соединить разными способами. Сочетание различных комбинаций соединений аминокислот дает огромные цифры - вот причина, по которой проекту так нужны большие вычислительные мощности.

Приведу еще аналогию, она предложена основателем проекта – Дэвидом Бейкером, профессором биохимии Университета медицинских исследований Ховарда Хьюза в Вашингтоне (David Baker, Professor of Biochemistry at the University of Washington Howard Hughes Medical Institute investigator) на сайте проекта:

"Вы - космический исследователь и обнаруживаете новую планету, ваша задача - найти и сообщить координаты самой низкой точки поверхности планеты. Как Вам найти эту самую низкую точку? Одна из возможностей - приземлится где-нибудь на планете, и начать поиски оттуда. Тем не менее, если планета очень большая, вряд ли ваш корабль приземлится где-нибудь в глубокой долине, чтобы находить эту самую низкую точку. Например, если вы приземлились бы на нашу Землю, вы вряд ли найдете самую низкую точку, которая располагается на Земле, на берегу Мертвого Моря, наиболее вероятно, что вы будете находиться на другом континенте, возможно изучая Гималаи или пустыню Сахара. Но что если у вас было бы 10,000 преданных исследователей, и у каждого из них был бы парашют?

Вы высаживаете их в произвольном месте на планете, и даете задание найти самую низкую точку в том регионе, где их посадили; вы принимаете сообщения о самых низких точках, которые они обнаружили. Ваши шансы на успех увеличиваются, и чем больше количество исследователей, которых вы можете послать, тем больше ваш шанс на успех".

Как это все работает?

Итак, ваш компьютер будет работать следующим образом: в начале вычисления считаем энергию в первой точке, затем найдем самую низкую энергетическую точку в районе. В конечном счете, на сервер проекта сообщается самая низкая энергетическая структура, которая найдена, вместе с энергией этой структуры. Сервер сравнит энергию всех низких энергетических структур, обнаруженных всеми участвующими процессорами, и определит самую низкую из всех энергетических структур.

В чём польза от проекта?

По сути Rosetta - это компьютерная программа для поиска:

  • - структуры с наименьшей энергией для заданной аминокислотной последовательности для предсказания структуры белка
  • - обратная задача - поиск аминокислотной последовательности с наименьшей энергией для заданной белковой структуры
  • - расчета взаимодействия комплекса белок-белок.

В данном проекте используется обратная связь по прогнозированию и полученным результатам, чтобы улучшать потенциальные функции и алгоритмы поиска.

Rosetta разрабатывалась позже, чем такие проекты, как Predictor@Home, Folding@Home, Distributed Folding и строилась на основе нескольких идей, развиваемых несколькими группами, которые потом объединили усилия. Вот эти идеи:

  1. 3D структура белка полностью определяется 1D последовательностью.
  2. Знание вторичной структуры сильно облегчает жизнь при предсказании 3D.
  3. Нужен промежуточный набор блоков, из которых можно строить белок для преодоления комбинаторного взрыва (эти блоки потом были названы мотивами)
  4. Необходимо построить функцию пригодности смоделированной структуры достаточно хорошо описывающую свободную энергию белка в физиологическом растворе.
  5. Поиск оптимальной конфигурации нужно вести, как минимум, в две стадии - на гладком потенциале для больших блоков, а затем на полноатомном потенциале.
  6. Молекулярная динамика подходит только для заключительной полноатомной шлифовки, на начальных стадиях необходимо использовать методы Монте-Карло и генетические алгоритмы.
  7. Самый компактный кластер решений в пространстве, построенном по метрике RMSD, обычно содержит правильное решение.

Немного о спорте

Организаторы любого проекта распределённых вычислений уважают и поддерживают спортивный дух участников. Одним из важных достоинств любого проекта РВ является качественная статистика и более-менее эффективная (а лучше наиболее эффективная ;) защита от читинга (увеличения количества очков при тех же затратах времени и полученных результатах). Сначала в проекте были проблемы с читингом, потому что каждое задание выдается только один раз и количество очков за него определяется только бенчмарком (индексом производительности компьютера), который производит BOINC клиент. И результаты бенчмарка можно было подменить. Но потом организаторы проекта эту проблему одолели. Так что теперь с читингом всё нормально. Его нету :)  

Статистика проекта обновляется практически в режиме реального времени, кроме того, существует несколько общедоступных альтернативных серверов, обобщающих и обрабатывающих исходную статистику проекта для получения более наглядных и красивых результатов. 

Пока мы можем порекомендовать вам следующие странички для изучения статистики:

Статистика команды: официальная и обновляющаяся в режиме реального времени

неофициальная, запаздывающая, но с более широкими возможностями:

А еще можно установить красивый информер с Вашей личной статистикой на десктоп. выбирайте:

Если вы нашли белок с наименьшей энергией, то ваше имя появится на странице результатов проекта. а рядом будет красивая картинка белка, который вы нашли

А сейчас, если вас заинтересовал проект, вы можете изучить наше описание клиентского ПО, и процесса установки и настройки клиента и начать свою деятельность в команде TSC! Russia.

По всем возникающим вопросам можно обращаться в наш форум, где существует отдельная тема, посвящённая данному проекту. Прежде чем задавать вопросы, настоятельно рекомендуем почитать список часто задаваемых вопросов на форуме,

и разумеется FAQ по Розетте

Страничка составлена ShiZ. Использованы материалы blackbird, SwZ, lusvladimir, RosMag, citerra, Kapten Trumm, Gercog, RM, Agafonov_KY, norlang, -=SR=-, Alexa

  Rambler's Top100 Internet Map