Биоинформатика, пожалуй, наиболее известна как конгломерат передовых методов анализа данных геномики, но это также обращающий на себя внимание термин для любого способа изучения биологии, который включает в себя компьютерное программирование. По этому определению, в наши дни она повсюду! Если вы — биолог-практик, то, вероятно, вы были более часто соприкасаетесь с биоинформатикой, чем вы думаете. Если Вы структурный биолог и использовали круговой дихроизм, за которым следует DICHROWEB для деконволюции данных, или нейробиолог и картировали мозг с помощью Jupyter Notebook, то вы уже использовали биоинформатику. Я обнаружил, что использование биоинформатики одним из способов помогло обучить мой мозг другим способам ее использования, потому что логика схожа, несмотря на то, что приложения могут сильно отличаться. Вот лишь некоторые из разнообразных способов использования биоинформатики:
Протеомика
Существует известная потребность в вычислительных подходах, чтобы иметь представление о данных о ДНК и РНК, так что имеет смысл воспользоваться подходами биоинформатики для исследования белков. Возможно, вы захотите знать все белки в клетке, или в органелле, или даже просто взаимодействие белка со многими потенциальными партнерами. Во всех этих ситуациях вы могли бы провести масс-спектрометрию на Ваших образцах и получить кучу масс, соответствующих различным белкам в наборе.
Как можно «прочитать», какие белковые сигнатуры соответствуют безумному количеству пиков (которые не только многочисленны, но и мешают друг другу!) и поэтому находятся в вашем наборе? Во-первых, масс-спектрометр должен поставляться с программным обеспечением для считывания пиков, которое должно отделять истинные пики от шума (для правильного считывания, скорее всего, потребуется некоторая подстройка настроек). Далее, в режиме онлайн доступен ряд программ для сопоставления ваших пиков с базой данных белковых последовательностей, которая, как правило, является одной или более из баз данных протеомов, входящих в состав UniProt, перечисленных здесь. Maxquant сам ищет спектры по базе данных, в то время как X! Tandem и PepNovo выполняют de novo секвенирование ваших белков по спектрам, позволяя затем искать последовательности по базе данных, в идеале используя алгоритмический инструмент поиска, такой как InsPecT.
Данные могут быть дополнительно проанализированы и уточнены с помощью мощного программного обеспечения Scaffold, которое позволяет быстрее идентифицировать белки путем высокопроизводительной пакетной обработки, классифицировать биологическую релевантность и внутриклеточные локализации обнаруженных белков, а также различать изоформы и посттрансляционно модифицированные формы белка. Функциональные возможности, стоимость и системные требования, предъявляемые к этим программным пакетам по протеомике и веб-сайтам для их приобретения, перечислены в таблице ниже
Название | Использование | Стоимость | Совместима с ОС |
X! Tandem | Последовательность белков de novo из их масс-спектров без попыток соотнесения спектров с белковыми базами данных | Бесплатно | Windows, Linux, macOS |
PepNovo | Windows, Linux | ||
InsPecT | Средство поиска базы данных, согласованное для работы с PepNovo и другим программным обеспечением в области протеомики. | Бесплатно | Windows, Linux/Unix |
Maxquant | Идентифицирует и количественно определяет белки в образце по их масс-спектрам, предоставляя сводную статистику о том, насколько вероятно каждое совпадение. | Бесплатно | Windows, Linux |
Scaffold | Быстрая идентификация белков путем высокопроизводительной пакетной обработки и более глубокого анализа биологической релевантности. | От $5795 для институтов и $6795 для коммерческого использования | Windows, Linux, macOS |
Молекулярная динамика
Чтобы представить структуру молекулы — как правило, белка или нуклеиновой кислоты — в трехмерном пространстве, специалисты по структурной биологии часто используют программы визуализации, такие как Pymol и VMD. Это помогает получить представление о структуре в прямом и переносном смысле — например, увидеть, насколько большой размер гидрофобной поверхности имеет белок. Многие специалисты по структурной биологии делают шаг вперед в области визуализации и моделируют молекулярное поведение, например, конформацию ионного канала, перемещающегося из «закрытого» в «открытый», или пептида, образующего связь с фосфолипидной мембраной. NAMD (который работает как дополнение к VMD), Amber и GROMACS являются образцовым программным обеспечением, используемым для проведения таких симуляций молекулярной динамики.
В то время как Pymol, VMD/NAMD и GROMACS можно скачать бесплатно, Amber взимает плату за лицензию ($500 за академическое и другое некоммерческое использование и $15,000-$20,000 за промышленное использование) за полную версию, хотя базовая версия под названием AmberTools бесплатна. Все эти пакеты программ по молекулярной динамике совместимы с MacOS, Linux и Windows 10.
Биодиверсионная информатика
Этот термин, разработанный в 1992 году, относится к отдельной отрасли биоинформатики, которая использует большие данные для картирования видов, открытия новых видов, разработки универсальной таксономической системы и отслеживания переходов видов в опасные зоны и из опасного в опасное состояние. На странице Википедии, посвященной этой области, представлен довольно подробный список баз данных и растущих проектов, в которых представлена информация о биоразнообразии, обнаруженном во всем мире, включая Catalogue of Life, Biodiversity Heritage Library и International Plant Names Index.
Книга «Гражданин ученый» Мэри Эллен Ганнибал (Mary Ellen Hannibal) — замечательная книга, рассказывающая о людях, имеющих и не имеющих докторскую степень, прожорливо и скрупулезно исследующих нашу экосистему, чтобы собрать информацию о том, какие виды существуют, как они выживают, хорошо ли у них получается, меняются ли они или их окружающая среда, и могут ли эти изменения быть вызваны человеком. Ганнибал знакомит нас со многими проектами, включая iNaturalist, краудсорсинговую платформу и мобильное приложение, позволяющее как ученым, так и неученым регистрировать данные о биоразнообразии, объединять их с другими и даже помогать интерпретировать данные из их собственных домов (например, путем сопоставления видов в рамках различных проектов). Данные из iNaturalist могут быть введены в более курируемые базы данных, упомянутые выше, такие как Catalogue of Life.
Макросы!
Вы когда-нибудь использовали приложение и хотели бы, чтобы была кнопка для конкретной вещи, которую вы хотите сделать? Вот тут-то и появляются макросы. Макросы — это, по сути, скрипты, которые добавляют функцию в используемую программу и позволяют автоматизировать повторяющиеся и часто трудоемкие задачи. Это особенно полезно в Excel. Иногда очень хочется выбрать все графики в рабочем листе, поэтому приходится открывать Visual Basic и писать несколько строк кода.
Такая техника не ограничивается Microsoft Office. Мой коллега однажды написал скрипты для программирования нашего спектрофлюориметра, чтобы брать таймпункты самостоятельно. Например, ImageJ, бесплатная и популярная программа для интерпретации изображений из микроскопов, в основном состоит наполовину из кликов и наполовину из макросов, которые выводят ее на новый уровень. Это все еще биоинформатика, так как это новое компьютерное программирование все во имя биологии!
Это лишь некоторые из способов, которыми ученые из разных областей используют биоинформатику. Биоинформатика — это то, чем Вы хотите заниматься? Узнайте, какие навыки Вам необходимы, чтобы стать биоинформатиком.
Добавить комментарий