Как стать биоинформатиком

Если вы хотите начать путешествие к биоинформатике, вы должны сначала знать значение термина. Вы также должны знать, чем занимаются биоинформатики, и что вам нужно знать, чтобы получить работу начального уровня в новом качестве.

Большинство биоинформатиков работают в различных областях медицины и здравоохранения, включая биологию, генетику, протеомику и фармацевтику. Некоторые специалисты имеют опыт биомедицинских исследований, в то время как другие специализируются на вычислительных инструментах.

Биоинформатик

Биоинформатик не только использует инструменты для понимания или решения биологических проблем, но и участвует в разработке инструментов для исследований. Биоинформатики состоят из двух типов.1 Первая категория включает разработчиков, которые реализуют алгоритмы и разрабатывают инструменты для биоинформатики. Вторая категория включает кураторов, которые отвечают за всю работу, связанную с ресурсами данных и интеграцией данных.

Навыки, необходимые для того, чтобы быть биоинформатиком

Навыки биоинформатики — Вы должны научиться пользоваться:

  • Инструменты для выравнивания последовательности, такие как Blast или Bowtie
  • Инструментарий для анализа генома (GATK)
  • Программное обеспечение для секвенирования следующего поколения (NGS), микрочипов, qPCR и анализа данных (Partek).
  • Инструменты для обработки высокопроизводительных последовательностей данных, таких как samtools
  • Чтобы получить наборы генетических данных, используйте такой инструмент, как Ensemble
  • Инструменты для систем поиска баз данных типа Entrez

Статистические навыки — Тебе нужно учиться:

  • Системы статистического программного обеспечения, такие как SPSS и SAS.
  • Как проводить статистический анализ с помощью Python или R

Навыки программирования — Вы должны быть знакомы:

  • Один или несколько из этих языков программирования: R, Perl, Python, Java и Matlab.
  • Очень полезны для обучения такие инструменты машинного обучения и библиотеки, как Mllib и Scikit-Learn на Python.

Биологические знания — Это требование будет варьироваться в зависимости от вашей области или конкретной работы, в которой вы хотите работать. Скорее всего, вам потребуются знания в области молекулярной биологии, генетики, биологии рака и/или современной биологии.

Геномные и генетические знания — Эти знания являются основой биоинформатики. Некоторыми из наиболее важных навыков являются высокопроизводительное секвенирование, секвенированием следующего поколения и вычислительная геномика.

Управление базами данных — Это требование включает в себя традиционные реляционные базы данных, которые являются основой SQL (например, SQL Server и Oracle). Вы также должны иметь понятия о базах данных NoSQL: не реляционными, распределенными, с открытым исходным кодом и горизонтально масштабируемыми (например, MongoDB). Наконец, есть большие базы данных (например, TCGA) и большие аналитические базы данных (например, Vertica), о которых Вам следует знать.

Data Mining и машинное обучение — Также полезны такие методы обучения, как иерархическая кластеризация и деревья принятия решений.

Общие навыки — Существуют важные дополнительные навыки, такие как многозадачность, независимость, хорошие коммуникативные навыки, любопытство, аналитическое мышление и управленческие навыки.

Ресурсы для бесплатного обучения

Ниже приведены некоторые бесплатные ресурсы для начала обучения некоторым навыкам, которые вам понадобятся.

SPSS: Сайт SPSS содержит очень хорошие учебные материалы.

SAS: Кроме того, SASCrunch предоставляет список бесплатных ресурсов, которые помогут вам изучить SAS.

Python: Если вы только начинаете изучать Python, «Программирование по биоинформатике с использованием Python: Практическое программирование для биологических данных» от О’Райли является хорошей отправной точкой. После этого вы должны познакомиться с Numpy для векторизованных вычислений массивов. Scipy также очень полезен для некоторых специальных функций или линейной алгебры. Если вы действительно хотите обрабатывать большие данные, то вам нужно будет разобраться в некоторых из связок python-C (например, SWIGctypesCython) для высокопроизводительной обработки данных на С и манипуляций на питоне.

Язык R: Дэвид Ромни предоставляет список онлайн-ресурсов для изучения R.

Perl: Начиная с онлайн-библиотеки на Perl, Вы можете получить доступ к Beginning Perl или другим продвинутым документам, если Вы не являетесь новичком.

Java: Существует очень хороший бесплатный он-лайн учебник по Java и интерактивное руководство LearnJavaOnline.org по Java.

Matlab: Существует отличный курс, который преподает основы Matlab на coursera, и вы можете найти другие полезные ресурсы в этой статье.

Молекулярная биология: Существует также интерактивное онлайн-учебное пособие по молекулярной биологии.

Биология рака: На CancerQuest доступно несколько анимационных и видеороликов по биологии рака.

Геномика и генетика: EMBL-EBI предоставляет бесплатный практический курс по анализу высокопроизводительных данных секвенирования, а также другой курс по функциональной геномике.

Наконец, я хочу сказать, что ваш путь к биоинформатике будет нелегким, но он стоит усилий и упорного труда. Желаю вам счастливого путешествия, полного волнений и знаний.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.