Если вы хотите начать путешествие к биоинформатике, вы должны сначала знать значение термина. Вы также должны знать, чем занимаются биоинформатики, и что вам нужно знать, чтобы получить работу начального уровня в новом качестве.
Большинство биоинформатиков работают в различных областях медицины и здравоохранения, включая биологию, генетику, протеомику и фармацевтику. Некоторые специалисты имеют опыт биомедицинских исследований, в то время как другие специализируются на вычислительных инструментах.
Биоинформатик
Биоинформатик не только использует инструменты для понимания или решения биологических проблем, но и участвует в разработке инструментов для исследований. Биоинформатики состоят из двух типов.1 Первая категория включает разработчиков, которые реализуют алгоритмы и разрабатывают инструменты для биоинформатики. Вторая категория включает кураторов, которые отвечают за всю работу, связанную с ресурсами данных и интеграцией данных.
Навыки, необходимые для того, чтобы быть биоинформатиком
Навыки биоинформатики — Вы должны научиться пользоваться:
- Инструменты для выравнивания последовательности, такие как Blast или Bowtie
- Инструментарий для анализа генома (GATK)
- Программное обеспечение для секвенирования следующего поколения (NGS), микрочипов, qPCR и анализа данных (Partek).
- Инструменты для обработки высокопроизводительных последовательностей данных, таких как samtools
- Чтобы получить наборы генетических данных, используйте такой инструмент, как Ensemble
- Инструменты для систем поиска баз данных типа Entrez
Статистические навыки — Тебе нужно учиться:
- Системы статистического программного обеспечения, такие как SPSS и SAS.
- Как проводить статистический анализ с помощью Python или R
Навыки программирования — Вы должны быть знакомы:
- Один или несколько из этих языков программирования: R, Perl, Python, Java и Matlab.
- Очень полезны для обучения такие инструменты машинного обучения и библиотеки, как Mllib и Scikit-Learn на Python.
Биологические знания — Это требование будет варьироваться в зависимости от вашей области или конкретной работы, в которой вы хотите работать. Скорее всего, вам потребуются знания в области молекулярной биологии, генетики, биологии рака и/или современной биологии.
Геномные и генетические знания — Эти знания являются основой биоинформатики. Некоторыми из наиболее важных навыков являются высокопроизводительное секвенирование, секвенированием следующего поколения и вычислительная геномика.
Управление базами данных — Это требование включает в себя традиционные реляционные базы данных, которые являются основой SQL (например, SQL Server и Oracle). Вы также должны иметь понятия о базах данных NoSQL: не реляционными, распределенными, с открытым исходным кодом и горизонтально масштабируемыми (например, MongoDB). Наконец, есть большие базы данных (например, TCGA) и большие аналитические базы данных (например, Vertica), о которых Вам следует знать.
Data Mining и машинное обучение — Также полезны такие методы обучения, как иерархическая кластеризация и деревья принятия решений.
Общие навыки — Существуют важные дополнительные навыки, такие как многозадачность, независимость, хорошие коммуникативные навыки, любопытство, аналитическое мышление и управленческие навыки.
Ресурсы для бесплатного обучения
Ниже приведены некоторые бесплатные ресурсы для начала обучения некоторым навыкам, которые вам понадобятся.
SPSS: Сайт SPSS содержит очень хорошие учебные материалы.
SAS: Кроме того, SASCrunch предоставляет список бесплатных ресурсов, которые помогут вам изучить SAS.
Python: Если вы только начинаете изучать Python, «Программирование по биоинформатике с использованием Python: Практическое программирование для биологических данных» от О’Райли является хорошей отправной точкой. После этого вы должны познакомиться с Numpy для векторизованных вычислений массивов. Scipy также очень полезен для некоторых специальных функций или линейной алгебры. Если вы действительно хотите обрабатывать большие данные, то вам нужно будет разобраться в некоторых из связок python-C (например, SWIG, ctypes, Cython) для высокопроизводительной обработки данных на С и манипуляций на питоне.
Язык R: Дэвид Ромни предоставляет список онлайн-ресурсов для изучения R.
Perl: Начиная с онлайн-библиотеки на Perl, Вы можете получить доступ к Beginning Perl или другим продвинутым документам, если Вы не являетесь новичком.
Java: Существует очень хороший бесплатный он-лайн учебник по Java и интерактивное руководство LearnJavaOnline.org по Java.
Matlab: Существует отличный курс, который преподает основы Matlab на coursera, и вы можете найти другие полезные ресурсы в этой статье.
Молекулярная биология: Существует также интерактивное онлайн-учебное пособие по молекулярной биологии.
Биология рака: На CancerQuest доступно несколько анимационных и видеороликов по биологии рака.
Геномика и генетика: EMBL-EBI предоставляет бесплатный практический курс по анализу высокопроизводительных данных секвенирования, а также другой курс по функциональной геномике.
Наконец, я хочу сказать, что ваш путь к биоинформатике будет нелегким, но он стоит усилий и упорного труда. Желаю вам счастливого путешествия, полного волнений и знаний.
Добавить комментарий