С одной стороны, поиск работы — это суровая игра, в которой нужно выделиться среди сотен, а иногда и тысяч других соискателей. С другой стороны, найти работу, на которую можно откликнуться — это тоже непростая задача.
Когда я только начинала заниматься наукой о данных, меня сбивали с толку разные обязанности на позициях в этой сферой. Я не хотела выбирать должность, на которой я бы не знала, что точно нужно делать. Легко запутаться в большом количестве профессий с разными названиями и сложно понять, какая из них соответствует вашим конкретным навыкам или с чем хочется поработать.
Так как популярность этой сферы растёт и пока не собирается останавливаться, я решила написать эту статью, чтобы объяснить разницу между профессиями и устранить путаницу, которая возникает при взгляде на их названия.
Я хочу обратить внимание, что названия этих профессий не являются фиксированными и могут измениться в будущем. В зависимости от компании на некоторых позициях обязанности могут частично совпадать, а их объём — отличаться. Тем не менее, эта статья расскажет в общих чертах о 10 основных профессиях в области науки о данных.
1. Специалист по обработке данных
Начнём с самой распространённой должности — специалист по обработке данных. Такой специалист занимается всеми аспектами проекта: от бизнес-вопросов до сбора и анализа данных, а также визуализации и предварительного тестирования.
Специалисты по обработке данных знают обо всём понемногу на каждом этапе проекта. Поэтому им проще найти наилучшее решение для конкретного проекта и выявить закономерности. И именно они отвечают за исследование и разработку новых алгоритмов и подходов.
Часто в крупных компаниях специалисты по обработке данных являются руководителями групп, отвечающих за сотрудников с узкоспециализированными навыками. Набор их навыков позволяет видеть весь проект целиком и направлять команду от начала и до конца.
2. Специалист по анализу данных
Вторая по популярности профессия — специалист по анализу данных. Иногда в нанимающей вас компании границы между специалистом по обработке данных и специалиста по анализу данных могут быть размыты. Должность может называться «специалист по обработке данных», хотя большей частью работы будет анализ данных.
К задачам специалистов по анализу данных относятся визуализация, преобразование и манипулирование данными. Иногда они также отвечают за отслеживание веб-аналитики и анализ A/B-тестирования.
Так как в задачи таких специалистов входит визуализация, они часто отвечают за подготовку информации для бизнес-стороны проекта: готовят отчёты, которые наиболее полно отражают тенденции и идеи, полученные в результате анализа.
3. Инженер данных
Инженеры данных отвечают за проектирование, создание и обслуживание конвейеров данных. Они тестируют экосистемы для компаний и готовят их к тому, чтобы специалисты по обработке данных могли запускать свои алгоритмы.
Инженеры данных также работают над пакетной обработкой собранных данных и сопоставляют их формат с сохраненными данными. Иными словами, они следят за тем, чтобы данные были готовы к обработке и анализу.
Наконец, они поддерживают экосистему и конвейер в оптимизированном и рабочем состоянии, а также обеспечивают доступ к данным для специалистов по обработке и анализу данных.
4. Архитектор данных
У архитекторов данных и инженеров данных есть общие обязанности. Они должны обеспечить, чтобы данные были хорошо отформатированы и доступны для специалистов по обработке и анализу данных, а также улучшить производительность конвейеров данных.
Плюс к этому, архитекторы данных проектируют и создают новые системы баз данных, соответствующие требованиям конкретной бизнес-модели и работы.
Они поддерживают эти системы баз данных как с точки зрения функциональности, так и с точки зрения администрирования. Они отслеживают данные и определяют, кто может просматривать, использовать и управлять различными разделами данных.
5. Сторителлер данных
Наверное, это самая новая профессия в этом списке и, на мой взгляд, важная и творческая.
Часто сторителлинг о данных путают с визуализацией данных. Хотя у них действительно есть общие черты, всё же между ними существует чёткое различие. Повествование данных — это не просто визуализация данных и подготовка отчётов и статистики. Здесь речь идёт о поиске повествования, которое лучше всего опишет данные.
Профессия находится на стыке между чистыми, необработанными данными и человеческим общением. Сторителлер данных берёт данные, упрощает их, рассматривает их в конкретном аспекте, анализирует их поведение и на основе своих выводов создаёт убедительную историю, которая поможет другим лучше понять эти данные.
6. Специалист по машинному обучению
Чаще всего слово «специалист» в названии профессии указывает на то, что она связана с проведением исследований и разработкой новых алгоритмов и идей.
Специалист по машинному обучению исследует новые подходы к управлению данными и разрабатывает новые алгоритмы для использования. Они часто являются частью отдела исследований и разработок, и результатом их работы обычно становятся исследовательские статьи. Их работа ближе к академической деятельности, но в промышленных условиях.
Названия должностей, которые можно использовать для описания специалиста по машинному обучению — это учёный-исследователь или инженер-исследователь.
7. Инженер машинного обучения
Инженеры машинного обучения очень востребованы. Они должны быть хорошо знакомы с различными алгоритмами машинного обучения, такими как кластеризация, категоризация и классификация, и быть в курсе последних прогрессивных исследований в этой области.
Для корректного выполнения своей работы инженерам по машинному обучению необходимы хорошие знания статистики и развитые навыки программирования, наряду со знаниями основ разработки программного обеспечения.
Помимо проектирования и создания систем машинного обучения, такие инженеры проводят тесты, например A/B-тесты, и отслеживают производительность и функциональность различных систем.
8. Разработчик бизнес-аналитики
Разработчики бизнес-аналитики ответственны за проектирование и разработку стратегий, благодаря которым бизнес-пользователи находят необходимую информацию для быстрого и эффективного принятия решений.
Они также должны свободно пользоваться новыми инструментами бизнес-аналитики или разрабатывать собственные инструменты, которые предоставляют аналитику и бизнес-идеи для лучшего понимания своих систем.
Деятельность такого разработчика в основном ориентирована на бизнес, поэтому им необходимо иметь хотя бы базовое представление об основах бизнес-моделей и о том, как они реализуются.
9. Администратор базы данных
Иногда разрабатывает базу данных одна команда, а использует — другая. Многие компании разрабатывают систему баз данных на основе конкретных бизнес-требований. Однако управляет базой данных компания, которая её покупает или заказывает разработку.
В таких случаях каждая компания нанимает человека или несколько человек, отвечающих за управление системой баз данных. Администратор базы данных отвечает за мониторинг базы данных, обеспечение её правильного функционирования, отслеживание последующих данных, создание резервных копий и восстановление.
В их обязанности также входит предоставление разных разрешений разным сотрудникам в зависимости от их должностных требований и уровня занятости.
10. Узкопрофильные специалисты
Наука о данных — по-прежнему развивающаяся область. По мере её роста появляются новые технологии, такие как искусственный интеллект или определённые алгоритмы машинного обучения. А это приводит к созданию новых узкоспециализированных профессий, таких как специалисты по искусственному интеллекту, специалисты по глубокому обучению, специалисты по обработке естественного языка и т. д.
То же самое касается специалистов по обработке и анализу данных. Будут и дальше создаваться должности под конкретные обязанности, чтобы снизить нагрузку на специалистов и инженеров более широкого профиля: например, специалист по данным о транспортировке или специалист по маркетинговому повествованию.
Читайте также:
- 5 причин смещения в машинном обучении и что с этим делать
- Разработка виртуального помощника для удовлетворения основных потребностей пользователей
- Пять направлений применения исследования операций
Читайте нас в Telegram, VK и Яндекс.Дзен
Перевод статьи Sara A. Metwalli: 10 Different Data Science Job Titles and What They Mean