11 шагов на пути к работе дата-сайентиста

В последние 3 года в моей карьере произошли изменения: я перешел с должности руководителя проектами/дата-аналитика на должность дата-сайентиста.

В этой статье я расскажу об 11 шагах, которые помогли мне совершить этот переход и получить первую работу дата-сайентистом.

Не стоит питать иллюзий: получить работу в области науки о данных, МО и ИИ сложно. Но если вы готовы приложить усилия, эта статья поможет вам более стратегически подойти к решению данной проблемы и с пользой потратить время и энергию.

Приступим к делу.

Пишите код ежедневно

Первое, что мне помогло,  —  это написание кода каждый день. Конечно, иногда можно пропустить день  —  жизнь состоит не только из науки о данных. Но если вы думаете о том, как попасть в эту область, нет лучшего способа подготовки, чем регулярное написание кода.

Почему? Рискую сказать очевидное, но именно этим вы будете заниматься большую часть дня в качестве дата-сайентиста.

Дополнительный плюс такой практики в том, что это отличный способ испытать себя и понять, действительно ли вы хотите стать дата-сайентистом. Возможно, вас привлекают большие зарплаты и ажиотаж вокруг таких технологий, как ChatGPT? Хотя это немаловажные причины заинтересоваться искусственным интеллектом, важно все же выяснить, придется ли вам по душе повседневный труд дата-сайентиста. Потратив всего 20 минут в день на написание кода, вы быстро поймете, нравится ли вам работа, которой занимаются дата-сайентисты и инженеры МО.

Какой язык (языки) программирования следует изучать? Можно услышать разные мнения по этому поводу, но я бы рекомендовал начать с Python. Потратьте некоторое время на освоение Python-библиотек pandas, numpy и matplotlib. Затем, когда вы освоите эти библиотеки, переходите к более интересному предмету  —  машинному обучению. Начните с библиотеки scikit-learn, а затем, когда вам надоест model.fit() и model.predict(), попробуйте глубокое обучение с помощью PyTorch и TensorFlow.

Наряду с этим попробуйте изучить SQL, который используется для сбора и предварительной обработки данных. Python и SQL будут составлять основу вашей повседневной работы в качестве дата-сайентиста, поэтому ими нужно овладеть прежде всего.

Станьте Citizen Data Scientist

Следующее, что мне помогло,  —  это включение науки о данных в круг моих занятий и увлечений. Я бы посоветовал вам то же самое: не ждите, пока вы “официально” станете дата-сайентистом, чтобы начать профессионально мыслить. Вместо этого станьте тем, кого называют Citizen Data Scientist, найдя возможность включить работу с данными в свою повседневную деятельность.

Например, можете добровольно взять на себя часть задач по составлению отчетов вашей текущей команды или попробовать провести анализ, который поможет усовершенствовать стратегию команды. Когда я работал в своей предыдущей команде (не специализирующейся на анализе данных), я предлагал другим помощь в анализе, а также делал отчеты и визуализации данных. Конечно, придется совмещать это с обязанностями на основной работе, но, находя способы применения данных, вы значительно повысите авторитет своей нынешней команды, а также разовьете собственные навыки.

Если вы работаете в крупной компании, где уже есть команда дата-сайентистов, простой способ стать Citizen Data Scientist  —  обратиться к кому-нибудь из этой команды, рассказать о своих амбициях и спросить, есть ли проекты, в которых вы могли бы оказать поддержку. Не исключено, что они будут очень рады вашему предложению, так как и для них это в некотором роде беспроигрышный вариант.

Создайте онлайн-портфолио

Для меня это стало поворотным моментом. Создание портфолио помогло мне завоевать расположение рекрутеров и в конечном итоге получить первую работу дата-сайентистом. Создание портфолио также укрепило мою мотивацию, поскольку дало мне настоящее “дело”, над которым я мог постоянно работать и искать способы его совершенствования.

Строгих установок относительно того, что помещать в портфолио, не существует. Вы можете наполнить его проектами из онлайн-курсов, собственными разработками и т. д. Чем интереснее и уникальнее портфолио, тем лучше. Но не стоит переусердствовать. Портфолио не поможет получить работу  —  это скорее повод для рекрутера начать с вами разговор и сделать шаг вам навстречу.

Если вы застряли на этапе поиска идей, ознакомьтесь с некоторыми проектами на Kaggle. Лично я никогда не пользовался Kaggle, так как смог наполнить свое портфолио проектами из различных курсов по науке о данных и МО, которые я посещал, но Kaggle определенно является отличным ресурсом, если вам нужны идеи.

Общайтесь с другими дата-сайентистами

Вы можете задаться вопросом: почему общение с другими специалистами имеет значение? Разве нельзя просто учиться онлайн?

Когда-то я рассуждал так же. Но дело в том, что многие советы, которые вы найдете в интернете, вам не подойдут, потому что они: 1) устарели; 2) не актуальны для вашего региона или отрасли; 3) рассчитаны на аудиторию, к которой вы не относитесь. Мир искусственного интеллекта быстро меняется, и нужно общаться с местными дата-сайентистами, чтобы получить актуальную и релевантную картину отрасли. Знаю, это может показаться сложным, но это очень важно и здорово поможет вам. Судите сами: вы же не хотите, чтобы первым встреченным вами дата-сайентистом оказался интервьюер на собеседовании!

Если мысль о налаживании контактов пугает вас, не волнуйтесь: меня это тоже пугало. На самом деле все гораздо проще, чем вы думаете. Для начала подпишитесь на дата-сайентистов и ИИ-специалистов, публикующих свои работы в социальных сетях. Это отличный способ отслеживать актуальные события в отрасли.

Если вы работаете в компании, где есть команда дата-сайентистов, свяжитесь с парой человек из этой команды и спросите, не хотят ли за чашкой кофе рассказать о своем опыте. Если в вашей компании нет таких сотрудников, попробуйте обратиться к дата-сайентистам из других организаций через LinkedIn. Возможно, придется предпринять несколько попыток завязать знакомство, прежде чем вы получите хоть какой-то ответ: люди очень заняты! Но будьте настойчивы, и в конце концов найдете желающих общаться.

Не бойтесь ошибиться. Помните: все когда-то начинали с нуля. Людям свойственно испытывать естественное чувство эмпатии к тем, кто находится в ситуации, в которой они сами побывали. Уверен, что вы будете удивлены тем, как много специалистов выразят готовность протянуть вам руку помощи.

Получите соответствующую квалификацию или сертификат

Я бы солгал, если бы сказал, что это не сыграло большой роли в моем профессиональном становлении. Первым документом, подтверждающим мои компетенции в области науки о данных, был сертификат дата-сайентиста от IBM. Наличие этого документа позволило мне пройти обучение в Оксфордском университете по магистерской программе социальной науки о данных, что, в свою очередь, помогло получить первую работу.

Важно отметить, что для карьеры дата-сайентиста не обязательно иметь диплом об образовании. По моим подсчетам, в моей текущей команде менее 50% сотрудников являются дипломированными специалистами в сфере дата-сайенс и МО. Более типичный путь (особенно если у вас уже есть другое профессиональное образование)  —  пройти несколько онлайн-курсов и буткампов и “доукомплектовать” недостающие навыки.

Пройдите стажировку

Если у вас нет опыта работы в области науки о данных, вам будет трудно произвести должное впечатление на работодателей. Именно в этом случае стажировка может оказаться очень полезной. Я проходил две стажировки: неофициальную и неоплачиваемую во время обучения в магистратуре и 4-месячную оплачиваемую после окончания университета. Обе они позволили мне убедить будущих работодателей в том, что я обладаю необходимыми качествами, а также помогли освоить некоторые практические навыки работы с данными, которыми трудно овладеть на онлайн-курсах (например, git/GitHub и GCP/AWS).

Как найти стажировку? Один из вариантов  —  обратиться напрямую в небольшие и малоизвестные компании. Для меня это всегда срабатывало. Напишите дружелюбное письмо, объяснив, что вы ищете и что вы можете предложить. 

Стратегически подходите к выбору места прохождения стажировки

Не пишите только в крупные компании или туда, куда стремятся все остальные. Определите, что вы действительно ищете и в какой среде хотите работать. После долгих размышлений я твердо решил, что сектор медиа  —  это то, где я хочу быть, поэтому подавал документы только в компании из этой отрасли.

Определившись с местом работы, изучите описание вакансии и узнайте подробности о процессе собеседования. Вы же не хотите неожиданных сюрпризов!

Не преуменьшайте значение своего предыдущего опыта

Даже если вы раньше не работали в области науки о данных, могу гарантировать, что ваш предыдущий опыт будет полезен: нужно просто найти способ его применения.

Мне пригодились навыки коммуникации и сторителлинга, которыми я овладел в процессе проведения множества презентаций, а также опыт управления отношениями с заинтересованными сторонами, приобретенный мной на сложных проектных совещаниях. Подобные нетехнические компетенции очень актуальны в области науки о данных. Вам просто нужно четко понимать, где и как их проявить.

Не переоценивайте себя

Будьте реалистичны в оценке своих навыков. У вас может быть колоссальный опыт в смежных областях, но это не значит, что вы сможете быстро перейти в науку о данных. Примите тот факт, что вы, возможно, не сразу получите должность мечты.

Например, для старта вам может понадобиться стажировка, менее высокая должность или выполнение обязанностей технического аналитика данных. Я не говорю, что нужно умерить свои амбиции  —  по-прежнему стремитесь к высотам! Но смиритесь с тем, что вам, возможно, придется сделать промежуточный шаг, прежде чем вы достигнете цели.

Будьте терпеливы

Менять профессию нелегко, и на это может потребоваться время. Вы не добьетесь успеха в одночасье. Но если проявить немного терпения и настойчивости, у вас все получится.

Помните, что жизнь не сводится к науке о данных

Берите выходной каждую неделю. Помните, зачем вы это делаете. Не пренебрегайте своим здоровьем и личной жизнью ради карьеры. Это важные вещи.

Честно говоря, мне приходится и самого себя постоянно в этом убеждать. Но ни одна карьера не стоит того, чтобы жертвовать ради нее всем, даже карьера в области науки о данных.

Читайте также:

Читайте нас в TelegramVK и Дзен


Перевод статьи Matt Chapman: 11 Practical Things That Helped Me Land My First Data Science Job

Предыдущая статьяРазделение окон в Vim
Следующая статьяПланирование и оркестрация облачных задач dbt Cloud с помощью Prefect