От нуля к единице: как сервис Instawork исследует данные

До прихода в Google я работала в компании-единороге с явной склонностью к действию. Корпорация Google, в свою очередь, может позволить себе такую роскошь, как теоретические размышления. Тяжело отрицать, что с точки зрения управления данными ей нет равных. Для специалиста по обработке данных, которому нравится исследовательская фаза работы над проектами, Google  —  идеальное место.

Помимо сильной культуры, Google заботится о балансе между профессиональной и личной жизнью сотрудников. Поэтому когда генеральный директор и соучредитель сервиса по поиску работы Instawork Сумир Мегани связался со мной, чтобы пригласить в команду по изучению данных и машинному обучению, я вежливо отказалась.

Причины ухода из Google

Анализ возможных рисков и имитационное моделирование помогли мне почувствовать уверенность в сохранении комфортного образа жизни. Принимая решение, я сопоставила свой более чем 4-летний опыт в Google с тем, чему могу научиться и как смогу продвинуться по карьерной лестнице за тот же период в Instawork. Окончательный выбор был сделан на основе следующих факторов в пользу Instawork.

  1. Миссия. Instawork предоставляет экономические возможности и lifestyle-маркетинг. Создавать продукт, который позволяет обычным людям обеспечивать семью,  —  это чрезвычайно благодарный труд.
  2. Ориентация на продукты, созданные на основе датасетов и машинного обучения. В этой сфере много конкурентов, хотя дифференциация невелика. Отличительным признаком Instawork является креативность персонала, обслуживающего приложение. На совещаниях здесь всегда хватает идей, касающихся DS/ML-продуктов и способов их продвижения.
  3. Большое количество опытных специалистов и руководство, способное принимать ответственные решения.

Инновации имеют значение

В крупной технологической компании требуются недели экспериментов, чтобы внести, казалось бы, незначительные доработки. Например, сделать квадратную кнопку закругленной. В какой-то момент эта работа перестает казаться важной, интересной и мотивирующей.

Здесь, в Instawork, мы создаем все с нуля, начиная с основополагающих принципов. Формирование универсального набора моделей является более сложной и вдохновляющей задачей, которая к тому же требует гораздо больше знаний. Построение фундаментальных процессов нуждается в другом наборе навыков и особом подходе. Мы работаем так быстро, как только можем, чтобы создавать базовые модели, пригодные для производства.

С чего начать

Каждый рынок должен принять решение  —  склониться на сторону бизнеса или потребителя. Для Instawork бизнес  —  это наши партнеры, а наши потребители  —  Pro (высококвалифицированные кадры).

Нашей команде нужно было разработать проект за три месяца. С чего мы начали? Для меня было очевидным решением выбрать категорию Pro. Прежде всего, нужны модели, которые позволят высококвалифицированным сотрудникам добиваться успеха с помощью приложения Instawork. Для этой площадки все начинается и заканчивается уровнем профессионализма подобранного персонала.

Как должен выглядеть процесс привлечения высококвалифицированного сотрудника? Как обеспечить высокую точность подбора кадров, гарантирующую положительный опыт как наемного работнику, так и работодателю? Какие процессы можно автоматизировать с помощью машинного обучения, чтобы обеспечить беспроблемный процесс найма? Вот основные вопросы, которые мы решаем на старте.

Переход к следующему МО-продукту

Мы не можем вечно уделять стопроцентное внимание потребителям. Наши партнеры также нуждаются в поддержке продуктов машинного обучения. Разработка нового проекта всегда дается нелегко. Но важно понимать: за то время, пока идет работа по повышению точности старой модели с 80% до 90%, упускается возможность достичь уровня точности от 0 до 80% для новой модели.

Мы  —  команда, которая готова идти на все ради результата. Иногда объем проектов, который предстоит подготовить, намного превышает наши возможности. Команда планирует создание базовых моделей на 2 года вперед. Однако мы готовы к тому, что дорожные карты бизнеса могут измениться, и потребуются совершенно новые базовые модели. В этом и заключается весь драйв мира стартапов.

Читайте также:

Читайте нас в TelegramVK и Яндекс.Дзен


Перевод статьи Angela Han: Zero to One, Data Science at Instawork

Предыдущая статья15 часто используемых методов массивов JavaScript
Следующая статьяSMOTE: метод увеличения числа примеров миноритарного класса