Data Scientist — что за профессия названа «самой сексуальной»

По данным Эндрю Чемберлена из Glassdoor, Data Scientist лидирует в списке лучших c профессий. Рейтинг основан на удовлетворенности сотрудников, уровне зарплаты и спросе. А еще несколько лет назад журнал Harvard Business Review назвал Data Scientist самой сексуальной профессией XXI века. Редакция разобралась, что за профессия Data Scientist, почему вокруг специалистов так много шума и как стать одним из них.

Data Scientist — что это за профессия

Преподаватель по биологической статистике Джеффри Лик из Университета Джонса Хопкинса дает содержательное определение профессии. Так, Data Scientist — это специалист, владеющий IT-грамотностью, математическими и статистическими знаниями, имеющий опыт в какой-либо отрасли.

Профессионал умеет программировать на Python, R, SAS, решать аналитические задачи, опыт позволяет понимать бизнес-задачи организации, чтобы двигаться в верном направлении.

Чем занимается Data Scientist

Общепринятого описания профессии нет. То, чем занимается Data Scientist, зависит от сферы работы. Но любой специалист по Big Data:

  • собирает большие массивы данных и преобразовывает их в удобный формат;
  • решает бизнес-задачи с использованием данных;
  • работает с языками программирования SAS, Python, R;
  • использует аналитическое методы: глубокое обучение, машинное обучение, текстовая аналитика;
  • работает со статистикой, включая тесты и распределения;
  • выявляет тенденции, ищет порядок и шаблоны данных.

В области обработки данных можно развиваться, как Data Engineer, Scientist и Data Manage. Инженер проектирует системы обработки, а Scientist умеет находить закономерности в больших массивах. В обязанности Data Manager не входит разработка продукта, но специалист должен представлять себе область, чтобы эффективно управлять проектом.

Что должен знать Data Scientist

Навыки Data Scientist

Data Scientist должен хорошо знать статистический анализ, чтобы описывать и сравнивать данные, определять тренды, проверять гипотезы, уметь изучать и сортировать данные для глубокого анализа, программировать и работать с БД, работать с инструментами визуализации. Нужно разбираться в аналитике, машинном и глубоком обучении.

Область знаний

Data Scientist должен иметь обширные знания

Где учиться на Data Scientist

Исполнительный директор сервиса E-Contenta Александр Петров считает, что лучшее образование для работы в этой области можно получить в вузах по направлениям «Математическая статистика», «Прикладная математика», «Информатика». Для обучения на профессиональных курсах также требуется хорошая математическая подготовка.

Новичкам рекомендуется перед обучением Big Data пройти подготовительные уроки, позволяющие освежить знания по высшей математике, теории вероятности, статистике, алгоритмам и структурам данных. Вводный курс поможет подготовиться к изучению машинного обучения и анализа данных на продвинутом уровне и решению задач на собеседовании.

Можно пройти коммерческие курсы, отличительными чертами которых являются короткий срок обучения и направленность на практическое применение технологий. Обучение предлагают онлайн-школы (Нетология), некоторые компании (Яндекс, Mail.ru), и классические университеты (МГУ, ВШЭ). Учиться может любой желающий (даже бесплатно), но в некоторых случаях нужно пройти онлайн-тестирование и собеседование, сдать письменный экзамен по высшей математике, алгоритмам, основам программирования, комбинаторике, теории вероятности и анализу.

Курсы онлайн

Онлайн-обучение длится от 8 месяцев. Программа включает изучение языка программирования Python, линейной алгебры, численных методов и алгоритмов, получение навыков извлечения и предобработки данных, исследовательского и статистического анализа, введение в машинное обучение и компьютерное зрение.

По каждой теме студенты выполняют практические задания, а ревью кода проводят профессионалы.

В ходе обучения реализуется несколько проектов, один из которых — дипломный. По окончании курса студент вместе с дипломом может получить выгодное предложение по трудоустройству.

Бесплатное обучение

Программист Николай Лотоцкий, который более 15 лет занимается разработкой ПО, говорит, что по окончании коммерческих курсов в отрасль попадает около 10% слушателей. Эти 10% обладают достаточным усердием и мотивацией, чтобы получить знания и без платных уроков.

Качественные бесплатные программы сейчас реализуют классические университеты (при поддержке Министерства науки РФ) и МООК.

Автор блога маркетингового агентства TexTerra Дмитрий Скалубо считает, что в сфере информационных технологий лучше всего работает связка самообразования и практики. Теорию можно изучить самостоятельно на бесплатных курсах, по книгам, какие-то знания получить на тематических площадках и в блогах профессионалов. Полученные навыки нужно сразу же применять на практике для реализации своих проектов.

С чего начать работу

Многие агентства, студии и крупные IT-компании предлагают новичкам пройти стажировку. Это хорошая возможность испытать себя на практике и добавить в резюме строчку, которая повысит ценность кандидата в глазах будущего работодателя.

К составлению резюме особенных рекомендаций для Data Scientist нет, работают все универсальные советы.

Обязательно нужно задуматься о создании качественного портфолио. Несуществующие проекты реализовывать не стоит, лучше добавить кейс со стажировки, дипломный проект с курсов или описать решение какой-либо реальной задачи для существующего заказчика (найти можно, например, на биржах фриланса).

С чего начать работу Data Scientist, рассказывают здесь:

Где искать работу Data Scientist

Вакансии, подразумевающие эту специализацию, могут называться по-разному. Самые распространенные наименования: математик-программист, архитектор Big Data, бизнес-аналитик, аналитик Big Data, менеджер по машинному обучению, специалист Data Mining.

Директор E-Contenta Александр Петров рассказывает, что Data Scientist работают в разных типах компаний:

  1. Стартапы в области обработки данных. Можно максимально быстро получить разносторонние знания и заработать в случае успеха проекта. Но работа нестабильная, а зарплата зачастую серая.
  2. Крупные интернет-компании. Предлагаются отличные условия (официальная зарплата, страховка, офис, бесплатное питание), можно учиться у настоящих профи, но главный минус — работа, которую выполняет Junior незаметна в масштабах всей компании.
  3. Исследовательские подразделениях аудиторских компаний, ритейл-сетей, телеком-операторов, банков. Специалист может получить достаточно большое поле ответственности, но в таких компаниях сильна внутренняя бюрократия, так что согласовывать и внедрять новые технологии достаточно сложно.

Искать работу можно на специализированных сайтах, в социальных сетях, на IT-конференциях, через знакомства в профессиональной среде. Можно напрямую интересоваться наличием подходящих вакансий у HR-менеджеров компаний. Найти их можно через LinkedIn, но писать лучше на Facebook, потому что профили LinkedIn редко проверяют.

HR-менеджер компании Beeline рассказал, как проходит собеседование на позицию Data Scientist. Процесс начинается с телефонного интервью с вопросами по некоторым разделам математики. После кандидата ждет тестовая задача. Если алгоритм получит высокое значение метрики качества, соискатель приглашается непосредственно на собеседование, где тоже проверяется знание методов анализа данных и машинного обучения, задаются нетипичные вопросы из практики и задачи на логику.

Вакансии в Москве

На Indeed открыто почти 50 вакансий для Data Scientist в Москве, HeadHunter находит более 220 предложений. Многие компании ищут специалистов уровня Senior, но есть и вакансии для Junior.

О типичных ошибках на собеседовании в Data Science рассказывают здесь:

Сколько можно заработать

По данным HeadHunter, Data Scientist платят в 2 раза больше, чем другим профессионалам в IT — около 190 тыс. руб. (при средней зарплате в IT — 90 тыс. руб.). Экспертам Big Data предлагают 200 тыс. руб., специалистам по машинному обучению — 180 тыс. руб., в области нейронных сетей — 140 тыс. руб.

В России потребность в специалистах по искусственному интеллекту и машинному обучению растет, но на рынке немного Data Scientist. У новичков все еще остается возможность занять конкурентную нишу.

Похожие статьи
Оставить отзыв
Наверх