Data Science - все о профессии, плюсы и минусы, возможности обучения и заработка

Мария Рухлова
Автор-эксперт проекта «Edu UP»


В дословном переводе Data Science - это наука о данных. Она предполагает сбор, анализ и систематизацию так называемых “Big Data” (больших данных), представляющих собой огромные объемы информации, получаемые изначально в неструктурированном виде. Это могут быть: статистика поисковых запросов, метеоданные за определенный период времени, база геномов и многое другое.

Data Science - все о профессии, плюсы и минусы, возможности обучения и заработка

*Показатели профессии по расчетам автора материала
период обучения: от 1 года
среднемесячный доход: 850 - 5000 $
востребованность на рынке: Высокая
уровень сложности обучения: Тяжелый

Кто такой Data Science и чем он занимается

Основными задачами Data Scientist является поиск закономерностей в “Big Data” и их детальный анализ. На его базе специалист составляет программный алгоритм, помогающий найти оптимальное решение поставленных задач. Такое представление функционала кому-то обманчиво может показаться довольно простым. Но в действительности же, профессия дата сайентист по праву считается одной из самых сложных специальностей среди всех IT-направлений.

В то же время Data Scientist - это незаменимый эксперт цифровой обработки данных, а сама наука - неотъемлемая составляющая будущего информационных технологий. И, прежде всего, база для последующего развития и совершенствования искусственного интеллекта.

Сейчас Data Science активно используется не только в состоявшихся IT-компаниях, но и в стартапах, в банковской системе и многих других сферах. Результатом применения технологии обработки и структуризации данных являются максимально точные прогнозы, которые помогают стать ближе к пользователям, лучше их понимать и, как следствие, предлагать оптимальные решения для удовлетворения потребностей. То есть, профессиональная деятельность Data Scientist создает базу для автоматизации решений, способствующих повышению маржинальности бизнеса.

К основным функциям Data Scientist относятся:

  • поиск скрытых закономерностей и связей между ними;

  • визуализация данных;

  • проведение анализа в соответствии с определенными критерием, способным продемонстрировать эффективность прогнозируемой модели;

  • программирование, тренировка и объективная оценка модели с экономической точки зрения;

  • выявление наиболее “богатых” источников получения данных, их объединение с потенциально недостаточными и последующая чистка набора, полученного в результате компоновки;

  • анализ внутренних процессов и возможных рисков с определением их вероятности;

  • внедрение моделей в действующие инфраструктуры, их доработка и слежение за процессами, происходящими в результате этого введения;

  • разработка отчетов и прогноз результатов;

  • внесение предложений в отношении использования новых направлений с целью развития клиентского бизнеса;

  • консультирование руководителей проектов и менеджеров продуктов с учетом полученных результатов.

Благодаря профессиональной деятельности дата сайентист владельцам и управленцам бизнеса удается принимать оптимальные решения, помогающие опережать конкурентов за счет сближения с пользователями и потенциальными потребителями продуктов. В свою очередь жизнь последних становится комфортнее, что тоже немаловажно.

Что должен знать и уметь Data Scientist

В первую очередь, любой Data Scientist должен знать несколько языков программирования ввиду того, что одной из основных функций этого специалиста является написание кода модели с целью аналитики, оценки гипотез и данных в целом.

Data Scientist должен владеть:

  • Java, представляющий собой типизированный язык общего назначения;

  • Python, являющийся базовым языком программирования, необходимым для работы с методами машинного обучения;

  • Hive, представляющий собой систему хранилища данных для Apache Hadoop, позволяющую их запрашивать, обобщать и анализировать;

  • инструментами Scikit, Matplotlib, Skipy, Numpy;

  • C++ (для старта достаточно опциональных навыков);

  • языком R, являющимся наряду с Python одним из основных инструментов в работе дата сайентист, пригодным для расчета статистических данных.

Но знание программирования - это далеко не единственная область знаний, которой необходимо владеть Data Scientist. Помимо него, пригодятся:

  • Математика. Специалисту по данным не обойтись без знаний математического анализа, статистики, теории вероятности и линейной алгебры. Они пригодятся при составлении прогнозов, работе над построением математических моделей и поиске закономерностей.

  • Машинное обучение, которое необходимо, в первую очередь, для создания новых прогнозируемых моделей и корректировки существующих.

  • Deep Learning (с англ. “глубокое обучение”), представляющий собой один из видов машинного обучения, основанный на использовании нейронных сетей, способных к самообучению посредством обработки больших объемов данных.

  • Специфику отраслей, с которыми придется работать.

  • Английский язык. С ним аналитикам приходится сталкиваться не только при общении и обмене опытом с зарубежными коллегами, но и при работе с кодом, различными технологиями, фреймворками.

Это, можно сказать, базовый набор знаний и навыков, которые необходимо иметь будущему дата сайентист. К опытным специалистам по данным предъявляются еще более высокие требования. Он должен владеть всеми вышеуказанными “hard skills” буквально в совершенстве, а также иметь опыт глубинного обучения с использованием фреймворков (TensorFlow, Scikit-Learn, MLLib, Keras и ряда других).

Кому подходит профессия, нужен ли талант

Кто может стать успешным Data Scientist? В первую очередь тот, кого привлекает процесс анализа данных и их систематизации. Тот, кто неравнодушен к передовым технологиям и понимает суть, важность и обоснованность их стремительного развития. Будущий Data Sciencetist должен интересоваться современной наукой, разнообразными исследованиями в области IT-технологий и, в особенности, продвижениями в сфере совершенствования механизмов работы искусственного интеллекта.

Помимо знаний, навыков и желания, для построения успешной карьеры Data Scientist необходимо обладать и определенным набором личностных качеств. К числу “soft skills” для специалиста по данным стоит отнести:

  • внимательность к деталям, скрупулезность;

  • настойчивость, стремление получить максимально хороший результат;

  • ассоциативное мышление;

  • любопытство, склонность к поиску доказательств, обоснований;

  • способность к погружению в проблему;

  • коммуникативность, гибкость, терпимость (дата сайентист работает не только с компьютером, но и с людьми);

  • дотошность;

  • аналитический склад ума и хорошо развитая логика.

Data Scientist пригодится усидчивость и выдержка, которые будут наиболее полезны при выполнении длительной монотонной работы. Не лишними станут и врожденные способности к усвоению технических наук.

Где и как учатся будущие Data Scientist

Поскольку будущему дата сайентист необходимо иметь знания в области математики и программирования, оптимальным вариантом является освоение профессии на базе уже имеющегося высшего технического образования. Лучше всего, если потенциальный студент курса по обучению аналитике данных будет иметь диплом по одной из следующих специальностей:

  • программная инженерия;

  • обеспечение информационных систем и технологий;

  • математическое администри­рование;

  • прикладная математика и информатика;

  • технологии искусственного интеллекта и анализ данных;

  • проектирование ПО;

  • анализ данных и цифровые технологии и другие смежные специализации.

Если вы окончили ВУЗ с гуманитарным уклоном, но хотите испытать свои силы в Data Science и готовы упорно трудиться, то обязательно попробуйте! История этого направления IT уже знает немало примеров становления высококлассных специалистов, изначально имевших гуманитарное образование. И это с учетом того, что Data Science является сравнительно молодой наукой.

Курсы в учебных центрах в основном длятся 18 месяцев. Но здесь многое зависит от выбранного образовательного учреждения и имеющейся квалификации (образования, базы знаний). В течение первых 6-8 месяцев студент проходит основную подготовку, изучая азы. В последующие 5-7 месяцев обучается по конкретно выбранной специализации.

Базовыми считаются 3: машинное обучение, дата-инженер и аналитик. Затем учащийся проходит курс повышения квалификации (3-5 месяцев), после которого он становится готовым к сдаче финального экзамена.

Расходы на обучение

Курсы для будущих дата сайентистов, не имеющих соответствующего высшего образования, сравнительно дорогие. Средняя цена за 18 месяцев обучения составляет около 200 тыс руб. Но многие образовательные центры предоставляют рассрочку, то есть, возможность помесячной оплаты, поэтому курсы могут позволить себе если не все, то очень многие.

Для тех, кто уже задействован в сфере IT и имеет навыки в области программирования, курсы обойдутся дешевле. Но здесь многое зависит от квалификации и выбранного направления, которое необходимо подтянуть. Например:

  • Средняя стоимость за 4-5 месяцев обучения на курсе “Основы математики для дата сайентист” стоят 55 тыс. руб (минимальная цена составляет 25 тыс. руб со скидкой при единовременной оплате всего периода обучения).

  • Цена 11-месячного курса переподготовки для программистов и разработчиков с целью освоения профессии Data Scientist варьируется от 70 до 150 тыс. руб со скидкой при единовременной оплате и от 90 до 200 тыс. руб без скидки на условиях помесячной оплаты).

  • Расширенные курсы, предлагаемые несколькими образовательными центрами для студентов технических ВУЗов и IT-шников, стоят от 200 до 320 тыс. руб. Длится обучение 18 месяцев.

  • Курсы повышения квалификации для действующих сайентистов можно пройти за 21-38 тыс. руб (срок - 2-2,5 месяца в зависимости от выбранного учебного центра).

  • Узконаправленный курс по машинному обучению стоит в среднем 65 тыс. руб (за 4-5 месяцев).

Если говорить о предварительном получении высшего образования, то оно обойдется значительно дороже. Год обучения в ВУЗе стоит от 85 до 360 тыс руб. Средняя цена по России составляет 165 тыс руб.

Где может работать Data Scientist

Вариантов трудоустройства у Data Scientist более чем достаточно. К наиболее перспективным относятся:

  • банки и другие финансовые учреждения, в том числе, брокерские, инвестиционные компании;

  • любые крупные организации и холдинги, производственные предприятия, транспортные компании;

  • фирмы из IT-сферы, нуждающиеся в разработке различных алгоритмов, ботов, систем искусственного интеллекта;

  • страховые, медицинские организации, предприятия, задействованные в сельском хозяйстве;

  • метеослужбы, которые готовят прогноз погоды именно при помощи Data Science, компании, работающие в области биоинформатики, физических, генетических исследований.

Уровень дохода аналитика данных

Доход аналитика данных зависит от опыта, навыков, сложности конкретного проекта и организации, в которой он трудоустроен. По состоянию на 3 квартал 2022 года, общая картина выглядит примерно так:

  • Работодатели из Москвы предлагают аналитикам данных зарплату, начиная от 100 тыс. руб. В среднем компании готовы платить специалисту 200 тыс. руб. Самые “завидные” организации оценивают работу своего будущего сотрудника в 400 тысяч и выше. При этом они ищут специалиста, имеющего опыт работы в узком направлении профессии не менее 5 лет.

  • В среднем по России зарплата начинающего Data Scientist стартует с 70 тыс. руб., а вот максимальный порог не определен.

  • Основной диапазон предлагаемых зарплат варьируется в пределах 150-250 тыс. руб. Но на такой доход могут рассчитывать только аналитики данных с опытом (оптимально - 3-5 лет).

Что касается заграничных работодателей, то в странах Западной Европы дата сайентист в среднем зарабатывает 8-10 тыс евро. При этом “топовые” компании предлагают от 12 тыс евро и более. В США сайентисту среднего уровня платят 35-60 долларов в час. Наиболее престижные американские компании готовы платить Data Scientist от 72 тыс долларов и более, что эквивалентно 4 млн 180 тыс российских рублей.

Востребованность, уровень конкуренции

В соответствии с данными, представленными Всемирным экономическим форумом, Data Scientist является самым востребованным специалистом на рынке профессий. И по заявлению экспертов, такая тенденция сохранится как минимум до 2025 года. Более того, с высокой долей вероятности спрос на этих специалистов будет только расти. Ведь за последние 4 года он увеличился почти на 450%.

Потребность в Data Scientist растет стремительнее предложений. То есть, новых специалистов на рынке появляется меньше, чем требуется для удовлетворения существующего спроса. Связано это прежде всего с постоянным появлением новых задач, решить которые способен именно Data Scientist.

Но нельзя однозначно сказать, что абсолютно любой специалист по данным может сиюминутно найти хорошую работу. Многие работодатели ищут сотрудников с опытом, причем иногда в определенной узкой нише. На новичков на рынке спрос невелик, но при желании начинающих аналитик может достаточно быстро перешагнуть на ступень специалиста класса “Мидл” (примерно через несколько лет упорной работы).

Плюсы и минусы профессии

К достоинствам профессии Data Scientist стоит отнести:

  • большие перспективы развития;

  • потенциально высокую оплату труда, а для настоящих экспертов - фантастическую;

  • востребованность на рынке, которая будет продолжать расти;

  • доступность обучения (попробовать может каждый);

  • возможность оказывать влияние на развитие информационных технологий в целом;

  • престижность.

Несмотря на впечатляющий перечень плюсов, у профессии дата сайентист есть и минусы:

  • невозможность предсказать результат с вероятностью в 100% до начала непосредственной работы с прогнозной моделью (то есть, нередко специалисту придется мужественно терпеть неудачи, начиная сначала снова и снова);

  • сложность и дороговизна обучения;

  • высокие требования, предъявляемые крупными компаниями;

  • необходимость постоянного развития и слежения за новшествами.

Компании мечты

Самыми перспективными работодателями для Data Scientist любого уровня являются компании-гиганты. И в России их достаточно много (не говоря уже про США и Западную Европу). Они предлагают своим сотрудникам не только высокую зарплату, но и стремительное продвижение по карьерной лестнице, которое не только значительно повысит доход, но и статус специалиста, что в мире IT немаловажно.

К числу отечественных предприятий, в которых мечтает работать каждый эксперт по аналитике данных, стоит отнести:

  • “ВКонтакте”;

  • Сбербанк;

  • поисковую систему “Яндекс”;

  • инвестиционный холдинг “Финам”;

  • “Газпром”;

  • “Металлоинвест” и много других.

Специалист по анализу данных - это определенно престижное, интересное и перспективное направление, которое к тому же еще и очень хорошо оплачивается. Но стать настоящим экспертом в этой области - задача не из простых. Data Scientist должен в совершенстве владеть не только несколькими языками программирования, но и отлично знать математику, методы машинного обучения, специфику отрасли, а также разбираться в множестве различных фреймворков.

Оцените профессию

Голосуем!
Проголосовало: 0

Понравилась статья?

Комментарии 0