Дата-сайентист — герой нашего времени

Еще десять лет назад в Harvard Business Review назвали профессию в области аналитики больших данных одной из самых привлекательных в мире. С тех пор спрос на таких специалистов продолжает расти. О том, что нужно знать и уметь дата-сайентисту и как попасть в эту сферу, рассказывает директор направления больших данных VK Герман Царев.

Герман Царев, директор направления больших данных VK

Герман Царев, директор направления больших данных VK

Герман Царев, директор направления больших данных VK

Многие крупные компании уже умеют работать с данными. Они поняли, что специалисты в этой области могут напрямую или косвенно генерировать дополнительную выручку, создавать новые продукты и направления за счет технологий. Поэтому в организациях появляются подобные вакансии — а там, где такие профессионалы уже были, их становится больше.

Если описать, кто такой дата-сайентист и какими навыками должен обладать, получится программист с отличным математическим фундаментом. Он умеет работать с различными базами данных и стеком больших данных, может строить и улучшать модели машинного обучения. Важно, чтобы специалист был погружен в специфику работы компании: это помогает формулировать гипотезы и проверять определенные наборы данных для решения задач бизнеса быстрее.

Конкретный набор навыков и компетенций, которые потребуются дата-сайентисту, может разниться от компании к компании. К тому же со временем выделяются узконаправленные специальности, например инженер машинного обучения или специалист по качеству данных. Поэтому сейчас диапазон задач дата-сайентиста простирается от классической аналитики до построения моделей машинного обучения. Часто отличие между позициями заключается именно в пропорции задач внутри этого диапазона — например, одни вакансии предполагают 80% аналитических задач и 20% машинного обучения, а другие наоборот.

В список технологий и инструментов дата-сайентистов в коммерческих компаниях, как правило, входят Python, SQL, Hadoop, Spark, Presto, Jupyter Notebook, библиотеки работы с данными и библиотеки машинного обучения.

Из персональных качеств важно желание разбираться в деталях сложных систем, не бояться неопределенности и любить эксперименты. Часто приходится работать с чем-то совершенно новым, непредсказуемым, делать то, чего никто до этого не делал. Очень помогают сильные коммуникативные навыки: для решения нетривиальных задач часто нужно общаться с коллегами.

Хорошей базой для дата-сайентиста станет образование в сфере прикладной математики или техническое, например факультет компьютерных наук НИУ ВШЭ, ВМК или мехмат МГУ, математическо-технические факультеты МФТИ, МИФИ, Бауманки и других ведущих вузов. Но в этой профессии главное не диплом, а способности кандидата и его опыт, которые позволяют хорошо пройти технические собеседования. Есть много примеров, когда это успешно удавалось студентам второго-третьего курсов.

Поскольку для дата-сайентиста важна техническо-математическая база, перейти в эту профессию легче тому, у кого эта база уже есть. Часто дата-сайентистами становятся продуктовые аналитики или аналитики данных, разработчики.

Несмотря на сильную тенденцию к автоматизации как при работе с данными, так и в машинном обучение, в перспективе пяти лет спрос на дата-сайентистов и их количество на рынке, скорее всего, продолжат расти. Ведь именно такие профессионалы генерируют и проверяют множество гипотез, от которых зависят многие процессы, качество сервисов, счастье клиентов и, как следствие, доходы компаний.

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...