Дата-сайентист — герой нашего времени
Еще десять лет назад в Harvard Business Review назвали профессию в области аналитики больших данных одной из самых привлекательных в мире. С тех пор спрос на таких специалистов продолжает расти. О том, что нужно знать и уметь дата-сайентисту и как попасть в эту сферу, рассказывает директор направления больших данных VK Герман Царев.
Герман Царев, директор направления больших данных VK
Герман Царев, директор направления больших данных VK
Многие крупные компании уже умеют работать с данными. Они поняли, что специалисты в этой области могут напрямую или косвенно генерировать дополнительную выручку, создавать новые продукты и направления за счет технологий. Поэтому в организациях появляются подобные вакансии — а там, где такие профессионалы уже были, их становится больше.
Если описать, кто такой дата-сайентист и какими навыками должен обладать, получится программист с отличным математическим фундаментом. Он умеет работать с различными базами данных и стеком больших данных, может строить и улучшать модели машинного обучения. Важно, чтобы специалист был погружен в специфику работы компании: это помогает формулировать гипотезы и проверять определенные наборы данных для решения задач бизнеса быстрее.
Конкретный набор навыков и компетенций, которые потребуются дата-сайентисту, может разниться от компании к компании. К тому же со временем выделяются узконаправленные специальности, например инженер машинного обучения или специалист по качеству данных. Поэтому сейчас диапазон задач дата-сайентиста простирается от классической аналитики до построения моделей машинного обучения. Часто отличие между позициями заключается именно в пропорции задач внутри этого диапазона — например, одни вакансии предполагают 80% аналитических задач и 20% машинного обучения, а другие наоборот.
В список технологий и инструментов дата-сайентистов в коммерческих компаниях, как правило, входят Python, SQL, Hadoop, Spark, Presto, Jupyter Notebook, библиотеки работы с данными и библиотеки машинного обучения.
Из персональных качеств важно желание разбираться в деталях сложных систем, не бояться неопределенности и любить эксперименты. Часто приходится работать с чем-то совершенно новым, непредсказуемым, делать то, чего никто до этого не делал. Очень помогают сильные коммуникативные навыки: для решения нетривиальных задач часто нужно общаться с коллегами.
Хорошей базой для дата-сайентиста станет образование в сфере прикладной математики или техническое, например факультет компьютерных наук НИУ ВШЭ, ВМК или мехмат МГУ, математическо-технические факультеты МФТИ, МИФИ, Бауманки и других ведущих вузов. Но в этой профессии главное не диплом, а способности кандидата и его опыт, которые позволяют хорошо пройти технические собеседования. Есть много примеров, когда это успешно удавалось студентам второго-третьего курсов.
Поскольку для дата-сайентиста важна техническо-математическая база, перейти в эту профессию легче тому, у кого эта база уже есть. Часто дата-сайентистами становятся продуктовые аналитики или аналитики данных, разработчики.
Несмотря на сильную тенденцию к автоматизации как при работе с данными, так и в машинном обучение, в перспективе пяти лет спрос на дата-сайентистов и их количество на рынке, скорее всего, продолжат расти. Ведь именно такие профессионалы генерируют и проверяют множество гипотез, от которых зависят многие процессы, качество сервисов, счастье клиентов и, как следствие, доходы компаний.
