Российская экономика остро нуждается в цифровых специалистах. Времени ждать, пока эти профессии освоят вчерашние школьники, нет. Поэтому в рамках национальной программы «Цифровая экономика» планируется бесплатно обучить IT-специальностям всех, кто хочет сменить профессию и готов трудиться на цифровом поприще. В 48 российских регионах уже началась выдача персональных образовательных сертификатов, которые дают возможность отучиться по цифровым специальностям.
Пройти обучение сможет любой взрослый, не достигший пенсионного возраста и имеющий законченное высшее или среднее профессиональное образование. Выбрать будущую профессию можно из 22 направлений. Это и программирование, и создание IT-продуктов, и 3D-моделирование, и кибербезопасность, и искусственный интеллект. Также в рамках программы можно отучиться на специалиста по большим данным (big data) — это направление сегодня крайне востребовано в IT-сфере.
Область больших данных — одна из самых молодых и быстроразвивающихся. Спрос здесь существенно превышает предложение. Молодых специалистов разбирают еще на стадии обучения, а зарплаты постоянно растут. «В среднем востребованность специалистов в области больших данных растет ежегодно на треть, — отмечает руководитель службы исследований компании hh.ru Мария Игнатова. — С января по октябрь 2020 г. количество вакансий для big data-специалистов на hh.ru выросло на 30 процентов по сравнению с аналогичным периодом прошлого года (с 570 вакансий до 739). За сопоставимый период 2019 года по сравнению с 2018 годом рост вакансий составил 28 процентов».
В 2019 году, по словам Марии Игнатовой, на одну вакансию специалиста в области больших данных приходилось 0,3 резюме, в 2020 году — 0,6. За год резюме таких специалистов стало больше на 150 процентов, но этого по-прежнему недостаточно для того, чтобы закрыть растущие потребности бизнеса.
С большими данными ежедневно сталкивается каждый из нас, но доступны они, как правило, крупным компаниям или госструктурам. Например, данные о транзакциях банковских карт хранятся в банках, данные с уличных камер принадлежат различным госорганам, данные о маршрутах такси — таксопаркам. Работа с данными позволяет составить «портрет» пользователя и предложить то, что ему максимально подходит. Изучив информацию о поездках, таксопарк, например, предложит клиенту скидку на самый популярный маршрут. Большие данные помогают бизнесу повысить эффективность, поэтому компании создают целые подразделения, отвечающие за их обработку.
Специалистов по большим данным совместно с ИТ-компаниями готовят ведущие российские вузы, в которых сильно направление информатики
«Сегодня от обработки данных выгоду получает не только средний и крупный бизнес, но и небольшие компании, — считает генеральный директор компании НОРБИТ Антон Чехонин. — Особенно это касается B2C-сегмента. Работа с данными — это комплексный процесс, который включает инфраструктурные и аналитические задачи, задачи, связанные с очисткой, обработкой, обогащением, обновлением данных, построением отчетов, поиском инсайтов. Для всех этих процессов нужны специалисты по большим данным с хорошей теоретической подготовкой и практическим опытом».
Специалист по большим данным занимается построением моделей, на основе которых принимаются те или иные решения. И неважно, какая это сфера деятельности: бизнес, производство, наука, безопасность или что-то еще. Однако каждая сфера имеет свои нюансы и специфику, поэтому и специалисты по большим данным также имеют различные специализации.
Пожалуй, самые востребованные и популярные сегодня — это data engineer, data scientist и data manager. Data engineer, или инженер данных, занимается формированием инфраструктуры для работы с большими данными. Он собирает информацию, анализирует ее, перемещает и хранит.
Data scientist — это более широкая специализация по сравнению с data engineer и включает в себя такие задачи, как программирование, решение алгоритмических задач, понимание бизнес-запросов или задач своей отрасли.
Data manager отвечает за управление проекта и, как правило, не занимается непосредственно разработкой продукта.
Для big data-специалистов важно иметь практические навыки по работе с ETL-инструментами (извлечение, очистка и трансформация данных), умение проектировать и работать с базами данных, настраивать процессы обработки данных и, конечно же, разбираться в бизнес-составляющей данных, если речь идет о работе в коммерческой компании. «Прежде всего в специалистах по большим данным мы хотим видеть способность быстро обучаться, понимать и документировать задачи, быть универсальными, уметь писать программный код и настраивать базы, — говорит Антон Чехонин. — Специалист должен иметь практический опыт по работе с ETL-инструментами, базами данных, стеком Hadoop, Kafka, NiFi, Airflow. В идеале выпускники вузов уже должны обладать теоретическими знаниями по работе с такими технологиями, но пока это далеко от действительности».
Конечно, в нашей стране готовят специалистов по большим данным. Но поскольку сфера довольно молодая, то получить такое образование можно далеко не везде. В основном этим занимаются ведущие вузы, в которых сильно направление информатики. Как правило, обучающие программы составляются и проводятся совместно с крупнейшими IT-компаниями, которые и заинтересованы во «взращивании» таких специалистов. И это вполне положительный тренд. Во-первых, можно быть уверенным, что обучающие программы будут составлены по самым современным стандартам, отвечающим запросу рынка. Во-вторых, уже на стадии обучения можно будет пройти стажировку и в перспективе трудоустроиться в одну из ведущих IT-компаний.
«Во многих отраслях есть множество примеров, когда компании собирают команды специалистов по big data и делают ставку на сбор и обработку данных, — рассказывает Антон Чехонин. — И в итоге обгоняют по капитализации даже сырьевые компании. Очевидное преимущество, при прочих равных, в конкурентной борьбе получат те компании, которые будут использовать инструменты по обработке данных и прогнозированию. На практике это может давать такие результаты, как экономия финансовых средств на проведение персонализированных маркетинговых кампаний, снижение стоимости привлечения новых клиентов, повышение среднего чека за счет точных релевантных торговых предложений, сокращение фонда оплаты труда за счет замены рутинных задач специалистов автоматическими ИИ-алгоритмами».