Bonjour! На календаре уже второй месяц осени. Зима всё ближе и погода всё прохладнее. Думаю, новая статья про IT-профессии отлично согреет вашу душу.
Data Scientist
Сегодня на очереди профессия, которую я изучал в университете. Скажу честно, далось мне это очень тяжело. Да, работать с данными – это не моё. Итак, Data Scientist или дата-сайентист – специалист по машинному обучению. Какие обязанности должен выполнять человек в этой сфере?
Во-первых, он составляет датасет. Например, он готовит много фотографий кошек и собак. Дальше на основе этих данных создаётся модель. Ее можно считать неким черным ящиком. Если не знаете что это такое, то рекомендую ознакомиться со статьёй про reverse engineering. После всех этих действий, модели «скармливают» датасет. В нашем примере мы показываем модели огромное количество фотографий этих животных.
Суть этого действия в том, чтобы объяснить, как выглядят кошки и как собаки. То есть, мы буквально показываем фотографию и говорим: «Вот так выглядит собака, а вот так кошка». Как только мы завершаем объяснение, приходит время для проверки точности модели. В наш черный ящик подают новые фотографии животных, и он делает прогноз – насколько вероятно, что на новой фотографии кошка или собака. Зачастую получается так, что модель совершает ошибки. Для решения данных проблем и улучшения точности прогноза, происходит ее корректировка. Кстати, даже если данный пример выглядит довольно искусственно, знайте, проходят реальные соревнования по машинному обучению. Давайте теперь подытожим всё то, что было на примере.
В задачи дата-сайентиста входят:
– Создание датасета
– Создание модели
– Проверка точности модели
– Корректировка модели
Навыки
Давайте теперь поговорим про навыки, которые необходимы для того, чтобы стать дата-сайентистом. В отличие от разработчика, этим специалистам действительно важна сильная математика. Нужно знать линейную алгебру, статистику и ещё несколько разделов царицы наук. Помимо сильных знаний в математике, дата-сайентисту необходимо быть терпеливым. Data Science – это иногда задачи с непредсказуемым результатом. Можно месяцами безрезультатно сидеть над одной проблемой.
Перспективы
Как вы поняли, профессия дата-сайентиста достаточно таки сложная. Именно поэтому она довольно высокооплачиваемая. Однако, получить работу в этой сфере очень сложно. На это есть две основные причины. Во-первых, чтобы стать дата-сайентистом нужно получить немало навыков, на что уйдет большое количество времени. Во-вторых, вакансий на эту профессию также мало. Однако, если у вас получится войти в эту профессию, вы окажетесь на переднем крае IT-сферы, и ваша специальность будет востребована очень долгое время.
В заключении могу сказать, что дата Data Science – это одна из самых сложных в освоении и одна из самых перспективных профессий.