В Вышке состоялся выпускной первой в России онлайн-программы «Магистр по наукам о данных»
Однажды Любовь — дипломированный лингвист — заинтересовалась сферой NLP (Natural Language Processing) и решила получить высшее образование в сфере Data Science.
Любовь, почему вы решили изучать науки о данных именно в НИУ ВШЭ?
Я рассматривала несколько возможных программ обучения, в том числе долгосрочные курсы, но остановила свой выбор именно на Вышке. “Master of Data Science” — это полноценная очная магистратура, при этом удаленный формат позволял совмещать учебу с работой. Также решающим фактором стало то, что Вышка набирала студентов с любым бэкграундом (c бакалавриатом в любой сфере) при успешном прохождении вступительных испытаний, и программа охватывала все математические дисциплины — начиная от дискретной математики до математической статистики.
Изучение наук о данных неразрывно связано с решением реальных кейсов индустрии, насколько программа ориентирована на практические задачи?
Программа построена таким образом, что все новые знания нужно было обязательно интегрировать в практику: практических заданий было очень много, что очень хорошо. Однако также стоит отметить, что обучение требовало большой самостоятельной работы и изучения дополнительных материалов, так что студенту без математической подготовки может быть сложнее, чем остальным. На выполнение заданий у меня уходило в среднем на 10 часов больше в неделю, чем у моих однокурсников. Мне было особенно интересно делать задания по алгоритмам и NLP. Но все без исключения задания были актуальными «боевыми» задачами, которые могут встретиться на собеседовании или в работе.
Чему был посвящен ваш финальный проект?
Методам машинного чтения в задаче извлечения именованных сущностей (Named Entity Recognition). Это передовая технология, позволяющая извлекать полезную информацию из текста. На протяжении всей работы меня курировал научный руководитель, к которому всегда можно было обратиться с вопросом. На защите было не страшно, я была полностью уверена в своем проекте. Также я знаю, что некоторые однокурсники даже писали научные статьи по своим исследованиям.
Удобно ли было обучаться онлайн?
Удаленный формат учебы оказался для меня очень продуктивным, так как я могла слушать лекции и выполнять задания в любое удобное время. Расставленные дедлайны не давали расслабиться, всегда держали нас в тонусе. Конечно, иногда после лекций возникали вопросы, но их можно было задать однокурсникам или кураторам курса. Среди однокурсников сложилась доброжелательная атмосфера, все были готовы помочь друг другу с разъяснениями заданий или тем, а также просто делились впечатлениями и эмоциями.
В каком направлении вы хотели бы расти?
Я преподаю Python, в будущем планирую развиваться как Data scientist. Все так же хочу работать специалистом по NLP и продолжаю свой путь к мечте.
Науки о данных постоянно меняются и эволюционируют, уже сейчас становится возможным то, что казалось фантастикой еще 5–10 лет назад. Например, в сфере NLP благодаря нейронным сетям стало возможным создавать реалистичные изображения на основе текста. Пример тому нейронная сеть Imagen от Google — своего рода иллюстрации, которые говорят об очень высоком уровне понимания текста. Я думаю, что Data Science ждет бурный рост в обозримом будущем.
Программа “Master of Data Science” рассчитана на подготовку специалистов по трем направлениям:
Data scientist — специалист по машинному обучению, способный решать как традиционные бизнес-задачи (прогнозирование спроса, предсказание оттока, анализ текстовых данных, сегментация и пр.), так и более современные постановки (построение вопросно-ответных систем, анализ изображений, генерация реалистичных примеров и пр.).
Machine Learning Engineer — специалист на стыке наук о данных и разработки, который понимает и профессионально использует современные технологии для сбора, хранения и анализа больших массивов данных, умеет писать эффективный код и проектировать сложные системы, связанные с сервисами на основе машинного обучения.
Researcher in DS — специалист по машинному обучению, знакомый со state-of-the-art результатами, понимающий теоретические основы машинного обучения и способный заниматься улучшением существующих методов.
«Мы выполнили более 200 разномасштабных практических проектов и задач!»
Ти два года назад стал управлять данными в собственной логистической компании и решил получить более фундаментальные знания в сфере data science и аналитики. По словам сингапурца, он стремился следить за исследованиями и разработками в этой области, но отраслевые тренинги и фрагментарное самообучение вне академической системы не позволяли создать адекватную базу знаний.
Почему вы выбрали для получения высшего образования в сфере Data Science Вышку?
Я выбирал вуз в разгар пандемии, когда из-за локдауна были закрыты офисы и образовательные учреждения. Программа, которая позволяла обучаться не посещая кампус университета, приобрела особый смысл. Я рассматривал различные программы, но силлабус MDS показался мне наиболее структурированным, в частности, я оценил, что магистратура Вышки уделяла внимание математической базе, где у меня были пробелы.
Кроме того, мне импонировал энтузиазм, с которым академические лидеры и учебный офис продвигали программу.
Чем вам запомнилась проектная работа?
Я насчитал, что за время учебы мы выполнили более 200 разномасштабных практических проектов и задач! Самыми интересными для меня были те, что позволяли навести мосты между теорией и практической реализацией — они часто требовали упорства, но давали бесценный опыт. Меня впечатлили инсайты, полученные в результате работы в исследовательской группе для моего финального проекта по детальному распознаванию домашних животных. Энергия и самоотверженность моего руководителя Николая Арефьева и товарищей по команде по-настоящему вдохновляли!
Вообще, обучение в магистратуре Вышки полезно не только само по себе, но и общением, обменом мнениями с однокурсниками, многие из которых — опытные практики. Магистратура НИУ ВШЭ придала мне уверенности, чтобы преуспеть в профессии. Полученные знания я буду применять в текущей работе, кроме того, я буду искать достойные проекты, чтобы укрепить профессиональную репутацию и выстроить карьерные треки в сфере наук о данных для будущего развития.
Что было самым сложным во время учебы?
Балансировать между учебой, работой и семьей. Учиться приходилось допоздна, в том числе по выходным, без возможности проводить время с близкими и друзьями. Грамотный тайм-менеджмент требовал от меня известной дисциплины, пришлось сделать перестановку в квартире и организовать место для учебы, где мне никто бы не мешал. Активное общение в чатах с однокурсниками из разных стран мира очень помогало, давало ощущение, что я не одинок в этом путешествии.
Будущим студентам программы я бы посоветовал записать на листке причины, почему вы решили учиться — и обращаться к ним, каждый раз, когда вы теряете мотивацию. Учиться легче с оптимистичным настроем и активным вовлечением в коммуникацию. Заранее подумайте над темой финального проекта — ее поиск требует времени.
Дедлайн приема документов на программу «Магистр по наукам о данных» продлен до 19 августа.
Интервью: Екатерина Зиньковская, Дирекция по онлайн-обучению НИУ ВШЭ