Обработка больших данных

Ключ к успешному развитию любой компании в современном мире — это умение делать быстрые и правильные решения, основываясь на данных. С каждым годом этих данных становится всё больше, при этом старые методы анализа перестают адекватно работать на таких объемах.

На этом онлайн-курсе НИУ ВШЭ мы изучим основные технологии и приемы, позволяющие эффективно хранить и обрабатывать огромные массивы информации. Мы также обсудим, откуда данные вообще возникают, как их собирать и какая инженерная подготовка требуется для безболезненной работы с этими технологиями

  • Курс онлайн-специализации "Промышленное машинное обучение"
  • Гибкие сроки
  • 5 недель (3 кредита)
  • Время прохождения; 42 часа
  • В онлайн-формате
  • Сертификат
Записаться на специализацию

О курсе

Курс является частью специализации, позволяющей освоить методы обработки больших данных и получить представление о процессе проектирования, реализации и поддержки полноценного решения на базе интеллектуального анализа данных.
В нем мы изучим технологии работы с большими данными.
Слушатели, успешно освоившие все темы, научатся эффективно использовать большие данные, обучать на них модели машинного обучения и создавать на их основе сервисы для решения практических задач

Цели курса


01

Узнать, чем отличаются большие данные от маленьких


02

Разобраться в существующих подходах обработки больших данных


03

Познакомиться с современными инструментами, которые сейчас используются в индустрии больших данных

Вы научитесь

1. Работать с наиболее распространенными источниками данных

2. Уверенно работать с командной строкой в Linux

3. Разрабатывать и запускать алгоритмы на платформах Hadoop и Spark

4. Научиться работать с современными инструментами, используемыми в индустрии больших данных

Программа обучения

Тема 1. Базовые подходы к хранению и извлечению информации

Тема 2. Bash для инженера данных

Тема 3. Начало работы с большим объемом данных: Hadoop, MapReduce

Тема 4. Знакомство со Spark

Тема 5. Продвинутое использование Spark




Преподаватель

Космачев Алексей Дмитриевич
Департамент больших данных и информационного поиска: Приглашенный преподаватель

Бардуков Анатолий Андреевич
Департамент больших данных и информационного поиска: Приглашенный преподаватель

Зимовнов Андрей Вадимович
Базовая кафедра Яндекс: Старший преподаватель

Для кого

Для слушателей, которые имеют общие знания в следующих областях:
Основы программирования на Python и SQL,
Основы Unix,
Основы высшей математики,
Основы компьютерных сетей,
Базовые знания о машинном обучении

Документ об окончании

После успешного освоения материалов курса выдается сертификат установленного НИУ ВШЭ образца

 

 

Стоимость и условия


13 000 ₽

Полный доступ к материалам курса + сертификат

Подробнее: публичная оферта