О курсе
Курс является частью специализации, позволяющей освоить методы обработки больших данных и получить представление о процессе проектирования, реализации и поддержки полноценного решения на базе интеллектуального анализа данных.
В нем мы изучим технологии работы с большими данными.
Слушатели, успешно освоившие все темы, научатся эффективно использовать большие данные, обучать на них модели машинного обучения и создавать на их основе сервисы для решения практических задач
Цели курса
01
Узнать, чем отличаются большие данные от маленьких
02
Разобраться в существующих подходах обработки больших данных
03
Познакомиться с современными инструментами, которые сейчас используются в индустрии больших данных
Вы научитесь
1. Работать с наиболее распространенными источниками данных
2. Уверенно работать с командной строкой в Linux
3. Разрабатывать и запускать алгоритмы на платформах Hadoop и Spark
4. Научиться работать с современными инструментами, используемыми в индустрии больших данных
Программа обучения
Тема 1. Базовые подходы к хранению и извлечению информации
Тема 2. Bash для инженера данных
Тема 3. Начало работы с большим объемом данных: Hadoop, MapReduce
Тема 4. Знакомство со Spark
Тема 5. Продвинутое использование Spark
Преподаватель
Космачев Алексей Дмитриевич
Департамент больших данных и информационного поиска: Приглашенный преподаватель
Бардуков Анатолий Андреевич
Департамент больших данных и информационного поиска: Приглашенный преподаватель
Зимовнов Андрей Вадимович
Базовая кафедра Яндекс: Старший преподаватель
Документ об окончании
После успешного освоения материалов курса выдается сертификат установленного НИУ ВШЭ образца
Стоимость и условия
13 000 ₽
Полный доступ к материалам курса + сертификат
Подробнее: публичная оферта