72 часа
длительность
с 5-6 ноября
дата
Онлайн
формат
Стоимость обучения
15 000 рублей
Предварительно на электронную почту
будут направлены инструкции по обучению

Описание
В результате успешного освоения образовательной программы будут сформированы основы компетенций «управление информацией и данными», «критическое мышление в цифровой среде» в части, касающейся статистической обработки числовой информации и проверки различных статистических гипотез.
Требования для успешного прохождения программы:
– владение математическим аппаратом на уровне 10-11 класса;
– наличие ПК с операционной системой Windows 2000 и новее, 256 МБ оперативной памяти.
Для успешного прохождения обучения желательно владение основами эконометрики или математической статистики.
По итогам освоения образовательной программы студент:
– получит информацию о простых методах визуализации и статистической обработки данных с использованием R;
– сможет визуализировать числовые данные, проверять статистические гипотезы, в том числе и о наличии между ними взаимосвязей, подбирать оптимальные модели;
– сформирует навыки программирования, анализа статистических данных на языке R и поиска информации в экосистеме R для решения в дальнейшем более сложных задач;
Это позволит обучающемуся проводить простой анализ данных в области своей профессиональной деятельности.
Требования
Среднее профессиональное или высшее образование
Результаты обучения
- Знание (осведомленность в областях)
- Порядка установки R, порядок установки пакетов, составляющие экосистемы R
- Принципов выполнения арифметических операций в R, основные форматы данных и способы их преобразования, основные статистические показатели, описывающие распределение данных
- Основных пакетов графики в R
- Основных понятий математической статистики, основные виды распределений.
- Понятий, основных видов и алгоритмов проверки статистических гипотез.
- Метода наименьших квадратов, линейной регрессии, предпосылок Гаусса-Маркова, значимость коэффициентов и модели в целом
- Критериев сравнения качества статистических моделей. Методы автоматического отбора лучшей по качеству модели
- Статистических основ и видов кросс-валидации
- Статистических основ регрессии с регуляризацией, квантильной регрессии
- Умение (способность к деятельности)
- Проводить арифметические действия, преобразовывать данные, высчитывать в R основные статистические функции
- Подобрать тип графика для оптимального решения поставленной задачи визуализации
- Подобрать статистический тест для проверки необходимой гипотезы
- Построить уравнение линейной регрессии и проанализировать его значимость
- Сравнить качество двух моделей множественной линейной регрессии
- Выбрать необходимый тип кросс-валидации при решении конкретной задачи
- Подобрать преобразование, улучшающее статистическую достоверность модели
- Навык (использование конкретных инструментов)
- Использовать CRAN для поиска пакетов и информации о выполняемых функциях.
- Загрузить базу данных из Excel, осуществить первичное преобразование и посчитать основные статистические показатели
- Визуализировать обрабатываемую информацию с помощью различных графиков
- Тестировать статистические гипотезы по представленному набору данных
- Построить уравнение линейной регрессии по набору данных, проанализировать ее статистическую значимость, содержательно ее проинтерпретировать
- Построить оптимальные модели множественной линейной регрессии
- Проверить качество построенной модели путем кросс-валидации
- Построить при необходимости модели регрессии с регуляризацией, преобразованную модель, модель квантильной регрессии