Основы обработки данных в R

72 часа
длительность
с 5-6 ноября
дата
Онлайн
формат
Стоимость обучения
15 000 рублей
Предварительно на электронную почту
будут направлены инструкции по обучению

Описание

В результате успешного освоения образовательной программы будут сформированы основы компетенций «управление информацией и данными», «критическое мышление в цифровой среде» в части, касающейся статистической обработки числовой информации и проверки различных статистических гипотез.

Требования для успешного прохождения программы:

– владение математическим аппаратом на уровне 10-11 класса;

– наличие ПК с операционной системой Windows 2000 и новее, 256 МБ оперативной памяти.

Для успешного прохождения обучения желательно владение основами эконометрики или математической статистики.

По итогам освоения образовательной программы студент:

– получит информацию о простых методах визуализации и статистической обработки данных с использованием R;

– сможет визуализировать числовые данные, проверять статистические гипотезы, в том числе и о наличии между ними взаимосвязей, подбирать оптимальные модели;

– сформирует навыки программирования, анализа статистических данных на языке R и поиска информации в экосистеме R для решения в дальнейшем более сложных задач;

Это позволит обучающемуся проводить простой анализ данных в области своей профессиональной деятельности.

Требования

Среднее профессиональное или высшее образование

Результаты обучения

  • Знание (осведомленность в областях)
    • Порядка установки R, порядок установки пакетов, составляющие экосистемы R
    • Принципов выполнения арифметических операций в R, основные форматы данных и способы их преобразования, основные статистические показатели, описывающие распределение данных
    • Основных пакетов графики в R
    • Основных понятий математической статистики, основные виды распределений.
    • Понятий, основных видов и алгоритмов проверки статистических гипотез.
    • Метода наименьших квадратов, линейной регрессии, предпосылок Гаусса-Маркова, значимость коэффициентов и модели в целом
    • Критериев сравнения качества статистических моделей. Методы автоматического отбора лучшей по качеству модели
    • Статистических основ и видов кросс-валидации
    • Статистических основ регрессии с регуляризацией, квантильной регрессии
  • Умение (способность к деятельности)
    • Проводить арифметические действия, преобразовывать данные, высчитывать в R основные статистические функции
    • Подобрать тип графика для оптимального решения поставленной задачи визуализации
    • Подобрать статистический тест для проверки необходимой гипотезы
    • Построить уравнение линейной регрессии и проанализировать его значимость
    • Сравнить качество двух моделей множественной линейной регрессии
    • Выбрать необходимый тип кросс-валидации при решении конкретной задачи
    • Подобрать преобразование, улучшающее статистическую достоверность модели
  • Навык (использование конкретных инструментов)
    • Использовать CRAN для поиска пакетов и информации о выполняемых функциях.
    • Загрузить базу данных из Excel, осуществить первичное преобразование и посчитать основные статистические показатели
    • Визуализировать обрабатываемую информацию с помощью различных графиков
    • Тестировать статистические гипотезы по представленному набору данных
    • Построить уравнение линейной регрессии по набору данных, проанализировать ее статистическую значимость, содержательно ее проинтерпретировать
    • Построить оптимальные модели множественной линейной регрессии
    • Проверить качество построенной модели путем кросс-валидации
    • Построить при необходимости модели регрессии с регуляризацией, преобразованную модель, модель квантильной регрессии

Преподаватели

Черемухин Артем Дмитриевич

осударственное бюджетное образовательное учреждение высшего образования «Нижегородский государственный инженерно – экономический университет»606340, Нижегородская область, г. Княгинино, ул. Октябрьская, д. 22а

Стоимость – 15 000 рублей

Ссылка на курс 20.35