Сравнение и создание групп

via

  • Provider
  • Cost
  • Session
  • Language
  • Certificate
  • Effort
  • Duration

Overview

Курс посвящен статистическому сравнению характеристик групп и категорий.
В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок. Различаются ли регионы (или аудитории) по доходу или возрасту? Как отличается пользовательская активность в разные времена года? Случайны различия между группами или закономерны?
Курс научит искать ответы на такие вопросы.
Вторая половина курсов посвящена выделению групп на основе эмпирических данных. Есть ли структура в данных? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные, узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать такие задачи.
В практических видео курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи и задания для отработки полученных навыков.

Syllabus

Одновыборочные и двухвыборочные критерии
-В первом модуле курса мы начнем разбираться со статистическими инструментами сравнения параметров и распределений в группах. Сначала поговорим об основных задачах межгрупповых сравнений, затем рассмотрим одновыборочные и двухвыборочные критерии, научимся сравнивать связанные и несвязанные выборки и посмотрим на практике, на реальных данных, как рассчитывать основные статистики в R и SPSS и интерпретировать полученные результаты.

Сравнение нескольких выборок
-В этом модуле мы продолжим разговор о сравнении групп. Мы научимся сравнивать несколько групп при помощи разных инструментов, грамотно выбирать инструменты исходя из задачи и типа данных, с которыми мы работаем, и на практике, на реальных данных посмотрим, как рассчитывать основные статистики в R и SPSS и интерпретировать полученные результаты.

Введение в кластерный анализ
-В третьем модуле курса мы поговорим о методах выделения групп. Если до этого мы сравнивали группы, которые уже были нам известны, то во второй половине курса мы будем говорить о том, как обнаружить группы в данных, как их выделить, охарактеризовать, и что можно делать с построенной классификацией дальше. Основной фокус модуля - агломеративные методы классификации. В заключении, как всегда, практика на реальных данных.

Итерационные методы кластерного анализа
-В заключительном модуле курса мы разберемся с еще одним классом методов кластеризации - с итерационными методами: увидим, как работают алгоритмы, каковы возможности и ограничения разных алгоритмов, научимся строить классификации, оценивать их качество, характеризовать и анализировать полученные группы, а также разберем некоторые инструменты визуализации результатов классификации. В заключении, как всегда, практика на реальных данных.

Итоговое задание
-В заключительном модуле курса вам предлагается применить полученные в курсе знания и выполнить собственный проект на реальных данных, предоставленных компанией 2GIS. Сначала пройдите итоговый тест и оцените, насколько хорошо вы усвоили материал курса. Затем внимательно прочтите инструкции и выполните расчетное задание. Вам предстоит построить кластерную модель, а также попрактиковаться в сравнении групп. Не забывайте о том, что в вашем распоряжении форум, и если что-то не получается, можно обратиться за помощью к сокурсникам, которые, возможно, встречались с теми же проблемами и нашли решение.