T-TEST и ANOVA

Anonim

T-TEST против ANOVA

Сбор и расчет статистических данных для получения среднего часто - это долгий и утомительный процесс. Т-тест и односторонний анализ дисперсии (ANOVA) - это два наиболее распространенных теста, используемых для этой цели.

Т-критерий является статистическим критерием гипотезы, в котором тестовая статистика соответствует распределению t ученика, если поддерживается нулевая гипотеза. Этот тест применяется, когда тестовая статистика соответствует нормальному распределению, и известно значение масштабирующего термина в статистике теста. Если термин масштабирования неизвестен, он затем заменяется оценкой, основанной на доступных данных. Статистика теста будет следовать за t-распределением ученика.

Уильям Сили Госсет ввел т-статистику в 1908 году. Госсет был химиком для пивоваренного завода Guinness в Дублине, Ирландия. Пивоварня Guinness провела политику найма лучших выпускников Оксфорда и Кембриджа, выбрав из тех, кто мог бы обеспечить применение биохимии и статистики для установленных промышленных процессов компании. Уильям Сили Госсет был одним из таких выпускников. В ходе этого процесса Уильям Сили Госсет разработал t-тест, который изначально предполагался как способ контроля качества толстого (темного пива пивоваренного завода) экономически эффективным способом. Госсет опубликовал тест под псевдонимом «Студент» в Биометрике, около 1908 года. Причиной названия пера была настойчивость Гиннеса, поскольку компания хотела сохранить свою политику в отношении использования статистики в рамках своих «торговых секретов».

Статистика T-тестов обычно соответствует форме T = Z / s, где Z и s - функции данных. Переменная Z предназначена для чувствительности к альтернативной гипотезе; эффективно, величина Z-переменной больше, если альтернативная гипотеза верна. Между тем, 's' является параметром масштабирования, позволяющим определить распределение T. Предположения, лежащие в основе t-теста, заключаются в том, что a) Z следует стандартным нормальным распределениям при нулевой гипотезе; б) ps2 следует за распределением Ï ‡ 2 с p степенями свободы при нулевой гипотезе (где p - положительная константа); и c) значение Z и значение s независимы. В конкретном типе t-теста эти условия являются следствиями изучаемой популяции, а также способом отбора данных.

С другой стороны, анализ дисперсии (ANOVA) представляет собой набор статистических моделей. Хотя принципы ANOVA были использованы исследователями и статистиками в течение длительного времени, только в 1918 году сэр Рональд Фишер сделал предложение о формализации анализа разногласий в статье под названием «Соотношение родственников по предположению менделевского наследования»,, С тех пор ANOVA расширилась по своему охвату и применению. ANOVA на самом деле является неправильным, поскольку он не определяется различиями различий, а скорее различиями между средствами групп. Он включает связанные процедуры, в которых наблюдаемая дисперсия в конкретной переменной разделяется на компоненты, относящиеся к различным источникам изменения.

По сути, ANOVA предоставляет статистический тест для определения того, являются ли средства нескольких групп одинаковыми и, как результат, обобщает t-тест на более чем две группы. ANOVA может быть более полезным, чем двухпробный t-тест, поскольку он имеет меньшую вероятность совершения ошибки типа I. Например, наличие нескольких тестовых тестов с двумя образцами будет иметь больший шанс совершить ошибку, чем ANOVA тех же переменных, что и для получения среднего значения. Модель такая же, и тестовая статистика - это коэффициент F. Проще говоря, t-тесты - это всего лишь частный случай ANOVA: выполнение ANOVA будет иметь тот же результат из нескольких t-тестов. Существует три класса моделей ANOVA: a) модели с фиксированными эффектами, которые предполагают, что данные поступают из обычных групп населения, отличающихся только их средствами; б) Модели случайных эффектов, которые принимают данные, описывают иерархию различных групп населения, различия которых ограничены иерархией; и c) Модели смешанного эффекта, в которых присутствуют как фиксированные, так и случайные эффекты.

Резюме:

  1. Т-критерий используется при определении того, являются ли два средних или средних одинаковыми или разными. ANOVA является предпочтительным при сравнении трех или более средних или средних значений.
  2. У t-теста больше шансов совершить ошибку, тем больше средств используется, поэтому ANOVA используется при сравнении двух или более средств.