лекция №7 Постникова Ольга Алексеевна * Тема. Элементы теории корреляции http://prezentacija.biz/ лекция №7 Постникова Ольга Алексеевна
Cлайд 2
лекция №7 Постникова Ольга Алексеевна * План: Основные понятия теории корреляции. Коэффициент линейной корреляции и его свойства. Проверка гипотезы о значимости выборочного коэффициента корреляции. http://prezentacija.biz/ лекция №7 Постникова Ольга Алексеевна
Cлайд 3
лекция №7 Постникова Ольга Алексеевна * 1. Основные понятия теории корреляции Корреляционный анализ – это статистический метод, изучающий связь между явлениями, если одно из них входит в число причин, определяющих другое или, если имеются общие причины, воздействующие на эти явления. лекция №7 Постникова Ольга Алексеевна
Cлайд 4
лекция №7 Постникова Ольга Алексеевна * Основная задача – выявление связи между случайными величинами. лекция №7 Постникова Ольга Алексеевна
Cлайд 5
лекция №7 Постникова Ольга Алексеевна * Функциональная зависимость – это зависимость вида когда каждому возможному значению случайной величины X соответствует одно возможное значение случайной величины Y. лекция №7 Постникова Ольга Алексеевна
Cлайд 6
лекция №7 Постникова Ольга Алексеевна * Например, площадь круга S однозначно связана с радиусом окружности R: лекция №7 Постникова Ольга Алексеевна
Cлайд 7
лекция №7 Постникова Ольга Алексеевна * Корреляционная зависимость – это статистическая зависимость, проявляющаяся в том, что при изменении одной из величин изменяется среднее значение другой: лекция №7 Постникова Ольга Алексеевна
Cлайд 8
лекция №7 Постникова Ольга Алексеевна * Например, рост и масса. При одном и том же росте масса различных индивидуумов может быть различна, но между средними значениями этих показателей имеется определенная зависимость. лекция №7 Постникова Ольга Алексеевна
Cлайд 9
лекция №7 Постникова Ольга Алексеевна * Установление взаимосвязи между различными признаками и показателями функционирования организма позволяют по изменениям одних судить о состоянии других. лекция №7 Постникова Ольга Алексеевна
Cлайд 10
лекция №7 Постникова Ольга Алексеевна * Схема эксперимента следующая: пусть имеется выборка объема n из генеральной совокупности N. На каждом объекте выборки определяют числовые значения признаков, между которыми требуется установить наличие или отсутствие связи. Таким образом, получают два ряда числовых значений. лекция №7 Постникова Ольга Алексеевна
Cлайд 11
лекция №7 Постникова Ольга Алексеевна * Для изучения корреляционной связи, данные о статистической зависимости удобно задавать в виде корреляционной таблицы или в виде двумерной выборки. лекция №7 Постникова Ольга Алексеевна
Cлайд 12
лекция №7 Постникова Ольга Алексеевна * лекция №7 Постникова Ольга Алексеевна
Cлайд 13
лекция №7 Постникова Ольга Алексеевна * Для наглядности полученного материала каждую пару можно представить в виде точки на координатной плоскости. По оси абсцисс откладывают значения одного вариационного ряда а по оси ординат другого лекция №7 Постникова Ольга Алексеевна
Cлайд 14
лекция №7 Постникова Ольга Алексеевна * Такое изображение статистической зависимости называется полем корреляции или корреляционным полем точек. Оно создает общую картину корреляции. лекция №7 Постникова Ольга Алексеевна
Cлайд 15
лекция №7 Постникова Ольга Алексеевна * Если точки группируются вдоль некоторого направления, то это говорит о наличии линейной корреляционной связи между признаками. Если точки распределены равномерно, то линейная корреляционная связь отсутствует. лекция №7 Постникова Ольга Алексеевна
Cлайд 16
лекция №7 Постникова Ольга Алексеевна * 0 x y 0 x y ПОЛЕ КОРРЕЛЯЦИИ Рис. А Рис. Б лекция №7 Постникова Ольга Алексеевна
Cлайд 17
лекция №7 Постникова Ольга Алексеевна * 2. Коэффициент линейной корреляции и его свойства На практике исследователя часто может интересовать не сама зависимость одной переменной от другой, а характеристика тесноты связи между ними, которую можно было бы выразить одним числом. Эта характеристика называется выборочным коэффициентом линейной корреляции r лекция №7 Постникова Ольга Алексеевна
Cлайд 18
лекция №7 Постникова Ольга Алексеевна * Требования к корреляционному анализу: корреляционный анализ – это метод, используемый, когда данные можно считать случайными и выбранными из совокупности, распределенной по нормальному закону. лекция №7 Постникова Ольга Алексеевна
Cлайд 19
лекция №7 Постникова Ольга Алексеевна * Выборочный коэффициент линейной корреляции r характеризует тесноту линейной связи между количественными признаками в выборке: лекция №7 Постникова Ольга Алексеевна
Cлайд 20
лекция №7 Постникова Ольга Алексеевна * Если r > 0, то корреляционная связь между переменными прямая, при r < 0 – связь обратная. лекция №7 Постникова Ольга Алексеевна
Cлайд 21
лекция №7 Постникова Ольга Алексеевна * Свойства коэффициента корреляции r: 1. Коэффициент корреляции принимает значения на отрезке [-1;1]. В зависимости от того, насколько модуль r приближается к 1, различают связи: r < 0,3 – слабая связь; r = 0,3-0,5 – умеренная связь; r = 0,5-0,7 – значительная; r = 0,7-0,8 – достаточно тесная; r = 0,8 – 0,9 – тесная (сильная); r > 0,9 – очень тесная. лекция №7 Постникова Ольга Алексеевна
Cлайд 22
лекция №7 Постникова Ольга Алексеевна * 2. При r = 1 - функциональная зависимость . 3. Чем ближе r к 0, тем слабее связь. 4. При r = 0 линейная корреляционная связь отсутствует. 5. Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина коэффициента корреляции не изменится. лекция №7 Постникова Ольга Алексеевна
Cлайд 23
лекция №7 Постникова Ольга Алексеевна * 3. Проверка гипотезы о значимости выборочного коэффициента корреляции Эмпирический (опытный) коэффициент корреляции, как и любой другой выборочный показатель, служит оценкой своего генерального параметра. лекция №7 Постникова Ольга Алексеевна
Cлайд 24
лекция №7 Постникова Ольга Алексеевна * Выборочный коэффициент линейной корреляции rв - величина случайная, так как он вычисляется по значениям переменных, случайно попавших в выборку из генеральной совокупности, а значит, как и любая случайная величина имеет ошибку лекция №7 Постникова Ольга Алексеевна
Cлайд 25
лекция №7 Постникова Ольга Алексеевна * Чтобы выяснить, находятся ли случайные величины X и Y генеральной совокупности в линейно корреляционной зависимости, надо проверить значимость rв. Для этого проверяют нулевую гипотезу о равенстве нулю коэффициента корреляции генеральной совокупности H0: rген=0, т.е. линейная корреляционная связь между признаками X и Y случайна. лекция №7 Постникова Ольга Алексеевна
Cлайд 26
лекция №7 Постникова Ольга Алексеевна * Выдвигается альтернативная гипотеза т.е. линейная корреляционная связь не случайна. Задается уровень значимости, например, лекция №7 Постникова Ольга Алексеевна
Cлайд 27
лекция №7 Постникова Ольга Алексеевна * Критерием для проверки нулевой гипотезы является отношение выборочного коэффициента корреляции к своей ошибке где - ошибка коэффициента корреляции. лекция №7 Постникова Ольга Алексеевна
Cлайд 28
лекция №7 Постникова Ольга Алексеевна * Если объем выборки n100, то лекция №7 Постникова Ольга Алексеевна
Cлайд 29
лекция №7 Постникова Ольга Алексеевна * Число степеней свободы для проверки критерия равно f = n-2 . Гипотезу проверяют по таблицам распределения Стьюдента в соответствии с выбранным уровнем значимости. лекция №7 Постникова Ольга Алексеевна
Cлайд 30
лекция №7 Постникова Ольга Алексеевна * По таблице критических точек распределения Стьюдента находим определенное на уровне значимости при числе степеней свободы f = n-2, где n – объем двумерной выборки. лекция №7 Постникова Ольга Алексеевна
Cлайд 31
лекция №7 Постникова Ольга Алексеевна * Если отвергают нулевую гипотезу и принимают альтернативную имеется линейная корреляционная связь между признаками. лекция №7 Постникова Ольга Алексеевна
Cлайд 32
лекция №7 Постникова Ольга Алексеевна * Если то нет оснований отвергать нулевую гипотезу, а rв - статистически незначим. Эта связь случайна. лекция №7 Постникова Ольга Алексеевна
Cлайд 33
лекция №7 Постникова Ольга Алексеевна * Пример 1. Проверить значимость коэффициента корреляции r = 0,74 между переменными X и Y для выборки объема n=50, при уровне значимости лекция №7 Постникова Ольга Алексеевна
Cлайд 34
лекция №7 Постникова Ольга Алексеевна * Проверяется нулевая гипотеза об отсутствии линейной корреляционной связи между переменными X и Y в генеральной совокупности лекция №7 Постникова Ольга Алексеевна
Cлайд 35
лекция №7 Постникова Ольга Алексеевна * При справедливости этой гипотезы где и имеет распределение Стьюдента с f = n-2 степенями свободы. лекция №7 Постникова Ольга Алексеевна
Cлайд 36
лекция №7 Постникова Ольга Алексеевна * Поскольку (7,62>2,02) коэффициент корреляции значимо отличается от нуля, а значит корреляционная зависимость - не случайна. лекция №7 Постникова Ольга Алексеевна
Cлайд 37
лекция №7 Постникова Ольга Алексеевна * Пример 2. По выборке объема n=122, извлеченной из нормальной двумерной совокупности (X,Y) найден выборочный коэффициент линейной корреляции r = 0,4. При уровне значимости проверить нулевую гипотезу, которая заключается в том, что связь между признаками случайна. лекция №7 Постникова Ольга Алексеевна
Cлайд 38
лекция №7 Постникова Ольга Алексеевна * Решение. При справедливости этой нулевой гипотезы где лекция №7 Постникова Ольга Алексеевна
Cлайд 39
лекция №7 Постникова Ольга Алексеевна * имеет распределение Стьюдента с f = n-2 степенями свободы. лекция №7 Постникова Ольга Алексеевна
Cлайд 40
лекция №7 Постникова Ольга Алексеевна * Поскольку (5,25>1,98), то нулевая гипотеза отвергается и принимается альтернативная гипотеза Вывод между признаками имеется умеренная линейная корреляционная связь r = 0,4. лекция №7 Постникова Ольга Алексеевна