РЕГРЕССИОННЫЙ И КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ
способ установления линейной зависимости и тесноты связи между параметрами (численностью персонала и влияющими на нее факторами). Математический аппарат К. и р.а. подробно рассматривается в специальной литературе по статистике.
Источник: Управление персоналом. Энциклопедический словарь. Инфра-М. 1998
РЕГРЕССИОННЫЙ И КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
REGRESSION AND CORRELATION ANALYSIS
Р.а. представляет собой вычисления на основе статистической информации с целью математической оценки усредненной связи между зависимой переменной и некоторой независимой переменной или переменными. Простая регрессия предполагает одну независимую переменную, множественная же регрессия предполагает две и более переменных. К.а. проводится для описания таких связейР.а. широко используется для прогнозирования продаж отдельных видов продукции, а также для прогнозирования доходов и др. фин. показателей. Требования по предоставлению необходимой информации могут отличаться, но месячные или квартальные данные на протяжении нескольких лет могут служить основой для выявления существенных зависимостей. С точки зрения математика, необходимо иметь как минимум на два результата наблюдений больше, нежели число имеющихся показателей независимых переменных. Р.а. обычно весьма эффективен при краткосрочных и среднесрочных аналитических исследованиях. Он считается весьма хорошим средством определения узловых точек при анализе взаимосвязей фин. показателей.Р.а. описывает или оценивает величину какой-либо переменной (зависимой переменной на основе изменения одной или более др. переменных - независимых или каузальных). Если менеджер по продажам желает спрогнозировать объем продаж автомобилей на следующий год (зависимая переменная), исходя из располагаемого дохода, то Р.а. может быть использован при попытке предсказания или оценки величины зависимой переменной (продаж автомобилей).По следующей формуле рассчитывается простая линейная регрессия:y = a + bx,где:y - зависимая переменная;x - независимая переменная;a - постоянная величина или точка пересечения постоянной линии регрессии переменной y, отражающая величину y при b = 0;b - наклон линии регрессии (коэффициент пропорциональности изменений y при изменении x).Для нахождения оптимального прохождения линии на графике регрессионного управления используется метод наименьших квадратов. Этот метод позволяет расположить линию регрессии между точками, отражающими величины отдельных наблюдений т. о., что возведенная в квадрат сумма разницы, взятая по вертикали между значением линии регрессии и значением отдельного наблюдения, минимальна.Для того чтобы проиллюстрировать нахождение линии регрессии, возьмем следующие данные, характеризующие объем продаж и заработной платы продавцов.Заработная плата (в сотнях долларов) Продажи (в тыс.) x y xy x2 y2 11 14 154 121 196 17 18 306 289 324Данные по десяти дополнительным наблюдениям опускаются.Итого: 174 225 3,414 2,792 4,359Линия регрессии y = a + bx определяется следующими двумя стандартными уравнениями:Sy = na + b(Sx),Sxy = a(Sx) + b(Sx2),где:n - число наблюдений (в данном случае 12);x - заработная плата (измеритель та (измеритель объема);y - продажи;S - сумма по переменным.Решение уравнения дает следующие результаты:a = 10,5836,b = 0,5632.Линия регрессии описывается как:y = 10,5836 + 0,5632(x).Если заработная плата равна 10 дол., то прогнозные продажи составят 16,2156 дол.:y = 10,5836 + 0,5631(10),y = 16,2156.Преимуществом анализа с помощью метода наименьших квадратов является то, что может быть проведен К.а., к-рый позволяет количественно измерить, насколько соответствует линия регрессии отдельным точкам, фиксирующим данные наблюдений. Набор различных статистических данных может быть использован для характеристики точности и надежности результатов Р.а., в особенности коэффициент корреляции (r) и его квадрат - коэффициент детерминации (r2).Коэффициент корреляции рассчитывается для измерения степени взаимосвязи между двумя переменными, в данном случае между заработной платой и продажами. К.а. - это анализ наличия линейных связей между переменными. Если изменение переменных происходит в одном направлении, то имеет место прямая зависимость (положительная корреляция), как это показано на прилагаемом графике 1. Если изменение переменных происходит в противоположных направлениях, то имеет место обратная зависимость (отрицательная корреляция). Если зависимость незначительна или отсутствует, то представленные данные имеют широкое рассеивание и не взаимосвязаны.Степень и направление корреляции измеряются от -1 до 1. Знак обозначает, является связь прямой или обратной. Коэффициент корреляции рассчитывается следующим образом:Среднее квадратическое отклонение, определяемое уравнением регрессииПолное среднее квадратическое отклонение по всей совокупностиЕсли данные по всем наблюдениям, отраженные на графике, выстраиваются в прямую линию, то все случаи отклонений считаются объяснимыми и коэффициент корреляции должен составить 1 или -1. При отсутствии корреляции ее коэффициент равен 0 (см. прилагаемые графики).При определении значимости величины корреляции необходимо произвести расчет, характеризующий возможность сохранения этой величины корреляции при проведении случайной выборки из генеральной совокупности, в к-рой корреляция отсутствовала.Коэффициент детерминации представляет ту долю дисперсии величины y, зависимость изменений к-рой выявлена регрессионным уравнением. Его величина колеблется от 0 до 1. Напр., если зависимость объема продаж от заработной платы продавцов характеризуется r2 = 0,61, то 61% общей дисперсии (разброса) объема продаж отслеживается регрессионным уравнением (или связано с изменением фонда оплаты труда), а 39% зависит от действия др. факторов (таких, как цены, доходность). Такой недостаточно высокий коэффициент детерминации говорит о том, что заработная плата продавцов не является достаточно надежным критерием оценки объема продаж.Почти каждый статистический комплект программного обеспечения имеет стандартную программу определения линии регрессии.См. АНАЛИЗ СТАТИСТИЧЕСКИЙ.
Р.а. представляет собой вычисления на основе статистической информации с целью математической оценки усредненной связи между зависимой переменной и некоторой независимой переменной или переменными. Простая регрессия предполагает одну независимую переменную, множественная же регрессия предполагает две и более переменных. К.а. проводится для описания таких связейР.а. широко используется для прогнозирования продаж отдельных видов продукции, а также для прогнозирования доходов и др. фин. показателей. Требования по предоставлению необходимой информации могут отличаться, но месячные или квартальные данные на протяжении нескольких лет могут служить основой для выявления существенных зависимостей. С точки зрения математика, необходимо иметь как минимум на два результата наблюдений больше, нежели число имеющихся показателей независимых переменных. Р.а. обычно весьма эффективен при краткосрочных и среднесрочных аналитических исследованиях. Он считается весьма хорошим средством определения узловых точек при анализе взаимосвязей фин. показателей.Р.а. описывает или оценивает величину какой-либо переменной (зависимой переменной на основе изменения одной или более др. переменных - независимых или каузальных). Если менеджер по продажам желает спрогнозировать объем продаж автомобилей на следующий год (зависимая переменная), исходя из располагаемого дохода, то Р.а. может быть использован при попытке предсказания или оценки величины зависимой переменной (продаж автомобилей).По следующей формуле рассчитывается простая линейная регрессия:y = a + bx,где:y - зависимая переменная;x - независимая переменная;a - постоянная величина или точка пересечения постоянной линии регрессии переменной y, отражающая величину y при b = 0;b - наклон линии регрессии (коэффициент пропорциональности изменений y при изменении x).Для нахождения оптимального прохождения линии на графике регрессионного управления используется метод наименьших квадратов. Этот метод позволяет расположить линию регрессии между точками, отражающими величины отдельных наблюдений т. о., что возведенная в квадрат сумма разницы, взятая по вертикали между значением линии регрессии и значением отдельного наблюдения, минимальна.Для того чтобы проиллюстрировать нахождение линии регрессии, возьмем следующие данные, характеризующие объем продаж и заработной платы продавцов.Заработная плата (в сотнях долларов) Продажи (в тыс.) x y xy x2 y2 11 14 154 121 196 17 18 306 289 324Данные по десяти дополнительным наблюдениям опускаются.Итого: 174 225 3,414 2,792 4,359Линия регрессии y = a + bx определяется следующими двумя стандартными уравнениями:Sy = na + b(Sx),Sxy = a(Sx) + b(Sx2),где:n - число наблюдений (в данном случае 12);x - заработная плата (измеритель та (измеритель объема);y - продажи;S - сумма по переменным.Решение уравнения дает следующие результаты:a = 10,5836,b = 0,5632.Линия регрессии описывается как:y = 10,5836 + 0,5632(x).Если заработная плата равна 10 дол., то прогнозные продажи составят 16,2156 дол.:y = 10,5836 + 0,5631(10),y = 16,2156.Преимуществом анализа с помощью метода наименьших квадратов является то, что может быть проведен К.а., к-рый позволяет количественно измерить, насколько соответствует линия регрессии отдельным точкам, фиксирующим данные наблюдений. Набор различных статистических данных может быть использован для характеристики точности и надежности результатов Р.а., в особенности коэффициент корреляции (r) и его квадрат - коэффициент детерминации (r2).Коэффициент корреляции рассчитывается для измерения степени взаимосвязи между двумя переменными, в данном случае между заработной платой и продажами. К.а. - это анализ наличия линейных связей между переменными. Если изменение переменных происходит в одном направлении, то имеет место прямая зависимость (положительная корреляция), как это показано на прилагаемом графике 1. Если изменение переменных происходит в противоположных направлениях, то имеет место обратная зависимость (отрицательная корреляция). Если зависимость незначительна или отсутствует, то представленные данные имеют широкое рассеивание и не взаимосвязаны.Степень и направление корреляции измеряются от -1 до 1. Знак обозначает, является связь прямой или обратной. Коэффициент корреляции рассчитывается следующим образом:Среднее квадратическое отклонение, определяемое уравнением регрессииПолное среднее квадратическое отклонение по всей совокупностиЕсли данные по всем наблюдениям, отраженные на графике, выстраиваются в прямую линию, то все случаи отклонений считаются объяснимыми и коэффициент корреляции должен составить 1 или -1. При отсутствии корреляции ее коэффициент равен 0 (см. прилагаемые графики).При определении значимости величины корреляции необходимо произвести расчет, характеризующий возможность сохранения этой величины корреляции при проведении случайной выборки из генеральной совокупности, в к-рой корреляция отсутствовала.Коэффициент детерминации представляет ту долю дисперсии величины y, зависимость изменений к-рой выявлена регрессионным уравнением. Его величина колеблется от 0 до 1. Напр., если зависимость объема продаж от заработной платы продавцов характеризуется r2 = 0,61, то 61% общей дисперсии (разброса) объема продаж отслеживается регрессионным уравнением (или связано с изменением фонда оплаты труда), а 39% зависит от действия др. факторов (таких, как цены, доходность). Такой недостаточно высокий коэффициент детерминации говорит о том, что заработная плата продавцов не является достаточно надежным критерием оценки объема продаж.Почти каждый статистический комплект программного обеспечения имеет стандартную программу определения линии регрессии.См. АНАЛИЗ СТАТИСТИЧЕСКИЙ.
Источник: Словарь-справочник экономика внешняя торговля выставки 2012