Finkurier.ru

Журнал про Деньги
2 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Проведение регрессионного анализа

Пример 1. Проведение регрессионного анализа

Регрессионный анализ

Регрессионный анализ часто используют в промышленности для описания результатов пассивного или активного промышленного эксперимента в виде линейных (1) или нелинейных (2) уравнений регрессии:

Уi = a + a1x1 + а2x2 + а3x3 + . + аixi = (1)

где Уi — выходной параметр (степень превращения, степень извлечения, содержание основного вещества, длительность процесса и т.п.);

xi — входные параметры, влияющие на выходной параметр (температура, концентрация, давление и т.п.);

m — количество входных параметров.

При проведении пассивного эксперимента процесс проводится в рамках установленных технических норм, входные и выходной параметры регистрируются на компьютере или в технологическом журнале. Как правило, изменение указанных параметров от регламентных составляет небольшие величины, поэтому результаты промышленного пассивного эксперимента представляются линейными уравнениями регрессии.

При проведении активного эксперимента (исходя из задач эксперимента) диапазон изменения входных и выходных величин существенно расширяется. В этом случае результаты активного эксперимента представляются нелинейными уравнениями регрессии, более точно описывающими многомерные функции выходного параметра Уi.

Уравнения регрессии (1 и 2) представляют математическую модель изучаемого объекта только для того диапазона, в котором проводилось исследование объекта. При расширении диапазона изменения входных переменных найденные уравнения регрессии (коэффициенты регрессии) становятся некорректными и должны быть пересчитаны. Вычисляемые коэффициенты и уравнения регрессии не имеют физического смысла и для одного и того же объекта (процесса) может быть найдено несколько уравнений регрессии, отличающихся точностью описания изучаемого объекта. Уравнения регрессии могут использоваться для оптимизации изучаемых процессов.

Выбор того или иного уравнения регрессии зависит от исследователя и определяет точность (адекватность) с которой уравнение описывает в требуемых пределах исследуемый (наблюдаемый) объект. Такой выбор уравнения определяется исследователем на основании априорных сведений об объекте, влияющих факторов и удобства использования математической модели конкретного вида. Методы регрессионного анализа позволяют из нескольких различных по виду моделей выбрать наиболее адекватную.

Регрессионный анализ сводится к определению коэффициентов уравнения регрессии (на основании экспериментальных данных), оценки значимости этих коэффициентов и степени адекватности математической модели. Для проведения регрессионного анализа полученные массивы данных пассивного или активного эксперимента обрабатываются, производится отсев неверных значений, далее очищенные от ошибок данные подвергаются математической обработке и представляются в виде функции регрессии одной или более переменных.

Вычисление коэффициентов регрессии проводится по методу наименьших квадратов. Суть метода заключается в следующем. Пусть входные и выходной параметры имеет линейную корреляционную связь, тогда при оценке выходного параметра используется линейное регрессионное уравнение вида (1). Необходимо найти коэффициенты регрессии а, аi (i=1. m, m-число коэффициентов уравнения регрессии) такие, чтобы экспериментальные точки (yj), (j=1..n, n-число экспериментальных наблюдаемых точек) построенные по данным наблюдений, лежали как можно ближе к расчетной прямой У=f(x), вычисляемой по уравнению регрессии (см. рис.1).

Для нахождения коэффициентов регрессии составляют функцию квадратов отклонений расчетных и экспериментальных (наблюдаемых) значений:

(3)

где Yj — вычисленное по уравнению (1) значение, соответствующее наблюдаемым значениям xij, yj — наблюдаемое значение выходного параметра, соответствующее xij.

Подбирают коэффициенты регрессии так, чтобы сумма квадратов отклонений (3) была минимальной. Подставляя в уравнение (3) уравнение (1) получают:

(4)

Поскольку условием существования экстремума функции (4) является равенство частных производных по каждой переменной (искомым коэффициентам) нулю, то для отыскания минимума функции F приравнивают нулю соответствующие частные производные:

В итоге получают систему из m+1 линейных уравнений, решив которую находят коэффициенты регрессии а, аi (i=1. m). Для решения системы линейных уравнений обычно используют компьютеры и программное обеспечение.

При необходимости получения нелинейных уравнений регрессии, например в виде уравнения (2), расчет коэффициентов регрессии проводят аналогично.

Если анализируемая функция зависит от одного параметра, то уравнение линейной регрессии представляется в простом виде:

(5)

где – – свободный коэффициент (пересечение с осью у при х=0);

b – коэффициент — тангенс угла наклона прямой к оси х.

Коэффициенты регрессии для уравнения (5) можно непосредственно вычислить по формулам:

b= (6)

= (7)

где –n- число экспериментальных точек.

Статистический анализ уравнений регрессии

Статистический анализ уравнений регрессии заключается в проверке адекватности полученного уравнения и значимости коэффициентов регрессии. Он дает возможность найти пределы измерения углового коэффициента и отрезка на оси ординат для линии регрессии, а исследование адекватности позволяет оценить степень отклонения экспериментальных точек от расчетной линии.

Дисперсия адекватности уравнения регрессии S 2 ад характеризует меру отклонения расчетных данных Ур, полученных по уравнению, от реальных экспериментальных результатов уi для i-й точки, в которой произведено измерение. Значение S 2 ад находят по формуле:

S 2 ад = (6)

где (n-2)=f – число степеней свободы.

Дисперсии коэффициентов уравнения регрессии (5) находят из выражений:

(7)

(8)

при числе степеней свободы f=n-2.

После вычисления дисперсий вычисляют статистическую значимость коэффициентов регрессии. Эта проверка дает ответ на вопросы о том, проходит ли прямая, выраженная уравнением (5) через начало координат и отличается ли угол её наклона от 45 0 . Критерием значимости для такой проверки является критерий Стьюдента.

Доверительные интервалы (границы) Dа и Dв для коэффициентов регрессии вычисляют по формулам:

Некоторые из найденных коэффициентов могут оказаться пренебрежимо малыми – незначимыми, которые могут быть отброшены. Факторы, перед которыми стоят незначимые коэффициенты, оказывают незначимое влияние на анализируемую функцию. Коэффициенты регрессии ai значимы, если абсолютная величина коэффициента больше половинного значения Dа/2 или Dв/2, т.е. если выполняется условие:

(11)

где si — оценка дисперсии каждого из коэффициентов регрессии;

t — значение критерия Стьюдента, определяемое по статистической таблице или вычисляемое на компьютере по уровню значимости a=1-Р и числу степеней свободы f, (см. приложение ниже).

Проверку адекватности уравнения регрессии проводят по F-критерию Фишера:

при числе степеней свободы числителя (n-2), а знаменателя n(m-1). Выборочная дисперсия S 2 y определяется по формуле:

S 2 y= (13)

где n — число серий измерений , i=1,2. n;

m — число параллельных измерений в каждой серии, j=1,2. m.

Если в каждой из серий число измерений mi разное, то для расчета S 2 y используют выражение:

S 2 y= (14)

Для вычисления по этой формуле предварительно находят значения дисперсий S 2 i в каждой из i-серий.

Если значение Fр, определяемое по формуле (12) меньше табличного значения Fт, при избранном уровне значимости a=1-Р, то уравнение регрессии (5) адекватно описывает экспериментальные данные. Если значение Fр> Fт, то уравнение регрессии (5) неадекватно, следует предложить другой вид уравнения и исследовать новое уравнение.

Пример 1. Проведение регрессионного анализа

С использованием регрессионного анализа и программного пакета Microsoft Excel найти уравнение регрессии, максимальную степень превращения Х и оптимальные условия проведения процесса (температура Т, концентрация С, соотношение реагентов n, расход W и давление газа P), соответствующие максимуму Х для экспериментов, результаты которых приведены в табл.1.

Исходные экспериментальные данные для регрессионного анализа

Реализация регрессионного анализа в различных компьютерных программах

физико-математические науки

  • Кульков Алексей Владимирович , магистр, студент
  • Смоленский государственный университет, г. Смоленск
  • STADIA
  • STATISTICA
  • MICROSOFT OFFICE EXCEL
  • РЕГРЕССИОННЫЙ АНАЛИЗ

Похожие материалы

Статистический анализ данных нашёл широкое применение при анализе практически всех процессов и явлений. Если речь идёт о выявлении статистической зависимости, то в большинстве случаев используется регрессионный анализ. Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную. Результатом применение регрессионного анализа является построение уравнения регрессии, которое в общем виде имеет вид:
(1).

В случае линейной зависимости уравнение (1) принимает вид:

(2)

В формулах (1) и (2) Y — зависимая переменная, Xn — независимые переменный.

При проведении регрессионного анализа возникает вопрос о средстве, с помощью которого данный анализ будет проведён. В работе рассмотрена реализация регрессионного анализа в следующих компьютерных программах: Microsoft Office Excel, Stadia, Statistica. Процедура регрессионного анализа состоит из нескольких этапов [2], а именно:

  1. задание математической формы уравнения регрессии и определение параметров регрессии (коэффициентов регрессионного уравнения).
  2. определение взаимосвязи результативного признака и факторов, проверка статистической значимости уравнения регрессии.
  3. проверка статической значимости каждого коэффициента уравнения регрессии и определение их доверительных интервалов.
Читать еще:  Сп наружное водоснабжение и канализация 2020

Наибольшую популярность для построения графиков зависимости и получения математической формы уравнения регрессии приобрёл табличный редактор Microsoft Office Excel. Это вызвано тем, что данная программа является русифицированной и с ней начинают знакомство ещё в школе. Графическое представление уравнение регрессии в MS Excel возможно только для одномерного случая. При этом регрессионная функция может быть следующей:

  1. линейная;
  2. экспоненциальная;
  3. логарифмическая;
  4. степенная;
  5. полиномиальная (до 6 степени).

Процесс получения графика зависимости в MS Excel является достаточно простым. При имеющимся наборе данных независимой (Y) и зависимой переменной (X), строится точечная диаграмма, на которую добавляется линия тренда. Линия тренда — это и есть график регрессионной зависимости. При необходимости на график можно добавить уравнение регрессии и коэффициент детерминации. На рисунке 1 «Регрессионный анализ в MS Excel» показаны примеры графиков зависимости, соответствующие данным графикам уравнения регрессии и коэффициенты детерминации.

Рисунок 1. Регрессионный анализ в MS Excel

MS Excel позволяет провести более глубокий регрессионный анализ путём использования пакета анализа данных. Для работы с регрессией необходимо открыть вкладку «Анализ данных — Регрессия» и выбрать входные параметры для анализа. В результате программа выдаст результаты регрессионного анализа, пример которых приведён на рисунке 2 «Результаты регрессионного анализа в MS Excel».

Рисунок 2. Результаты регрессионного анализа в MS Excel

При проведении регрессионного анализа через пакет анализа данных программа выводит коэффициенты уравнения линейной регрессии, статистические показатели значимости коэффициентов регрессии и уравнения в целом, а так же доверительные интервалы. Следует отметить, что полученная регрессионная модель является линейной и одномерной.

Программа для статистической обработки результатов Stadia является редкой. Во многом это связано с её примитивным дизайном, который на протяжении [1] многих лет не изменялся. Несмотря на простой вид, программа имеет ряд преимуществ, среди которых можно выделить русский язык интерфейса и полученных результатов.

Регрессионный анализ в Stadia реализован как для случая одномерных моделей, так и для множественных линейных и нелинейных моделей. На рисунке 3 «Результаты множественного регрессионного анализа» приведены результаты множественного регрессионного анализа бля случая линейной модели с двумя независимыми факторами.

Рисунок 3. Результаты множественного регрессионного анализа

Программа Stadia выдаёт все результаты на русском языке. Первый блок результатов относится к коэффициентам уравнения регрессии, где приводятся сами коэффициенты и их значимость. Второй блок результатов относится к дисперсии. Третий блок позволяет судить о статистической значимости модели по приведенным там значениям F-критерия и множественного коэффициента детерминации. Следует отметить, что после всех результатов программа выдаёт ту статистическую гипотезу, которую следует принять.

Программа Stadia позволяет получать результаты не только в случае линейной, но и нелинейной однофакторной и многофакторной регрессии. Вид нелинейной множественной регрессии пользователь может задать самостоятельно в специальном окне во вкладке «Общая/нелинейная модель». На рисунке 4 «Нелинейная пользовательская модель в Stadia» показан пример нелинейной множественной регрессии и полученные для данной модели результаты. Модель задавалась пользователем самостоятельно.

Рисунок 4. Нелинейная пользовательская модель в Stadia

Построение графиков регрессионной модели в программе Stadia реализовано плохо. Следует отметить, что работа велась с учебной версией программы Stadia 8.0.

Одной из самых распространённых программ для статистической обработки данных является программа Statistica. Интерфейс программы Statistica написан на английском языке, однако встречаются и русскоязычные ознакомительные версии программы. Данная программа имеет большой функционал для проведения регрессионного анализа. Итоги регрессионного анализа приведены подробно. В итоговых таблицах находится вся необходимая информация о результатах регрессионного анализа. При необходимости, можно провести анализ остатков регрессии. На рисунке 5 «Регрессия в Statistica» показан пример результатов регрессионного анализа, проведенного в программе Statistica.

Рисунок 5. Регрессия в Statistica

Следует отметить, что статистически значимые результаты на заданном уровне значимости автоматически выделяются красным цветом, что является информативным. Также программа Statistica позволяет строить графики по полученным регрессионным моделям, в том числе и множественным. На рисунке 6 «График множественной регрессии» изображен график регрессии, результаты которой приведены на рисунке 5.

Программа Statistica имеет большой функционал по работе с нелинейными регрессионными моделями. Составление пользовательских нелинейных регрессионных моделей производится путём выбора вкладки «Анализ — Углублённые методы анализа — Множественная нелинейная регрессия».

Таким образом, если требуется провести линейный однофакторный регрессионный анализ без выяснения статистической значимости полученной модели, то целесообразно использовать табличный редактор Microsoft Office Excel. Также Microsoft Office Excel можно использовать для построения линейной однофакторной регрессионной модели. Для проведения подробного регрессионного анализ, либо для получения нелинейных однофакторных и многофакторных регрессионных моделей лучше использовать программу Statistica. Богатый функционал, доступность и наглядность результатов анализа, графические возможности и большое количество методической литературы делаю данную программу незаменимым средством для проведения регрессионного анализа. Программа Stadia является довольно редкой программой и её интерфейс не соответствует требованию настоящего времени.

Список литературы

  1. Современное программное обеспечение для статистической обработки биомедицинских исследований / В.А. Герасевич, А.Р. Аветисов, 2005 Белорусский медицинский журнал, № 1, с. 14.
  2. Студопедия. Суть и этапы регрессионного анализа. URL: https://studopedia.su/14_173066_sut-i-etapi-regressionnogo-analiza.html Дата обращения: 08.01.2018

Электронное периодическое издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), свидетельство о регистрации СМИ — ЭЛ № ФС77-41429 от 23.07.2010 г.

Соучредители СМИ: Долганов А.А., Майоров Е.В.

Регрессионный анализ в Microsoft Excel

Регрессионный анализ является одним из самых востребованных методов статистического исследования. С его помощью можно установить степень влияния независимых величин на зависимую переменную. В функционале Microsoft Excel имеются инструменты, предназначенные для проведения подобного вида анализа. Давайте разберем, что они собой представляют и как ими пользоваться.

Подключение пакета анализа

Но, для того, чтобы использовать функцию, позволяющую провести регрессионный анализ, прежде всего, нужно активировать Пакет анализа. Только тогда необходимые для этой процедуры инструменты появятся на ленте Эксель.

    Перемещаемся во вкладку «Файл».

Открывается окно параметров Excel. Переходим в подраздел «Надстройки».

В самой нижней части открывшегося окна переставляем переключатель в блоке «Управление» в позицию «Надстройки Excel», если он находится в другом положении. Жмем на кнопку «Перейти».

Теперь, когда мы перейдем во вкладку «Данные», на ленте в блоке инструментов «Анализ» мы увидим новую кнопку – «Анализ данных».

Виды регрессионного анализа

Существует несколько видов регрессий:

  • параболическая;
  • степенная;
  • логарифмическая;
  • экспоненциальная;
  • показательная;
  • гиперболическая;
  • линейная регрессия.

О выполнении последнего вида регрессионного анализа в Экселе мы подробнее поговорим далее.

Линейная регрессия в программе Excel

Внизу, в качестве примера, представлена таблица, в которой указана среднесуточная температура воздуха на улице, и количество покупателей магазина за соответствующий рабочий день. Давайте выясним при помощи регрессионного анализа, как именно погодные условия в виде температуры воздуха могут повлиять на посещаемость торгового заведения.

Общее уравнение регрессии линейного вида выглядит следующим образом: У = а0 + а1х1 +…+акхк . В этой формуле Y означает переменную, влияние факторов на которую мы пытаемся изучить. В нашем случае, это количество покупателей. Значение x – это различные факторы, влияющие на переменную. Параметры a являются коэффициентами регрессии. То есть, именно они определяют значимость того или иного фактора. Индекс k обозначает общее количество этих самых факторов.

    Кликаем по кнопке «Анализ данных». Она размещена во вкладке «Главная» в блоке инструментов «Анализ».

Открывается небольшое окошко. В нём выбираем пункт «Регрессия». Жмем на кнопку «OK».

Открывается окно настроек регрессии. В нём обязательными для заполнения полями являются «Входной интервал Y» и «Входной интервал X». Все остальные настройки можно оставить по умолчанию.

В поле «Входной интервал Y» указываем адрес диапазона ячеек, где расположены переменные данные, влияние факторов на которые мы пытаемся установить. В нашем случае это будут ячейки столбца «Количество покупателей». Адрес можно вписать вручную с клавиатуры, а можно, просто выделить требуемый столбец. Последний вариант намного проще и удобнее.

Читать еще:  Факторный анализ прибыли онлайн

В поле «Входной интервал X» вводим адрес диапазона ячеек, где находятся данные того фактора, влияние которого на переменную мы хотим установить. Как говорилось выше, нам нужно установить влияние температуры на количество покупателей магазина, а поэтому вводим адрес ячеек в столбце «Температура». Это можно сделать теми же способами, что и в поле «Количество покупателей».

С помощью других настроек можно установить метки, уровень надёжности, константу-ноль, отобразить график нормальной вероятности, и выполнить другие действия. Но, в большинстве случаев, эти настройки изменять не нужно. Единственное на что следует обратить внимание, так это на параметры вывода. По умолчанию вывод результатов анализа осуществляется на другом листе, но переставив переключатель, вы можете установить вывод в указанном диапазоне на том же листе, где расположена таблица с исходными данными, или в отдельной книге, то есть в новом файле.

После того, как все настройки установлены, жмем на кнопку «OK».

Разбор результатов анализа

Результаты регрессионного анализа выводятся в виде таблицы в том месте, которое указано в настройках.

Одним из основных показателей является R-квадрат. В нем указывается качество модели. В нашем случае данный коэффициент равен 0,705 или около 70,5%. Это приемлемый уровень качества. Зависимость менее 0,5 является плохой.

Ещё один важный показатель расположен в ячейке на пересечении строки «Y-пересечение» и столбца «Коэффициенты». Тут указывается какое значение будет у Y, а в нашем случае, это количество покупателей, при всех остальных факторах равных нулю. В этой таблице данное значение равно 58,04.

Значение на пересечении граф «Переменная X1» и «Коэффициенты» показывает уровень зависимости Y от X. В нашем случае — это уровень зависимости количества клиентов магазина от температуры. Коэффициент 1,31 считается довольно высоким показателем влияния.

Как видим, с помощью программы Microsoft Excel довольно просто составить таблицу регрессионного анализа. Но, работать с полученными на выходе данными, и понимать их суть, сможет только подготовленный человек.

Отблагодарите автора, поделитесь статьей в социальных сетях.

Реализация регрессионного анализа в различных компьютерных программах

физико-математические науки

  • Кульков Алексей Владимирович , магистр, студент
  • Смоленский государственный университет, г. Смоленск
  • STADIA
  • STATISTICA
  • MICROSOFT OFFICE EXCEL
  • РЕГРЕССИОННЫЙ АНАЛИЗ

Похожие материалы

Статистический анализ данных нашёл широкое применение при анализе практически всех процессов и явлений. Если речь идёт о выявлении статистической зависимости, то в большинстве случаев используется регрессионный анализ. Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную. Результатом применение регрессионного анализа является построение уравнения регрессии, которое в общем виде имеет вид:
(1).

В случае линейной зависимости уравнение (1) принимает вид:

(2)

В формулах (1) и (2) Y — зависимая переменная, Xn — независимые переменный.

При проведении регрессионного анализа возникает вопрос о средстве, с помощью которого данный анализ будет проведён. В работе рассмотрена реализация регрессионного анализа в следующих компьютерных программах: Microsoft Office Excel, Stadia, Statistica. Процедура регрессионного анализа состоит из нескольких этапов [2], а именно:

  1. задание математической формы уравнения регрессии и определение параметров регрессии (коэффициентов регрессионного уравнения).
  2. определение взаимосвязи результативного признака и факторов, проверка статистической значимости уравнения регрессии.
  3. проверка статической значимости каждого коэффициента уравнения регрессии и определение их доверительных интервалов.

Наибольшую популярность для построения графиков зависимости и получения математической формы уравнения регрессии приобрёл табличный редактор Microsoft Office Excel. Это вызвано тем, что данная программа является русифицированной и с ней начинают знакомство ещё в школе. Графическое представление уравнение регрессии в MS Excel возможно только для одномерного случая. При этом регрессионная функция может быть следующей:

  1. линейная;
  2. экспоненциальная;
  3. логарифмическая;
  4. степенная;
  5. полиномиальная (до 6 степени).

Процесс получения графика зависимости в MS Excel является достаточно простым. При имеющимся наборе данных независимой (Y) и зависимой переменной (X), строится точечная диаграмма, на которую добавляется линия тренда. Линия тренда — это и есть график регрессионной зависимости. При необходимости на график можно добавить уравнение регрессии и коэффициент детерминации. На рисунке 1 «Регрессионный анализ в MS Excel» показаны примеры графиков зависимости, соответствующие данным графикам уравнения регрессии и коэффициенты детерминации.

Рисунок 1. Регрессионный анализ в MS Excel

MS Excel позволяет провести более глубокий регрессионный анализ путём использования пакета анализа данных. Для работы с регрессией необходимо открыть вкладку «Анализ данных — Регрессия» и выбрать входные параметры для анализа. В результате программа выдаст результаты регрессионного анализа, пример которых приведён на рисунке 2 «Результаты регрессионного анализа в MS Excel».

Рисунок 2. Результаты регрессионного анализа в MS Excel

При проведении регрессионного анализа через пакет анализа данных программа выводит коэффициенты уравнения линейной регрессии, статистические показатели значимости коэффициентов регрессии и уравнения в целом, а так же доверительные интервалы. Следует отметить, что полученная регрессионная модель является линейной и одномерной.

Программа для статистической обработки результатов Stadia является редкой. Во многом это связано с её примитивным дизайном, который на протяжении [1] многих лет не изменялся. Несмотря на простой вид, программа имеет ряд преимуществ, среди которых можно выделить русский язык интерфейса и полученных результатов.

Регрессионный анализ в Stadia реализован как для случая одномерных моделей, так и для множественных линейных и нелинейных моделей. На рисунке 3 «Результаты множественного регрессионного анализа» приведены результаты множественного регрессионного анализа бля случая линейной модели с двумя независимыми факторами.

Рисунок 3. Результаты множественного регрессионного анализа

Программа Stadia выдаёт все результаты на русском языке. Первый блок результатов относится к коэффициентам уравнения регрессии, где приводятся сами коэффициенты и их значимость. Второй блок результатов относится к дисперсии. Третий блок позволяет судить о статистической значимости модели по приведенным там значениям F-критерия и множественного коэффициента детерминации. Следует отметить, что после всех результатов программа выдаёт ту статистическую гипотезу, которую следует принять.

Программа Stadia позволяет получать результаты не только в случае линейной, но и нелинейной однофакторной и многофакторной регрессии. Вид нелинейной множественной регрессии пользователь может задать самостоятельно в специальном окне во вкладке «Общая/нелинейная модель». На рисунке 4 «Нелинейная пользовательская модель в Stadia» показан пример нелинейной множественной регрессии и полученные для данной модели результаты. Модель задавалась пользователем самостоятельно.

Рисунок 4. Нелинейная пользовательская модель в Stadia

Построение графиков регрессионной модели в программе Stadia реализовано плохо. Следует отметить, что работа велась с учебной версией программы Stadia 8.0.

Одной из самых распространённых программ для статистической обработки данных является программа Statistica. Интерфейс программы Statistica написан на английском языке, однако встречаются и русскоязычные ознакомительные версии программы. Данная программа имеет большой функционал для проведения регрессионного анализа. Итоги регрессионного анализа приведены подробно. В итоговых таблицах находится вся необходимая информация о результатах регрессионного анализа. При необходимости, можно провести анализ остатков регрессии. На рисунке 5 «Регрессия в Statistica» показан пример результатов регрессионного анализа, проведенного в программе Statistica.

Рисунок 5. Регрессия в Statistica

Следует отметить, что статистически значимые результаты на заданном уровне значимости автоматически выделяются красным цветом, что является информативным. Также программа Statistica позволяет строить графики по полученным регрессионным моделям, в том числе и множественным. На рисунке 6 «График множественной регрессии» изображен график регрессии, результаты которой приведены на рисунке 5.

Программа Statistica имеет большой функционал по работе с нелинейными регрессионными моделями. Составление пользовательских нелинейных регрессионных моделей производится путём выбора вкладки «Анализ — Углублённые методы анализа — Множественная нелинейная регрессия».

Читать еще:  Анализ множественной регрессии

Таким образом, если требуется провести линейный однофакторный регрессионный анализ без выяснения статистической значимости полученной модели, то целесообразно использовать табличный редактор Microsoft Office Excel. Также Microsoft Office Excel можно использовать для построения линейной однофакторной регрессионной модели. Для проведения подробного регрессионного анализ, либо для получения нелинейных однофакторных и многофакторных регрессионных моделей лучше использовать программу Statistica. Богатый функционал, доступность и наглядность результатов анализа, графические возможности и большое количество методической литературы делаю данную программу незаменимым средством для проведения регрессионного анализа. Программа Stadia является довольно редкой программой и её интерфейс не соответствует требованию настоящего времени.

Список литературы

  1. Современное программное обеспечение для статистической обработки биомедицинских исследований / В.А. Герасевич, А.Р. Аветисов, 2005 Белорусский медицинский журнал, № 1, с. 14.
  2. Студопедия. Суть и этапы регрессионного анализа. URL: https://studopedia.su/14_173066_sut-i-etapi-regressionnogo-analiza.html Дата обращения: 08.01.2018

Электронное периодическое издание зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), свидетельство о регистрации СМИ — ЭЛ № ФС77-41429 от 23.07.2010 г.

Соучредители СМИ: Долганов А.А., Майоров Е.В.

Применение корреляционно-регрессионного анализа

В системе статистической обработки данных и аналитики часто используется сочетание методик корреляции и регрессии. Создателем корреляционно-регрессионного анализа считается Фрэнсис Гальтон, который разработал теоретическую основу методологии в 1795 году. В конце 19 века многие европейские ученые в области теории статистики углубили познания в вопросе использования количественных измерителей для отражения связей между явлениями.

Что такое корреляционно-регрессионный анализ (КРА) предприятия?

Корреляционно-регрессионный анализ (КРА) на предприятиях используется для выявления связей между несколькими факторами хозяйственной деятельности и оценки степени взаимозависимости выбранных для анализа критериев. Методика использует два алгоритма действий:

  1. Корреляция, которая направлена на построение моделей связей.
  2. Регрессия, используемая для прогнозирования событий на основе наиболее подходящей для ситуации модели связей.

Анализ проводится в несколько шагов:

  • постановка задач проведения исследования;
  • массовый сбор информации: систематизация статистических данных по конкретным показателям деятельности предприятия в динамике за несколько периодов;
  • этап создания модели связей;
  • анализ функционирования модели, оценка ее эффективности.

Для проведения КРА необходимо использовать показатели в едином измерителе, все они должны иметь числовое значение.

ОБРАТИТЕ ВНИМАНИЕ! Для достоверности данных и работоспособности модели сведения должны быть собраны за длительный отрезок времени.

Для полноты анализа надо устранить количественные ограничения на показатели модели, должно соблюдаться условие постоянной временной и территориальной структуры рассматриваемой совокупности элементов.

Где используется корреляционно-регрессионный анализ?

Основные ситуации применения КРА:

  1. Тестирование отношения между несколькими величинами: выявляется, что именно этот показатель является влияющим, а второй – зависимым.
  2. Определение связи между двумя переменными факторами без уточнения причинно-следственного блока сведений.
  3. Расчет показателя по изменению значения другого фактора.

Корреляционно-регрессионная методика анализа может применяться для подготовки данных о разных сторонах деятельности компании. В бизнесе построение моделей зависимости одного показателя от других факторов и дальнейшая эксплуатация выведенной математической формулы позволяют отслеживать оперативное изменение текущей ситуации в выбранном сегменте хозяйствования и быстро принимать управленческие решения.

Например, благодаря КРА можно постоянно отслеживать уровень рыночной стоимости предприятия. Для этого на начальных этапах проводится сбор информации о динамике изменения рыночной стоимости и статистических показателей всех возможных факторов влияния:

  • уровень выручки;
  • рентабельность;
  • размер активов;
  • сумма непогашенной дебиторской или кредиторской задолженности;
  • резерв сомнительных долгов и др.

Для каждого критерия строится модель, которая выявляет, насколько сильно фактор может влиять на рыночную стоимость бизнес-проекта. Когда все модели построены, оценивается их работоспособность и адекватность. Из комплекса данных выбирается тот тип взаимосвязей, который отвечает требованиям объективности и достоверности. На основе полученной схемы связей создается уравнение, которое позволит получать прогнозные данные об изменении рыночной стоимости при условии изменения значения конкретного фактора.

Методику можно применять при формировании ценовой политики, составлении бизнес-планов, проработке вопроса о расширении ассортиментного ряда и в других сегментах предпринимательства.

Задачи, виды и показатели корреляционно-регрессионного анализа

Задачи КРА заключаются в:

  • идентификации наиболее значимых факторов влияния на конкретный показатель деятельности предприятия;
  • количественном измерении тесноты выявленных связей между показателями;
  • определении неизвестных причин возникновения связей;
  • всесторонней оценке факторов, которые признаны наиболее важными для рассматриваемого показателя;
  • выведении формулы уравнения регрессии;
  • составлении прогноза возможного результата деятельности при изменении ключевых связанных факторов с учетом возможного влияния других факторных признаков.

КРА подразумевает использование нескольких видов корреляционных и регрессионных методов. Зависимости выявляются при помощи корреляций таких типов:

  • парная, если связь устанавливается с участием двух признаков;
  • частная – взаимосвязь оценивается между искомым показателем и одним из ключевых факторов, при этом условием задается постоянное значение комплекса других факторов (то есть числовое выражение всех остальных факторов в любых ситуациях будет приниматься за определенную неизменную величину);
  • множественная – основу исследования составляет влияние на показатель деятельности не одного фактора, а сразу нескольких критериев (двух и более).

СПРАВОЧНО! Выявленные показатели степени тесноты связей отражаются коэффициентом корреляции.

На выбор коэффициента влияет шкала измерения признаков:

  1. Шкала номинальная, которая предназначена для приведения описательных характеристик объектов.
  2. Шкала ординальная нужна для вычисления степени упорядоченности объектов в привязке к одному и более признакам.
  3. Шкала количественная используется для отражения количественных значений показателей.

Регрессионный анализ пользуется методом наименьших квадратов. Регрессия может быть линейной и множественной. Линейный тип предполагает модель из связей между двумя параметрами. Например, при наличии таких двух критериев, как урожайность клубники и полив, понятно, что именно объем поступающей влаги будет влиять на объем выращенной и собранной клубники. Если полив будет чрезмерным, то урожай пропадет. Урожайность же клубники никак не может воздействовать на систему полива.

Множественная регрессия учитывает более двух факторов одновременно. В случае с клубникой при оценке ее урожайности могут использоваться факторы полива, плодородности почвы, температурного режима, отсутствия слизняков, сортовые особенности, своевременность внесения удобрений. Все перечисленные показатели в совокупности оказывают комплексное воздействие на искомое значение – урожайность ягод.

Система показателей анализа формируется критериями классификации. Например, при экстенсивном типе развития бизнеса в качестве показателей могут выступать такие факторы:

  • количество сотрудников;
  • число заключенных договоров за отчетный период;
  • посевные площади;
  • прирост поголовья скота;
  • расширение дилерской сети;
  • объем основных фондов.

При интенсивном типе развития могут применяться следующие показатели:

  • производительность труда;
  • рентабельность;
  • урожайность;
  • фондоотдача;
  • ликвидность;
  • средний объем поставок в отчетном периоде по одному договору.

Оценка

Для оценки достоверности и эффективности модели связей необходимо построить матрицу коэффициентов. Коэффициент в случае парной корреляции вычисляется по формуле:

Диапазон значений коэффициента ограничивается показателями от -1 до +1. Если итоговое значение было получено со знаком плюс, то между рассматриваемыми переменными имеется прямая связь. Если в результате расчетов значение оказалось отрицательным, то связь будет обратной, то есть при увеличении одного из показателей другой связанный с ним фактор будет уменьшаться. Пример прямой связи – увеличение посевных площадей будет способствовать росту объема собираемой с полей продукции. Пример обратной связи – увеличение посевных площадей сопровождается снижением урожайности.

Качественный аспект тесноты связи между рассматриваемыми в аналитических расчетах показателями можно оценивать, основываясь на шкале Чеддока.

В соответствии с ее нормами связь будет расцениваться как сильная при значении коэффициента корреляции по абсолютным данным величины выше 0,7. Положительный или отрицательный знак сопровождает числовое значение – неважно, ориентироваться необходимо только на число. Если коэффициент после вычислений оказался ниже 0,3, то связь можно считать слабой.

Для дальнейших этапов анализа выбираются факторы с высокой степенью связанности. Все остальные критерии, для которых установлена слабая связь, отбрасываются. На основании полученных сведений определяется вид математического уравнения регрессии. Рассчитывается численное значение оценки параметров регрессии, определяются качества полученной модели регрессии.

Ссылка на основную публикацию
ВсеИнструменты
Adblock
detector