Методы статистического анализа и прогнозирования - Журнал про Деньги
Finkurier.ru

Журнал про Деньги
4 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Методы статистического анализа и прогнозирования

Статистическое прогнозирование

Для рассмотрения выделим следующие методы статистического прогнозирования:

1. Экстраполяция по скользящей средней — может применяться для целей краткосрочного прогнозирования.

Необходимость применения скользящей средней вызывается следующими обстоятельствами. Бывают случаи, когда имеющиеся данные динамического ряда не позволяют обнаруживать какую-либо тенденцию развития (тренд) того или иного процесса (из-за случайных и периодических колебаний исходных данных). В таких случаях для лучшего выявления тенденции прибегают к методу скользящей средней.

Метод скользящей средней состоит в замене фактических уровней динамического ряда расчетными, имеющими значительно меньшую колеблемость, чем исходные данные. При этом средняя рассчитывается по группам данных за определенный интервал времени, причем каждая последующая группа образуется со сдвигом на один год (месяц). В результате подобной операции первоначальные колебания динамического ряда сглаживаются, поэтому и операция называется сглаживанием рядов динамики (основная тенденция развития выражается при этом уже в виде некоторой плавной линии).

Метод скользящей средней называется так потому, что при вычислении средние как бы скользят от одного периода к другому; с каждым новым шагом средняя как бы обновляется, впитывая в себя новую информацию о фактически реализуемом процессе.

Таким образом, при прогнозировании исходят из простого предположения, что следующий во времени показатель по своей величине будет равен средней, рассчитанной за последний интервал времени.

Пример: если объем продаж товара Х составил (штук):

в январе — 60,
в феврале — 85,
в марте — 80,
в апреле — 92,
в мае — 88.
в июне — 96,

то прогноз продаж на июль (для 5-ти месячного периода) составит:

(85 + 80 + 92 + 88 + 96) / 5 = 88,2.

Если реальный объем продаж на июль составил 94 штуки, то прогноз продаж на август уже будет равен:

(80 + 92 + 88 + 96 + 94) / 5 = 90

Число значений “n” для подсчета скользящей средней (в нашем примере равно 5) выбирается в зависимости от того, насколько важны старые значения исследуемого показателя в сравнении с новыми. Так, если мы будем использовать для подсчета 3-х месячный период, тогда:

В случае с 5-ти месячной средней старые значения имеют удельный вес 4/5, а текущие – 1/5. В случае с 3-х месячной средней старые значения “весят” 2/3, а текущие – 1/3, т.е. скользящая средняя уже в большей степени зависит от текущего уровня и несколько слабее – от предшествующего.

2. Экспоненциальная средняя. При рассмотрении скользящей средней было отмечено, что чем “старше” наблюдение, тем меньше оно должно оказывать влияние на величину скользящей средней. То есть влияние прошлых наблюдений должно затухать по мере удаления от момента, для которого определяется средняя.

Одним из простейших приемов сглаживания динамического ряда с учетом “устаревания” является расчет специальных показателей, получивших название экспоненциальных средних, которые широко применяются в краткосрочном прогнозировании. Основная идея метода состоит в использовании в качестве прогноза линейной комбинации прошлых и текущих наблюдений. Экспоненциальная средняя рассчитывается по формуле:

Qt = a yt + (1 — a )Qt-1 (1)

где Qt— экспоненциальная средняя (сглаженное значение уровня ряда) на момент t;

a — коэффициент, характеризующий вес текущего наблюдения при расчете экспоненциальной средней (параметр сглаживания), причем 0 2 = min (7)

Для определения параметров а и b уравнения (6) на основе требований метода наименьших квадратов (уравнение 7) при помощи дифференциальных исчислений составляется система нормальных уравнений:

å у = na + bå х;

å ху = аå х + bå x 2 . (8)

Для решения данной системы уравнений применяется способ определителей, позволяющий сводить к минимуму неточности округлений в расчетах параметров уравнений регрессии:

å у å х 2 å х

nå x 2 — å хå x

nå xу xå y

nå x 2 — å хå x

Для нахождения а можно воспользоваться упрощенной формулой:

а = ybx, (11)

å y å x

где y = ——- и x = ——

N n

Если в решаемой задаче много цифр, то формула для b, приведенная выше (10), не очень удобна. Можно воспользоваться другой:

å (xx)(yy)

å (xx) 2

Пример:на основании нижеследующих данных о продажах и расходах на рекламу (графы 2 и 3) составим прогноз ожидаемого объема продаж в будущем периоде (при расходах на рекламу в 20 тыс. руб.):

Статистические методы прогнозирования.

Статистический прогноз основывается на знании общей тенденции и закономерностей развития явления за предпрогнозный период.

Процесс прогнозирования, опирающийся на статистические методы, распадается на два этапа.

Первый, индуктивный, заключается в обобщении данных, наблюдаемых за более или менее продолжительный период времени, и в представлении соответствующих статистических закономерностей в виде модели. Статистическую модель получают или в виде аналитически выраженной тенденции развития, или в виде уравнения зависимости от одного или нескольких факторов-аргументов, или в виде взаимосвязанных систем уравнений. Процесс построения и применения статистической модели для прогнозирования обязательно включает выбор формы уравнения, описывающего динамику или взаимосвязь явлений, и оценивание его параметров с помощью того или иного метода.

Второй этап, собственно прогноз, является дедукутивным. На этом этапе на основе найденных статистических закономерностей определяют ожидаемое значение прогнозируемого признака. Полученные результаты не могут рассматриваться как нечто окончательное. При их оценке и использовании должны приниматься во внимание факторы, условия или ограничения, которые не были учтены при разработке статистической модели.

Выделяют следующие методы статистического прогноза:

I. По среднегодовым абсолютным приростам или среднегодовым темпам роста – наиболее простой, но наименее надежный метод.

Рисунок 9.1 — Динамика объема продаж

Средний абсолютный прирост за месяц составит:

= = где Аi – абсолютный прирост i-го периода

n – число периодов

Прогноз по среднему абсолютному приросту:

где t – период упреждения

i – номер последнего уровня исследуемого периода, за который рассчитан средний абсолютный прирост

Прогноз на январь следующего года = 158+5,3 = 163,3, на февраль = 158+2*5,3 = 168,6 и т.д.

Среднемесячный темп роста:

Прогноз по среднему темпу роста:

Прогноз на январь следующего года = 158*1,042 = 164,6, на февраль = 158*1,042 2 = 171,6 и т.д.

II. Экстраполяция полученной тенденции на основе уравнения тренда

По методологии, принятой в статистике, определяются вид и параметры уравнения тренда, оценивается ошибка тренда и ошибка прогноза. Прогноз дается в виде интервала.

Для определения линии тренда можно использовать статистические программы и табличный редактор Excel.

Пример: По данным предыдущего примера, используя возможности Excel, получим уравнение прямой y = 3,5315t + 104,38 , ошибка аппроксимации данной модели 50,8%, что закономерно, т.к. динамика выручки, судя по рисунку 1, подвержена сезонности и более точно описывается рядом Фурье. (см. Статистика: национальные счета, показатели и методы анализа / под ред. Теслюка И.Е. – Минск: БГЭУ, 1995; Теория статистики /под ред. Шмойловой. – М.: Финансы и статистика, 1996)

Однако, возможности табличного редактора не позволяют получить ряд Фурье, поэтому при необходимости следует использовать более сложные специализированные статистические программы.

Уравнение прямой в общем виде может быть представлена следующей формулой:

где n – число анализируемых лет

t – порядковый номер года (1,2,…,n)

Для прогноза на перспективу необходимо подставить в уравнение порядковый номер прогнозного периода. Так как предпрогнозный период был представлен месячными данными за предыдущий год, то для нашего примера порядковый номер января – 13, февраля – 14.

Точечный прогноз на: январь = 3,5315*13+104,38 = 150,3; февраль = 3,5315*14+104,38 = 153,8

Однако, фактическая динамика, как видно на рисунке, отличается от выравненной. Следовательно, точечный прогноз может оказаться некорректным.

Для повышения точности прогноза следует построить прогнозный интервал, для чего необходимо определить ошибку прогноза. (см. Теория статистики./ под ред. Елисеевой, 1999).

В первую очередь определяют стандартную ошибку модели по следующей формуле:

где yi, – соответственно фактические и выравненные уровни

n – объем совокупности (число периодов)

р – число параметров модели прогноза (для прямой р=2, для параболы р=3 и т.д.)

Далее рассчитывается стандартная ошибка прогноза:

где к – период упреждения (порядковый номер периода, на который осуществляется прогноз)

По данным нашего примера рассчитаем ошибку прогноза. Ошибка модели также может быть определена с использованием функции “СТОШYX” EXCEL после расчета выравненных значений с помощью функции “ПРЕДСКАЗ”.

Sr = 13,14 = 24,51

Для расчета доверительных интервалов полученную ошибку прогноза умножают на t – критерий Стьюдента при заданной вероятности (a) и продолжительности предпрогнозного периода (n).

Таблица 9.1 — Выдержка из таблицы “Распределение Стьюдента”

Для выбора необходимой вероятности следует оценить устойчивость тренда по соответствующему коэффициенту.

Читать еще:  Количественный подход к анализу полезности

где Ку – коэффициент устойчивости тренда

`y – среднее фактическое значение изучаемого показателя

По данным примера`y = 127,33, коэффициент устойчивости 10,32%. Следовательно, тренд достаточно устойчив и t-критерий можно принять с надежностью 0,90. Таким образом, границы прогноза составят:

для января — 150,3-1,782*24,51 у13 150,3+1,782*24,51

осуществив расчет, получим 106,62 у13 193,98

Аналогично рассчитываем для февраля — 110,12,62 у14 199,48

При рассмотрении квартальных или помесячных данных часто обнаруживаются определенные, постоянно повторяющиеся колебания, которые существенно не изменяются за длительный период времени. Такие колебания, которые имеют определенный и постоянный период, равный годовому промежутку, в статистике носят название “сезонные колебания” или “сезонные волны”. В этом случае более эффективным методом прогнозирования считается метод, базирующийся на аналитическом выравнивании по ряду Фурье.

Прежде чем использовать выравнивание по ряду Фурье, следует оценить наличие сезонных колебаний в динамике изучаемого показателя.

.Для этого используются следующие показатели:

1. Размах сезонных колебаний — это разность наибольшего и наименьшего значений показателя в течение анализируемого периода

2. Коэффициент сезонных колебаний представляет соотношение наибольшего и наименьшего значений показателя в течение года

3. Индексы сезонных колебаний характеризуют помесячные сезонные колебания и рассчитываются несколькими способами.

а) уровень каждого месяца сопоставляется со средним (или максимальным или минимальным в течение года) уровнем показателя

где `y – средняя, рассчитанная по фактическим значениям показателя за 12 месяцев, или средняя, исчисленная по выравненным теоретическим данным

б) если имеются помесячные данные за ряд лет, индексы сезонности рассчитываются вначале за каждый год по первому способу, а затем из индексов сезонности каждого месяца находят среднюю арифметическую за анализируемый период;

4. Обобщающим показателем величины сезонных колебаний является коэффициент вариации, который находится по следующей формуле:

где s– среднеквадритическое отклонение

i — среднее значение признака за весь период (год)

где iсез – индексы сезонности для i-го периода внутри года

Чем выше показатель вариации, тем более сильно выражены сезонные колебания признака, следовательно, тем более обоснованным является применение ряда Фурье.

По нашему примеру размах сезонных колебаний составил R = 158 (декабрь) – 100 (январь) = 58 тыс.руб. Коэффициент сезонных колебаний Ксез = 158 / 100 = 1,58 или 158%, что свидетельсвует о наличии значительных сезонных колебаний. Для расчета индексов сезонных колебаний вначале определим среднемесячное значение выручки:

`y = = 1528/12 = 127,33.

Тогда индексы сезонности для каждого месяца составят (табл.9.2)

Введение. Лекция №13. Статистические методы прогнозирования;

Лекция №13. Статистические методы прогнозирования

Примеры решения задач индексным методом.

1.Средняя интенсивность смертности от суицида в регионе за период уменьшилась на 20 %, а в стандартной половозрастной структуре это изменение составило бы +20%, то изменение смертности от суицида за счёт структурных факторов составило .

Решая задачу, нужно воспользоваться формулой: I пер.сост. = I пост.сост × I стр.сдв

Индекс структурных сдвигов равен 0,8/1,2= 0,667.

1-0,667 = 34,4 – т.е. смертность за счет структурных факторов уменьшилась на 34,3%

2.Объём товарной продукции предприятия увеличился на 9,5% и составил 25,2млн.руб., общая сумма материальных затрат возросла на 7,2%.

Если материалоёмкость товарной продукции в базисном году составляла 0,67 р/руб., то чему равно абсолютное изменение материальных затрат за счёт изменения материалоёмкости продукции?

При решении задачи нужно учитывать то, что сумма материальных затрат является произведению удельной материалоемкости (расходу материалов на единицу продукции) на объем товарной продукции. Z = Me * Q.

В настоящее время статистические методы прогнозирования заняли особое место в мировой статистической практике и с успехом применяются в самых разных областях экономики: как для макроэкономических прогнозно-аналитических расчетов и разработки мер по регулированию экономического развития страны, так и в микроэкономическом управленческом и маркетинговом анализе. Широкое распространение специальных статистических программных пакетов сделало использование этих методов простым и удобным.

Статистические методы прогнозирования все шире применяются в деятельности плановых, маркетинговых и аналитических отделов производственных предприятий и объединений, торговых, страховых, финансовых компаний, банков и правительственных учреждений.

Использование компьютеров для выполнения сложных и трудоемких расчетов приводит к тому, что на долю человека остается исследовательская, творческая работа: постановка задачи, выбор модели и метода прогнозирования, оценка качества построенных моделей и интерпретация полученных результатов. Однако для того, чтобы выполнять эту работу на высоком профессиональном уровне, необходима определенная подготовка в области статистических методов прогнозирования и представление о многомерном статистическом анализе.

На данной лекции мы изучим сущность статистических методов прогнозирования и возможности их использования.

Предварительно следует рассмотреть само понятие «прогноз» и разобраться в том, что такое «прогнозирование».

1. Понятие «прогноз» и виды прогнозов

Прогноз(от греческогоprognosisпредвидение, предсказание)это научно обоснованное описание возможных состояний изучаемых объектов в будущем, а также альтернативных путей и сроков достижения этих состояний.

Процесс разработки прогнозов называется прогнозированием.

Прогнозирование должно дать ответ на два вопроса:

1) Чего вероятнее всего ожидать в будущем?

2) Каким образом нужно изменить условия, чтобы достичь желаемого состояния изучаемого объекта.

Прогнозы, отвечающие на вопросы первого типа, называются поисковыми, а второго типа – нормативными (иногда их называют программно-целевыми).

Например, если Правительство г. Москвы ставит задачу обеспечить каждую семью отдельной квартирой, то нормативный прогноз покажет, при каких финансовых вложениях и в какие сроки может быть выполнена такая задача.

В зависимости от объектов прогнозирования принято разделять прогнозы на научно-технические, экономические, социальные, военно-политические и т.п. Однако такая классификация носит условный характер, так как между такими видами прогнозов обычно существует множество прямых и обратных связей.

В зависимости от масштабности объекта прогнозирования прогнозы могут охватывать все уровни: от микроуровня (на котором рассматриваются прогнозы развития отдельных предприятий) до макроуровня, на котором анализируется и прогнозируется макроэкономическое развитие страны.

По времени упреждения (то есть длины периода, на который делается прогноз) прогнозы делятся на:

— оперативные (до 1 мес.);

— краткосрочные (от нескольких месяцев до 1 года);

— среднесрочные (с периодом упреждения более 5 лет).

Наибольший практический интерес для финансистов-аналитиков, предпринимателей, маркетологов, менеджеров, несомненно, представляют краткосрочные и оперативные прогнозы.

Для прогнозирования могут использоваться не только статистические, но и другие методы, например, экспертно-аналитические или интуитивно-логические. Но статистические методы имеют немало преимуществ, связанных с тем, что они основаны на использовании имеющейся базы статистических данных, причем процедура прогнозирования с их помощью может быть компьютеризирована, что сокращает время и затраты на сбор и обработку исходной информации.

В то же время у этих методов имеются и определенные недостатки, которые ограничивают область их применения. В частности, достаточно достоверный прогноз может быть построен только при соблюдении определенных требований к исходной статистической информации. Кроме того, если прогноз делается на основе уравнений тренда или регрессии, важное значение имеет выбор математической функции, используемой для прогнозирования, с учетом содержательного смысла поставленной задачи и исследуемого процесса.

2. Сущность статистических методов прогнозирования и требования к исходной статистической информации

Статистические методы прогнозирования основаны на процессе экстраполяции, то есть продолжении на будущее тенденции, наметившейся в прошлом. Такая экстраполяция может быть выполнена даже на основе чисто графического анализа при наличии графика исходного ряда данных.

Однако к статистическим методам прогнозирования относится не только экстраполяция тренда (на основе одномерного временного ряда), но и экстраполяция на основе уравнений парной и множественной регрессии, которая осуществляется в два этапа. Вначале методом экстраполяции тренда прогнозируется изменение каждого из факторных признаков (показателей), а затем найденные прогнозные значения подставляются в уравнение регрессии и рассчитывается прогноз результативного показателя.

Сущность статистических методов прогнозирования приводит к ограничениям на область их использования.

В частности, такие методы дают достаточно достоверный результат, лишь при наличии сохранения в будущем некоторой тенденции, которая наметилась в прошлом. Если эта тенденция не сохранится (т.е. произойдет резкий «перелом» плавного течения процесса), то использовать статистические методы для прогнозирования не имеет смысла.

Это чаще всего происходит, если в ход исследуемого процесса неожиданно вмешиваются какие-то новые факторы, ранее не оказывающие на него влияния.

Например, таким фактором послужил банковский кризис 1998 года, который полностью изменил все условия экономической деятельности отечественных предприятий.

Далее, очень важно иметь достаточно качественную исходную информацию.

Во-первых, длина исходного ряда данных должна быть достаточной, то есть не менее чем в 3-4 раза больше периода упреждения прогноза. Во-вторых, желательно использовать для прогнозирования динамические ряды с равными интервалами между соседними уровнями ряда. В-третьих, значения показателей (уровней ряда) за разные моменты времени должны быть сопоставимыми. Проблема сопоставимости статистической информации во времени часто становится «камнем преткновения» в прогнозно-аналитических исследованиях экономических явлении и процессов. Например, несопоставимость может иметь место из-за изменения методики расчета показателей, изменения терминологии, классификации, структурных изменений в отраслях экономики и т.д. Все эти явления практически «разрушили» накопленную за 70 лет в СССР базу статистических данных, сделав ее непригодной для прогнозных расчетов. Поэтому прогноз макроэкономических показателей у нас сейчас осуществляется на основе достаточно «короткого» ряда данных чуть более 10 лет (в основном за период, начиная с 1994г). Существуют и другие ограничения на возможность использования статистических методов.

Читать еще:  Анализ предприятия это

Применение определенного математического аппарата также накладывает дополнительные ограничения на допустимую длину динамических рядов, используемых для прогнозирования. Построение прогноза на основе уравнений множественной регрессии требует наличия таких временных рядов, длина которых в несколько раз превышает количество независимых (факторных) переменных.

Временные ряды не должны иметь пропущенных наблюдений (то есть неизвестных значений показателей за отдельные периоды). Такие пропуски могут возникать из-за недостатков в системе сбора информации, изменений в системе отчетности и т.д. Например, может измениться сам состав показателей, включаемых в ту или иную форму отчетности, но через некоторое время решение об исключении какого-то показателя может быть отменено в связи с осознанием его важности для аналитических исследований. В этом случае для использования данного временного ряда в дальнейшем необходимо восстановить пропущенные значения (например, с помощью, так называемой интерполяции). Если временной ряд содержит какие-то аномальные значения или так называемые «выбросы», которые часто возникают из-за ошибок в расчетах (например, из-за выбора разных единиц измерения для разных уровней), то такие значения необходимо исключить и заменить другими, рассчитанными тем же методом интерполяции.

Процесс прогнозирования с помощью статистических методов, как правило, включает следующие этапы:

1) Постановка задачи и сбор необходимой информации;

2) Первичная обработка исходных данных;

3) Определение круга возможных моделей прогнозирования;

4) Оценка параметров моделей;

5) Исследование качества построенных моделей и выбор наилучшей;

6) Построение прогноза:

7) Содержательный анализ и интерпретация полученных результатов.

В практике прогнозирования принято считать, что значения уровней временных рядов экономических показателей складываются из трех основных компонент:

— периодической (сезонной или циклической) составляющей;

Т.е. значения показателя можно представить в виде функции:

Yt = F (ut; vt; εt), где ut — тренд или трендовая составляющая; vt — циклическая составляющая, а εt – случайная составляющая.

Под трендом понимают изменение, определяющее общее направление развития, основную тенденцию временного ряда. Это систематическая составляющая долговременного воздействия. Наряду с долговременными тенденциями во временных рядах экономических показателей часто встречаются более или менее регулярные колебания – периодические составляющие. Если период колебаний не превышает 1 года, то их называют сезонными. Например, спрос или цены на большинство товаров массового спроса подвержены ярко выраженным сезонным колебаниям.

При большом периоде колебаний (длиной более 1 года до нескольких лет) считается, что во временном ряду имеет место циклическая составляющая. Примерами могут служить инвестиционные циклы, циклы деловой активности, демографические и т.д.

Если из временного ряда удалить тренд и периодическую компоненту, то останется нерегулярная, случайная компонента, которая обычно формируется под воздействием разных случайных факторов, не учтенных в построенной модели.

Модель временного ряда Yt = F (ut; vt; εt) может иметь вид суммы или произведения перечисленных компонент. В первом случае она называется аддитивной, во втором – мультипликативной. Иногда она может иметь смешанный характер, например:

Решение любой задачи по анализу и прогнозированию временных рядов рекомендуется начинать с построения графика исследуемого показателя. При этом на графике не всегда можно обнаружить присутствие тренда, то есть четко выраженной тенденции, которую можно экстраполировать. В этом случае, прежде чем перейти к выделению тренда, нужно выяснить, существует ли вообще тенденция в исследуемом процессе.

Основные подходы к решению этой задачи основаны на проверке статистических гипотез, прежде всего гипотезы о случайном характере изменений уровней ряда в динамике. Наиболее часто на практике для этого используются:

1) Критерий восходящих и нисходящих серий;

2) Критерий серий, основанный на медиане выборки;

Методы прогнозирования

Можно считать, что прогнозирование является чуть ли не основной целью и задачей большого числа специалистов, занимающихся анализом данных. Современные методы статистического прогнозирования позволяют с высокой точностью прогнозировать практически все возможные показатели.

Автоматизируйте решение задачи прогнозирования с помощью системы Sales-Forecast. Смотреть видео

При анализе временных рядов можно выделить две основные цели:

Однако надо помнить, что не существует универсальных методов прогнозирования на все случаи жизни. Выбор метода прогнозирования и его эффективность зависят от многих условий, и в частности от требуемой длины или времени прогнозирования.

По времени прогнозирования различают краткосрочный, среднесрочный и долгосрочный прогноз.

Краткосрочный прогноз характеризует собой прогноз «на завтра», то есть прогноз на несколько шагов вперед. Для него применяют практически все известные методы: экспоненциальное сглаживание, АРПСС (ARIMA) и нейронные сети.

Среднесрочный прогноз – это обычно прогноз на один или на половину сезонного цикла. Для него используют АРПСС и экспоненциальное сглаживание, которые позволяют отслеживать качество прогноза в зависимости от срока прогноза.

А при построении долгосрочного прогноза стандартные статистические методы прогнозирования практически не используют, и требуется использование комплексных подходов. Например, использование нейронных сетей или регрессионных моделей.

Для построения прогноза, важно правильно понимать термины, используемые при построении моделей и хорошо ими оперировать. Это и выделение тренда, циклической составляющей ряда, трендциклической, сезонной составляющей и шумовой компоненты; и исследование автокорреляционной и частной автокорреляционной функции для нахождения сезонности; и построение периодограммы, и вычисление сезонного лага (например, при помощи спектрального анализа Фурье).

После построения любой модели важно проверять, насколько адекватно она построена. Для этого можно, во-первых, провести визуальный анализ со сдвигом прогноза на несколько шагов назад. А во-вторых, воспользоваться анализом остатков – стандартным методом проверки адекватности любой построенной статистической модели.

Для наглядного представления применимости моделей в зависимости от интересующей длительности прогноза удобно пользоваться следующей таблицей:

Программа STATISTICA является комплексным аналитическим инструментом, предназначенным для построения точных прогнозов в любых областях, используя различные методы прогнозирования, а справка системы своевременно напомнит необходимую терминологию.

STATISTICA — полностью на русском языке!

При решении задач прогнозирования могут применяться процедуры и модули следующих продуктов STATISTICA:

STATISTICA Base

Продукт необходим для расчета описательных статистик, построения графиков, сравнения нескольких групп (например, рядов продаж за несколько лет) и оценки правомерности использования «старых» данных при построении прогнозов, оценки изменчивости ряда, «чистки данных» (нахождения и обработки выбросов), расчета корреляций, выявления зависимостей между временными рядами и т.д.

В этом блоке реализован один из наиболее часто используемых методов прогнозирования — построение классической линейной модели многомерной регрессии, описывающей зависимость между переменной, которую необходимо прогнозировать, и влияющими на нее факторами.

Например, может быть смоделирована зависимость объемов продаж от таких факторов как цены на продукцию, расходы на проведение рекламных и маркетинговых акций, сезонность в распределении продаж, цены конкурентов и др. При известных значениях факторов на основе объясняющей модели легко могут быть спрогнозированы объемы продаж.

Таким образом, анализ зависимостей между переменными не ограничивается проведением корреляционного анализа, а включает также построение на основе исходных данных численной зависимости, которая может быть использована для прогнозирования значений независимых переменных при известных значениях факторов. Кроме этого проводится оценка статистической значимости как самой модели, так и предикторов, входящих в ее состав.

Например, зная запланированные на следующий месяц объемы скидок, уровни цен, затраты на проведение рекламных акций и т.д., можно получить предполагаемый уровень продаж и его доверительный интервал, подставив соответствующие значения в уравнение зависимости.

STATISTICA Advanced

Продукт содержит все возможности STATISTICA Base и расширяет их углубленными методами анализа.

Позволяет перейти от построения простейших линейных регрессионных моделей к более общим и сложным нелинейным моделям, которые обеспечивают более точное моделирование рынка. Например, в модель могут входить не только сами факторы, но и их различные функциональные преобразования. Для построения подобных моделей доступны модули Общие линейные и нелинейные модели, Общие регрессионные модели, Нелинейное оценивание и др.

Читать еще:  Факторный анализ чистой прибыли

Кроме этого, при построении нелинейных моделей появляется возможность нахождения оптимальных значений факторов, при которых будут достигаться наиболее желательные значения зависимой переменной (например, максимальные объемы продаж). Для этого используются специальные оптимизационные алгоритмы и графические методы, например, инструмент Профили желательности.

Модуль Временные ряды и прогнозирование, также входящий в блок Линейные и Нелинейные Модели STATISTICA, широко используется для построения прогнозов временных рядов без привлечения сопутствующих факторов, т.е. для прогнозирования поведения ряда на основе его собственной истории. Модуль включает наиболее эффективные и популярные методы и анализа временных рядов, такие как экспоненциальное сглаживание, модель авторегрессии и скользящего среднего, сезонная декомпозиция, спектральный анализ Фурье и другие. Для каждого из методов имеется большое число настроек, что позволяет наилучшим образом адаптировать его под исследуемый временной ряд.

При исследовании временных рядов часто очень эффективными оказываются графические и описательные методы и анализа, большинство из которых для удобства интегрированы в модуль Временные ряды и прогнозирование. Модуль также содержит полный набор средств для проведения всевозможных преобразований временных рядов, таких как взятие разности различных порядков (исследование изменчивости ряда), сглаживание ряда (обнаружение тенденций в поведении ряда), выделение тренда (выделение детерминированной систематической составляющей ряда), вычисление автокорреляционных и кросскорреляционных функций, а также построение их графиков (коррелограмм).

Процедура Анализ распределенных лагов, представленная в модуле, позволяет исследовать запаздывающие влияния сопутствующих факторов на изучаемый временной ряд. Например, при анализе зависимости между фактором рекламных акций и объемом продаж логично предположить, что реклама может подействовать не моментально, а через некоторое время. Как раз при решении подобных задач может быть применена эта процедура, она позволит выявить наличие зависимости и определить, через какое время следует ожидать «отдачи» от рекламы.

Предоставляет широкий выбор разведочных технологий анализа различных типов данных в сочетании с богатыми интерактивными средствами визуализации.

Модули этого блока могут быть использованы при решении задач, связанных с сегментацией исходных объектов в данных, снижением размерности данных, задач классификации и др. Применение многомерных статистических методов анализа позволяет снизить трудоемкость решения задачи прогнозирования.

Модуль Кластерный анализ позволяет разбить исходную, вообще говоря, неоднородную совокупность объектов на максимально однородные группы, или кластеры. Например, в крупных торговых сетях ассортимент продаваемых товаров насчитывает тысячи единиц. Анализ и прогнозирование каждого временного ряда по отдельности не представляются возможными в связи с высокой трудоемкостью такого подхода. Мы можем разбить все множество временных рядов на однородные кластеры, которые будут содержать ряды, обладающие сходной динамикой, после чего анализировать уже не отдельные ряды, а целые кластеры. Таким образом, значительно (иногда в десятки раз) снижается размерность задачи, а следовательно и трудоемкость прогнозирования продаж.

Кроме этого, можно кластеризовать временные ряды исходя из абсолютных значений оборота по каждому из товаров, и выделить товары, продажи которых приносят наибольшую прибыль. Как показывает опыт, часто около 20% ассортимента обеспечивают 80% оборота (так называемый принцип Парето).

STATISTICA Automated Neural Networks

Единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык. Поддержка различных типов анализов: регрессия, классификация, временные ряды (прогнозирование), временные ряды (классификация), кластерный анализ, визуализация данных.

Продукт содержит мощное собрание встроенных интеллектуальных возможностей, которые позволяют решить реальные задачи, не имея практически никакого опыта работы с нейронными сетями. В то же время, опытный пользователь нейронных сетей может полностью управлять почти всеми аспектами нейросетевой структуры и обучения.

STATISTICA Data Miner

Продукт содержит наиболее полный набор методов Data Mining на рынке программного обеспечения, в удобном пользовательском интерфейсе позволяет исследовать большие массивы информации и выявлять в них скрытые правила и закономерности (продукт также содержит все возможности STATISTICA Advanced, STATISTICA Automated Neural Networks).

Кроме того, StatSoft Russia ведет разработку готовых отраслевых решений, позволяющих автоматизировать процесс построения прогнозов (в том числе для сотен рядов), а также учесть всю специфику задач Заказчика.

Ниже представлены некоторые примеры применения системы STATISTICA для решения задач прогнозирования в различных областях:

Вопрос 39 Методы статистического анализа и прогноза.

Статистический анализ в широком понимании представляет собой научный метод мысленного или реального расчленения изучаемого предмета, явления, процесса на составные элементы, признаки, свойства, отношения, которые затем исследуются путем анализа количественных и качественных характеристик каждого из них в отдельности и во взаимосвязи с разделенным целым для получения нового знания или систематизации уже имеющихся знаний.

Предмет статистического анализа — совокупность качественных и количественных характеристик правонарушений в их единстве и развитии.

Статистический анализ в криминологическом исследовании предполагает расчленение преступности, ее причин, мер предупреждения и т.д. на составные элементы в целях установления и количественного измерения, взаимосвязей и закономерностей преступности и связанных с ней массовых социальных явлений и процессов.

Статистический анализ юридически значимых показателей помогает различным отраслям юридической науки не утратить связи с социальными реалиями при выполнении ею своих функций: описательной; объяснительной; прогностической; организационно-практической.

В статистическом анализе находят применение частные методы: статистических группировок; обобщающих величин; статистических рядов; корреляции.

Использование статистического наблюдения, сводок и группировок собранного статистического материала позволяет получить разностороннюю информацию об изучаемых явлениях и процессах. Итоговые данные по изучаемой совокупности в целом, по ее отдельным группам и подгруппам представляют собой обобщающие показатели; они могут быть абсолютными и относительными. Эти показатели связаны и вытекают из таких методов, как сводка и группировка, и одновременно позволяют перейти к следующей группе методов — статистическому анализу.

Абсолютные показатели — суммарные величины, подсчитанные или полученные из сводных статистических отчетов без всяких преобразований.

Относительные показатели получают путем сравнения, сопоставления двух абсолютных показателей.

В статистике при изучении правонарушений используются следующие виды относительных показателей: для характеристики структуры совокупности или отношения распределения; отношения части к целому, или отношения интенсивности; отношения степени и сравнения; для характеристики динамики.

Своеобразным относительным показателем является индекс — показатель сравнения одного и того же исследуемого явления для выяснения его состояния или изменения.

Основным приемом статистического анализа является сравнение исследуемых совокупностей на основе использования рядов.

Ряд в статистике — это цифровые данные, показывающие изменения явления во времени или в пространстве и дающие возможность производить статистическое сравнение явлений как в процессе их развития во времени, так и по различным формам и видам процессов, что позволяет обнаружить взаимную зависимость явлений.

Процесс развития, движение социальных явлений во времени в статистике называется динамикой. Для ее отображения строят ряды динамики (хронологические, временные), которые представляют собой ряды изменяющихся во времени значений статистического показателя (например, число осужденных за 10 лет), расположенных в хронологическом порядке. Их составными элементами являются цифровые значения данного показателя и периоды или моменты времени, к которым они относятся.

Важнейшая характеристика рядов динамики — уровень, под которым в статистике понимается размер (объем, величина) того или иного явления, достигнутый в определенный период или к определенному моменту. Различают начальный, средний и конечный уровни динамики ряда.

Начальный уровень показывает величину первого, конечный — величину последнего члена ряда.

Ряды динамики классифицируются по следующим признакам: по способу выражения уровней — на ряды абсолютных и производных показателей; в зависимости от того, как выражают уровни ряда состояние явления на определенные моменты времени (на начало месяца, квартала, года и т.п.) интервалы времени (например, за сутки, месяц, год и т.п.) различают моментные и интервальные ряды динамики.

Важнейшим условием правильного построения и исследования рядов динамики показателей правовой статистики является сопоставимость уровней показателей, относящихся к различным периодам.

Сопоставимость данных правовой статистики — это соответствие условий и методов расчета ее показателей, обеспечивающих правильность получаемых при их сравнении выводов о различиях между изучаемыми явлениями.

Соблюдение требования сопоставимости уровней ряда означает, что научно-обоснованным будет такое сравнение, которое учитывает существо изучаемого явления и цель, достижение которой оно обеспечивает.

Методология статистического, как и любого другого научного исследования включает методы исследования, измерения существенных связей, взаимозависимостей между признаками социально-правовых явлений.

Различают два вида (типа) связей между различными явлениями и их признаками: функциональная и статистическая. Разновидностью последней является корреляционная зависимость, предполагающая такую взаимосвязь между признаками, когда средняя величина значений одного признака меняется в зависимости от изменения другого

Ссылка на основную публикацию
ВсеИнструменты
Adblock
detector