Разное

Коэффициент вариации больше 100 процентов – σ = 207,74 V = σ/x * 100% V = 207,74/306,6 *100% = 67,8%

15.06.2017

Содержание

Коэффициент вариации

Из всех показателей вариации среднеквадратическое отклонение в наибольшей степени используется для проведения других видов статистического анализа. Однако среднеквадратическое отклонение дает абсолютную оценку меры разбросанности значений и чтобы понять, насколько она велика относительно самих значений, требуется относительный показатель. Такой показатель называется он коэффициент вариации.

Формула коэффициента вариации:

Данный показатель измеряется в процентах (если умножить на 100%).

В статистике принято, что, если коэффициент вариации

меньше 10%, то степень рассеивания данных считается незначительной,

от 10% до 20% — средней,

больше 20% и меньше или равно 33% — значительной,

значение коэффициента вариации не превышает 33%, то совокупность считается однородной,

если больше 33%, то – неоднородной.

Средние, рассчитанные для однородной совокупности – значимы, т.е. действительно характеризуют эту совокупность, для неоднородной совокупности – незначимы, не характеризуют совокупность из-за значительного разброса значений признака в совокупности.

Возьмем пример с расчетом среднего линейного отклонения.

 

 

И график для напоминания

По этим данным рассчитаем: среднее значение, размах вариации, среднее линейное отклонение, дисперсию и стандартное отклонение.

Среднее значение – это обычная средняя арифметическая.

 

 

Размах вариации – разница между максимумом и минимумом:

 

 

Среднее линейное отклонение считается по формуле:

 

 

 

Дисперсия считается по формуле:

 

 

Среднеквадратическое отклонение – квадратный корень из дисперсии:

 

 

Расчет сведем в табличку.

 

 

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

  1. Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.

  2. Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.

  3. Дисперсия – средний квадрат отклонений.

  4. Среднеквадратическое отклонение – корень из дисперсии (среднего квадрата отклонений).

  5. Коэффициент вариации – наиболее универсальных показатель, отражающий степень разбросанности значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

7

studfile.net

Коэффициент вариации больше 100 процентов. Коэффициент вариации и коэффициент детерминации

Одним из основных статистических показателей последовательности чисел является коэффициент вариации. Для его нахождения производятся довольно сложные расчеты. Инструменты Microsoft Excel позволяют значительно облегчить их для пользователя.

Этот показатель представляет собой отношение стандартного отклонения к среднему арифметическому. Полученный результат выражается в процентах.

В Экселе не существует отдельно функции для вычисления этого показателя, но имеются формулы для расчета стандартного отклонения и среднего арифметического ряда чисел, а именно они используются для нахождения коэффициента вариации.

Шаг 1: расчет стандартного отклонения

Стандартное отклонение, или, как его называют по-другому, среднеквадратичное отклонение, представляет собой квадратный корень из . Для расчета стандартного отклонения используется функция СТАНДОТКЛОН . Начиная с версии Excel 2010 она разделена, в зависимости от того, по генеральной совокупности происходит вычисление или по выборке, на два отдельных варианта: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В .

Синтаксис данных функций выглядит соответствующим образом:

СТАНДОТКЛОН(Число1;Число2;…)
= СТАНДОТКЛОН.Г(Число1;Число2;…)
= СТАНДОТКЛОН.В(Число1;Число2;…)


Шаг 2: расчет среднего арифметического

Среднее арифметическое является отношением общей суммы всех значений числового ряда к их количеству. Для расчета этого показателя тоже существует отдельная функция – СРЗНАЧ . Вычислим её значение на конкретном примере.


Шаг 3: нахождение коэффициента вариации

Теперь у нас имеются все необходимые данные для того, чтобы непосредственно рассчитать сам коэффициент вариации.


Таким образом мы произвели вычисление коэффициента вариации, ссылаясь на ячейки, в которых уже были рассчитаны стандартное отклонение и среднее арифметическое. Но можно поступить и несколько по-иному, не рассчитывая отдельно данные значения.


Существует условное разграничение. Считается, что если показатель коэффициента вариации менее 33%, то совокупность чисел однородная. В обратном случае её принято характеризовать, как неоднородную.

Как видим, программа Эксель позволяет значительно упростить расчет такого сложного статистического вычисления, как поиск коэффициента вариации. К сожалению, в приложении пока не существует функции, которая высчитывала бы этот показатель в одно действие, но при помощи операторов СТАНДОТКЛОН

и СРЗНАЧ эта задача очень упрощается. Таким образом, в Excel её может выполнить даже человек, который не имеет высокого уровня знаний связанных со статистическими закономерностями.

РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

ПРАКТИЧЕСКАЯ РАБОТА 3

Цель работы : получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.

Порядок выполнения работы :

1. Определить вид и форму (простая или взвешенная) показателей вариации.

3. Сформулировать выводы.

1. Определение вида и формы показателей вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение, относительный показатель квартильной вариации и т. д.

Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:

где – наибольшее значение варьирующего признака;

– наименьшее значение варьирующего признака.

Квартильное отклонение (Q) – применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.

где и – соответственно первая и третья квартили распределения.

Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% единиц будут заключены между и , и остальные 25% превосходят .

Квартили 1 и 3 определяются по формулам:

,

Где – нижняя граница интервала, в котором находится первая квартиль;

– сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;

– частота интервала, в котором находится первая квартиль.

где Ме – медиана ряда;

,

условные обозначения те же, что и для величин .

В симметричных или умеренно асимметричных распределениях Q»2/3s. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.

Среднее линейное отклонение () представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.

Невзвешенное среднее линейное отклонение,

— взвешенное среднее линейное отклонение.

Дисперсия () – средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.

— невзвешенная,

— взвешенная.

Среднее квадратическое отклонение (s) – наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.

Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения – величины именованные, имеют размерность осредняемого признака. Дисперсия единицы измерения не имеет.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.

Коэффициент осцилляции

(относительный размах вариации) рассчитывается по формуле:

,

Линейный коэффициент вариации (относительное линейное отклонение):

Относительный показатель квартильной вариации :

или

Коэффициент вариации :

,

Наиболее часто применяемый в статистике показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации (17; С.61).

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).

В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними , тем больше асимметрия ряда.

Для характеристики асимметричности в центральной части распределения, то есть основной массы единиц или для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель асимметрии К.Пирсона:

Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (рис. 1). Между показателями центра распределения в этом случае имеется соотношение: .



Рис. 1. Распределение:

1 – с левосторонней асимметрией; 2 – с правосторонней асимметрией.

Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:

где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

где — центральный момент третьего порядка:

σ – среднеквадратическое отклонение.

Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:

.

Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

,

где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.

Наиболее точным является показатель, использующий центральный момент четвертого порядка:

где — центральный момент четвертого момента;

— для несгруппированных данных;

— для сгруппированных данных.

На рисунке 2 представлены два распределения: одно – островершинное (величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .


Рис. 2. Распределение:

1,4 – нормальное; 2 – островершинное; 3 – плосковершинное

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

,

где n – число наблюдений.

Если , то эксцесс существенен, если , то несущественен.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.

2. Рассмотрим методику исчисления показателей вариации.

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой.

Показатели описательной статистики

Существует несколько показателей, которые использует описательная статистика.

Итак, представим, что перед нами стоит задача описать рост всех студентов в группе из десяти человек. Вооружившись линейкой и проведя измерения, мы получаем маленький ряд из десяти чисел (рост в сантиметрах):

168, 171, 175, 177, 179, 187, 174, 176, 179, 169.

Если внимательно посмотреть на этот линейный ряд, то можно обнаружить несколько закономерностей:

  • Ширина интервала, куда попадает рост всех студентов, – 18 см.
  • В распределении рост наиболее близок к середине этого интервала.
  • Встречаются и исключения, которые наиболее близко расположены к верхней или нижней границе интервала.

Совершенно очевидно, что для выполнения задачи по описанию роста студентов в группе нет необходимости приводить все значения, которые будут измеряться. Для этой цели достаточно привести всего два, которые в статистике называются параметрами распределения. Это среднеарифметическое и стандартное отклонение от среднего арифметического. Если обратиться к росту студентов, то формула будет выглядеть следующим образом:

Среднеарифметическое значение роста студентов = (Сумма всех значений роста студентов) / (Число студентов, участвовавших в измерении)

Если свести все к строгим математическим терминам, то определение среднего арифметического (обозначается греческой буквой – μ («мю»)) будет звучать так:

Среднее арифметическое – это отношение суммы всех значений одного признака для всех членов совокупности (X) к числу всех членов совокупности (N).

Если применить эту формулу к нашим измерениям, то получаем, что μ для роста студентов в группе 175,5 см.

Если присмотреться к росту студентов, который мы измерили в предыдущем примере, то понятно, что рост каждого на сколько-то отличается от вычисленного среднего (175,5 см). Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением.

На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ 2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N). В виде формулы это рассчитывается понятнее:

Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример:

Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии. С единицами измерения тоже теперь все в порядке, можем посчитать стандартное отклонение для группы:

Получается, что наша группа студентов исчисляется по росту таким образом: 175,50±5,25 см.

Среднее квадратичное отклонение хорошо работает с рядами, в которых разброс значений не очень велик (это хорошо прослеживалось на примере роста, где интервал был всего 18 см). Если бы ряд наших измерений был значительнее, а варьирование роста было сильнее, то стандартное отклонение стало непоказательным и нам потребовался бы критерий, который может отразить разброс в относительных единицах (т. е. в процентах, относительно средней величины).

Для этих целей предусмотрены абсолютные и относительные показатели вариации в статистике, характеризующие вариационные масштабы:

  • Размах вариации.

Квадратический коэффициент вариации (обозначается как Vσ) – это отношение среднеквадратичного отклонения к среднеарифметическому значению, выраженное в процентах.

Для нашего примера со студентами, определить Vσ несложно — он будет равен 3,18%. Основная закономерность – чем больше будет изменяться значение коэффициента, тем больше разброс вокруг среднего значения и тем менее однородна выборка.

Преимущество коэффициента вариации в том, что он показывает однородность значений (асимметрия) в ряду наших измерений, кроме того, на него не оказывают влияния масштаб и единицы измерения. Эти факторы делают коэффициент вариации особенно популярным в биомедицинских исследованиях. Будет считаться , что эксцесс значения Vσ =33% отделяет однородные выборки от неоднородных.

Если найти в ряду значений роста (первый пример) максимальное и минимальное значения, то получим размах вариации (обозначается как R, иногда ещё называется колеблемостью). В нашем примере – это значение будет равно 18 см. Эта характеристика используется для расчёта коэффициента осцилляции:

Коэффициент осцилляции – показывает как размах вариации будет относиться к среднему арифметическому ряда в процентном отношении.

Расчёты в Microsoft Ecxel 2016

* — в таблице указан диапазон A1:A10 для примера, при расчётах нужно указать требуемый диапазон.

Итак, обобщим информацию :

  1. Среднее арифметическое – это значение, позволяющее найти среднее значение показателя в ряду данных.
  2. Дисперсия – это среднее значение отклонений возведенное в квадрат.
  3. Стандартное отклонение (среднеквадратичное отклонение) – это корень квадратный из дисперсии, для приведения единиц измерения к одинаковым со среднеарифметическим.
  4. Коэффициент вариации – значение отклонений от среднего, выраженное в относительных величинах (%).

Отдельно следует отметить, что все приведённые в статье показатели, как правило, не имеют собственного смысла и используются для того, чтобы составлять более сложную схему анализа данных. Исключение из этого правила — коэффициент вариации, который является мерой однородности данных.

Коэффициент вариации – это один из наиболее применимых в финансовой сфере статистических коэффициентов. Расскажем, как рассчитать коэффициент вариации и чем он может пригодиться финансовому директору.

Что такое коэффициента вариации и зачем он нужен

Коэффициент вариации (Coefficient of variation, или CV) – это мера относительного разброса случайной величины. Он показывает, какую долю составляет средний разброс случайной величины от среднего значения этой величины.

В общем случае коэффициент вариации используют для определения дисперсии значений без привязки к масштабу измеряемой величины и единицам измерения. Коэффициент вариации входит в группу относительных методов статистики, измеряется в процентах и поэтому его можно использовать для сравнения вариации нескольких не связанных между собой процессов и явлений.

Использование коэффициента вариации в финансовом моделировании

Коэффициент вариации является лидером среди вариационных статистических методов, которые используют финансовые и инвестиционные аналитики.

Аналитики используют коэффициент:

  1. Для определения устойчивости прогнозной модели.
  2. Для сравнения нескольких прогнозных моделей (в основном инвестиционных) с разными абсолютными уровнями дохода и риска.
  3. Для проведения XYZ анализа.

Формула расчета коэффициента вариации

Коэффициент вариации рассчитывается по формуле:

где CV – коэфф вариации,

σ – среднеквадратическое отклонение случайной величины,

tср – среднее значение случайной величины.

Формула коэффициента вариации для инвестиционных финансовых моделей:

где NPV – чистый приведенный доход.

Формула коэффициента вариации для инвестиций в ценные бумаги:

где:%год – доходность по ценной бумаге в % годовых.

Коэффициент вариации в Excel

=СТАНДОТКЛОНПА(диапазон значений)/СРЗНАЧ (диапазон значений)

Или с использованием встроенного пакета «Анализ данных».

Анализ коэффициента вариации

Коэффициент вариации более универсален, в отличие от дисперсии и среднеквадратического отклонения, потому что позволяет сопоставлять риск и доходность двух и более активов, которые могут существенно отличаться. Правда, у метода оценки пары доходность/риск с помощью коэффициента вариации есть ограничения. Если ожидаемая доходность стремится к нулю, то значение коэффициента вариации стремится к бесконечности. И даже незначительное изменение ожидаемой доходности проекта (или ценной бумаги) приводит к значительному изменению коэффициента, что необходимо учитывать при обосновании инвестиционных решений.

  • меньше 10%, то степень риска проекта является незначительной,
  • от 10% до 20% – средней,
  • больше 20% – значительной,
  • если значение коэффициента вариации больше 33%, то финансовая модель считается неоднородной, неустойчивой. По ней нельзя принимать объективных инвестиционных решений

Примеры расчета коэффициента вариации в Excel

Пример 1

Первый – открытие сети розничных точек для торговли ювелирными изделиями в Москве и Санкт-Петербурге.

Второй – открытие сети розничных точек по всей России в городах-миллионниках.

Финансовый аналитик предприятия составил финансовые модели обоих проектов в Excel и по модели Монте-Карло сделал по 5000 прогонов для NPV в каждом проекте (см. также, как создать наглядную финансовую модель в Excel ). Далее с помощью пакета анализа «Анализ данных» получил следующие статистические показатели (см. таблицы 1 и 2).

Таблица 1 . Показатели по проекту 1

Средний предполагаемый NPV от Проекта 1 составит 14,05 тысяч долларов, дисперсия (она же среднее квадратическое отклонение) будет равна 1,72 тысяч долларов.

Коэффициент вариации для первого проекта равен:

CV = 1.72/14.05 = 12%

Проект признается среднерисковым.

Средний предполагаемый NPV от Проекта 2 составит 25,23 тысяч долларов, дисперсия будет равна 6,30 тысяч долларов.

Коэффициент вариации для второго проекта составит:

CV = 6,30/25,23 = 24,97%

Проект признается высокорисковым.

Если сравнивать проекты 1 и 2 по коэффициенту вариации, то следует выбрать Проект 1, так как соотношение доход/риск у него лучше.

Пример 2

Компания «Сигма» проводит XYZ анализ товарного ассортимента по показателю изменчивости продаж. Продуктовая линейка компании представлена пятью товарами: А, В, С, D и E.

Имеется помесячная статистика продаж за последний год по каждому товару (см. рисунок). На практике лучше иметь статистику за период более трех лет/

Рисунок . Статистика продаж за последний год по каждому товару

Финансовый аналитик компании рассчитал коэффициент вариации для каждого товара

CVа = СТАНДОТКЛОНПА(B2:В13)/СРЗНАЧ (В2:В13) = 30%

В компании установлены следующие интервалы для групп XYZ:

Z – 31–100%.

Значит, товары B и D относятся к категории X. Спрос на них постоянный, запасы на складах по ним должны быть под пристальным контролем и постоянно пополняться.

Товары A и C относятся к категории Y. Спрос на них отклоняется в пределах 30% от месяца к месяцу. Возможно, имеет место сезонность спроса. Нужно глубже анализировать статистику продаж и выработать оптимальную политику по остаткам на складах для данной группы.

Товар E имеет наиболее волатильный спрос, продажи по нему осуществляются нерегулярно, поэтому возможно имеет смысл перейти на работу с ним по предзаказу.

Выводы

Следует помнить, что коэффициент вариации – это не единственный способ оценки эффективности инвестирования, так как он не учитывает несколько важных факторов:

  1. Объемы первоначального инвестирования.
  2. Возможную асимметричность распределения. При расчете коэффициента вариации предполагается, что разброс значений случайной величины расположен симметрично к среднему (часто по нормальному распределению). Но это не всегда соответствует действительности. Например, для опционов, доходность которых не может быть ниже нуля, имеет место асимметрия распределения, и анализировать коэффициент вариации по ним нужно с оглядкой на другие методы статистического анализа.
  3. Инвестиционную политику субъекта инвестирования.
  4. Другие нечисловые факторы.

Однако метод оценки статистических, в том числе финансовых, данных посредством расчета коэффициента вариации заслуженно признан одним из наиболее эффективных сравнительных методов статистики.

fashionmonger.ru

формула и расчет в Excel и интерпретация результатов

Коэффициент вариации в статистике применяется для сравнения разброса двух случайных величин с разными единицами измерения относительно ожидаемого значения. В итоге можно получить сопоставимые результаты. Показатель наглядно иллюстрирует однородность временного ряда.

Коэффициент вариации используется также инвесторами при портфельном анализе в качестве количественного показателя риска, связанного с вложением средств в определенные активы. Особенно эффективен в ситуации, когда у активов разная доходность и различный уровень риска. К примеру, у одного актива высокая ожидаемая доходность, а у другого – низкий уровень риска.

Как рассчитать коэффициент вариации в Excel

Коэффициент вариации представляет собой отношение среднеквадратического отклонения к среднему арифметическому. Для расчета в статистике используется следующая формула:

CV = σ / ǩ,

  • CV – коэффициент вариации;
  • σ – среднеквадратическое отклонение по выборке;
  • ǩ – среднеарифметическое значение разброса значений.

Коэффициент вариации позволяет сравнить риск инвестирования и доходность двух и более портфелей активов. Причем последние могут существенно отличаться. То есть показатель увязывает риск и доходность. Позволяет оценить отношение между среднеквадратическим отклонением и ожидаемой доходностью в относительном выражении. Соответственно, сопоставить полученные результаты.

При принятии инвестиционного решения необходимо учитывать следующий момент: когда ожидаемая доходность актива близка к 0, коэффициент вариации может получиться большим. Причем показатель значительно меняется при незначительном изменении доходности.

В Excel не существует встроенной функции для расчета коэффициента вариации. Но можно найти частное от стандартного отклонения и среднего арифметического значения. Рассмотрим на примере.

Доходность двух ценных бумаг за предыдущие пять лет:

Наглядно это можно продемонстрировать на графике:

Обычно показатель выражается в процентах. Поэтому для ячеек с результатами установлен процентный формат.

Значение коэффициента для компании А – 33%, что свидетельствует об относительной однородности ряда. Формула расчета коэффициента вариации в Excel:

Сравните: для компании В коэффициент вариации составил 50%: ряд не является однородным, данные значительно разбросаны относительно среднего значения.



Интерпретация результатов

Прежде чем включить в инвестиционный портфель дополнительный актив, финансовый аналитик должен обосновать свое решение. Один из способов – расчет коэффициента вариации.

Ожидаемая доходность ценных бумаг составит:

Среднеквадратическое отклонение доходности для активов компании А и В составляет:

Ценные бумаги компании В имеют более высокую ожидаемую доходность. Они превышают ожидаемую доходность компании А в 1,14 раза. Но и инвестировать в активы предприятия В рискованнее. Риск выше в 1,7 раза. Как сопоставить акции с разной ожидаемой доходностью и различным уровнем риска?

Для сопоставления активов двух компаний рассчитан коэффициент вариации доходности. Показатель для предприятия В – 50%, для предприятия А – 33%. Риск инвестирования в ценные бумаги фирмы В выше в 1,54 раза (50% / 33%). Это означает, что акции компании А имеют лучшее соотношение риск / доходность. Следовательно, предпочтительнее вложить средства именно в них.

Таким образом, коэффициент вариации показывает уровень риска, что может оказаться полезным при включении нового актива в портфель. Показатель позволяет сопоставить ожидаемую доходность и риск. То есть величины с разными единицами измерения.

exceltable.com

Абсолютные и относительные показали вариации

В статистике под вариацией понимают количественные изменения величины исследуемого признака в пределах однородной совокупности, обусловленные взаимодействием различных факторов.  Причины, порождающие вариацию социально-экономических явлений, очень сложны и многообразны. Они лежат в коренных особенностях исследуемого явления, в его сущности, а также в методологии сбора исходной информации. Социально-экономические явления, как правило, обладают большой вариацией. Если исследуются результаты целенаправленной человеческой деятельности, то вариация будет выражать вмешательство многочисленных факторов, природу которых не всегда можно установить. Однако, в большинстве теоретических исследований и практических применений статистики необходимы наряду со средней показатели вариации, характеризующие группировку значений признака вокруг средней,  т. е. степень упорядоченности статистической совокупности.

В соответствии с определением вариация измеряется степенью колеблемости вариантов признака от уровня их средней величины. Именно на этом и основано большинство показателей, применяемых в статистике для измерения вариации значений признака в совокупности. К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Простейшим показателем вариации является размах вариации, определяемый как разность между максимальным и минимальным значениями признака:

Размах вариации выражается в тех же единицах измерений, что в варианты ряда. По величине его можно определить, например, передовое и отстающее в достижении какой-либо цели. Величина вариации служит также и для характеристики средней. Размах вариации имеет и самостоятельное значение. Например, в промышленности для измерения точности изделий устанавливают определенные пределы, соответствующие иногда величине размаха вариации их признаков.

Однако показатель размаха вариации не может в полной мере охарактеризовать колеблемость ряда, поскольку он не учитывает промежуточных значений вариантов внутри этих пределов, а по этому не отражает колеблемость ряда в целом, кроме того, он полностью зависит от максимального и минимального значений, которые могут оказаться не достаточно характерными.

Таким образом, размах вариации отражает иногда случайную, а не типичную для данного ряда величину колеблемости. По этому необходимы другие показатели вариации, основанные на всех значениях признака в данной совокупности, а именно: среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

Среднее линейное отклонение представляет среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их среднего значения. 

Для данных, где частота каждого варианта равна единице, среднее линейное отклонение определяется по формуле:

Для вариационных рядов  определяется с учетом частот по формуле:

Среднее линейное отклонение по сравнению с размахом вариации дает более полную характеристику колеблемости признака в совокупности.

Средний квадрат отклонений вариантов от их средней величины называют дисперсией . Дисперсия рассчитывается по формуле:

Для негруппированных данных, где частота каждого варианта равна единице, дисперсия рассчитывается по формуле простой средней:

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

либо при равенстве весов:

Среднее квадратическое отклонение является также обобщающим показателем колеблемости признака и характеризует средний показатель отклонения вариантов ряда от их общей средней. Выражается s в тех же именованных числах, в которых выражены варианты совокупности и средняя величина.

Дисперсия и среднее квадратическое отклонение — наиболее широко применяемые показатели вариации. Объясняется это тем, что они входят в большинство теорем теории вероятностей, служащих фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака. Порядок расчета среднего квадратического отклонения следующий:

1) Определяется средняя величина:

2) Рассчитывается отклонения вариантов от средней:

3) Отклонение каждого варианта от средней возводится в квадрат:

4) Квадрат отклонений взвешивается по частотам:

5) Взвешенные по частотам квадраты отклонений суммируются:

6) Полученная сумма делится на сумму частот, и из нее извлекается квадратный корень.

Среднее квадратическое отклонение можно вычислить, составив следующую расчетную таблицу:

№ п/п Линейные отклонения от средней

Квадрат линейных отклонений

Взвешенные квадраты

Итого

Среднее квадратическое отклонение можно вычислить на основании математических преобразований значений варьирующего признака, применяя способ условных моментов:

где первый условный момент:

второй условный момент:

Среднее квадратическое отклонение по способу условных моментов определяется по формуле:

Система условных моментов различных порядков, в частности, третьего  и четвертого  используется при расчете различных статистических характеристик (например, коэффициентов асимметрии и эксцесса).

Чем больше σ, тем разнообразнее состав совокупности по величине изучаемого признака, и, наоборот, чем меньше σ, тем состав совокупности по величине изучаемого признака более одинаков. Однако оценка величины σ как качественной характеристики ряда в конечном итоге определяется сущностью изучаемых явлений. Среднее квадратическое отклонение используется для сопоставления вариации по однородным совокупностям, а также для одной совокупности за разные годы. Среднее квадратическое отклонение является критерием надежности средней. Чем меньше оно, тем лучше средняя арифметическая отражает всю представляемую совокупность.

Коэффициент осцилляции – процентное отношение размаха вариации к средней

Линейный  коэффициент вариации (относительное линейное отклонение) измеряют через соотношение среднего линейного отклонения и средней:

Коэффициент вариации представляет собой отношение среднего квадратического отклонения к средней арифметической:

Характеризуя степень колеблемости признака, коэффициент вариации позволяет давать сравнительную характеристику этой колеблемости одного и того же признака в различных совокупностях.

Коэффициент вариации используется также, если сравнивается степень вариации одного и того же признака в двух совокупностях, имеющих разные по величине средние. Как относительные величины коэффициенты вариации могут сопоставляться не только для одинаковых одноименных показателей, но и для различных показателей, выраженных в разных единицах измерения. Таким образом, коэффициент вариации в отличие от среднего квадратического отклонения позволяет сопоставить глубину вариации неоднородных совокупностей.

Задали объемную контрольную? Скоро важный зачет/экзамен? Нет времени на выполнение работы или подготовку к зачету/экзамену, но есть деньги? На сайте 100task.ru можно заказать решение задач, контрольных или онлайн-помощь на зачете/экзамене 〉〉

100task.ru

Дисперсия, среднеквадратичное (стандартное) отклонение, коэффициент вариации в Excel

Из предыдущей статьи мы узнали о таких показателях, как размах вариации, межквартильный размах и среднее линейное отклонение. В этой статье изучим дисперсию, среднеквадратичное отклонение и коэффициент вариации.

Дисперсия

Дисперсия случайной величины – это один из основных показателей в статистике. Он отражает меру разброса данных вокруг средней арифметической.

Сейчас небольшой экскурс в теорию вероятностей, которая лежит в основе математической статистики. Как и матожидание, дисперсия является важной характеристикой случайной величины. Если матожидание отражает центр случайной величины, то дисперсия дает характеристику разброса данных вокруг центра.

Формула дисперсии в теории вероятностей имеет вид:

То есть дисперсия — это математическое ожидание отклонений от математического ожидания.

На практике при анализе выборок математическое ожидание, как правило, не известно. Поэтому вместо него используют оценку – среднее арифметическое. Расчет дисперсии производят по формуле:

где

s2 – выборочная дисперсия, рассчитанная по данным наблюдений,

X – отдельные значения,

– среднее арифметическое по выборке.

Стоит отметить, что у такого расчета дисперсии есть недостаток – она получается смещенной, т.е. ее математическое ожидание не равно истинному значению дисперсии. Подробней об этом здесь. Однако при увеличении объема выборки она все-таки приближается к своему теоретическому аналогу, т.е. является асимптотически не смещенной.

Простыми словами дисперсия – это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Теперь вы знаете, как найти дисперсию.

Расчет дисперсии в Excel

Генеральную и выборочную дисперсии легко рассчитать в Excel. Есть специальные функции: ДИСП.Г и ДИСП.В соответственно.

В чистом виде дисперсия не используется. Это вспомогательный показатель, который нужен в других расчетах. Например, в проверке статистических гипотез или расчете коэффициентов корреляции. Отсюда неплохо бы знать математические свойства дисперсии.

Свойства дисперсии

Свойство 1. Дисперсия постоянной величины A равна 0 (нулю).

D(A) = 0

Свойство 2. Если случайную величину умножить на постоянную А, то дисперсия этой случайной величины увеличится в А2 раз. Другими словами, постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат.

D(AX) = А2 D(X)

Свойство 3. Если к случайной величине добавить (или отнять) постоянную А, то дисперсия останется неизменной.

D(A + X) = D(X)

Свойство 4. Если случайные величины X и Y независимы, то дисперсия их суммы равна сумме их дисперсий.

D(X+Y) = D(X) + D(Y)

Свойство 5. Если случайные величины X и Y независимы, то дисперсия их разницы также равна сумме дисперсий.

D(X-Y) = D(X) + D(Y)

Среднеквадратичное (стандартное) отклонение

Если из дисперсии извлечь квадратный корень, получится среднеквадратичное (стандартное) отклонение (сокращенно СКО). Встречается название среднее квадратичное отклонение и сигма (от названия греческой буквы). Общая формула стандартного отклонения в математике следующая:

На практике формула стандартного отклонения следующая:

 

Как и с дисперсией, есть и немного другой вариант расчета. Но с ростом выборки разница исчезает.

Расчет cреднеквадратичного (стандартного) отклонения в Excel

Для расчета стандартного отклонения достаточно из дисперсии извлечь квадратный корень. Но в Excel есть и готовые функции: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В (по генеральной и выборочной совокупности соответственно).

Среднеквадратичное отклонение имеет те же единицы измерения, что и анализируемый показатель, поэтому является сопоставимым с исходными данными.

Коэффициент вариации

Значение стандартного отклонения зависит от масштаба самих данных, что не позволяет сравнивать вариабельность разных выборках. Чтобы устранить влияние масштаба, необходимо рассчитать коэффициент вариации по формуле:

По нему можно сравнивать однородность явлений даже с разным масштабом данных. В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. В реальности, если коэффициент вариации превышает 33%, то специально ничего делать по этому поводу не нужно. Это информация для общего представления. В общем коэффициент вариации используют для оценки относительного разброса данных в выборке.

Расчет коэффициента вариации в Excel

Расчет коэффициента вариации в Excel также производится делением стандартного отклонения на среднее арифметическое:

=СТАНДОТКЛОН.В()/СРЗНАЧ()

Коэффициент вариации обычно выражается в процентах, поэтому ячейке с формулой можно присвоить процентный формат:

Коэффициент осцилляции

Еще один показатель разброса данных на сегодня – коэффициент осцилляции. Это соотношение размаха вариации (разницы между максимальным и минимальным значением) к средней. Готовой формулы Excel нет, поэтому придется скомпоновать три функции: МАКС, МИН, СРЗНАЧ.

Коэффициент осцилляции показывает степень размаха вариации относительно средней, что также можно использовать для сравнения различных наборов данных.

Таким образом, в статистическом анализе существует система показателей, отражающих разброс или однородность данных. 

Ниже видео о том, как посчитать коэффициент вариации, дисперсию, стандартное (среднеквадратичное) отклонение и другие показатели вариации в Excel.

Поделиться в социальных сетях:

statanaliz.info

коэффициент вариации может ли больше 100 процентов? Подсчитал, вышло 124 %

ВУЗы, Колледжи Юдаков Илья 2 (132) коэффициент вариации может ли больше 100 процентов? Подсчитал, вышло 124 % 6 лет

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *