Разное

Коэффициент относительной вариации: Коэффициент вариации (Variation coefficient) · Loginom Wiki

03.07.2021

Содержание

Коэффициент вариации — Coefficient of variation

Статистический параметр

В теории вероятностей и статистике , на коэффициент вариации ( CV ), также известный как относительное стандартное отклонение ( RSD ), является стандартизированная мера дисперсии в виде распределения вероятностей или распределения частот . Это часто выражается в процентах и определяется как отношение стандартного отклонения к среднему (или его абсолютному значению , ). CV или RSD широко используются в аналитической химии для выражения точности и повторяемости анализа . Он также обычно используется в таких областях, как инженерия или физика, при проведении исследований по обеспечению качества и анализа и анализа ANOVA . Кроме того, CV используется экономистами и инвесторами в экономических моделях .   σ {\ displaystyle \ \ sigma}   μ {\ displaystyle \ \ mu} | μ | {\ displaystyle | \ mu |}

Определение

Коэффициент вариации (CV) определяются как отношение стандартного отклонения к среднему значению , Это показывает степень изменчивости по отношению к средней части населения. Коэффициент вариации следует вычислять только для данных, измеренных по шкале отношений , то есть шкалам, которые имеют значимый ноль и, следовательно, позволяют относительное сравнение двух измерений (т. Е. Деление одного измерения на другое). Коэффициент вариации может не иметь никакого значения для данных на интервальной шкале . Например, большинство температурных шкал (например, Цельсия, Фаренгейта и т. Д.) Представляют собой интервальные шкалы с произвольными нулями, поэтому вычисленный коэффициент вариации будет различным в зависимости от того, какую шкалу вы использовали. С другой стороны, температура Кельвина имеет значимый ноль, полное отсутствие тепловой энергии и, таким образом, является шкалой отношений. Проще говоря, имеет смысл сказать, что 20 Кельвинов вдвое горячее, чем 10 Кельвинов, но только в этой шкале с истинным абсолютным нулем.

Хотя стандартное отклонение (SD) может быть измерено в Кельвинах, Цельсиях или Фаренгейтах, вычисленное значение применимо только к этой шкале. Только шкала Кельвина может использоваться для вычисления действительного коэффициента изменчивости.   σ {\ displaystyle \ \ sigma}   μ {\ displaystyle \ \ mu} c v знак равно σ μ . {\ displaystyle c _ {\ rm {v}} = {\ frac {\ sigma} {\ mu}}.}

Измерения с нормальным логарифмическим распределением демонстрируют стационарную CV; напротив, SD варьируется в зависимости от ожидаемого значения измерений.

Более надежная возможность заключается в квартиль коэффициент дисперсии , половину межквартильного диапазона , деленное на среднее значение квартили (The midhinge ), . ( Q 3 — Q 1 ) / 2 {\ displaystyle {(Q_ {3} -Q_ {1}) / 2}} ( Q 1 + Q 3 ) / 2 {\ displaystyle {(Q_ {1} + Q_ {3}) / 2}}

В большинстве случаев CV вычисляется для одной независимой переменной (например, для одного производственного продукта) с многочисленными повторяющимися измерениями зависимой переменной (например, ошибка в производственном процессе). Однако данные, которые являются линейными или даже логарифмически нелинейными и включают непрерывный диапазон для независимой переменной с разреженными измерениями по каждому значению (например, диаграмма разброса), могут поддаваться вычислению одиночного CV с использованием подхода оценки максимального правдоподобия .

Примеры

Набор данных [100, 100, 100] имеет постоянные значения. Его стандартное отклонение равно 0, а среднее значение равно 100, что дает коэффициент вариации как

0/100 = 0

Набор данных [90, 100, 110] более изменчив. Стандартное отклонение его выборки составляет 10, а среднее значение — 100, что дает коэффициент вариации как

10/100 = 0,1

Набор данных [1, 5, 6, 8, 10, 40, 65, 88] еще более изменчив. Его стандартное отклонение составляет 32,9, а среднее значение — 27,9, что дает коэффициент вариации

32,9 / 27,9 = 1,18

Примеры неправильного использования

Сравнение коэффициентов вариации между параметрами с использованием относительных единиц может привести к различиям, которые могут быть нереальными. Если мы сравним один и тот же набор температур в градусах Цельсия и Фаренгейта (обе относительные единицы, где кельвин и шкала Ренкина — их связанные абсолютные значения):

Цельсия: [0, 10, 20, 30, 40]

Фаренгейт: [32, 50, 68, 86, 104]

В выборочных стандартных отклонениях являются 15,81 и 28,46 соответственно. CV первого набора составляет 15,81 / 20 = 79%. Для второго набора (с теми же температурами) это 28,46 / 68 = 42%.

Если, например, наборы данных представляют собой показания температуры от двух разных датчиков (датчик Цельсия и датчик Фаренгейта), и вы хотите узнать, какой датчик лучше, выбрав тот, который имеет наименьшее отклонение, то вы будете введены в заблуждение, если будете использовать РЕЗЮМЕ. Проблема здесь в том, что вы разделили на относительное значение, а не на абсолютное.

Сравнивая тот же набор данных, теперь в абсолютных единицах:

Кельвин: [273,15, 283,15, 293,15, 303,15, 313,15]

Ренкин: [491,67, 509,67, 527,67, 545,67, 563,67]

В выборочных стандартных отклонениях по — прежнему 15,81 и 28,46, соответственно, поскольку стандартное отклонение не зависят от константы смещения. Однако теперь оба коэффициента вариации равны 5,39%.

С математической точки зрения коэффициент вариации не является полностью линейным. То есть для случайной величины коэффициент вариации равен коэффициенту вариации только тогда, когда . В приведенном выше примере градусы Цельсия можно преобразовать в градусы Фаренгейта только с помощью линейного преобразования формы с , тогда как градусы Цельсия можно преобразовать в градусы Ренкина с помощью преобразования формы . Икс {\ displaystyle X} а Икс + б {\ displaystyle aX + b} Икс {\ displaystyle X} б знак равно 0 {\ displaystyle b = 0} а Икс + б {\ displaystyle ax + b} б ≠ 0 {\ displaystyle b \ neq 0} а Икс {\ displaystyle ax}

Оценка

Когда доступна только выборка данных из совокупности, CV совокупности можно оценить, используя отношение стандартного отклонения выборки к среднему выборке : s {\ displaystyle s \,} Икс ¯ {\ displaystyle {\ bar {x}}}

c v ^ знак равно s Икс ¯ {\ displaystyle {\ widehat {c _ {\ rm {v}}}} = {\ frac {s} {\ bar {x}}}}

Но эта оценка, применяемая к выборке небольшого или среднего размера, имеет тенденцию быть слишком заниженной: это смещенная оценка . {s _ {\ rm {ln}}} \! \! — 1}}

Этот термин был задуман как аналог коэффициента вариации для описания мультипликативной вариации логнормальных данных, но это определение GCV не имеет теоретической основы как самооценки . c v {\ displaystyle c _ {\ rm {v}} \,}

Для многих практических целей (таких как определение размера выборки и вычисление доверительных интервалов ) именно он является наиболее полезным в контексте данных с нормальным логарифмическим распределением. При необходимости это можно вывести из оценки ВТС путем обращения соответствующей формулы. s л п {\ displaystyle s_ {ln} \,} c v {\ displaystyle c _ {\ rm {v}} \,}

Сравнение со стандартным отклонением

Преимущества

Коэффициент вариации полезен, потому что стандартное отклонение данных всегда следует понимать в контексте среднего значения данных. Напротив, фактическое значение CV не зависит от единицы измерения, поэтому это безразмерное число . Для сравнения наборов данных с разными единицами измерения или сильно различающимися средними значениями следует использовать коэффициент вариации вместо стандартного отклонения.

Недостатки

  • Когда среднее значение близко к нулю, коэффициент вариации приближается к бесконечности и, следовательно, чувствителен к небольшим изменениям среднего. Это часто бывает, если значения не основаны на шкале соотношений.
  • В отличие от стандартного отклонения, его нельзя использовать напрямую для построения доверительных интервалов для среднего.
  • CV не являются идеальным показателем достоверности измерения, когда количество повторов варьируется в разных выборках, потому что CV инвариантно к количеству повторов, в то время как достоверность среднего увеличивается с увеличением количества повторов. В этом случае рекомендуется использовать стандартную ошибку в процентах.

Приложения

Коэффициент вариации является обычным явлением в прикладных вероятностных таких областях, как теории восстановления , теории массового обслуживания и теории надежности . В этих полях экспоненциальное распределение часто более важно, чем нормальное распределение . Стандартное отклонение экспоненциального распределения равно его среднему значению, поэтому его коэффициент вариации равен 1. Распределения с CV <1 (например, распределение Эрланга ) считаются низко-дисперсионными, а с CV> 1 (например, распределение гипер-экспоненциальной ) считаются высокой дисперсией. Некоторые формулы в этих полях выражаются с использованием квадрата коэффициента вариации , часто обозначаемого сокращенно SCV. При моделировании вариацией CV является CV (RMSD). По сути, CV (RMSD) заменяет термин стандартного отклонения среднеквадратическим отклонением (RMSD) . Хотя многие естественные процессы действительно показывают корреляцию между средним значением и величиной вариации вокруг него, точные сенсорные устройства должны быть спроектированы таким образом, чтобы коэффициент вариации был близок к нулю, т. Е. Давал постоянную абсолютную погрешность по их величине. рабочий диапазон.

В актуарной науке CV известен как единичный риск .

В промышленной переработке твердых тел CV особенно важен для измерения степени однородности порошковой смеси. Сравнение рассчитанного CV со спецификацией позволит определить, была ли достигнута достаточная степень перемешивания.

Лабораторные измерения CV внутри анализов и между анализами

Измерения CV часто используются в качестве контроля качества для количественных лабораторных анализов . Хотя можно предположить, что CV внутри анализа и между анализами можно рассчитать путем простого усреднения значений CV по значениям CV для нескольких образцов в рамках одного анализа или путем усреднения нескольких оценок CV между анализами, было высказано предположение, что эти методы неверны и что требуется более сложный вычислительный процесс. Также было отмечено, что значения CV не являются идеальным показателем достоверности измерения, когда количество повторов варьируется в разных образцах — в этом случае предполагается, что стандартная ошибка в процентах выше. Если измерения не имеют естественной нулевой точки, тогда CV не является допустимым измерением, и рекомендуются альтернативные меры, такие как коэффициент внутриклассовой корреляции .

Как мера экономического неравенства

Коэффициент вариации отвечает требованиям к оценке экономического неравенства . Если x (с записями x i ) — это список значений экономического показателя (например, богатства), где x i — богатство агента i , то выполняются следующие требования:

  • Анонимность — c v не зависит от порядка в списке x . Это следует из того факта, что дисперсия и среднее не зависят от порядка x .
  • Масштабная инвариантность: c v ( x ) = c v x ), где α — действительное число.
  • Независимость от популяции — если { x , x } — это список x, добавленный к самому себе, то c v ({ x , x }) = c v ( x ). Это следует из того факта, что и дисперсия, и среднее подчиняются этому принципу.
  • Принцип передачи Пигу – Дальтона: когда богатство передается от более богатого агента i к более бедному агенту j (т. Е. X i  >  x j ) без изменения их ранга, тогда c v уменьшается, и наоборот.

c v принимает минимальное значение нуля для полного равенства (все x i равны). Его наиболее заметным недостатком является то, что он не ограничен сверху, поэтому его нельзя нормализовать, чтобы он находился в фиксированном диапазоне (например, как коэффициент Джини, который ограничен между 0 и 1). Однако он более податлив с математической точки зрения, чем коэффициент Джини. {2} / \ mu}

При обработке сигналов , в частности обработки изображений , обратное отношение (или его квадрат) называется отношением сигнал / шум в целом и отношением сигнал / шум (визуализация) в частности. μ / σ {\ displaystyle \ mu / \ sigma}

Другие связанные соотношения включают:

Смотрите также

Рекомендации

внешняя ссылка

  • cvequality : пакет R для проверки значительных различий между несколькими коэффициентами вариации

Как интерпретировать коэффициент вариации?

В таких примерах, как ваш, когда данные отличаются лишь аддитивно, то есть мы добавляем ко всему некоторую постоянную , тогда, как вы указываете, стандартное отклонение не изменяется, среднее значение изменяется именно на эту константу, и поэтому коэффициент вариации изменяется от σ / μ чтобы сг / ( μ + K ) , которая не является ни интересным , ни полезным.ККσ/ μσ/μσ/ (μ+k)σ/(μ+К)

Это мультипликативное изменение, которое интересно и где коэффициент вариации имеет некоторое применение. Для умножения всего на некоторую константу следует, что коэффициент вариации становится k σ / k µ , то есть остается таким же, как и раньше. Изменение единиц измерения является показательным примером, как в ответах @Aksalal и @Macond.ККk σ/ кμКσ/Кμ

Поскольку коэффициент вариации не содержит единиц измерения, он также не имеет размеров, поскольку любые единицы или измерения, которыми обладает базовая переменная, вымываются делением. Это делает коэффициент вариации мерой относительной изменчивости , поэтому относительная изменчивость длин может сравниваться с весовой и так далее. Одна область, где коэффициент вариации нашел некоторое описательное использование, является морфометрией размера организма в биологии.

В принципе и на практике коэффициент вариации определяется только полностью и вообще полезен для переменных, которые являются полностью положительными. Поэтому подробно ваш первый пример со значением не является подходящим примером. Другой способ увидеть это состоит в том, чтобы отметить, что если бы среднее значение всегда было равно нулю, коэффициент был бы неопределенным, а если бы среднее значение всегда было отрицательным, коэффициент был бы отрицательным, предполагая в последнем случае, что стандартное отклонение положительно. В любом случае мера станет бесполезной как мера относительной изменчивости или даже для какой-либо другой цели. 00

Эквивалентное утверждение состоит в том, что коэффициент вариации интересен и полезен только в том случае, если логарифмы определены обычным образом для всех значений, и, действительно, использование коэффициентов вариации эквивалентно рассмотрению изменчивости логарифмов.

Хотя это должно показаться невероятным для читателей здесь, я видел климатологических и географические публикации , в которых коэффициенты вариации температур по Цельсию озадачили наивные ученые, заметим , что коэффициенты могут взорваться , как средние температуры подобраться к C и стать отрицательным для средних температур ниже нуля Еще более странно, я видел предположения, что проблема решается с помощью Фаренгейта вместо этого. И наоборот, коэффициент вариации часто упоминается правильно как сводная мера, определяемая тогда и только тогда, когда шкалы измерения квалифицируются как шкала коэффициентов. Как это бывает, коэффициент вариации не особенно полезен даже для температур, измеряемых в Кельвинах, но по физическим причинам, а не по математическим или статистическим показателям.0∘0∘

Как и в случае со странными примерами из климатологии, которые я оставляю без ссылок, поскольку авторы не заслуживают ни уважения, ни позора, коэффициент вариации был чрезмерно использован в некоторых областях. Иногда наблюдается тенденция рассматривать его как своего рода магическую сводную меру, которая включает в себя как среднее, так и стандартное отклонение. Это естественно примитивное мышление, так как даже когда соотношение имеет смысл, из него невозможно восстановить среднее значение и стандартное отклонение.

В статистике коэффициент вариации является довольно естественным параметром, если вариация следует либо за гаммой, либо за логнормальным значением, что можно увидеть, посмотрев на форму коэффициента вариации для этих распределений.

Хотя коэффициент вариации может быть полезен, в тех случаях, когда он применяется, более полезным шагом является работа в логарифмическом масштабе, либо путем логарифмического преобразования, либо с использованием функции логарифмической связи в обобщенной линейной модели.

σ/ | μ |σ/|μ|

Вариации коэффициент в статистике — Справочник химика 21

    Многими исследователями предложены разные способы применения методологии информационных мер в нефтепромысловой геологии. Наиболее часто применяемыми оказались методы математической статистики и теории информации, использующие в качестве меры, выражаемой коэффициентом вариации по оцениваемому параметру, величину энтропии — критерий оценки [c.19]
    Относительная ширина ММР вычисляется как коэффициент вариации в статистике. Она равна соответственно [c.19]

    Коэффициент однородности гранулометрического состава. К. А. Богоявленский предложил использовать применяемый в математической статистике коэффициент вариации. Коэффициент однородности — это величина, обратная этому коэффициенту [c.44]

    При обработке результатов испытаний методами математической статистики неравномерность признака характеризуется коэффициентом вариации (см. стр. 90). [c.86]

    При рассмотрении практических данных по статистическим закономерностям простого смешения можно сделать вывод, что отношение дисперсий концентрации несмешанной и смешанной систем обычно составляет примерно 10″ (когда процесс завершается), а отношение соответствующих среднеквадратичных отклонений или коэффициентов вариации, — около 100. Того же порядка (10 —10″ ) и Ys —суммарная накопленная деформация сдвига в конце смешения. Возникает вопрос, случайно ли это совпадение Можно ли установить, иначе говоря, связь статистики и реологии простого смешения  [c.127]

    Нормированное отклонение р в уравнении (90) принимают исходя из объема выборки Пв, используемой для вычисления среднего квадратического отклонения 5 (коэффициента вариации V) и уровня значимости 1—Р, гарантирующего справедливость заданной относительной ошибки к с вероятностью Р. Табулированные значения /р, (или 1-р- ) здесь не приводятся, так как они имеются в многочисленной литературе по математической статистике. [c.119]

    Критерием, показывающим, насколько успешными были предпринятые меры предосторожности, является воспроизводимость метода. К сожалению, не все авторы исследуют воспроизводимость путем надлежащего статистического анализа адекватного числа случаев. Один из критериев, широко используемых в статистике, — коэффициент вариации (стандартное отклонение индивидуальных результатов, выраженное в процентах от среднего). Если индивидуальные результаты подчиняются закону нормального распределения, то 95% (Р = 0,95) этих результатов находятся внутри области, близкой к удвоенному коэффициенту вариации. При недостаточном числе параллельных определений не всегда возможно проверить, является ли распределение нормальным, и оценить истинное стандартное отклонение отклонение поэтому может соответствовать утроенному коэффициенту вариации или даже большей величине. Если коэффициент вариации равен 5%, то это означает, что индивидуальные результаты будут отклоняться от среднего значения при доверительной вероятности Р = 0,95 на 10ч- 15%. [c.10]

    Результаты вычисления величин коэффициентов вариации по данным измерений относительной прочности пород для разных слоев на шахте № 8 в соответствии с методами математической статистики (Митропольский, 1961) явились следуюш,ими для. слоя Рг = 26,0%, для слоя Рз/Рг = 30,7%, для слоя Рз = 20,6%.[c.65]

    Наиболее часто по формулам математической статистики производится оценка неоднородности результатов технологических и других видов испытаний материалов и изделий. Наряду со средним значением вычисляются среднее квадратическое отклонение, коэффициент вариации и другие показатели разброса. Обязательное определение этих показателей оговорено в некоторых стандартах и технических условиях на материалы или методы испытаний. Однако вычисление указанных величин еще не означает применения методов математической статистики, хотя во многих случаях является необходимым элементом последующего анализа результатов со статистических позиций. [c.65]

    Свойства стеклопластика имеют ярко выраженный вероятностный характер, что обусловлено природой материала и технологическими факторами. Так, коэффициент вариации при испытании стеклопластиковых образцов лежит в пределах 8-28%. Поэтому корректная обработка результатов наблюдений основана на применении методов теории вероятности и математической статистики. Зависимости между параметрами, получаемые в ходе испытаний, как правило, носят корреляционный характер и в той или иной степени приближаются к функциональным. Поэтому применение методов корреляционного анализа с оценкой степени тесноты свя- [c.56]

    Обычной мерой рассеяния в математической статистике является среднеквадратическое отклонение. Так как в нашем случае распределения количественно весьма отличны, то за меру рассеяния целесообразно взять среднеквадратическое отклонение в ее относительной форме, т. е. коэффициент вариации. [c.93]

    Термин коэффициент вариации является в математической статистике стандартным и должен заменить выражение средняя квадратичная ошибка, выраженная в процентах относительных и ему подобные (термины абсолютная и относительная ошибка в число нерекомендуемых не входят в этом нет противоречия, так как коэффициент вариации, как и средняя квадратичная ошибка, выражаемая в абсолютных величинах, характеризует не ошибку, а распределение ошибок).[c.23]

    Числовые показатели измеряемого свойства выражаются обобщенными сводными характеристиками, такими, как средняя арифметическая, модальная величина, коэффициент неровноты, коэффициент вариации и др. Вычисление указанных характеристик производится с помощью методов математической статистики. Образцы перед испытание.м подвергают вылежке при стандартном климате (относительной влажности 1 = 65 2% и температуре 7 =20 2°С в соответствии с ГОСТ 10681—63), в этих же атмосферных условиях производят и испытания. [c.13]

    Из вышеизложенного видно, насколько различны природные условия. Если к этому добавить вариации технических условий строительства скважин (глубина забоя, диаметр, длина и конструкция фильтра), то становится ясно, что стационарность функционирования скважин — явление скорее вероятностное, стохастическое, чем детерминированное. Поэтому для оценки идентичности работы скважин в режимах закачки и отбора корректно использование методов математической статистики и теории вероятностей. Для статистической обработки авторы использовали коэффициенты, характеризующие продуктивность и приемистость эксплуатационных скважин  [c.70]


Коэффициент вариации

                                     

1. Определение.

(Definition)

Коэффициент вариации определяется как отношение среднеквадратического отклонения σ к среднему μ: c v = σ μ {\свойства стиль отображения значение {\фрац {\Сигма }{\му }}}. он показывает степень изменчивости относительно средней пробы. коэффициент вариации должен быть вычислена только для данных, измеренных по соотношению уровня, т. е. весы, которые имеют значимый ноль и, следовательно, позвольте для относительного сравнения двух измерений. коэффициент вариации может не иметь никакого значения для данных интервала шкалы. например, большинство температурные шкалы являются интервальными шкалами с произвольным ноль, следовательно, вычисленный коэффициент вариации будет отличаться в зависимости от масштаба. С другой стороны, абсолютная температура оказывает существенное ноль, полное отсутствие тепловой энергии, и, таким образом, является шкала отношений. проще говоря, имеет смысл говорить что 20 Кельвин вдвое горячее чем 10 Кельвинов, но только в таком масштабе с истинно абсолютному нулю. хотя стандартное отклонение измеряется в градусах Кельвина, Цельсия или Фаренгейта, расчетную стоимость только в таком масштабе. только Кельвина шкала может быть использована для расчета фактического коэффициента вариации.

Измерения, которые распределены логарифмически нормальное продемонстрировать стационарный КВ, наоборот, КНО варьируется в зависимости от ожидаемых значений измерений.

Более надежный вариант-один из квартиль коэффициент дисперсии, половину диапазона межквартирных делим на средние квартили. В большинстве случаев, общая площадь вычисляется для одной независимой переменной например, одна фабрика для продукта с многих повторных измерений зависимой переменной например, ошибка в производственном процессе. но данные, лог-линейная, или даже нелинейной, и включают в себя непрерывный диапазон независимой переменной из разреженных измерений для каждого значения, например, диаграмма разброса может дать один расчет Q использование подхода максимального правдоподобия оценок.

Коэффициент вариации (CV) – Финансовая энциклопедия

Что такое Коэффициент вариации (CV)?

Коэффициент вариации (CV) – это статистическая мера разброса точек данных в серии данных вокруг среднего значения. Коэффициент вариации представляет собой отношение стандартного отклонения к среднему, и это полезный статистический показатель для сравнения степени вариации от одной серии данных к другой, даже если средние значения сильно отличаются друг от друга.

Понимание коэффициента вариации

Коэффициент вариации показывает степень изменчивости данных в выборке по отношению к среднему значению генеральной совокупности. В финансах коэффициент вариации позволяет инвесторам определить, насколько предполагается волатильность или риск по сравнению с суммой ожидаемого дохода от инвестиций. В идеале, если формула коэффициента вариации должна приводить к более низкому отношению стандартного отклонения к средней доходности, то тем лучше соотношение риска и доходности. Обратите внимание: если ожидаемая доходность в знаменателе отрицательна или равна нулю, коэффициент вариации может ввести в заблуждение.

Коэффициент вариации полезен при использовании соотношения риска / прибыли для выбора инвестиций. Например, инвестор, не склонный к риску, может захотеть рассмотреть активы с исторически низкой степенью волатильности по отношению к доходности по отношению к рынку в целом или его отрасли. И наоборот, инвесторы, ищущие риска, могут инвестировать в активы с исторически высокой степенью волатильности.

Хотя чаще всего используется для анализа разброса вокруг среднего, квартиля, квинтиля или дециля, CV также могут использоваться, например, для понимания вариации вокруг медианы или 10-го процентиля.

Краткая справка

Формула или расчет коэффициента вариации могут использоваться для определения отклонения между исторической средней ценой и текущими ценовыми характеристиками акции, товара или облигации по сравнению с другими активами.

Ключевые моменты

  • Коэффициент вариации (CV) – это статистическая мера относительного разброса точек данных в серии данных вокруг среднего значения.
  • В финансах коэффициент вариации позволяет инвесторам определить, насколько предполагается волатильность или риск по сравнению с суммой ожидаемого дохода от инвестиций.
  • Чем ниже отношение стандартного отклонения к средней доходности, тем лучше соотношение риска и доходности.

Формула коэффициента вариации

Ниже приведена формула расчета коэффициента вариации:

CVзнак равноσμжчере:σзнак равностпдр парddévяTяоп μзнак равномеан\ begin {align} & \ text {CV} = \ frac {\ sigma} {\ mu} \\ & \ textbf {где:} \\ & \ sigma = \ text {стандартное отклонение} \\ & \ mu = \ текст {среднее} \\ \ конец {выровненный}Взаимодействие с другими людьмирезюмезнак равноμ

Обратите внимание, что если ожидаемая доходность в знаменателе формулы коэффициента вариации отрицательна или равна нулю, результат может ввести в заблуждение.

Коэффициент вариации в Excel

Формулу коэффициента вариации можно выполнить в Excel, сначала используя функцию стандартного отклонения для набора данных. Затем вычислите среднее значение, используя предоставленную функцию Excel. Поскольку коэффициент вариации – это стандартное отклонение, деленное на среднее значение, разделите ячейку, содержащую стандартное отклонение, на ячейку, содержащую среднее значение.

Пример коэффициента вариации для выбора инвестиций

Например, рассмотрим не склонного к риску инвестора, который желает инвестировать в торгуемый на бирже фонд (ETF) , который представляет собой корзину ценных бумаг, отслеживающую индекс широкого рынка. Инвестор выбирает SPDR S&P 500 ETF, Invesco QQQ ETF и iShares Russell 2000 ETF. Затем он анализирует доходность и волатильность ETF за последние 15 лет и предполагает, что ETFs могут иметь доходность, аналогичную их долгосрочным средним показателям.

В иллюстративных целях для принятия решения инвестором используется следующая историческая информация за 15 лет:

  • Если SPDR S&P 500 ETF имеет среднегодовую доходность 5,47% и стандартное отклонение 14,68%, коэффициент вариации SPDR S&P 500 ETF составляет 2,68.
  • Если Invesco QQQ ETF имеет среднегодовую доходность 6,88% и стандартное отклонение 21,31%, коэффициент вариации QQQ равен 3,10.
  • Если iShares Russell 2000 ETF имеет среднегодовую доходность 7,16% и стандартное отклонение 19,46%, коэффициент вариации IWM составляет 2,72.

Основываясь на приблизительных цифрах, инвестор может инвестировать либо в SPDR S&P 500 ETF, либо в ETF iShares Russell 2000, поскольку соотношение риска и прибыли примерно одинаково и указывает на лучшее соотношение риска и доходности, чем в Invesco QQQ ETF.

Показатели разброса или вариации

Вариация — это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие   показатели вариации: размах вариации, среднее линейное отклонение, линейный коэффициент вариации, дисперсия, среднее квадратическое отклонение, квадратический коэффициент вариации.

Размах вариации

Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:

H=Xmax-Xmin

Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности.

Cреднее линейное отклонение

Cреднее линейное отклонение   — это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой — получим среднее линейное отклонение простое:

Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной — получим среднее линейное отклонение взвешенное:

Функция СРОТКЛ вычисляет среднее абсолютных значений отклонений точек данных от среднего, т.е. является мерой разброса множества данных.

Уравнение для среднего отклонения следующее:

Линейный коэффициент вариации

Линейный коэффициент вариации   — это отношение среднего линейного отклонения к средней арифметической:

С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.

Дисперсия

Дисперсия — это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой — получим дисперсию простую:

Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной — получим дисперсию взвешенную:

Если преобразовать формулу дисперсии (раскрыть скобки в числителе, почленно разделить на знаменатель и привести подобные), то можно получить еще одну формулу для ее расчета как разность средней квадратов и квадрата средней:

Если значения X — это доли совокупности, то для расчета дисперсии используют частную формулу дисперсии доли :

.

Функция ДИСПР вычисляет дисперсию для генеральной совокупности. (Для дисперсии по выборке используется функция ДИСП). Дисперсией (s2) называют среднюю арифметическую квадратов отклонений результатов наблюдений от их средней арифметической.

Уравнение для дисперсии имеет следующий вид:

Для функции ДИСП используется формула

Функция ДИСПРА вычисляет дисперсию для генеральной совокупности. В расчете помимо численных значений учитываются также текстовые и логические значения, такие как ИСТИНА или ЛОЖЬ.

Cреднее квадратическое отклонение

Выше уже было рассказано о формуле средней квадратической, которая применяется для оценки вариации путем расчета среднего квадратического отклонения, обозначаемое малой греческой буквой сигма:

Еще проще можно найти среднее квадратическое отклонение, если предварительно рассчитана дисперсия, как корень квадратный из нее:

Функция КВАДРОТКЛ возвращает сумму квадратов отклонений точек данных от их среднего.

Уравнение для суммы квадратов отклонений имеет следующий вид:

Функция СТАНДОТКЛОНП определяет среднее квадратическое или стандартное отклонение, равное арифметическому значению корня квадратного из дисперсии и имеющее ту же размерность, что и значение признака. Стандартное отклонение — это мера того, насколько широко разбросаны точки данных относительно их среднего.

СТАНДОТКЛОНП предполагает, что аргументы образуют всю генеральную совокупность. Если данные являются только выборкой из генеральной совокупности, то стандартное отклонение следует вычислять с использованием функции СТАНДОТКЛОН. Для больших выборок СТАНДОТКЛОН и СТАНДОТКЛОНП возвращают примерно равные значения.

СТАНДОТКЛОНП использует следующую формулу:

,

а СТАНДОТКЛОН —

Функция СТАНДОТКЛОНПА вычисляет стандартное отклонение по генеральной совокупности. В данном случае аргументами могут являться текст и логические значения.

Квадратический коэффициент вариации

Квадратический коэффициент вариации — это самый популярный относительный показатель вариации:

Критериальным значением квадратического коэффициента вариации V служит 0,333 или 33,3%, то есть если V меньше или равен 0,333 — вариация считает слабой, а если больше 0,333 — сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина —   нетипичной   и ее нельзя использовать как обобщающий показатель этой совокупности.

Средние величины, характеризуя ряд наблюдений, не отражают изменчивости наблюдавшихся значений признака, т.е. вариацию. Обычно рассматриваются меры наблюдений вокруг средних величин. Средняя арифметическая является основным видом средних, поэтому ограничимся рассмотрением мер рассеяния наблюдений вокруг средней арифметической.

Сумма отклонений результатов наблюдений от средней арифметической не может характеризовать вариацию наблюдений около средней арифметической, т.к. эта сумма равна нулю. Обычно берут или абсолютные величины или квадраты разностей. В результате получают различные показатели вариации: среднее отклонение, дисперсию или среднеквадратичное отклонение.

в начало


Показатели вариации

Вариация – различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

К показателям вариации относятся:

I группа — абсолютные показатели вариации

  • размах вариации
  • среднее линейное отклонение
  • дисперсия
  • среднее квадратическое отклонение

II группа — относительные показатели вариации

  • коэффициент вариации
  • коэффициент  осцилляции
  • относительное линейное отклонение

Самым элементарным показателем вариации признака является размах вариации R. Размах вариации показывает лишь крайние  (min, max) отклонения признака от общей средней.

Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Среднее линейное отклонение — средняя арифметическая абсолютных значений отклонений (модуль отклонений) отдельных вариантов от их средней арифметической:

  1. для несгруппированных данных (простое)
  2. для сгруппированных данных (взвешенное)

Дисперсия  признака — средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий:

  1. Простая дисперсия для несгруппированных данных
  2. Взвешенная дисперсия для вариационного ряда

Cвойства дисперсии:

  1. если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А- дисперсия не изменится; 
  2. если все значения признака уменьшить или увеличить в одно и то же число раз (k раз), то дисперсия уменьшится или увеличится в k раз.

Используя второе свойство дисперсии, можно получить формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:

где  i – величина интервала, X1 — новые (преобразованные) значения вариантов (А – условное начало, в качестве которого удобно использовать середину интервала или величину признака, обладающего наибольшей частотой.                   

                                                                    

  1. Момент второго порядка
  2. Квадрат момента первого порядка

Среднее квадратическое отклонение равно корню квадратному из дисперсии:

  1. для несгруппированных данных (простое)
  2. для вариационного ряда по сгруппированным данным (взвешенное)

Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются отдельные варианты от их среднего значения.

 Среднее значение альтернативного признака и его дисперсия

:
  1. Среднее значение альтернативного признака
  2. Дисперсия альтернативного признака

Подставив в формулу дисперсии q = 1 – p, получим:

Таким образом,  дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком и доли единиц, не обладающих данным признаком.

Среднее квадратическое отклонение альтернативного признака:

Показатели относительного рассеивания

Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах.  Они позволяют сравнивать характер рассеивания в различных распределениях  (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних,  при сравнении  разноименных  совокупностей). Расчет  показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к  средней  арифметической, умноженное на 100%.

1. Коэффициент  осцилляции  отражает  относительную  колеблемость крайних значений признака вокруг общей средней.

2. Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений (модуль отклонений) от средней величины.

3. Коэффициент вариации – отношение среднего квадратического отклонения к средней арифметической, применяется для сравнения вариаций различных признаков, используется как характеристика однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

Пример расчета абсолютных и относительных показателей вариации:

Распределение КФХ области по урожайности зерновых культур 

Группы хозяйств по урожайности (ц/га)

Середина интервала

Число хозяйств

Расчетные значения

Xi

ƒi

Xi ƒi

iср|

i – Хср|*ƒi

iср)2

iср)2 i

     9,1-15

12,1

2

24,20

12,44

24,87

154,641

309,28

   15,1-21,1

18,1

31

561,1

6,44

199,50

41,415

1283,88

   21,1-27,1

24,1

54

1301,40

0,44

23,52

0,190

10,24

   27,1-33,1

30,1

30

903,00

5,56

166,94

30,964

928,92

     > 33,1

36,1

7

252,7

11,56

80,95

133,738

936,17

Всего

X

124

3042,40

36,44

495,77

360,948

3468,48

Средние

X

X

24,54

X

4,00

 

27,97

Смотри также:

Обзор коэффициента вариации

Рассмотрите следующие две цели:

Стрелок №1

Стрелок №2

Стрелок №1 и Стрелок №2 выпустили по 15 выстрелов по своим мишеням. Кто лучший стрелок?

Большинство людей согласятся, что стрелок №1 лучше, поскольку все 15 его раундов сгруппированы внутри двух внутренних колец. Стрелок №2 довольно хорош, но многие его удары приходятся на третье кольцо; один даже приземлился на четвертом кольце.Поскольку минимизация отклонения от центрального яблочка является целью при стрельбе по мишени, а Стрелок №1 продемонстрировал меньшую вариацию из двух стрелков, то Стрелок №1 является лучшим стрелком. Верно?

Может и нет. Прежде чем мы решим, кто лучший стрелок, позвольте мне добавить к пазлу еще одну деталь:

Стрелок №1 находился в 10 метрах от мишени, а Стрелок №2 находился на расстоянии 1000 метров от мишени. Кто теперь лучший стрелок?

Примеры, подобные этому, раскрывают важное явление: при прочих равных вариация в наборе данных зависит от величины его среднего значения.А статистический инструмент, называемый коэффициентом вариации (CV), помогает нам сравнивать вариации наборов данных, когда величина измеряемых нами вещей отличается.

Давайте рассмотрим гипотетический пример из животного мира:

Представьте, что мы взвесили 100 каирских колючих мышей и 100 африканских слонов-бушей, а затем проанализировали данные. Мы можем найти что-то вроде этого:

Cairo Spiny Mice

Африканские слоны-кустарники
X-образный стержень = 42.61 грамм X-bar = 5910 килограмм
Стандартное отклонение = 3,20 грамма Стандартное отклонение = 395 килограммов

Что ж, неудивительно, что стандартное отклонение веса слонов намного больше, чем у мышей. Если бы это было неправдой, мир был бы намного страшнее!

Но при сравнении существ (или процессов) разных размеров возникает вопрос не «Как соотносятся их стандартные отклонения?», А «Как соотносятся их относительные стандартные отклонения и ?» И здесь действительно проявляется простой, но эффективный коэффициент вариации.Рассмотрим уравнение:

CV = (Стандартное отклонение / Среднее) * 100

Эта формула позволяет вам исследовать изменение ваших данных относительно к его среднему значению. Используя наше исследование мышей и слонов, мы находим:

CV мышей = (3,20 / 42,61) * 100 = 7,51%

C Слоны = (395/5910) * 100 = 6,68%

Итак, хотя очевидно, что ожидаемый диапазон веса мышей меньше, чем у слонов, может быть сюрпризом то, что их относительное распределение веса на самом деле больше.

CV также предлагает своим пользователям более удобный способ выражения стандартного отклонения. Вместо отдельного числа, такого как 3,20 грамма, теперь мы можем выразить его как процент от среднего, придав параметру некоторый необходимый контекст.

Заявки на резюме многочисленны. В финансах CV используется для измерения волатильности цены акции. В медицине CV используется для измерения сдвигов в результатах анализов пациента. А в производстве CV используется для сравнения тесно связанных процессов. Например, представьте себе операцию по резке пилой на заводе по производству труб с резьбой.Одна и та же пила может разрезать трубы самых разных диаметров и длин. Инженер по качеству может использовать CV для сравнения возможностей пилы в диапазоне длин пропила.

Для более глубокого изучения использования статистики, такой как резюме, для мониторинга и анализа производственного процесса, ознакомьтесь с онлайн-курсом под названием «Анализ возможностей процесса» и другими ресурсами на сайте themanufacturingacademy.com .

Упражнения по математике

]]>
  • Матрицы
  • Алгебра
  • Геометрия
  • Функции
  • Тригонометрия
  • Координатная геометрия
  • Комбинаторика
Сумма и ресторан Продукт на эскаларе Изделие Инверса
Мономы Полиномы Особые продукты Уравнения Квадратные уравнения
Радикальные выражения Системы уравнений Последовательности и серии Внутренний продукт Экспоненциальные уравнения
Матрицы Детерминанты Инверсия матрицы Логарифмические уравнения Системы трех переменных уравнений
Двумерные фигуры Площади Теорема Пифагора Расстояния
Графики Определение уклона Положительный или отрицательный наклон Определить наклон прямой Ecuación de una recta Уравнение прямой (из графика)
Квадратичная функция Posición relativa de dos rectas Асимптоты Пределы Distancias
Непрерывность и разрывы
Теорема Пифагора Синус Косинус Касательная Косеканс Секант

Котангенс

Тригонометрические идентификаторы
Тригонометрические функции острого угла Тригонометрические функции связанных углов Решение прямоугольных треугольников Закон косинусов Закон синусов
Ecuación de una recta Posición relativa de dos rectas Distancias Углы в пространстве Внутренний продукт
Факториал Варианты без повторения Вариации с повторением Перестановки с повторением Перестановки без повторов
Упражнения Круговые перестановки Биномиальный коэффициент Комбинации с повторением Комбинации без повторов
Среднее арифметическое

Мера относительной изменчивости | R-блогеры

[Эта статья была впервые опубликована на сайте Analysis с R и любезно предоставлена ​​R-блоггерам].(Вы можете сообщить о проблеме с содержанием на этой странице здесь)
Хотите поделиться своим контентом на R-блоггерах? щелкните здесь, если у вас есть блог, или здесь, если у вас его нет. Показателем относительной изменчивости является коэффициент вариации (КВ). В отличие от показателей абсолютной изменчивости, CV не имеет единицы измерения, когда дело доходит до сравнения дисперсий двух распределений разных единиц измерения. В R CV получается с использованием функции cv растрового пакета (чтобы установить пакет R, щелкните здесь).

Пример 1 . Ниже приведены среднее значение и стандартное отклонение количества часов, потраченных Тонетт на каждый экзамен по стохастическому процессу, а также соответствующие баллы, которые она получила из 100 заданий. Основываясь на этих данных, следует ли говорить, что количество часов, которые она потратила на обучение, более изменчиво, чем ее результаты на экзамене, или наоборот?

Переменная Среднее Стандартное отклонение
Часы обучения 25 2.6
Баллы 69 5,3

Чтобы определить это, мы используем функцию ниже

И, таким образом,

Интерпретация : Из вычисленного резюме очень ясно, что часы обучения равны более вариабельна, чем оценки за экзамен, даже если стандартное отклонение оценок выше, чем затраченные часы.

Пример 2 . Рассмотрим рост (в сантиметрах) 11 студентов младших курсов английского языка AB в MSU-TCTO: 151, 160, 162, 155, 154, 168, 153, 158, 157, 150 и 167.А также их соответствующие веса (в килограммах): 61, 69, 73, 65, 64, 78, 63, 68, 67, 60 и 77. Вычислите и интерпретируйте коэффициент вариации.

Используя функцию cv растрового пакета, мы получаем

Интерпретация : Вес учащихся более изменчив, чем их рост, что подтверждается вычисленным коэффициентом вариации.

Ссылка :

Асаад, Абубакар С. (2011). Упрощенная биостатистика .Манила: Rex Book Store, Inc.

Связанные

Коэффициент вариации | Психология Вики

Оценка | Биопсихология | Сравнительный | Познавательный | Развивающий | Язык | Индивидуальные различия | Личность | Философия | Социальные |
Методы | Статистика | Клиническая | Образовательная | Промышленное | Профессиональные товары | Мировая психология |

Статистика: Научный метод · Методы исследования · Экспериментальная дизайн · Курсы бакалавриата по статистике · Статистические тесты · Теория игры · Теория принятия решений


В теории вероятностей и статистике коэффициент вариации ( CV ) — это нормализованная мера дисперсии распределения вероятностей.Он также известен как унифицированный риск , или коэффициент вариации . Абсолютное значение CV иногда называют относительным стандартным отклонением (RSD), которое выражается в%. CV не следует использовать взаимозаменяемо с RSD (т. Е. Следует использовать один термин последовательно).

Коэффициент вариации (CV) определяется как отношение стандартного отклонения к среднему значению:

, что является обратной величиной отношения сигнал / шум.Он показывает степень изменчивости по отношению к среднему значению для населения.

Коэффициент вариации следует вычислять только для данных, измеренных по шкале отношений, т.е. измерений, которые могут принимать только неотрицательные значения. Коэффициент вариации может не иметь никакого значения для данных на интервальной шкале. [1] Например, большинство температурных шкал представляют собой интервальные шкалы (например, Цельсия, Фаренгейта и т. Д.), Они могут принимать как положительные, так и отрицательные значения. Шкала Кельвина имеет абсолютное нулевое значение, и отрицательные значения естественным образом возникнуть не могут.Следовательно, шкала Кельвина — это шкала отношений. В то время как стандартное отклонение (SD) может быть получено как по шкале Кельвина, так и по шкале Цельсия (обе приводят к одинаковым SD), CV имеет значение только как мера относительной изменчивости для шкалы Кельвина.

Часто лабораторные значения, измеренные с помощью хроматографических методов, имеют нормальное логарифмическое распределение. В этом случае CV будет постоянным в большом диапазоне измерений, тогда как SD будут варьироваться в зависимости от типичных измеряемых значений.

Когда доступна только выборка данных из генеральной совокупности, CV совокупности можно оценить, используя отношение стандартного отклонения выборки к среднему выборке:

Но эта оценка, когда применяется к выборке небольшого или среднего размера, имеет тенденцию быть слишком заниженной: это смещенная оценка. Для нормально распределенных данных несмещенная оценка [2] для выборки размера n:

Если предполагается, что данные распределены нормально логарифмически, более точная оценка, полученная из свойств логнормального распределения, [3] [4] [5] будет определяется как:

где — стандартное отклонение выборки данных после преобразования в натуральный логарифм.(В случае, если измерения записываются с использованием любого другого логарифмического основания, b, их стандартное отклонение преобразуется в основание e, а формула остается той же. [6] ) Эту оценку иногда называют «геометрической коэффициент вариации » [7] , чтобы отличить его от простой оценки, приведенной выше. Однако «геометрический коэффициент вариации» также был определен [8] как:

Этот термин должен был быть аналогом коэффициенту вариации для описания мультипликативной вариации логнормальных данных, но это определение GCV не имеет теоретической основы как самооценки.

Для многих практических целей (таких как определение размера выборки и расчет доверительных интервалов) именно он является наиболее полезным в контексте логарифмически нормально распределенных данных. При необходимости, это можно получить из оценки или GCV, инвертировав соответствующую формулу.

Сравнение со стандартным отклонением [править | править источник]

Преимущества [править | править источник]

Коэффициент вариации полезен, потому что стандартное отклонение данных всегда следует понимать в контексте среднего значения данных.Вместо этого фактическое значение CV не зависит от единицы измерения, поэтому это безразмерное число. Для сравнения наборов данных с разными единицами измерения или сильно различающимися средними значениями следует использовать коэффициент вариации вместо стандартного отклонения.

Недостатки [править | править источник]

  • Когда среднее значение близко к нулю, коэффициент вариации приближается к бесконечности и, следовательно, чувствителен к небольшим изменениям среднего.Это часто бывает, если значения не основаны на шкале соотношений.
  • В отличие от стандартного отклонения, его нельзя использовать напрямую для построения доверительных интервалов для среднего.

Коэффициент вариации также широко используется в прикладных областях вероятности, таких как теория восстановления, теория массового обслуживания и теория надежности. В этих полях экспоненциальное распределение часто более важно, чем нормальное распределение. Стандартное отклонение экспоненциального распределения равно его среднему значению, поэтому его коэффициент вариации равен 1.Распределения с CV <1 (например, распределение Эрланга) считаются низко-дисперсионными, тогда как распределения с CV> 1 (например, гиперэкспоненциальное распределение) считаются высокодисперсными. Некоторые формулы в этих полях выражаются с использованием квадрата коэффициента вариации , часто обозначаемого сокращенно SCV. При моделировании вариацией CV является CV (RMSD). По сути, CV (RMSD) заменяет термин стандартного отклонения среднеквадратическим отклонением (RMSD).

При условии, что отрицательные и небольшие положительные значения выборочного среднего возникают с незначительной частотой, распределение вероятностей коэффициента вариации для выборки размером n было показано Хендриксом и Роби [9] как

, где символ указывает, что суммирование проводится только по четным значениям n -1- i , т.е.е, если n является нечетным, суммируйте по четным значениям i и, если n является четным, суммируйте только по нечетным значениям i .

Это полезно, например, при построении тестов гипотез или доверительных интервалов. [ необходима ссылка ]

Стандартизированные моменты представляют собой аналогичные отношения, которые также безразмерны и не зависят от масштаба. Отношение дисперсии к среднему, является другим подобным соотношением, но не безразмерным и, следовательно, не инвариантным к масштабу.См. Нормализация (статистика) для дальнейших соотношений.

При обработке сигналов, в частности изображений, обратное отношение называется отношением сигнал / шум.

Шаблон: Дополнительные сноски

  1. В чем разница между порядковыми, интервальными и относительными переменными? Почему это должно меня беспокоить?. URL-адрес GraphPad Software Inc., дата обращения 22 февраля 2008 г.
  2. ↑ Sokal RR и Rohlf FJ. Биометрия (3-е изд.). Нью-Йорк: Фриман, 1995.п. 58. ISBN 0-7167-2411-1
  3. (1964). Доверительные интервалы для коэффициента вариации для нормального и логнормального распределений. Биометрика 51 : 25.
  4. (1992). Определение объема выборки для оценки биоэквивалентности с помощью доверительных интервалов. Международный журнал клинической фармакологии, терапии и токсикологии 30 Приложение 1 : S51–8.
  5. (2000). Почему фармакокинетические данные суммируются с помощью арифметических средств ?. Журнал биофармацевтической статистики 10 (1): 55–71.
  6. ↑ Рид Дж. Ф., Линн Ф., Мид Б. Д.. (2002) «Использование коэффициента вариации в оценке изменчивости количественных анализов». Clin Diagn Lab Immunol. 9 (6): 1235–1239. DOI: 10.1128 / CDLI.9.6.1235-1239.2002
  7. ↑ Sawant, S .; Мохан, Н. (2011) «Вопросы и ответы: вопросы анализа эффективности данных клинических испытаний с использованием SAS», PharmaSUG2011 , Paper PO08
  8. (1979).Геометрические средства и меры рассеивания. Биометрия 35 : 908–9.
  9. (1936). Выборочное распределение коэффициента вариации. Анналы математической статистики 7 (3): 129–32.

{enWP | Коэффициент вариации}}

Калькулятор коэффициента вариации

| Определение

Когда вы знаете стандартное отклонение и среднее значение для вашего набора данных, калькулятор коэффициента вариации поможет вам принять решение относительно этих данных.Вариант «большой» или «маленький»? Если вы сделаете новое случайное наблюдение, насколько близко вы ожидаете от него?

Прочтите, чтобы узнать:

  • Определение коэффициента вариации
  • Формула коэффициента вариации
  • Когда использовать коэффициент вариации
  • Интересный пример того, как вычислить коэффициент вариации

Что такое коэффициент вариации?

Коэффициент вариации (C v ) — это отношение стандартного отклонения к среднему значению , иногда выражаемое в процентах.

Например, вы можете сказать, что соотношение между стандартным отклонением и средним значением составляет 0,1 или 10%.

Как рассчитать коэффициент вариации

Формула коэффициента вариации:

Cv = (σ / μ) * 100%

, где σ — стандартное отклонение генеральной совокупности, а μ — среднее значение. * 100% используется только при выражении C v в процентах.

Это уравнение также может применяться к выборочным данным, где с используется для стандартного отклонения, а для среднего:

Cv = (s / x̅) * 100%

Для выборочных данных коэффициент вариации — это смещенная оценка коэффициента вариации генеральной совокупности.Формула коэффициента вариации немного изменена для расчета несмещенного коэффициента вариации , представленного как Ĉ v :

Ĉv = (1 + 1 / 4n) * Cv

, где n — размер выборки. Эта формула изменяет C v , чтобы он был больше при небольшом размере выборки. По мере увеличения n значение Ĉ v приближается к значению C v .

Подумайте об этом так: набор данных с большим размером выборки более точно представляет генеральную совокупность по сравнению с набором данных с небольшим размером выборки.

Коэффициент вариации и относительное стандартное отклонение

Коэффициент вариации (C v ) очень похож на относительное стандартное отклонение (RSD), с той лишь разницей, что коэффициент вариации может быть отрицательным, а RSD всегда положительным .

Коэффициент вариации скажет вам, является ли среднее отрицательным или положительным:

  • Положительное среднее дает положительный результат C v
  • Отрицательное среднее приводит к отрицательному результату C v

К счастью, запомнить легко.RSD, однако, часто используется, когда вы видите среднее значение ± стандартное отклонение (например, 11 ± 2% см).

Распространенное применение калькулятора коэффициента вариации

Калькулятор коэффициента вариации обычно используется для:

  • Провести анализ обеспечения качества
  • Оценить точность метода, например анализа в аналитической химии
  • Оценить соотношение риска и прибыли для вариантов инвестирования, таких как акции и облигации
  • Сравнить вариации двух наборов данных разными средствами

Когда не использовать коэффициент вариации

Вы не должны использовать коэффициент вариации для данных, которые находятся на шкале интервала .Шкалы интервалов не имеют истинного нуля , указывает на отсутствие количества, например температуры (в градусах Цельсия или Фаренгейта) или календарного года.

Также неуместно использовать коэффициент вариации , когда набор данных содержит как положительные, так и отрицательные числа .

Например, если вы зарегистрировали чистую дневную прибыль для киоска с лимонадом, то в одни дни чистая прибыль может быть положительной, а в другие — отрицательной. Если бы чистая прибыль была $ 5.00 в два дня и — 5,00 долларов США в следующие два дня, среднее значение будет 0 , а коэффициент вариации будет равен бесконечности , что не имеет большого смысла.

В любом наборе данных, где значения являются как положительными, так и отрицательными, среднее значение будет ближе к нулю, не обязательно влияя на стандартное отклонение. Расчет коэффициента вариации был бы необычно высоким, и он не мог бы точно отражать вариацию набора данных.

Интересный пример — Оцените метод оценки мармелада в банке

София собирается на вечеринку.Она знает, что будет банка, полная мармеладов, игра, где тот, кто предположит, будет самым близким к действительному количеству мармеладов в банке, получит приз (возможно, мармеладки)!

Чтобы подготовиться, София решает проверить точность метода, которому она научилась у своего дяди. Этот метод включал подсчет желейных бобов по стенке банки, умноженный на количество желейных бобов, соприкасающихся с дном банки.

София наполняет цилиндрическую банку мармеладом и подсчитывает количество мармеладов, встряхивая банку каждый раз перед следующей попыткой.Потом записала результаты: 80, 88, 76, 88, 91 .

На основе данных среднее значение составило 84,6 , а стандартное отклонение — 6,3 .

София затем рассчитала коэффициент вариации:

Cv = 6,3 / 84,6 * 100% = 7,4%

Поскольку размер ее выборки был небольшим, она изменяет коэффициент вариации, используя формулу несмещенного коэффициента вариации :

Ĉv = (1 + 1 / 4n) * Cv

Ĉv = 1 + 1 / (4 * 5) * 7.4% = 7,8%

Фактическое количество мармеладов было 86, поэтому расчетное среднее значение 84,6 было достаточно точным . Однако точность метода слишком сильно различалась, чтобы быть надежным с помощью одной оценки.

… на мероприятии

Чтобы усложнить задачу, встряхивать банку не разрешается на мероприятии, и каждый человек может видеть банку только в течение 1 минуты. Чтобы обеспечить победу, София формулирует стратегию:

  1. София подсчитала, что количество мармеладов в банке составляет 120, используя ту же технику, что и раньше.

  2. Основываясь на эмпирическом правиле, она размышляет о том, что ее предположение с вероятностью 68% находится в пределах одного стандартного отклонения (7,8%) от фактического количества мармеладов.

  3. Поскольку 7,8% от 120 составляют 9 мармеладов (120 * 0,078 = 9 ), София считает, что существует 68% -ная вероятность того, что фактическое количество мармеладов составляет 120 ± 9, или от 111 до 129 мармеладов .

  4. София собирает шесть друзей, и все они угадывают от 111 до 129 с шагом 3 мармелада :

111, 114, 117, 120, 123, 126, 129.

Выиграют ли София и ее друзья? Как бы вы улучшили эту стратегию? А еще лучше попробуйте сами!

Коэффициент вариации: значение, расчет, ограничения

Значение коэффициента вариации

Коэффициент вариации (CV) — это статистическая мера, которая помогает измерить относительную изменчивость данного ряда данных. Или мы можем сказать, что он измеряет распределение точек данных в соответствии со средним значением. Поскольку ключевыми факторами, участвующими в расчетах, являются стандартное отклонение и средние значения, следовательно, его также можно назвать отношением стандартного отклонения к среднему.Такой показатель помогает сравнить уровень отклонения между двумя или более наборами данных. Однако средние значения этих рядов данных отличаются друг от друга. CV или относительное стандартное отклонение всегда следует рассматривать по отношению к среднему значению.

Коэффициент вариации (CV) в финансах

В финансовом мире коэффициент вариации помогает определить волатильность по сравнению с ожидаемой окупаемостью инвестиций. Еще одно применение резюме состоит в том, что оно помогает сравнивать результаты различных тестов или опросов.Предположим, что CV двух опросов — A и B — составляет 5% и 10% соответственно, мы можем сказать, что опрос B имеет больше вариаций по отношению к его среднему значению.

Итак, мы можем сказать, что чем ниже значение CV или чем меньше отношение стандартного отклонения к среднему, тем оно лучше. Более низкое соотношение предполагает лучшее соотношение риска и доходности.

Следует отметить, что мы должны применять CV только к данным со шкалой отношения. CV не содержит значений для точек данных на шкале интервалов. Например, данные о температуре, такие как Цельсия или Фаренгейта, представляют собой шкалу интервалов.Однако шкала Кельвина — это шкала отношений. Или мы можем сказать, что если средняя или ожидаемая доходность равна 0 или отрицательна, то число CV может быть неточным.

Как найти коэффициент вариации?

Формула

Для расчета CV используется следующая формула.

CV = стандартное отклонение / ожидаемая доходность

Приведенная выше формула является общей. Для финансовых целей формула CV — волатильность / ожидаемая доходность.

Чтобы получить ответ в процентах, мы можем умножить полученное число на 100.

У нас также есть математическая формула для вычисления CV. И эта формула:

В формуле Xi — это случайная величина i th , X — среднее значение ряда данных, а N — количество переменных.

Ниже приведены шаги для расчета CV с использованием математической формулы:

Сначала определите случайные величины, которые являются частью ряда данных. Эти переменные будут Xi.

Во-вторых, найдите количество переменных. Это число будет N.

В-третьих, измерьте среднее значение ряда. Чтобы вычислить среднее значение, возьмите сумму всех случайных величин и разделите ее на количество переменных. Обозначьте среднее значение X.

В-четвертых, теперь рассчитайте стандартное отклонение. Для расчета SD нам необходимо определить две вещи — количество переменных в заданном ряду данных. И второй — отклонение каждой переменной от среднего значения.

Наконец, теперь поместите указанные выше значения среднего и SD в формулу или разделите SD на среднее.

Если задано стандартное отклонение, то это упрощается, и формула будет выглядеть следующим образом:

Стандартное отклонение / среднее значение ряда данных

Пример

Предположим, инвестор A хочет выбрать новую инвестицию для своего портфеля, которая безопасен, а также предлагает стабильную прибыль. Он выбрал следующие три варианта, из которых ему нужно выбрать один:

Вариант 1 — это акции компании ABC. Ожидаемая доходность акции составляет 15%, а ее волатильность — 9%.

Вариант 2 — это ETF с волатильностью 8% и ожидаемой доходностью 12%.

Вариант 3 — облигации с волатильностью 3% и ожидаемой доходностью 4%.

Чтобы найти лучший вариант среди трех, Инвестор А планирует рассчитать коэффициент вариации для всех трех. Используя приведенную выше формулу, ниже приведены резюме этих трех вариантов:

CV акций = (9% / 15%) * 100 = 60%

CV ETF = (8% / 12%) * 100 = 67%

CV облигаций = (3% / 4%) * 100 = 75%

На основе CV инвестор А должен инвестировать в акции, поскольку они имеют наименьшее CV или предлагают оптимальное соотношение риска и прибыли.

Коэффициент вариации по сравнению со стандартным отклонением

Стандартное отклонение и коэффициент вариации помогают измерить дисперсию данного набора данных. Говоря о SD, он показывает среднее расстояние между точкой данных и средним значением. SD равно нулю, если все точки данных в наборе данных одинаковы. На значение SD влияют высокие и низкие точки данных в наборе данных. Например, если точки данных более разбросаны, значение SD будет больше.

CV, с другой стороны, полезен, когда человек ничего не знает о наборе данных, кроме среднего и стандартного отклонения.По сути, это помогает принять решение при сравнении двух или более наборов данных. Или мы можем сказать, что CV дает значение, которое помогает нам легко точно сравнивать два или более наборов данных.

SD — это абсолютная мера дисперсии для распределения, а CV — относительная мера дисперсии. Мы можем рассчитать CV, если знаем SD (используя формулу, описанную выше).

Давайте рассмотрим пример, чтобы лучше понять разницу между ними. Предположим, игрок А имеет среднее значение 60 и стандартное отклонение 18, а игрок Б имеет среднее значение 48 и стандартное отклонение 12.Просто глядя на эту статистику, можно сделать вывод, что игрок А лучше, потому что у него больше голов, и разница в SD между ними также невелика.

Но если мы посчитаем CV для обоих игроков, мы получим 30% для A и 25% для B. Это означает, что дисперсия выше для A, или B лучше.

Коэффициент вариации — Приложения

CV — это простой, быстрый и эффективный способ сравнения различных наборов данных. По этой причине коэффициент вариации используется в нескольких областях, например:

Анализ вероятностей

CV очень полезен для анализа вероятностей.Например, его можно использовать в теории восстановления, теории массового обслуживания и теории надежности. В экспоненциальном распределении стандартное отклонение примерно такое же, как и среднее значение, и это приводит к тому, что CV равняется 1. Итак, если CV распределения меньше 1, то видно, что оно имеет низкую дисперсию. И, если CV больше 1, то распределение имеет высокую дисперсию.

Финансы

В сфере финансов резюме помогает выбрать между несколькими инвестиционными альтернативами.CV в финансах дает отношение риска к прибыли, где волатильность представляет собой риск, а среднее значение представляет собой вознаграждение или доходность инвестиций.

Чтобы принять решение, необходимо рассчитать CV различных ценных бумаг или вариантов инвестирования. Таким образом, инвестор получает соотношение риска и прибыли для различных ценных бумаг, чтобы принять инвестиционное решение.

Обычно инвестор выбирает инвестицию с более низким CV. Это потому, что он предлагает меньшую волатильность, но большую доходность.Но если средняя ожидаемая доходность меньше нуля, то использование ценных бумаг с более низким CV не выгодно.

Ограничения коэффициента вариации

Этот статистический инструмент также имеет несколько ограничений.

Ненадежно в нестабильных ситуациях —

Доходность от инвестиционного варианта могла значительно отличаться от среднего значения за последние несколько периодов или лет. Это может быть связано с неблагоприятными экономическими условиями или другими неконтролируемыми факторами.Ситуация, возможно, улучшилась в пользу инвестиционного варианта и может быть отличной возможностью возврата в настоящее время.

Стандартное отклонение для запаса при вычислении будет высоким, и, следовательно, будет высокий коэффициент вариации. Если инвестор полагается исключительно на эту цифру при принятии инвестиционного решения, он может не пойти на этот вариант. Следовательно, он может упустить возможность получить высокую прибыль.

Введение в заблуждение в случае отрицательных значений или нуля —

Эта статистическая мера может вводить в заблуждение или неверно, если среднегодовая доходность от инвестиционного варианта отрицательна или равна нулю.

Заключение

Коэффициент вариации является важным статистическим показателем для защиты рационального инвестора от нестабильных вариантов инвестирования. Он также может помочь в прогнозировании прибыли от любых инвестиций, поскольку учитывает данные за несколько периодов.

Он не основан исключительно на риске и возвращает данные только за один период или случай. Следовательно, это помогает принимать мудрые и правильные инвестиционные решения и достигать надлежащего баланса между риском и доходностью.Именно по этим причинам менеджеры портфелей и аналитики широко используют этот статистический инструмент в своих отчетах и ​​анализе. Однако, как объяснялось ранее, это также необходимо рассматривать в сочетании с другими аналогичными индикаторами для лучшего обзора.

Показать список литературы
  1. Коэффициент вариации [Источник]

Коэффициент вариации

Привет, янв,

Коэффициент вариации выражает стандартное отклонение в процентах от выборочного среднего.Это полезно, когда интерес представляет размер вариации относительно размера наблюдения, и это имеет то преимущество, что коэффициент вариации НЕЗАВИСИМО ОТ ЕДИНИЦ наблюдения. Например, значение стандартного отклонения набора гирь будет различным в зависимости от того, измеряются ли они в килограммах или фунтах. Однако коэффициент вариации будет одинаковым в обоих случаях, поскольку он не зависит от единицы измерения.

Значение, указывающее на то, что существует слишком много вариаций, похоже, зависит от субъекта.При поиске в Интернете мы нашли три приложения с разными значениями.

В приложении к спорту есть выписка

Коэффициент вариации индивидуальных результатов спортсмена обычно составляет несколько процентов.

Сайт о ламах, Llamapaedia, имеет страницу о тестировании волокон, которая содержит предложение о коэффициенте вариации

Желательно двадцать пять процентов или меньше.

И страница Статистика для анализа микрочипов, в которой говорится, что для своего приложения пользователь может установить значение, а затем приведены примеры 3% и 5%.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *