Формула расчёта коэффициента сезонности
Главная
Как управлять запасами
Блог
Как рассчитать коэффициент сезонности
- Блог
- 4 минуты
- Скачать pdf версию
Для того, чтобы сформировать заказ поставщикам, распределить запасы РЦ по филиалам и сбалансировать первые между вторыми, необходимо спрогнозировать спрос. Но важно понимать, что спрос не равно продажи.
Одним из факторов, влияющих на формирование спроса, является сезонность. В этой статье мы расскажем, что такое коэффициент сезонности и как его посчитать, почему для его расчёта лучше брать медиану, как и для чего нужно считать недельную сезонность и на какие ещё особенности этого показателя обратить внимание при прогнозировании спроса.
Формула коэффициента сезонности
Коэффициент сезонности показывает, как возрастают или падают продажи в определённый период. Одни товары лучше продаются летом, другие зимой, на третьи – высокий спрос один месяц в году. Расчёт коэффициента сезонности можно проводить разными методами. Рассмотрим два основных.
Классический метод по средним продажам
Для того чтобы рассчитать коэффициент сезонности, нужно найти средние продажи товаров для каждого года. Агрегируем данные по месяцам и считаем средние продажи за год. Затем делим продажи каждого месяца на год и получаем набор коэффициентов.
Для того чтобы рассчитать коэффициент сезонности, нужно найти средние продажи товаров для каждого года. Агрегируем данные по месяцам и считаем средние продажи за год. Затем делим продажи каждого месяца на год и получаем набор коэффициентов.
Коэффициент сезонности каждого месяца = продажи в штуках этого месяца/ продажи за год.
Коэффициент сезонности = среднее значение из коэффициентов по конкретным месяцам.
Рассмотрим на примере.
В строке 21 посчитаны средние продажи за год. Показатель февраля – 8307. Затем мы посчитали средние продажи за второй год. Цифра за февраль – 14243, и так далее для каждого года. После реальные продажи за каждый месяц (строка 20) поделили на средние – за год (строка 21).
7322/8307 = 0,8814 – это коэффициент сезонности для февраля.
Получаем набор коэффициентов для каждого месяца. Чтобы найти общий суммарный коэффициент по месяцу, берём среднее значение и получаем коэффициент сезонности.
Расчёт сезонности с очисткой от тренда
Первый шаг будет таким же, как и в предыдущем методе – суммируем продажи по месяцам. Затем вместо средних продаж рассчитываем тренд. В Exel это можно сделать с помощью функции «Тенденция». Затем проводим расчёт коэффициента сезонности для каждого месяца.
Итак, как считается коэффициент сезонности?
Коэффициент сезонности = Продажи в месяц/ тренд
После того как мы получили набор коэффициентов для каждого месяца, ищем не средние значения, а медиану. Это число, которое находится в середине. Половина получившихся значений выше его, а половина ниже. Рассмотрим на примере.
Итак, у нас есть данные по спросу по месяцам. Строим функцию тренда (с помощью функции «Тенденция» в Excel). Не забываем исключать дефициты и прочие факторы, которые могут привести к ошибкам в расчётах. Делим спрос на получившееся значение тренда и получаем коэффициент сезонности.
В чём ключевые отличия этого метода от классического? Во-первых, в расчёт коэффициента сезонности идёт не показатель средних продаж, а тренд. Во-вторых, вместо средних значений – медиана. Так, например, за апрель у нас всего шесть значений сезонности: два по 1,01, два ниже этого показателя и два выше. Значит, медианой для апреля будет показатель 1,01.
Почему лучше брать медиану?
Этот показатель наиболее стабилен к выбросу. Посмотрим на таблице ниже.
Мы видим: в январе 2017 года по товару был низкий коэффициент сезонности – 0,4. При этом в аналогичные периоды других лет продажи были стабильными – 1,2 – 1,3. Если посчитать среднее значение, мы получим, коэффициент 1,03. Это означает, что товар в этом месяце не обладает сезонностью, но это то не так. Медиана более устойчивый показатель. Если брать в расчёт её, то коэффициент будет 1,2. Это уже говорит об умеренной сезонности и ближе к правде.
Может быть и обратная ситуация. Например, товар в январе традиционно продаётся хуже, но в каком-то году был всплеск продаж. Возможно, на товар была акция или сработал какой-то другой фактор.
Если взять в расчёт средний показатель, мы увидим, что товар не обладает сезонностью. По медиане же мы получили коэффициент 0,9, который говорит, что продажи в январе ниже средних. Поэтому для расчёта сезонности по каждому месяцу лучше брать медиану.
Как считать: по отдельному товару или по группе?
Как правило, у продаж каждого отдельного товара внутри склада велик случайный фактор. И он в разы больше, чем влияние сезонности. Если считать коэффициенты сезонности по отдельным товарам, могут возникнуть сложности. Случайный фактор даст погрешность в расчётах, и коэффициенты сезонности будут посчитаны неправильно. Мы рекомендуем считать сезонность для группы товаров.
Как считается коэффициент сезонности в этом случае? Для начала агрегируем данные по группе товаров с похожей сезонностью. Считаем не по эскимо конкретной марки, а по всем эскимо, которые есть в продаже, или по всему мороженому.
Исключением могут быть только товары группы АХ в продуктовой рознице. Это позиции, которые стабильно и часто продаются. По ним допускается считать сезонность отдельно по каждому товару. В остальных случаях рекомендуем считать коэффициент сезонности по группам.
Нужно ли агрегировать данные для расчёта?
Чтобы минимизировать влияние случайного фактора, можно агрегировать данные для расчёта. Но делать это нужно только по складам и магазинам одинакового формата и похожего географического положения. Например, по всем магазинам у дома ЦФО или по супермаркетам Дальнего Востока. Возможно объединять похожие по географии магазины внутри города. Например, отдельно считать сезонность по проходным точкам, отдельно по магазинам в спальных районах и т.д. Делать прогноз с учётом сезонности одновременно для точки во Владивостоке и в Москве не имеет никакого смысла.
Как посчитать недельную сезонность?
Иногда этот показатель важен. Например, перед 8 марта традиционно растёт спрос на конфеты. Как считается коэффициент сезонности в таких случаях? Мы можем посчитать недельную сезонность так же, как и месячную. Агрегируем данные по неделям, даём им номера и считаем коэффициенты. Но у вас получится уже на 12, а 52 коэффициента. А чем больше декомпозиция данных, тем сложнее расчёты и их интерпретация. Если вам важен показатель недельной сезонности, рассчитывайте его отдельно.
Помимо недельной сезонности существует и внутринедельная. Например, продажи по алкогольным напиткам по пятницам и субботам всегда значительно выше, чем в другие дни недели. Нужно ли это учитывать? Если мы строим прогноз с учётом сезонности на месяц или больший период, то смысла в этом нет.
В месяце будет примерно одинаковое количество пятниц, суббот и других дней недели. Но если мы делаем заказ на какие-то скоропортящиеся продукты, конечно, показатель внутринедельной сезонности важен. Например, если мы заказываем молоко с маленьким сроком хранения на четверг и пятницу, логичнее опираться на данные по продажам в эти дни. Если же мы делаем заказ пастеризованного молока на месяц вперёд, то этот показатель не имеет значения.Расчет коэффициента атерогенности — Клиника 1
Коэффициент атерогенности – показатель, отражающий степень риска развития заболевания сердца и сосудов.
Коэффициент атерогенности – отношение «плохого» холестерола к «хорошему», характеризующее риск развития сердечно-сосудистых заболеваний.
Холестерол (ХС) – жироподобное вещество, жизненно необходимое организму. Он участвует в образовании клеточных мембран всех органов и тканей тела. На основе холестерола создаются гормоны, без которых невозможны рост, развитие организма и реализация функции воспроизведения. Из него образуются желчные кислоты, благодаря которым в кишечнике всасываются жиры.
Холестерол нерастворим в воде, поэтому для перемещения по организму он «упаковывается» в оболочку, состоящую из специальных белков – апопротеинов. Получившийся комплекс («холестерол + апопротеин») называется липопротеином. В крови циркулирует несколько типов липопротеинов, различающихся пропорциями входящих в их состав компонентов:
- липопротеины очень низкой плотности (ЛПОНП),
- липопротеины низкой плотности (ЛПНП),
- липопротеины высокой плотности (ЛПВП).
ЛПНП и ЛПОНП считаются «плохими» видами холестерола, так как они способствуют образованию в артериях бляшек, которые могут привести к инфаркту или инсульту. ЛПВП, напротив, называют «хорошим» холестеролом, потому что они удаляют избыточные количества холестерола низкой плотности со стенок сосуда.
В развитии атеросклеротических бляшек в сосудах значение имеет не только повышение общего количества холестерола в крови, но и соотношение между «плохим» и «хорошим» холестеролом. Именно его и отражает коэффициент атерогенности. Он рассчитывается по следующей формуле: КА = (общий ХС – ЛПВП)/ЛПВП.
Таким образом, для того чтобы определить КА, необходимо знать уровень общего холестерола и ЛПВП.
Оптимальным считается коэффициент атерогенности, равный 2-3.
Коэффициент атерогенности является ориентировочным показателем. Для более точной оценки риска развития атеросклероза и заболеваний сердца и сосудов лучше использовать точные значения общего холестерола, ЛПНП и ЛПВП.
Для чего используется исследование?
Тест на коэффициент атерогенности используется для того, чтобы оценить риск развития атеросклероза и проблем с сердцем и сосудами.
Изменение уровней «плохого» и «хорошего» холестерола и их соотношения само по себе, как правило, не проявляется никакими симптомами, поэтому их своевременное определение очень важно в профилактике сердечно-сосудистых заболеваний.
Когда назначается исследование?
Коэффициент атерогенности, как правило, является частью липидограммы, как и общий холестерол, ЛПВП, ЛПНП, ЛПОНП и триглицериды. Липидограмма может входить в стандартный набор анализов при профилактических осмотрах или сдаваться чаще, если человеку предписана диета с ограничением животных жиров и/или он принимает лекарства, снижающие уровень липидов. В этих случаях проверяют, достигает ли пациент целевого уровня значений холестерола и, соответственно, снижается ли у него риск сердечно-сосудистых заболеваний.
Кроме того, липидограмма назначается чаще, если в жизни пациента присутствуют факторы риска развития сердечно-сосудистых заболеваний:
- курение,
- у мужчин возраст более 45 лет, у женщин – более 55,
- повышенное артериальное давление (140/90 мм. рт. ст и выше),
- повышенный холестерол или сердечно-сосудистые заболевания у членов семьи (инфаркт или инсульт у ближайшего родственника мужкого пола моложе 55 лет или женщины моложе 65 лет),
- ишемическая болезнь сердца, перенесенный инфаркт сердечной мышцы или инсульт,
- сахарный диабет,
- избыточная масса тела,
- злоупотребление алкоголем,
- прием большого количества пищи, содержащей животные жиры,
- низкая физическая активность.
Если у ребенка выявлен повышенный холестерол или заболевания сердца, то впервые делать липидограмму или анализ на общий холестерол ему рекомендуется в возрасте от 2 до 10 лет.
Стоимость исследования
500
руб
Коэффициенты корреляции: положительный, отрицательный и нулевой
Коэффициенты корреляции — это индикаторы силы линейной связи между двумя разными переменными, x и y. Коэффициент линейной корреляции больше нуля указывает на положительную связь. Значение меньше нуля означает отрицательную связь. Наконец, нулевое значение указывает на отсутствие связи между двумя переменными x и y.
В этой статье объясняется значение коэффициентов линейной корреляции для инвесторов, как рассчитать ковариацию для акций и как инвесторы могут использовать корреляцию для прогнозирования рынка.
Основные выводы:
- Коэффициенты корреляции используются для измерения силы линейной зависимости между двумя переменными.
- Коэффициент корреляции больше нуля указывает на положительную связь, а значение меньше нуля указывает на отрицательную связь.
- Нулевое значение указывает на отсутствие связи между двумя сравниваемыми переменными.
- Отрицательная корреляция, или обратная корреляция, является ключевой концепцией создания диверсифицированных портфелей, способных лучше противостоять волатильности портфеля.
- Вычисление коэффициента корреляции занимает много времени, поэтому данные часто вставляются в калькулятор, компьютер или статистическую программу, чтобы найти коэффициент.
Понимание корреляции
Коэффициент корреляции ( ρ ) — это мера, определяющая степень, в которой движение двух разных переменных связано. Наиболее распространенный коэффициент корреляции, генерируемый корреляцией продукта-момента Пирсона, используется для измерения линейной зависимости между двумя переменными. Однако при нелинейной зависимости этот коэффициент корреляции не всегда может быть подходящей мерой зависимости.
Возможный диапазон значений коэффициента корреляции составляет от -1,0 до 1,0. Другими словами, значения не могут превышать 1,0 или быть меньше -1,0. Корреляция -1,0 указывает на идеальную отрицательную корреляцию, а корреляция 1,0 указывает на идеальную положительную корреляцию. Если коэффициент корреляции больше нуля, это положительная связь. И наоборот, если значение меньше нуля, это отрицательная связь. Нулевое значение указывает на отсутствие связи между двумя переменными.
При интерпретации корреляции важно помнить, что если две переменные коррелированы, это не означает, что одна является причиной другой.
Корреляция и финансовые рынки
На финансовых рынках коэффициент корреляции используется для измерения корреляции между двумя ценными бумагами. Например, когда две акции движутся в одном направлении, коэффициент корреляции положительный. И наоборот, когда две акции движутся в противоположных направлениях, коэффициент корреляции отрицательный.
Если коэффициент корреляции двух переменных равен нулю, между переменными нет линейной зависимости. Однако это только для линейной зависимости. Возможно, что переменные имеют сильную криволинейную связь. Когда значение ρ близко к нулю, обычно между -0,1 и +0,1, говорят, что переменные не имеют линейной связи (или имеют очень слабую линейную связь).
Например, предположим, что цены на кофе и компьютеры наблюдают и обнаруживают корреляцию +0,0008. Это означает, что между двумя переменными нет корреляции или взаимосвязи.
Инвестопедия / Хьюго ЛинРасчет ρ
Перед определением корреляции необходимо рассчитать ковариацию двух рассматриваемых переменных. Далее требуется стандартное отклонение каждой переменной. Коэффициент корреляции определяется путем деления ковариации на произведение стандартных отклонений двух переменных.
Стандартное отклонение — это мера разброса данных по сравнению со средним значением. Ковариация — это мера того, как две переменные изменяются вместе. Однако его величина неограничена, поэтому его трудно интерпретировать. Нормализованная версия статистики рассчитывается путем деления ковариации на произведение двух стандартных отклонений. Это коэффициент корреляции.
Корреляция знак равно р знак равно крышка ( Икс , Д ) о Икс о Д \text{Корреляция}=\rho=\frac{\text{cov}(X,Y)}{\sigma_X\sigma_Y} Корреляция=ρ=σXσYcov(X,Y)
Положительная корреляция
Положительная корреляция — когда коэффициент корреляции больше 0 — означает, что обе переменные движутся в одном направлении. Когда ρ равно +1, это означает, что две сравниваемые переменные имеют совершенно положительную связь; когда одна переменная движется вверх или вниз, другая переменная движется в том же направлении с той же величиной.
Чем ближе значение ρ к +1, тем сильнее линейная связь. Например, предположим, что значение цен на нефть напрямую связано с ценами на авиабилеты с коэффициентом корреляции +0,95. Связь между ценами на нефть и стоимостью авиабилетов имеет очень сильную положительную корреляцию, поскольку значение близко к +1. Так, если цена на нефть снижается, стоимость авиабилетов также снижается, а если цена на нефть растет, то снижаются и цены на авиабилеты.
На приведенной ниже диаграмме мы сравниваем один из крупнейших банков США, JPMorgan Chase & Co. (JPM), с биржевым фондом Financial Select SPDR (ETF) (XLF). Как вы понимаете, JPMorgan Chase & Co. должна иметь положительную корреляцию с банковской отраслью в целом. Мы видим, что коэффициент корреляции в настоящее время составляет 0,9.8, что свидетельствует о сильной положительной корреляции. Показание выше 0,50 обычно свидетельствует о положительной корреляции.
Понимание корреляции между двумя акциями (или одной акцией) и ее отраслью может помочь инвесторам оценить, как акции торгуются по сравнению с аналогами. Все типы ценных бумаг, включая облигации, секторы и ETF, можно сравнивать с коэффициентом корреляции.
Отрицательная корреляция
Отрицательная (обратная) корреляция возникает, когда коэффициент корреляции меньше 0. Это указывает на то, что обе переменные движутся в противоположном направлении. Короче говоря, любое значение от 0 до -1 означает, что две ценные бумаги движутся в противоположных направлениях. Когда ρ равно -1, говорят, что отношение полностью отрицательно коррелировано.
Короче говоря, если одна переменная увеличивается, другая переменная уменьшается с той же величиной (и наоборот). Однако степень отрицательной корреляции между двумя ценными бумагами может меняться со временем (и почти никогда они не всегда точно коррелируют).
Примеры отрицательной корреляции
Например, предположим, что проводится исследование для оценки взаимосвязи между наружной температурой и счетами за отопление. В исследовании делается вывод, что существует отрицательная корреляция между ценами на счета за отопление и температурой наружного воздуха. Коэффициент корреляции рассчитывается равным -0,9.6. Эта сильная отрицательная корреляция означает, что при понижении температуры снаружи растут цены на счета за отопление (и наоборот).
Когда дело доходит до инвестирования, отрицательная корреляция не обязательно означает, что ценных бумаг следует избегать. Коэффициент корреляции может помочь инвесторам диверсифицировать свой портфель, включив в него несколько инвестиций, имеющих отрицательную или низкую корреляцию с фондовым рынком. Короче говоря, при снижении риска волатильности в портфеле иногда противоположности притягиваются.
Например, предположим, что у вас есть сбалансированный портфель в размере 100 000 долларов, который вложен на 60% в акции и на 40% в облигации. В год сильных экономических показателей компонент акций вашего портфеля может принести доход в размере 12%, а компонент облигаций может принести доход -2%, потому что процентные ставки растут (что означает, что цены на облигации падают).
Таким образом, общая доходность вашего портфеля составит 6,4% ((12% x 0,6) + (-2% x 0,4). В следующем году, когда экономика заметно замедлится и процентные ставки будут снижены, ваш портфель акций может принести -5 %, в то время как доходность вашего портфеля облигаций может составлять 8 %, что дает вам общую доходность портфеля в размере 0,2 %.
Что, если бы вместо сбалансированного портфеля ваш портфель состоял на 100 % из акций? Используя те же предположения о доходности, ваш портфель, полностью состоящий из акций, будет иметь доходность 12% в первый год и -5% во второй год. Эти цифры явно более волатильны, чем доходность сбалансированного портфеля в 6,4% и 0,2%.
Коэффициент линейной корреляции
Коэффициент линейной корреляции — это число, рассчитанное на основе заданных данных, которое измеряет силу линейной связи между двумя переменными: x и y. Знак коэффициента линейной корреляции указывает направление линейной зависимости между x и y. Когда r (коэффициент корреляции) близок к 1 или −1, линейная зависимость сильна; когда он близок к 0, линейная зависимость слабая.
Даже для небольших наборов данных вычисления коэффициента линейной корреляции могут быть слишком длинными, чтобы выполнять их вручную. Таким образом, данные часто вводятся в калькулятор или, что более вероятно, в компьютер или статистическую программу для нахождения коэффициента.
Коэффициент Пирсона
Как расчет коэффициента Пирсона, так и базовая линейная регрессия позволяют определить линейную связь между статистическими переменными. Однако эти два метода различаются. Коэффициент Пирсона — это мера силы и направления линейной связи между двумя переменными без предположения о причинно-следственной связи. Коэффициент Пирсона показывает корреляцию, а не причинно-следственную связь. Коэффициенты Пирсона варьируются от +1 до -1, где +1 представляет собой положительную корреляцию, -1 представляет отрицательную корреляцию, а 0 представляет отсутствие связи.
Простая линейная регрессия описывает линейную зависимость между переменной отклика (обозначается y) и независимой переменной (обозначается x) с использованием статистической модели. Статистические модели используются для прогнозирования.
Упрощение линейной регрессии путем расчета корреляции с помощью программного обеспечения, такого как Excel.
В финансах, например, корреляция используется в нескольких анализах, включая расчет стандартного отклонения портфеля. Поскольку это занимает много времени, корреляцию лучше всего рассчитывать с помощью программного обеспечения, такого как Excel. Корреляция объединяет статистические понятия, а именно дисперсию и стандартное отклонение. Дисперсия — это дисперсия переменной вокруг среднего значения, а стандартное отклонение — это квадратный корень из дисперсии.
Поиск корреляции с помощью Excel
Существует несколько методов расчета корреляции в Excel. Самый простой — получить два набора данных рядом и использовать встроенную формулу корреляции:
Investopedia.comЕсли вы хотите создать корреляционную матрицу для ряда наборов данных, в Excel есть подключаемый модуль анализа данных, который находится на вкладке «Данные» в разделе «Анализ».
Выберите таблицу возвратов. В этом случае наши столбцы имеют заголовки, поэтому мы хотим установить флажок «Ярлыки в первой строке», чтобы Excel знал, что их следует рассматривать как заголовки. Затем вы можете выбрать вывод на тот же лист или на новый лист.
Investopedia.comКак только вы нажмете Enter, данные будут созданы автоматически. Вы можете добавить текст и условное форматирование, чтобы очистить результат.
Investopedia.comКоэффициент линейной корреляции Часто задаваемые вопросы
Что такое коэффициент линейной корреляции?
Коэффициент линейной корреляции — это число, рассчитанное на основе заданных данных, которое измеряет силу линейной связи между двумя переменными, x и y.
Как найти коэффициент линейной корреляции?
Корреляция объединяет несколько важных и связанных статистических понятий, а именно дисперсию и стандартное отклонение. Дисперсия — это дисперсия переменной вокруг среднего значения, а стандартное отклонение — это квадратный корень из дисперсии.
Формула:
р знак равно н ( ∑ Икс у ) − ( ∑ Икс ) ( ∑ у ) [ н ∑ Икс 2 − ( ∑ Икс ) 2 ] [ н ∑ у 2 − ( ∑ у ) 2 ) ] \bold{r}=\frac{n(\sum xy)-(\sum x)(\sum y)}{\sqrt{[n\sum x^2-(\sum x)^2][n\ сумма у ^ 2-(\ сумма у) ^ 2)]}} r=[n∑x2−(∑x)2][n∑y2−(∑y)2)]n(∑xy)−(∑x)(∑y)
Вычисления слишком длительны, чтобы выполнять их вручную, а программное обеспечение, такое как Excel или статистическая программа, являются инструментами, используемыми для расчета коэффициента.
Что подразумевается под линейной корреляцией?
Коэффициент корреляции – это значение от -1 до +1. Коэффициент корреляции +1 указывает на идеальную положительную корреляцию. Когда переменная x увеличивается, переменная y увеличивается. Когда переменная x уменьшается, переменная y уменьшается. Коэффициент корреляции -1 указывает на полную отрицательную корреляцию. По мере увеличения переменной x переменная z уменьшается. Когда переменная x уменьшается, переменная z увеличивается.
Как найти коэффициент линейной корреляции на калькуляторе?
Графический калькулятор необходим для расчета коэффициента корреляции. Следующие инструкции предоставлены Statology.
Шаг 1. Включите диагностику
Вам нужно будет сделать этот шаг только один раз на вашем калькуляторе. После этого вы всегда можете начать с шага 2 ниже. Если вы этого не сделаете, r (коэффициент корреляции) не будет отображаться при запуске функции линейной регрессии.
- Нажмите [2nd], а затем [0], чтобы войти в каталог вашего калькулятора. Прокрутите, пока не увидите «диагностика включена».
- Нажимайте Enter, пока на экране калькулятора не появится надпись «Готово».
Важно повторить: вам никогда не придется делать это снова, если вы не перезагрузите свой калькулятор.
Шаг 2: введите данные
Введите свои данные в калькулятор, нажав [STAT], а затем выбрав 1:Редактировать. Чтобы упростить задачу, вы должны ввести все свои «данные x» в L1 и все ваши «данные y» в L2.
Шаг 3: Расчет!
После того, как вы введете свои данные, вы перейдете к [STAT], а затем к меню CALC вверху. Наконец, выберите 4:LinReg и нажмите Enter.
Вот и все! Готово! Теперь вы можете просто считать коэффициент корреляции прямо с экрана (это r). Помните, если r не отображается на вашем калькуляторе, значит, необходимо включить диагностику. Это то же самое место на калькуляторе, где вы найдете уравнение линейной регрессии и коэффициент детерминации.
Итог
Коэффициент линейной корреляции может быть полезен при определении связи между инвестициями и рынком в целом или другими ценными бумагами. Он часто используется для прогнозирования доходности фондового рынка. Это статистическое измерение полезно во многих отношениях, особенно в финансовой сфере.
Например, это может быть полезно для определения того, насколько хорошо ведет себя взаимный фонд по сравнению с его эталонным индексом, или его можно использовать для определения того, как взаимный фонд ведет себя по отношению к другому фонду или классу активов. Добавляя взаимный фонд с низкой или отрицательной корреляцией к существующему портфелю, вы получаете преимущества диверсификации.
Простое определение, формула, простые шаги расчета
Коэффициенты корреляции используются для измерения того, насколько сильна связь между двумя переменными. Существует несколько типов коэффициента корреляции, но наиболее популярным является коэффициент Пирсона. Корреляция Пирсона (также называемая R Пирсона) — это коэффициент корреляции , обычно используемый в линейной регрессии. Если вы начинаете заниматься статистикой, вы, вероятно, узнаете о 9 Пирсоновских0023 R первый. На самом деле, когда кто-то ссылается на коэффициент корреляции , он обычно имеет в виду коэффициент Пирсона.
Посмотрите видео с обзором коэффициента корреляции или прочитайте ниже:
Знакомство с коэффициентом корреляции
Посмотрите это видео на YouTube.
Видео не видно? Кликните сюда.
Содержание:
- Что такое коэффициент корреляции?
- Что такое корреляция Пирсона? Как рассчитать:
- Вручную
- ТИ 83
- Эксель
- СПСС
- Минитаб
- Что означают результаты?
Формулы коэффициента корреляции используются, чтобы определить, насколько сильна связь между данными. Формулы возвращают значение от -1 до 1, где:
- 1 указывает на сильную положительную связь.
- -1 указывает на сильную отрицательную связь.
- Нулевой результат означает полное отсутствие связи.
Графики, демонстрирующие корреляцию -1, 0 и +1
Значение
- Коэффициент корреляции, равный 1, означает, что при каждом положительном увеличении одной переменной происходит положительное увеличение фиксированной пропорции другой. Например, размеры обуви увеличиваются в (почти) идеальной зависимости от длины стопы.
- Коэффициент корреляции, равный -1, означает, что при каждом положительном увеличении одной переменной происходит отрицательное уменьшение другой в фиксированной пропорции. Например, количество бензина в баке уменьшается в (почти) полной корреляции со скоростью.
- Ноль означает, что для каждого увеличения нет положительного или отрицательного увеличения. Эти два просто не связаны.
Абсолютное значение коэффициента корреляции дает нам силу связи. Чем больше число, тем сильнее связь. Например, |-.75| = 0,75, что имеет более сильную связь, чем 0,65.
Нравится объяснение? Прочтите «Руководство по статистике практического мошенничества», в котором есть сотни пошаговых решений задач!
Типы формул коэффициентов корреляции.
Существует несколько типов формул коэффициента корреляции.
Одной из наиболее часто используемых формул является формула коэффициента корреляции Пирсона. Если вы посещаете базовый курс статистики, вы, вероятно, будете использовать это:
Коэффициент корреляции Пирсона
Обычно используются две другие формулы: коэффициент корреляции выборки и коэффициент корреляции генеральной совокупности.
Коэффициент корреляции выборки
S x и s y — стандартные отклонения выборки, а s xy — ковариация выборки.
Коэффициент корреляции населения
Коэффициент корреляции населения использует σ x и σ y в качестве стандартных отклонений населения, и σ xy как ковариация населения.
Посетите мой канал Youtube, чтобы получить дополнительные советы и помощь со статистикой!
В начало
Корреляция между наборами данных является мерой того, насколько хорошо они связаны. Наиболее распространенной мерой корреляции в статистике является корреляция Пирсона. Полное название: Pearson Product Moment Correlation (PPMC) . Он показывает линейную зависимость между двумя наборами данных. Проще говоря, он отвечает на вопрос: Могу ли я нарисовать линейный график для представления данных? Для обозначения корреляции Пирсона используются две буквы: греческая буква rho (ρ) для генеральной совокупности и буква «r» для выборки.
Возможные проблемы с корреляцией Пирсона.
PPMC не может определить разницу между зависимыми переменными и независимыми переменными. Например, если вы пытаетесь найти корреляцию между высококалорийной диетой и диабетом, вы можете найти высокую корреляцию 0,8. Однако вы также можете получить тот же результат с переключением переменных. Другими словами, можно сказать, что диабет вызывает высококалорийную диету. Это явно не имеет смысла. Следовательно, как исследователь, вы должны быть осведомлены о данных, которые вы подключаете. Кроме того, PPMC не предоставит вам никакой информации о наклоне линии; это только говорит вам, есть ли отношения.
Пример из реальной жизни
Корреляция Пирсона используется в тысячах реальных жизненных ситуаций. Например, ученые в Китае хотели узнать, существует ли связь между генетическими различиями популяций сорного риса. Цель состояла в том, чтобы выяснить эволюционный потенциал риса. Была проанализирована корреляция Пирсона между двумя группами. Он показал положительную корреляцию момента продукта Пирсона между 0,783 и 0,895 для сорных популяций риса. Эта цифра достаточно высока, что свидетельствует о достаточно прочной связи.
Если вы хотите увидеть больше примеров PPMC, вы можете найти несколько исследований на веб-сайте Openi Национального института здравоохранения, которые показывают результаты различных исследований, от визуализации кисты молочной железы до роли, которую углеводы играют в потере веса.
Вернуться к началу
Посмотрите видео, чтобы узнать, как найти PPMC вручную.
Как найти коэффициент корреляции Пирсона (вручную)
Посмотрите это видео на YouTube.
Видео не видно? Кликните сюда.
Пример вопроса : Найдите значение коэффициента корреляции из следующей таблицы:
Субъект | Возраст x | Уровень глюкозы y | 1 | 43 | 99 |
---|---|---|
2 | 21 | 65 | 3 | 25 | 79 |
4 | 42 | 75 | 5 | 57 | 87 |
6 | 59 | 81 |
Шаг 1: Создайте диаграмму. Используйте полученные данные и добавьте еще три столбца: xy, x 2 и y 2 .
Субъект | Возраст x | Уровень глюкозы y | ху | х 2 | г 2 | 1 | 43 | 99 |
---|---|---|---|---|---|
2 | 21 | 65 | 3 | 25 | 79 |
4 | 42 | 75 | 5 | 57 | 87 |
6 | 59 | 81 |
Шаг 2: Умножьте x и y, чтобы заполнить столбец xy. Например, строка 1 будет 43 × 9.9 = 4257 .
Субъект | Возраст x | Уровень глюкозы y | ху | х 2 | г 2 | 1 | 43 | 99 | 4257 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 3 | 25 | 79 | 1975 |
4 | 42 | 75 | 3150 | 5 | 57 | 87 | 4959 |
6 | 59 | 81 | 4779 |
Шаг 3: Возьмите квадрат чисел в столбце x и поместите результат в столбец x 2 .
Тема | Возраст x | Уровень глюкозы y | ху | х 2 | г 2 | 1 | 43 | 99 | 4257 | 1849 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 3 | 25 | 79 | 1975 | 625 |
4 | 42 | 75 | 3150 | 1764 | 5 | 57 | 87 | 4959 | 3249 |
6 | 59 | 81 | 4779 | 3481 |
Шаг 4: Возьмем квадрат чисел в столбце у и поместим результат в столбец у 2 .
Субъект | Возраст x | Уровень глюкозы y | ху | х 2 | г 2 | 1 | 43 | 99 | 4257 | 1849 | 9801 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 4225 | 3 | 25 | 79 | 1975 | 625 | 6241 |
4 | 42 | 75 | 3150 | 1764 | 5625 | 5 | 57 | 87 | 4959 | 3249 | 7569 |
6 | 59 | 81 | 4779 | 3481 | 6561 |
Шаг 5: Сложите все числа в столбцах и поместите результат в конец столбца. Греческая буква сигма (Σ) — это сокращенный способ сказать «сумма» или суммирование.
Субъект | Возраст х | Уровень глюкозы y | ху | х 2 | г 2 | 1 | 43 | 99 | 4257 | 1849 | 9801 |
---|---|---|---|---|---|
2 | 21 | 65 | 1365 | 441 | 4225 | 3 | 25 | 79 | 1975 | 625 | 6241 |
4 | 42 | 75 | 3150 | 1764 | 5625 | 5 | 57 | 87 | 4959 | 3249 | 7569 |
6 | 59 | 81 | 4779 | 3481 | 6561 |
Σ | 247 | 486 | 20485 | 11409 | 40022 |
Шаг 6: Используйте следующую формулу коэффициента корреляции.
Ответ: 2868 / 5413,27 = 0,529809
Щелкните здесь, если вам нужны простые пошаговые инструкции по решению этой формулы.
Из нашей таблицы:
- Σx = 247
- Σу = 486
- Σху = 20 485
- Σx 2 = 11 409
- Σy 2 = 40 022
- n — объем выборки, в нашем случае = 6
Коэффициент корреляции =
- 6(20 485) – (247 × 486) / [√[[6(11 409) – (247 2 )] × [6(40,022) – 486 2 ]]]
= 0,5298
Диапазон коэффициента корреляции от -1 до 1. Наш результат 0,5298 или 52,98%, что означает, что переменные имеют умеренную положительную корреляцию.
Наверх.
Нравится объяснение? Прочтите «Руководство по статистике практического мошенничества», в котором есть еще сотни пошаговых объяснений, таких как это!
Если вы принимаете статистику AP, вам фактически не придется работать с формулой корреляции вручную. Вы будете использовать свой графический калькулятор. Вот как найти r на TI83.
Шаг 1: Введите данные в список и постройте точечный график, чтобы убедиться, что ваши переменные примерно коррелируют. Другими словами, ищите прямую линию. Не знаете, как это сделать? См.: TI 83 Диаграмма рассеяния.
Шаг 2: Нажмите кнопку STAT.
Шаг 3: Прокрутите вправо до меню CALC.
Шаг 4: Прокрутите вниз до 4:LinReg(ax+b), затем нажмите ENTER. Вывод покажет «r» в самом низу списка.
Совет : Если вы не видите r, включите диагностику, а затем повторите шаги.
Посмотрите видео:
Найдите коэффициент корреляции в Excel
Посмотрите это видео на YouTube.
Видео не видно? Кликните сюда.
Шаг 1: Введите данные в два столбца в Excel. Например, введите данные «x» в столбец A и данные «y» в столбец B.
Шаг 2: Выберите любую пустую ячейку.
Шаг 3: Нажмите функциональную кнопку на ленте.
Шаг 4: Введите «корреляция» в поле «Поиск функции».
Шаг 5: Нажмите «Перейти». КОРРЕЛ будет выделен.
Шаг 6: Нажмите «ОК».
Шаг 7: Введите местоположение ваших данных в поля «Массив 1» и «Массив 2» . В этом примере введите «A2:A10» в поле «Массив 1», а затем введите «B2:B10» в поле «Массив 2».
Шаг 8: Нажмите «ОК». Результат появится в ячейке, выбранной на шаге 2. Для этого конкретного набора данных коэффициент корреляции (r) равен -0,1316.
Предупреждение. Результаты этого теста могут ввести в заблуждение, если только вы не построили точечный график, чтобы убедиться, что ваши данные примерно соответствуют прямой линии. Коэффициент корреляции в Excel 2007 будет , всегда будет возвращать значение, даже если ваши данные отличаются от линейных (т. е. данные соответствуют экспоненциальной модели).
Вот и все!
Подпишитесь на наш канал Youtube, чтобы получать дополнительные советы и статистику по Excel.
Наверх.
Посмотрите видео для шагов:
Коэффициент корреляции Пирсона в SPSS
Посмотрите это видео на YouTube.
Видео не видно? Кликните сюда.
Шаг 1: Нажмите «Анализ», затем нажмите «Корреляция», затем нажмите «Двумерный анализ». Появится окно Двумерные корреляции.
Шаг 2: Щелкните одну из переменных в левом всплывающем окне Двумерные корреляции. Затем щелкните центральную стрелку, чтобы переместить переменную в окно «Переменные:». Повторите это для второй переменной.
Шаг 3: Установите флажок «Pearson» , если он еще не установлен. Затем щелкните переключатель «односторонний» или «двусторонний» тест. Если вы не уверены, является ли ваш тест односторонним или двусторонним, см. раздел: Это односторонний или двусторонний тест?
Шаг 4: Нажмите «ОК» и прочтите результаты. Каждое поле в выходных данных показывает корреляцию между двумя переменными. Например, PPMC для числа старших братьев и сестер и среднего балла составляет -0,098, что означает практически отсутствие корреляции. Вы можете найти эту информацию в двух местах в выходных данных. Почему? Эти перекрестные ссылки на столбцы и строки очень полезны, когда вы сравниваете PPMC для десятков переменных.
Совет № 1: Всегда полезно сделать точечный график SPSS для набора данных до выполнения этого теста. Это потому, что SPSS будет всегда давать вам какой-то ответ и будет предполагать, что данные линейно связаны. Если у вас есть данные, которые могут лучше подходить для другой корреляции (например, экспоненциально связанные данные), SPSS по-прежнему будет запускать для вас Pearson, и вы можете получить вводящие в заблуждение результаты.
Совет № 2 : Нажмите кнопку «Параметры» в окне «Двумерные корреляции», если вы хотите включить описательную статистику, такую как среднее значение и стандартное отклонение.
Вернуться к началу.
Посмотрите это видео о том, как рассчитать коэффициент корреляции в Minitab :
Как найти коэффициент корреляции Пирсона в Minitab
Посмотрите это видео на YouTube.
Видео не видно? Кликните сюда.
Коэффициент корреляции Minitab вернет значение r от -1 до 1.
Пример вопроса : Найдите коэффициент корреляции Minitab на основе возраста и уровня глюкозы из следующей таблицы из преддиабетического исследования 6 участников. :
Тема | Возраст x | Уровень глюкозы y | 1 | 43 | 99 |
---|---|---|
2 | 21 | 65 | 3 | 25 | 79 |
4 | 42 | 75 | 5 | 57 | 87 |
6 | 59 | 81 |
Шаг 1: Введите данные в рабочий лист Minitab . Я ввел этот образец данных в три столбца.
Данные введены в три столбца рабочего листа Minitab.
Шаг 2: Нажмите «Статистика», затем нажмите «Основная статистика», а затем нажмите «Корреляция».
«Корреляция» выбирается в меню «Статистика > Базовая статистика».
Шаг 3: Щелкните имя переменной в левом окне, а затем нажмите кнопку «Выбрать» , чтобы переместить имя переменной в поле «Переменная». Для этого примера вопроса нажмите «Возраст», затем нажмите «Выбрать», затем нажмите «Уровень глюкозы», затем нажмите «Выбрать», чтобы перенести обе переменные в окно «Переменная».
Шаг 4: (Необязательно) Установите флажок «P-значение» , если вы хотите отобразить P-значение для r.
Шаг 5: Нажмите «ОК». Коэффициент корреляции Minitab будет отображаться в окне сеанса. Если вы не видите результатов, нажмите «Окно», а затем нажмите «Плитка». Должно появиться окно сеанса.
Результаты корреляции Minitab.
Для этого набора данных:
- Значение r: 0,530
- P-значение: 0,280
Вот оно!
Совет: Дайте своим столбцам понятные имена (в первой строке столбца, прямо под C1, C2 и т. д.). Таким образом, когда дело доходит до выбора имен переменных на шаге 3, вы легко увидите, что вы пытаетесь выбрать. Это становится особенно важным, когда в таблице данных десятки столбцов переменных!
Коэффициент корреляции Пирсона — это коэффициент линейной корреляции, который возвращает значение от -1 до +1. -1 означает, что существует сильная отрицательная корреляция, а +1 означает, что существует сильная положительная корреляция. 0 означает отсутствие корреляции (это также называется 9).0129 нулевая корреляция ).
Поначалу это может быть немного сложно понять (кто любит иметь дело с отрицательными числами?). Департамент политологии Университета Куиннипиак опубликовал этот полезный список значений коэффициентов корреляции Пирсона. Они отмечают, что это « грубых оценок » для интерпретации сил корреляции с использованием корреляции Пирсона:
r значение = | |
+0,70 или выше | Очень сильная положительная связь |
+0,40 до +0,69 | Сильные положительные отношения |
+,30 до +,39 | Умеренно положительные отношения |
+,20 до +,29 | слабая положительная связь |
+,01 до +,19 | Связь отсутствует или незначительна |
0 | Нет связи [нулевая корреляция] |
от -.01 до -.19 | Связь отсутствует или незначительна |
от -.20 до -.29 | слабая отрицательная связь |
от -.30 до -.39 | Умеренное негативное отношение |
от -0,40 до -0,69 | Сильные отрицательные отношения |
-0,70 или больше | Очень сильная отрицательная связь |
Может быть полезно увидеть графически, как выглядят эти корреляции:
Графики, показывающие корреляцию -1 (отрицательная корреляция), 0 и +1 (положительная корреляция)
Изображения показывают, что сильная отрицательная корреляция означает, что график имеет нисходящий наклон слева направо: по мере увеличения значений x значения y уменьшаются. Сильная положительная корреляция означает, что график имеет восходящий наклон слева направо: по мере увеличения значений x значения y становятся больше.
Наверх.
V-корреляция Крамера аналогична коэффициенту корреляции Пирсона. В то время как корреляция Пирсона используется для проверки прочности линейных отношений, V Крамера используется для расчета корреляции в таблицах с более чем 2 x 2 столбцами и строками. V-корреляция Крамера варьируется от 0 до 1. Значение, близкое к 0, означает, что связь между переменными очень мала. V Крамера, близкий к 1, указывает на очень сильную связь.
Крамер V | |
.25 или выше | Очень крепкие отношения |
от 0,15 до 0,25 | Крепкие отношения |
от 0,11 до 0,15 | Умеренные отношения |
от 0,06 до 0,10 | слабые отношения |
от 0,01 до 0,05 | Связь отсутствует или незначительна |
Наверх.
Коэффициент корреляции дает представление о том, насколько хорошо данные соответствуют линии или кривой. Пирсон не был изобретателем термина «корреляция», но его использование стало одним из самых популярных способов измерения корреляции.
Фрэнсис Гальтон (который также участвовал в разработке межквартильного диапазона) был первым, кто измерил корреляцию, первоначально названную «корреляцией», что на самом деле имеет смысл, учитывая, что вы изучаете взаимосвязь между парой различных переменных. . В «Соотношениях и их измерении» он сказал
: «Статус родственников — взаимосвязанные переменные; таким образом, рост отца соответствует росту взрослого сына и т. д.; но показатель корреляции… в разных случаях различен».
Стоит отметить, однако, что Гальтон упомянул в своей статье, что он заимствовал термин из биологии, где использовалось «Корреляция и корреляция структуры», но до времени его статьи он не был должным образом определен.
В 1892 году британский статистик Фрэнсис Исидро Эджворт опубликовал статью под названием «Коррелированные средние значения», Philosophical Magazine, 5th Series, 34, 190-204, где он использовал термин «коэффициент корреляции». Только в 1896 году британский математик Карл Пирсон использовал «коэффициент корреляции» в двух статьях: «Вклад в математическую теорию эволюции» и «Математический вклад в теорию эволюции». III. Регрессия, наследственность и панмиксия. Это была вторая статья, в которой была представлена формула корреляции Пирсона «произведение-момент» для оценки корреляции.
Корреляционное уравнение Пирсона «произведение-момент».
Наверх.
Если вы умеете читать таблицу — вы можете проверить коэффициент корреляции. Обратите внимание, что корреляции следует рассчитывать только для всего диапазона данных. Если ограничить диапазон, r будут ослаблены.
Пример задачи : проверить значимость коэффициента корреляции r = 0,565, используя критические значения для таблицы PPMC. Тест при α = 0,01 для размера выборки 9.
Шаг 1: Вычтите два из размера выборки, чтобы получить df, степени свободы .
9 – 7 = 2
Шаг 2: Найдите значения в таблице PPMC. При df = 7 и α = 0,01 табличное значение = 0,798
Шаг 3: Нарисуйте график, чтобы вам было легче увидеть взаимосвязь.
r = 0,565 не попадает в область отклонения (выше 0,798), поэтому недостаточно доказательств, чтобы утверждать, что в данных существует сильная линейная зависимость.
Тригонометрия редко используется в статистике (например, вам никогда не понадобится находить производную tan(x)!), но связь между корреляцией и косинусом является исключением. Корреляцию можно выразить через углы:
- Положительная корреляция = острый угол <45°,
- Отрицательная корреляция = тупой угол >45°,
- Некоррелированный = ортогональный (прямой угол).
Более конкретно, корреляция — это косинус угла между двумя векторами, определяемый следующим образом (Knill, 2011):
Если X, Y — две случайные величины с нулевым средним значением, то ковариация Cov[XY] = E[X · Y] является точечным произведением X и Y. Стандартное отклонение X равно длине X.
Ссылки
Эктон, Ф. С. Анализ прямолинейных данных. Нью-Йорк: Довер, 1966.
Эдвардс, А. Л. «Коэффициент корреляции». Ч. 4 в Введение в линейную регрессию и корреляцию. Сан-Франциско, Калифорния: WH Freeman, стр. 33-46, 1976.
Гоник, Л. и Смит, В. «Регрессия». Ч. 11 в The Cartoon Guide to Statistics. Нью-Йорк: Harper Perennial, стр. 187–210, 19.93.
Книл, О. (2011). Лекция 12: Корреляция. Получено 16 апреля 2021 г. с: http://people.math.harvard.edu/~knill/teaching/math29b_2011/handouts/lecture12.pdf
Другие подобные формулы, которые могут вам встретиться, включают корреляцию ( нажмите, чтобы перейти к статье ) :
- Конкордантность Коэффициент корреляции.
- Внутриклассовая корреляция.
- Тау Кендалла.
- Коэффициент корреляции Мэтьюза
- Моран I.
- Частичная корреляция.
- Коэффициент Фи.
- Бисериальная корреляция точек.