bannerbannerbanner
Краткий курс по статистике

Коллектив авторов
Краткий курс по статистике

Полная версия

7. Средние величины. Варианты и частоты

1. Если различные элементы принадлежат одному и тому же явлению, оказывают влияние друг на друга, то значения признаков у таких элементов сближаются, что дает возможность рассматривать их как единую совокупность. Для исследования совокупности, обладающей различными значениями признака у отдельных ее единиц, необходимо иметь единую типическую для совокупности величину признака, позволяющую анализировать совокупность и сравнивать динамические изменения в совокупности. Для этого применяется средняя величина. Средняя величина рассчитывается только по количественным признакам, т. е. определение средней по атрибутивным признакам невозможно.

Средняя величина – это наиболее типичное для совокупности значение признака, объем признака совокупности, распределенный поровну между единицами совокупности.

Варианты – различные значения признака, наблюдаемые у членов совокупности. Частоты – числа, показывающие, сколько раз встречается каждый вариант в совокупности. Относительные частоты – отношение соответствующей частоты к объему совокупности.

2. Для осредняемого признака определятся средняя величина () – показатель, рассчитываемый сопоставлением абсолютных или относительных величин.

Чтобы получить требуемую среднюю величину, необходимо правильно определить показатели, которые нужно соотнести. Данное исходное соотношение отражает сущность вычисляемой средней величины. Для каждой средней величины может быть только единственное исходное соотношение.

Средняя величина характеризует совокупность в целом и относится к единице совокупности как ее характеристика; отражает влияние всех факторов, влияющих на исследуемое явление, и является для них равнодействующей.

3. Выделяют следующие условия применения средних величин:

✓ однородность исследуемой совокупности. Если некоторые подверженные влиянию случайного фактора элементы совокупности имеют значительно отличающиеся от остальных величины изучаемого признака, то данные элементы повлияют на размер средней для данной совокупности. В этом случае средняя не будет выражать наиболее типичную для совокупности величину признака;

✓ если исследуемое явление неоднородно, требуется его разбивка на содержащие однородные элементы группы. В данном случае рассчитывают средние по группам – групповые средние, выражающие наиболее характерную величину явления в каждой группе, а затем рассчитывается общая средняя величина для всех элементов, характеризующая явление в целом. Она рассчитывается как средняя из групповых средних, взвешенных по числу включенных в каждую группу элементов совокупности;

✓ достаточное количество единиц в совокупности. При применении выборочного наблюдения именно это условие становится определяющим;

✓ максимальное и минимальное значения признака в изучаемой совокупности. Если изменчивость признака вызвана случайными факторами (в случае больших отклонений между крайними значениями и средней), то, возможно, крайние значения нехарактерны для совокупности и их следует исключить из анализа из-за влияния на размер средней величины.

4. Средние величины подразделяются на степенные средние (средняя степенная, средняя арифметическая, средняя гармоническая и т. д.) и структурные средние (мода, медиана).

Осредняемый признак – признак, по которому находится средняя (х). Величина осредняемого признака у любой единицы статистической совокупности составляет его индивидуальное значение, или варианты (х1, х2, x3, … хn). Частота осредняемого признака – повторяемость индивидуальных значений признака (f).

Один из наиболее распространенных видов средней – средняя арифметическая – исчисляется, когда объем осредняемого признака образуется как сумма его значений у отдельных единиц изучаемой статистической совокупности. Для вычисления средней арифметической величины сумму всех уровней признака делят на их число.

Если некоторые варианты встречаются несколько раз, то сумму уровней признака можно получить умножением каждого уровня на соответствующее число единиц совокупности с последующим сложением полученных произведений; исчисленная таким образом величина – средняя арифметическая взвешенная.

8. Основные виды средних величин

1. Для определения средней арифметической необходим ряд вариантов и частот, т. е. значения х и f

Средняя гармоническая взвешенная тождественна средней арифметической: когда произведения fx одинаковы или равны единице (m = 1), то применяется средняя гармоническая простая:


где х1 – отдельные варианты.

Если имеется n коэффициентов роста, то формула среднего коэффициента:



Средняя геометрическая равна корню степени n из произведения коэффициентов роста, характеризующих отношение величины каждого последующего периода к величине предыдущего. Средняя квадратическая простая определяется путем извлечения квадратного корня из частного от деления суммы квадратов отдельных значений признака на их число:



Средняя квадратическая взвешенная:



2. Выделяют следующие основные виды средних величин:

☞ по наличию признака-веса: невзвешенная и взвешенная;

охвату совокупности: групповая, общая;

☞ форме расчета: средняя арифметическая, гармоническая, геометрическая, квадратическая, кубическая и т. д. величины.


Данные средние выводятся из формулы степенной средней:



где xi – величины, для которых исчисляется средняя;

– средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений;

n – частота (повторяемость индивидуальных значений признака).


При при k = – средняя гармоническая; при k = 0 – средняя геометрическая; при k = 2 – средняя квадратическая.

При k = 1 формула расчета степенной средней превращается в формулу расчета средней арифметической:



3. Выделяют следующие основные виды средней арифметической величины: средняя арифметическая невзвешенная, средняя арифметическая взвешенная.

Средняя арифметическая невзвешенная величина наиболее распространена; рассчитывается путем деления значений признака каждого элемента совокупности на число элементов совокупности:



Средняя арифметическая взвешенная величина рассчитывается, если имеются сведения о количестве или доле единиц совокупности каждым значением осредняемого признака:



Выделяют следующие основные свойства средней арифметической величины:

☞ сумма всех отклонений каждого значения признака от среднего арифметического значения равна нулю:



Если отклонения каждого из вариантов от средней величины суммировать, то получится ноль, что свойственно арифметическим невзвешенным и взвешенным средним значениям;

☞ произведение каждого значения признака на соответствующую ему частоту равно произведению средней величины на сумму частот:



Средняя величина есть результат распределения объема совокупности поровну между всеми ее элементами;

☞ сумма квадратов отклонения индивидуальных значений признака от средней арифметической меньше суммы квадратов отклонения от любой другой величины:



если увеличить или уменьшить все варианты осредняемого признака на какое-либо одно и то же число, то объем средней соответственно увеличится или уменьшится на это же число;

☞ если увеличить или уменьшить все варианты осредняемого признака в какое-либо число раз, то объем средней соответственно увеличится или уменьшится в это же количество раз;

от увеличения или уменьшения веса каждого варианта признака в какое-либо число раз величина средней не изменится. Применение данного свойства удобно, если необходимо проанализировать совокупность со значительным количеством элементов, а частота элементов выражена многозначными числами. Если частоты элементов равны между собой, то среднюю можно рассчитать как невзвешенную;

вследствие предыдущего свойства величина средней зависит не от абсолютных значений весов отдельных элементов, а от их доли в общей сумме весов, т. е. если не известны абсолютные выражения весов элементов, а известны пропорции между ними, то они могут использоваться для расчета средней;

средняя арифметическая совокупности, состоящей из постоянных величин, равна этой постоянной:



4. Приведем также формулы расчета средней гармонической, средней геометрической, средней квадратической и средней степенной величин.

 

Формула расчета степенной средней:



где xi – величины, для которых исчисляется средняя;

– средняя, где имеет место осреднение индивидуальных значений;

n – частота (повторяемость индивидуальных значений признака).

При к = формула превращается в формулу расчета средней гармонической.

Средняя гармоническая простая (невзвешенная) величина взаимосвязана со средней арифметической невзвешенной как величина, обратная средней арифметической, рассчитанная из обратных значений признака:



Средняя гармоническая взвешенная величина:



где ω – значения сводного, объемного, выступающего как признак-вес показателя.

Рассчитывается, когда имеются данные об объеме определяющего показателя, т. е. произведения осредняемого признака и признака-веса.

Также рассчитывается при наличии сведений об индивидуальных значениях осредняемого признака при отсутствии отдельных значений признака-веса.

Средняя степенная при показателе степени к = 0 становится средней геометрической величиной.


5. К основным видам средних геометрических величин относятся средняя геометрическая невзвешенная и средняя геометрическая взвешенная величины. Расчет средней геометрической невзвешенной величины: если показатель степени k = 0, то формула средней степенной



где П(хi) – произведение индивидуальных значений осредняемого признака.


Применяется при наличии n коэффициентов роста. Индивидуальные значения признаков при этом становятся относительными величинами динамики (построены в виде цепных величин как отношение к предыдущему уровню каждого уровня в ряду динамики).

Средняя геометрическая невзвешенная величина характеризует средний коэффициент роста.

Средняя геометрическая взвешенная применяется в случае, если темпы роста остаются неизменными в течение нескольких периодов:



где – средняя геометрическая взвешенная (средний темп прироста);

х – количество периодов, при которых темпы роста оставались неизменными.


6. Средняя квадратическая – средняя степенная при показателе степени k = 2.

Различают следующие основные виды средних квадратических величин: средняя квадратическая невзвешенная, средняя квадратическая взвешенная.

Средняя квадратическая невзвешенная



используется при расчете степени колеблемости индивидуальных значений признака вокруг средней арифметической. Средняя квадратическая взвешенная:



Все формы средней (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и т. д.) образованы от единой степенной средней и отличаются друг от друга показателями степени k.

Правильность расчета средней величины можно проверить с помощью правила мажорантности: чем выше степень рассчитываемой формы средней величины, тем больше значение средней:


9. Медиана и мода. Абсолютные и относительные показатели вариации

1. Второй большой класс средних величин – структурные средние, используемые для определения структуры совокупности. К ним относятся мода и медиана. В отличие от степенных средних, рассчитывающихся на основе использования всех вариантов значений признака, медиана и мода характеризуют величину варианта, занимающего определенное среднее положение.

Для определения понятий моды и медианы требуется определение вариационного ряда. Построение ряда – процесс упорядочения количественного распределения элементов совокупности по значениям признака с последующим подсчетом числа элементов совокупности с этими значениями.

Выделяют следующие основные виды вариационного ряда по количественному признаку:

ранжированный;

дискретный;

интервальный вариационный.

Ранжированный ряд – распределение отдельных элементов совокупности в порядке возрастания или убывания исследуемого признака. Дискретный ряд – распределение, основу которого составляют признаки с прерывным изменением, так называемые дискретные признаки – признаки, принимающие только конечное число определенных значений. Интервальный вариационный ряд – распределение признаков, имеющих непрерывное изменение, которые в определенных границах могут принимать любые значения.

Медиана (Ме) – величина, соответствующая находящемуся в середине ранжированного ряда варианту.

Для нахождения медианы необходимо определить ее положение в ранжированном ряду.

Положение медианы (NМе) в ранжированном ряду определяется:



где n – число единиц в совокупности.


В медианном интервале сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений. Численное значение медианы:



где х0 – нижняя граница интервала;

h – величина интервала;

n – число членов ряда;

Σ(m – 1) – сумма накопленных членов ряда, предшествующих медианному;

nМе – частота медианного интервала.

Мода (Мо) – значение признака, наиболее часто встречающегося у единиц совокупности.

В дискретном ряду модой будет вариант с наибольшей частотой. Для определения моды сначала определяют модальный интервал, т. е. интервал, имеющий наибольшую частоту.

Значение моды определяется по формуле:



где x0 – нижняя граница модального интервала;

h – величина модального интервала;

nm – частота модального интервала;

nm—1 – частота интервала, предшествующего модальному;

nm+1 – частота интервала, следующего за модальным.


2. Вариация – одна из важнейших категорий, применяемых в статистической науке, поскольку явления неизменные в статистике не рассматриваются. Также под вариацией понимают изменчивость только явлений, на которые оказывают влияние внешние факторы.

Вариация (лат. variatio – различие, изменение, колеблемость) – числовые значения признаков единиц совокупности, отличающиеся друг от друга.

Исследование вариации позволяет определить уровень зависимости изучаемого явления от прочих факторов (оценить степень устойчивости явления к внешним воздействиям); определить уровень однородности изучаемого явления; изучить явления, протекающие в обществе, характерные высоким уровнем их изменчивости.

3. В статистике принято различать следующие основные виды вариации:

☞ альтернативная – признак может принять только одно из двух, противоположных по своей сути, значений;

☞ систематическая – изменение признака в определенном направлении, не обусловленное внутренними законами развития исследуемого явления;

☞ случайная – изменчивость признака непредсказуема.

Показатели вариации бывают относительными и абсолютными (непосредственно характеризующими изменчивость исследуемой совокупности).

Выделяют несколько основных групп абсолютных показателей вариации.

Размах вариации (R), или амплитуда вариации, показывает пределы изменчивости признака; это разность между максимальной величиной признака (xmax) и минимальной величиной признака (xmin):


R = xmaxxmin.


К группе средних величин (групповых и общих) относятся: степенные средние величины (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и т. д.); структурные средние величины (мода и медиана).

Среднее линейное отклонение () учитывает различия всех единиц исследуемой совокупности. Определяется как средняя арифметическая из абсолютных значений отклонений, взятых по модулю, от средней. Различают простое (невзвешенное) и взвешенное среднее линейные отклонения.

Среднее линейное отклонение невзвешенное:



где xi – величины совокупности;


– средняя;


n – частота (повторяемость индивидуальных значений признака).


Среднее линейное отклонение взвешенное:



Недостаток среднего линейного отклонения заключается в том, что приходится иметь дело не только с положительными, но и с отрицательными величинами.

Также выделяют дисперсии (групповые, межгрупповые, общие) и среднее квадратическое отклонение.


4. Информативность показателей вариации повышается, если они рассчитываются для целей сравнительного анализа. Показатели, рассчитанные по одной совокупности, сопоставляются с показателями, рассчитанными по другой аналогичной совокупности или по той же самой, но относящейся к другому периоду времени. Например, исследуется динамика вариации курса доллара по недельным или месячным данным.

Показатели вариации можно использовать не только в анализе колеблемости или изменчивости изучаемого признака, но и для оценки степени воздействия одного признака на вариацию другого признака, т. е. в анализе взаимосвязей между показателями.

Для измерения вариации признака используют абсолютные и относительные показатели.

Абсолютные показатели вариации – размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия.

Относительные показатели вариации (коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение и др.) – результат сопоставления абсолютных показателей. Их суть состоит в соотнесении абсолютных показателей вариации со значением средней величины как характеристики центра распределения.

1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17 
Рейтинг@Mail.ru