Средняя величина отражает то общее, что скрывается в каждой единице совокупности. Она улавливает общие черты, общие закономерности, которые проявляются в силу закона больших чисел. Говоря о средних величинах, имеют в виду, что они характеризуют всю совокупность в целом, однако, наряду со средней необходимо приводить данные об отдельных единицах совокупности.
Задачи, решаемые с помощью метода средних величин:
1) характеристика уровня развития исследуемого явления;
2) сравнение двух или нескольких уровней исследуемых совокупностей;
3) характеристика изменения уровня явления во времени;
4) выявление и характеристика связей между исслеуемыми совокупностями.
П ринципы построения средних величин:
1) средние величины могут быть рассчитаны только лишь для качественно однородных совокупностей;
2) средние величины не должны быть абстрактными, т. е. только количественными показателями. Они должны давать качественно-количественную характеристику исследуемому явлению. Поэтому в статистике средняя величина представляет собой не абстрактное, отвлеченное число, а вполне конкретный показатель, относимый к какому-либо явлению, месту, времени;
3) выбор единицы совокупности, по отношению к которой рассчитывается средняя величина, должен быть теоретически обоснован.
Выделяются следующие основные виды средних величин: средняя арифметическая; средняя гармоническая; средняя квадратическая; средняя геометрическая.
Для правильного расчета средних величин необходимо ввести такие понятия, как варианты и частоты.
В результате сводки и группировки получают статистические ряды , т. е. ряды цифровых показателей. По своему содержанию такие ряды делятся на ряды распределения и ряды динамики .
Ряды распределения характеризуют распределение единиц совокупности по какому-либо одному признаку, разновидности которого упорядочены определенным образом. Различают два вида рядов распределения – атрибутивные и вариационные ряды.
Атрибутивные ряды образуются в результате группировки данных по качественным признакам (например, распределение населения по полу). В этих рядах столько групп, сколько вариантов качественного признака.
Вариационный ряд – это упорядоченный ряд значений варьирующего количественного признака и численности единиц, имеющих данное значение признака (например, распределение рабочих по заработной плате).
В вариационном ряду распределения выделяют следующие элементы:
1) варианты (х или х1, х2 … хn) – это ряд числовых значений количественного признака (например, стаж, заработная плата, возраст). Варианты могут быть как абсолютными, так и относительными величинами;
2) частоты (m: m1, m2 … mn) – это числа, показывающие, сколько раз повторяются соответствующие варианты (например, число рабочих). Частоты, как правило, обозначаются абсолютным числом; если по условию частоты выражены в виде процентов к итогу или долей, то их называют относительными частотами (или) частотами f:
f = m / Σm .
7. Средняя арифметическая
Основной средней величиной является средняя арифметическая. Выделяют простую и взвешенную среднюю арифметическую .
Базой для расчета простой средней арифметической являются первичные записи результатов наблюдения. Предположим, что известны значения признака x 1 x 2 , …, х п . Каждое из этих значений повторяется один раз (или теоретически одинаковое количество раз), т. е. данные не сгруппированы. Тогда для такого ряда следует использовать формулу средней арифметической простого ряда или простую среднюю арифметическую:
где х — значение варьирующегося признака;
n – число единиц совокупности.
Базой для расчета взвешенной средней арифметической является обработанный цифровой материал, т. е. сгруппированные данные. Для таких данных используется формула средней арифметической взвешенной:
где х — значение варьирующегося признака;
m – веса, т. е. частоты, показывающие, сколько раз повторяется каждое значение признака в данной совокупности.
Формула получена путем взвешивания значений каждой варианты и деления суммы вариант на сумму весов. Формулы простой и взвешенной средней арифметической не эквивалентны друг другу.
Свойства средней арифметической:
1) алгебраическая сумма отклонений всех вариантов от средней арифметической равна нулю:
x = Σxm /Σm => x Σm = Σxm =>Σ(х-х)m = 0.
Это свойство используется для проверки правильности расчетов;
2) сумма квадратов отклонений вариант от их средней арифметической больше суммы квадратов отклонений вариант от любого другого числа, не равного средней арифметической:
где x ≠a ;
3) среднее алгебраическое суммы нескольких варьирующихся признаков равно сумме средних этих признаков:k = x + y + z + …;
Это свойство позволяет определить сумму путем суммирования значений каких*либо признаков;
4) если все варианты ( х ) увеличить или уменьшить на какое-либо постоянное число (а), средняя (x) увеличится или уменьшится на то же самое число (y):( х – а ) = у ;
x – a = y;
5) если все варианты (х) увеличить или уменьшить в одно и то же число раз (в), то средняя арифметическая увеличится или уменьшится в то же самое число раз:
если , то,
8. Средняя гармоническая, геометрическая, квадратическая, степенная
При решении задач расчет средней величины начинается с составления исходного отношения – логической словесной формулы средней. Она составляется на основе теоретического и логического анализа. Иногда среднюю арифметическую нельзя использовать. В этом случае в зависимости от ситуации применяется одна из трех форм средней.
Средняя гармоническая простая строится по формуле:
где n — число единиц совокупности или число вариантов;
х — значения варьирующегося признака.
Средняя гармоническая простая используется для несгруппированных данных.
Средняя гармоническая взвешенная строится по формуле:
где х — значения варьирующего признака;
m — веса;
n — число единиц совокупности. Среднюю гармоническую взвешенную используют для сгруппированных данных, т. е. когда каждое значение х повторяется различное число раз.
Средняя квадратическая простая строится по формуле:
где n — число единиц совокупности или число вариантов; х — значения варьирующегося признака.
Средняя квадратическая простая используется для несгруппированных данных.
Средняя квадратическая взвешенная строится по формуле:
где m – веса;
х – значения варьирующего признака.
Среднюю квадратическую взвешенную используют для сгруппированных данных.
Данные формулы используются редко, в специальных расчетах.
Средняя геометрическая простая строится по формуле:
где n – число единиц совокупности или число вариантов;
х – значения варьирующегося признака. Средняя геометрическая простая используется для несгруппированных данных.
Средняя геометрическая взвешенная строится по формуле:
где х – значения варьирующего признака;
m – веса;
n – число единиц совокупности или число вариантов. Различные формулы средних величин можно объединить в одной формуле – формуле степенной средней:
где р – порядок средней.
9. Медиана и мода. Асимметрия распределения
Медианой М е называется варианта, которая делит ранжированный вариационный ряд на две равные части, из которых значение одной половины меньше медианы, а значения другой – больше медианы.
Медиана для несгруппированных данных при нечетном числе вариантов ( n = 2k+ 1 ), определяется как M e = x k + 1, а при четном числе вариантов (n = 2k ), медиана определяется по формуле:
Медиана для сгруппированных данных рассчитывается по формуле:
где х 0 – это нижняя граница медианного интервала;
/– величина медианного интервала;
em / 2 – полусумма всех частот;
S Me – накопленная частота, предшествующая медианному интервалу;
m Ме – частота медианного интервала.
Медиана рассчитывают наряду со средней величиной или вместо нее, когда в ряду данных присутствуют открытые или неравные интервалы. Это не влияет на точность медианы, однако, влияет на точность величины.
Модой М 0 называется варианта, которая имеет наибольшую частоту по сравнению с другими частотами. В дискретно-вариационном ряду мода – это та варианта, которой соответствует наибольшая частота.
В интервальном вариационном ряду с равными интервалами моду определяют по формуле:
где х 0 – это нижняя граница модального интервала;
h – величина модального интервала;
d 1 – разность между частотами модального и предмодального интервалов;
d 2 – разность между частотами модального и послемодального интервалов.
Мода рассчитывается в тех случаях, когда невозможно или нецелесообразно рассчитывать среднюю величину по обычным формулам.
Асимметрией распределения называется несоразмерность, т. е. нарушение соответствия в расположении частей одного целого относительно средней линии или центра. На графике асимметрия распределения определяется как вытянутость одной из ветвей распределения. Асимметрия распределения возникает в связи с различной частотой появления вариант больших или меньших моды (т. к. мода соответствует вершине распределения) под влиянием преобладающего действия определенных факторов. Таким образом, наличие асимметрии говорит о неустойчивости распределения совокупности в связи с преобладающим воздействием какой-либо группы факторов.