Средняя арифметическая по способу моментов вычисляется. Метод упрощения вычисления средней арифметической называется методом условных моментов или методом отчета от условного нуля. Свойства средней арифметической. Расчет средней арифметической способом «м

«Способ моментов» применяется в рядах с равными интервалами на основе свойств средней арифметической. Средняя арифметическая исчисляется по формуле

где i – размер интервала;

m 1 – момент первого порядка (средняя арифметическая из новых упрощенных вариант
;
– новые упрощенные варианты;f – частота);

А – постоянное число (лучше всего взять его равным варианте, у которой наибольшая частота).

Определим среднее значение признака «способом моментов» на следующем примере.

Пример 5 . Имеются следующие данные о распределении магазинов облпотребсоюза по торговой площади (табл. 14).

Таблица 14

Следует определить среднюю площадь магазинов, применив «способ моментов».

Решение

Данные распределения магазинов по торговой площади представлены в виде интервального ряда распределения с равными интервалами (i = 20 м 2), следовательно, расчет средней площади магазина можно провести по формуле
, применив «способ моментов».

Первый и последний интервалы даны открытыми, т. е. не имеют границ нижней и верхней соответственно. Для определения среднего значения в них границы интервалов следует закрыть. Для первой группы с размером площади до 40 м 2 условно считаем, что интервал также равен 20 м 2 , затем вычитаем 20 м 2 из 40 м 2 и находим условную нижнюю границу первого интервала (20 – 40). Условную верхнюю границу последнего интервала определяем аналогично (100 – 120).

Расчеты следует проводить в табл. 15.

Таблица 15

Группировка мага- зинов по торговой площади, м 2 (х )

Удельный вес магазинов, % (f )

Середина интервала (х )

х А

Наибольшая частота f равна 40, следовательно, в качестве постоянной величины А принимаем 70.

Определяем момент первого порядка:
.

Среднее значение признака равно:

+ 70 = = 68 м 2 .

Следовательно, средняя площадь магазина составляет 68 м 2 .

5.3. Структурные средние

В качестве структурных средних чаще всего используют показатели моды и медианы. Мода (Мо ) – наиболее часто повторяющееся значение признака. Медиана (Ме ) – величина признака, которая делит упорядоченный ряд на две равные по численности части.

Если расчет моды и медианы проводится в дискретном ряду, то он опирается на их понятия. В интервальном ряду распределения для расчета моды и медианы применяют следующие формулы.

Мода рассчитывается по формуле

где х Мо – нижнее значение модального интервала;

i Мо – размер модального интервала;

f Мо – частота модального интервала;

f Мо –1 – частота, предшествующая модальной частоте;

f Мо +1 – частота, последующая за модальной частотой.

Модальному интервалу соответствует наибольшая (модальная) частота. Медиана рассчитывается по формуле

,

где х Ме – нижнее значение медианного интервала;

i Ме – размер медианного интервала;

f – сумма частот;

S Ме –1 – сумма частот, предшествующих медианной частоте;

f Ме – медианная частота.

Медианному интервалу соответствует медианная частота. Таким интервалом будет интервал, сумма накопленных частот которого равна или превышает половину суммы всех частот.

Рассмотрим определение моды и медианы на следующих примерах.

Пример 6 . В результате статистического обследования области получены следующие данные по распределению семей по числу детей (табл. 16).

Таблица 16

Следует определить моду и медиану.

Решение

В дискретных рядах модой является варианта с наибольшей частотой. Наибольшая частота – 34, следовательно мода равна 2.

Для вычисления медианы определим сумму частот ряда (f = 100), затем рассчитаем полусумму
.

Так как сумма накопленных частот 5 + 32 + 34 = 71 превышает полусумму (71 > 50), то варианта, имеющая значение 2 и соответствующая этой накопленной сумме частот, и есть медиана.

Пример 7 . В результате статистического обследования получены следующие данные распределения продавцов магазинов облпотребсоюза по возрасту (табл. 17).

Таблица 17

Необходимо определить моду и медиану.

Решение

В интервальных рядах мода и медиана определяются по вышеприведенным формулам.

Сначала определим модальный интервал, он соответствует наибольшей частоте. Так как наибольшая частота равна 35 и является модальной, то интервал 30–40 является модальным интервалом. Затем подставим данные в следующую формулу:

Определим медианный интервал. Полусумма частот равна 50
. Накапливая частоты, определим интересующий интервал. Так как сумма накопленных частот 6 + 24 + 35 = 65 превышает полусумму (65 > 50), значит 35 является медианной частотой, а интервал 30–40 является медианным интервалом.

Затем подставим данные в формулу

Таким образом, мода равна 35,5 лет (больше всего продавцов в возрасте 35,5 лет), медиана – 35,7 лет (50 % продавцов достигли возраста 35,7 лет).

Признаки единиц статистических совокупностей различны по своему значению, например, заработная плата рабочих одной профессии какого-либо предприятия не одинакова за один и тот же период времени, различны цены на рынке на одинаковую продукцию, урожайность сельскохозяйственных культур в хозяйствах района и т.д. Поэтому, чтобы определить значение признака, характерное для всей изучаемой совокупности единиц, рассчитывают средние величины.
Средняя величина это обобщающая характеристика множества индивидуальных значений некоторого количественного признака.

Совокупность, изучаемая по количественному признаку, состоит из индивидуальных значений; на них оказывают влияние, как общие причины, так и индивидуальные условия. В среднем значении отклонения, характерные для индивидуальных значений, погашаются. Средняя, являясь функцией множества индивидуальных значений, представляет одним значением всю совокупность и отражает то общее, что присуще всем ее единицам.

Средняя, рассчитываемая для совокупностей, состоящих из качественно однородных единиц, называется типической средней . Например, можно рассчитать среднемесячную заработную плату работника той или иной профессиональной группы (шахтера, врача библиотекаря). Разумеется, уровни месячной заработной платы шахтеров в силу различия их квалификации, стажа работы, отработанного за месяц времени и многих других факторов отличаются друг от друга, так и от уровня средней заработной платы. Однако в среднем уровне отражены основные факторы, которые влияют на уровень заработной платы, и взаимно погашаются различия, которые возникают вследствие индивидуальных особенностей работника. Средняя заработная плата отражает типичный уровень оплаты труда для данного вида работников. Получению типической средней должен предшествовать анализ того, насколько данная совокупность качественно однородна. Если совокупность состоит их отдельных частей, следует разбить ее на типические группы (средняя температура по больнице).

Средние величины, используемые в качестве характеристик для неоднородных совокупностей, называются системными средними . Например, средняя величина валового внутреннего продукта (ВВП) на душу населения, средняя величина потребления различных групп товаров на человека и другие подобные величины, представляющие обобщающие характеристики государства как единой экономической системы.

Средняя должна вычисляться для совокупностей, состоящих из достаточно большого числа единиц. Соблюдение этого условия необходимо для того, чтобы вошел в силу закон больших чисел, в результате действия которого случайные отклонения индивидуальных величин от общей тенденции взаимно погашаются.

Виды средних и способы их вычисления

Выбор вида средней определяется экономическим содержанием определенного показателя и исходных данных. Однако любая средняя величина должна вычисляться так, чтобы при замене ею каждой варианты осредняемого признака не изменился итоговый, обобщающий, или, как его принято называть, определяющий показатель , который связан с осредняемым показателем. Например, при замене фактических скоростей на отдельных отрезках пути их средней скоростью не должно измениться общее расстояние, пройденное транспортным средством за одно и тоже время; при замене фактических заработных плат отдельных работников предприятия средней заработной платой не должен измениться фонд заработной платы. Следовательно, в каждом конкретном случае в зависимости от характера имеющихся данных, существует только одно истинное среднее значение показателя, адекватное свойствам и сущности изучаемого социально-экономического явления.
Наиболее часто применяются средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая и средняя кубическая.
Перечисленные средние относятся к классу степенных средних и объединяются общей формулой:
,
где – среднее значение исследуемого признака;
m – показатель степени средней;
– текущее значение (варианта) осредняемого признака;
n – число признаков.
В зависимости от значения показателя степени m различают следующие виды степенных средних:
при m = -1 – средняя гармоническая ;
при m = 0 – средняя геометрическая ;
при m = 1 – средняя арифметическая ;
при m = 2 – средняя квадратическая ;
при m = 3 – средняя кубическая .
При использовании одних и тех же исходных данных, чем больше показатель степени m в вышеприведенной формуле, тем больше значение средней величины:
.
Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется правилом мажорантности средних .
Каждая из отмеченных средних может приобретать две формы: простую и взвешенную .
Простая форма средней применяется, когда средняя вычисляется по первичным (несгруппированными) данным. Взвешенная форма – при расчете средней по вторичным (сгруппированным) данным.

Средняя арифметическая

Средняя арифметическая применяется, когда объем совокупности представляет собой сумму всех индивидуальных значений варьирующего признака. Следует отметить, что если вид средней величины не указывается, подразумевается средняя арифметическая. Ее логическая формула имеет вид:

Средняя арифметическая простая рассчитывается по несгруппированным данным по формуле:
или ,
где – отдельные значения признака;
j – порядковый номер единицы наблюдения, которая характеризуется значением ;
N – число единиц наблюдения (объем совокупности).
Пример. В лекции «Сводка и группировка статистических данных» рассматривались результаты наблюдения стажа работы бригады из 10 человек. Рассчитаем средний стаж работы рабочих бригады. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

По формуле средней арифметической простой вычисляются также средние в хронологическом ряду , если интервалы времени, за которое представлены значения признака, равны.
Пример. Объем реализованной продукции за первый квартал составил 47 ден. ед., за второй 54, за третий 65 и за четвертый 58 ден. ед. Среднеквартальный оборот составляет (47+54+65+58)/4 = 56 ден. ед.
Если в хронологическом ряду приведены моментные показатели, то при вычислении средней они заменяются полусуммами значений на начало и конец периода.
Если моментов больше двух и интервалы между ними равны, то средняя вычисляется по формуле средней хронологической

,
где n- число моментов времени
В случае, когда данные сгруппированы по значениям признака (т. е. построен дискретный вариационный ряд распределения) средняя арифметическая взвешенная рассчитывается с использовании либо частот , либо частостей наблюдения конкретных значений признака , число которых (k) значительно меньше числа наблюдений (N) .
,
,
где k – количество групп вариационного ряда,
i – номер группы вариационного ряда.
Поскольку , а , получаем формулы, используемые для практических расчетов:
и
Пример. Рассчитаем средний стаж рабочих бригад по сгруппированному ряду.
а) с использованием частот:

б) с использованием частостей:

В случае, когда данные сгруппированы по интервалам , т.е. представлены в виде интервальных рядов распределения, при расчете средней арифметической в качестве значения признака принимают середину интервала, исходя из предположения о равномерном распределении единиц совокупности на данном интервале. Расчет ведется по формулам:
и
где - середина интервала: ,
где и – нижняя и верхняя границы интервалов (при условии, что верхняя граница данного интервала совпадает с нижней границей следующего интервала).

Пример. Рассчитаем среднюю арифметическую интервального вариационного ряда, построенного по результатам исследования годовой заработной платы 30 рабочих (см. лекцию «Сводка и группировка статистических данных»).
Таблица 1 – Интервальный вариационный ряд распределения.

Интервалы, грн.

Частота, чел.

Частость,

Середина интервала,

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

грн. или грн.
Средние арифметические, вычисленные на основе исходных данных и интервальных вариационных рядов, могут не совпадать из-за неравномерности распределения значений признака внутри интервалов. В этом случае для более точного вычисления средней арифметической взвешенной следует использовать не средины интервалов, а средние арифметические простые, рассчитанные для каждой группы (групповые средние ). Средняя, вычисленная по групповым средним с использованием взвешенной формулы расчета, называется общей средней .
Средняя арифметическая обладает рядом свойств.
1. Сумма отклонений вариант от средней равна нулю:
.
2. Если все значения вариант увеличиваются или уменьшаются на величину А, то и средняя величина увеличивается или уменьшается на ту же величину А:

3. Если каждую варианту увеличить или уменьшить в В раз, то средняя величина также увеличится или уменьшатся в то же количество раз:
или
4. Сумма произведений вариант на частоты равна произведению средней величины на сумму частот:

5. Если все частоты разделить или умножить на какое-либо число, то средняя арифметическая не изменится:

6) если во всех интервалах частоты равны друг другу, то средняя арифметическая взвешенная равна простой средней арифметической:
,
где k – количество групп вариационного ряда.

Использование свойств средней позволяет упростить ее вычисление.
Допустим, что все варианты (х) сначала уменьшены на одно и то же число А, а затем уменьшены в В раз. Наибольшее упрощение достигается, когда в качестве А выбирается значение середины интервала, обладающего наибольшей частотой, а в качестве В – величина интервала (для рядов с одинаковыми интервалами). Величина А называется началом отсчета, поэтому этот метод вычисления средней называется спосо бом отсчета от условного нуля или способом моментов .
После такого преобразования получим новый вариационный ряд распределения, варианты которого равны . Их средняя арифметическая, называемая моментом первого порядка, выражаетсяформулой и согласно второго и третьего свойств средней арифметической равна средней из первоначальных вариант, уменьшенной сначала на А, а потом в В раз, т. е. .
Для получения действительной средней (средней первоначального ряда)нужно момент первого порядка умножить на В и прибавить А:

Расчет средней арифметической по способу моментов иллюстрируется данными табл. 2.
Таблица 2 – Распределение работников цеха предприятия по стажу работы


Стаж работников, лет

Количество работников

Середина интервала

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Находим момент первого порядка . Затем, зная, что А=17,5, а В=5, вычисляем средний стаж работы работников цеха:
лет

Средняя гармоническая
Как было показано выше, средняя арифметическая применяется для расчета среднего значения признака в тех случаях, когда известны его варианты x и их частоты f.
Если статистическая информация не содержит частот f по отдельным вариантам x совокупности, а представлена как их произведение , применяется формула средней гармонической взвешенной . Чтобы вычислить среднюю, обозначим , откуда . Подставив эти выражения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:
,
где - объем (вес) значений признака показателя в интервале с номером i (i=1,2, …, k).

Таким образом, средняя гармоническая применяется в тех случаях, когда суммированию подлежат не сами варианты, а обратные им величины: .
В тех случаях, когда вес каждой варианты равен единице, т.е. индивидуальные значения обратного признака встречаются по одному разу, применяется средняя гармоническая простая :
,
где – отдельные варианты обратного признака, встречающиеся по одному разу;
N – число вариант.
Если по двум частям совокупности численностью и имеются средние гармонические, то общая средняя по всей совокупности рассчитывается по формуле:

и называется взвешенной гармонической средней из групповых средних .

Пример. В ходе торгов на валютной бирже за первый час работы заключены три сделки. Данные о сумме продажи гривны и курсе гривны по отношению к доллару США приведены в табл. 3 (графы 2 и 3). Определить средний курс гривны по отношению к доллару США за первый час торгов.
Таблица 3 – Данные о ходе торгов на валютной бирже

Средний курс доллара определяется отношением суммы проданных в ходе всех сделок гривен к сумме приобретенных в результате этих же сделок долларов. Итоговая сумма продажи гривны известна из графы 2 таблицы, а количество купленных в каждой сделке долларов определяется делением суммы продажи гривны к ее курсу (графа 4). Всего в ходе трех сделок куплено 22 млн. дол. Значит, средний курс гривны за один доллар составил
.
Полученное значение является реальным, т.к. замена им фактических курсов гривны в сделках не изменит итоговой суммы продаж гривны, выступающей в качестве определяющего показателя : млн. грн.
Если бы для расчета была использована средняя арифметическая, т.е. гривны, то по обменному курсу на покупку 22 млн. дол. нужно было бы затратить 110,66 млн. грн., что не соответствует действительности.

Средняя геометрическая
Средняя геометрическая используется для анализа динамики явлений и позволяет определить средний коэффициент роста. При расчете средней геометрической индивидуальные значения признака представляют собой относительные показатели динамики, построенные в виде цепных величин, как отношения каждого уровня к предыдущему.
Средняя геометрическая простая рассчитывается по формуле:
,
где – знак произведения,
N – число осредняемых величин.
Пример. Количество зарегистрированных преступлений за 4 года возросло в 1,57 раза, в т. ч. за 1-й – в 1,08 раза, за 2-й – в 1,1 раза, за 3-й – в 1,18 и за 4-й – в 1,12 раза. Тогда среднегодовой темп роста количества преступлений составляет: , т.е. число зарегистрированных преступлений ежегодно росло в среднем на 12%.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Для расчета средней квадратической взвешенной определяем и заносим в таблицу и . Тогда средняя величина отклонений длины изделий от заданной нормы равна:

Средняя арифметическая в данном случае была бы непригодна, т.к. в результате мы получили бы нулевое отклонение.
Применение средней квадратической будет рассмотрено далее в показателях вариации.

Свойства средней арифметической. Расчет средней арифметической способом «моментов»

Для снижения трудоемкости расчетов используются основные свойства ср.арифм-кой:

  • 1. Если все варианты усредняемого признака увеличить/уменьшить на постоянную величину А, то средняя арифметическая соответственно увеличится/уменьшится.
  • 2. Если все варианты, определяемого признака увеличить/уменьшить в н-раз, то ср.арифм увеличится/уменьшится в н-раз.
  • 3. Если все частоты усредняемого признака увеличить/уменьшить в постоянное число раз, то ср.арифм.останется неизменной.
  • 18. Средняя гармоническая простая и взвешенная

Средняя гармоническая - используется, когда статистическая информация не содержит данных о весах по отдельным вариантам совокупности, но известны произведения значений варьирующего признака на соответствующие им веса.

Общая формула средней гармонической взвешенной имеет следующий вид:

х - величина варьирующего признака,

w - произведение значения варьирующего признака на его веса (xf)

Например, три партии товара А куплены по разным ценам (20, 25 и 40 руб.) Общая стоимость первой партии составила 2000 руб., второй партии - 5000 руб., и третьей партии - 6000 руб. Требуется определить среднюю цену единицы товара А.

Средняя цена определяется как частное от деления общей стоимости на общее количество закупленного товара. Используя среднюю гармоническую, мы получим искомый результат:


В том случае, если общие объемы явлений, т.е. произведения значений признаков на их веса равны, то применяется средняя гармоническая простая:

х - отдельные значения признака (варианты),

n - общее число вариант.

Пример. Две машины прошли один и тот же путь: одна со скоростью 60 км/час, а вторая - 80 км/час. Принимаем протяженность пути, который прошла каждая машина, за единицу. Тогда средняя скорость составит:

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности - носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

В процессе вычисления средней арифметической и использования ее в анализе социально-экономических процессов может оказаться полезным знание ряда ее математических свойств, которые мы приведем без развернутых доказательств.

Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной: при

Свойство 2. Алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической равна нулю: для несгруппированных данных и для рядов распределения.

Это свойство означает, что сумма положительных отклонений равна сумме отрицательных отклонений, т.е. все отклонения, обусловленные случайными причинами взаимно погашаются.

Свойство 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное: для несгруппировочных данных и для рядов распределения. Это свойство означает, что сумма квадратов отклонений индивидуальных значений признака от средней арифметической всегда меньше суммы отклонений вариантов признака от любого другого значения, даже мало отличающегося от средней.

Второе и третье свойство средней арифметической применяются для проверки правильности расчета средней величины; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Все три первых свойства выражают сущностные черты средней как статистической категории.

Следующие свойства средней рассматриваются как вычислительные, поскольку они имеют некоторое прикладное значение.

Свойство 4. Если все веса (частоты) разделить на какое-либо постоянное число d, то средняя арифметическая не изменится, поскольку это сокращение в равной степени коснется и числителя и знаменателя формулы расчета средней.

Из этого свойства вытекают два важных следствия.

Следствие 1. Если все веса равны между собой, то вычисление средней арифметической взвешенной можно заменить вычислением средней арифметической простой.

Следствие 2. Абсолютные значения частот (весов) можно заменять их удельными весами.

Свойство 5. Если все варианты разделить или умножить на какое-либо постоянное число d, то средняя арифметическая уменьшиться или увеличиться в d раз.

Свойство 6. Если все варианты уменьшить или увеличить на постоянной число A, то и со средней произойдут аналогичные изменения.

Прикладные свойства средней арифметической можно проиллюстрировать, применив способ расчета средней от условного начала (способ моментов).

Средняя арифметическая способом моментов вычисляется по формуле:

где А – середина какого-либо интервала (предпочтение отдается центральному);



d – величина равновеликого интервала, или наибольший кратный делитель интервалов;

m 1 – момент первого порядка.

Момент первого порядка определяется следующим образом:

.

Технику применения этого способа расчета проиллюстрируем по данным предшествующего примера.

Таблица 5.6

Стаж работы, лет Число рабочих Середина интервала x
до 5 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 и выше 22,5 +10 +2 +22
Итого Х Х Х -3

Как видно из расчетов, приведенных в табл. 5.6 из всех вариантов вычитается одно из их значений 12,5, которое приравнивается нулю и служит условным началом отсчета. В результате деления разностей на величину интервала – 5 получают новые варианты.

Согласно итогу табл. 5.6 имеем: .

Результат вычислений по способу моментов аналогичен результату, который был получен применением основного способа расчета по средней арифметической взвешенной.

М ср - рассчитанная при помощи метода моментов = 61,6 кг

Средняя арифметическая величина обладает тремя свой­ствами.

1. Средняя занимает серединное положение в вариационном ряду . В строго симметричном ряду: М = М 0 =М е.

2. Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных, она вскрывает то типичное, что характерно для всей совокуп­ности . К средней обращаются всякий раз, когда надо исклю­чить случайное влияние от­дельных факторов, выявить об­щие черты, существующие за­кономерности, получить полное и глубокое представление о наиболее общих и характерных особенностях всей группы.

3. Сумма отклоне­ний всех вариант от средней равна нулю : S (V-M)= 0 . Это происходит потому, что средняя величина превышает размеры одних вариант и мень­ше размеров других вариант.

Иначе говоря, истинное отклонение вариант от истинной средней (d =v-М) может быть положительной и отрицательной величи­ной, поэтому сумма S всех "+"d и "-"d равна нулю.

Данное свойство средней используется при проверке правильности расчетов М. Если сумма отклонений вариант от средней равна нулю, то можно сделать вывод, что средняя вычислена правильно. На этом свойстве основан способ моментов для определения М. Ведь если условная средняя А будет равна истинной М, то сумма отклонений вариант от условной средней будет равна нулю.

Роль средних величин в биологии чрезвычайно велика. С одной стороны их используют для характеристики явлений в целом, с другой - они необходимы для оценки отдельных величин. При сравнении отдельных величин со средними получают ценные харак­теристики для каждой из них. Использование средних величин требует строгого соблюдения принципа однородности совокупности. Нарушение этого принципа искажает представление о реальных процессах.

Вычисление средних из неоднородной в социально-экономическом отношении совокупности делает их фик­тивными, искаженными. Следовательно, для того чтобы правильно использовать средние величины, надо быть уверенным в том, что они характеризуют однородные статистические совокупности.

ХАРАКТЕРИСТИКА РАЗНООБРАЗИЯ ПРИЗНАКА В

СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Напри­мер, в группе детей, однородной по возрасту, полу и месту житель­ства, рост каждого ребенка отличается от роста сверстников. То же можно сказать о числе посещений, сделанных отдельными лицами в поликлинику, об уровне белка крови у каждого больного ревматизмом, об уровне артериального давления у отдельных лиц, больных гипертонической болезнью и т. п. В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности. Вариабельность демонстративно можно представить на примере роста в группах подростков.



Статистика позволяет охарактеризовать это специальными крите­риями, определяющими уровень разнообразия каждого признака в той или иной группе. К таким критериям относятся лимит (lim), амплитуда ряда (Am), среднее квадратическое отклонение (s) и коффициент вариации (C v). Так как каждый из этих крите­риев имеет свое самостоятельное значение, то следует остановиться на них отдельно.

Лимит - опреде­ляется крайними значе­ниями вариант в вариа­ционном ряду

Амплитуда (Am) - разность край­них вариант

Лимит и амплитуда - дают определен­ную информацию о степени разнообразия роста в каждой группе. Однако как лимит, так и амплитуда ряда обладает одним существенным недостатком. Они учитывают только разно­образие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Дело в том, что разнообразие проявляется не столько в крайних вариантах, сколько при анализе всей внутренней структуры группы. Поэтому этими критериями можно пользоваться для при­ближенной характеристики разнообразия, особенно при малом чис­ле наблюдений (n<30).

Наиболее полную характеристику разноо­бразию признака в совокупности дает так называемое среднее квадратическое отклоне­ние , обозначаемое греческой буквой "сигма" - s.

Существует два способа расчета среднего квадратического отклонения : среднеарифметический и способ моментов .

При сред­неарифметическом способе расчета применяют формулу, где d - истинное отклонение вариант от истинной средней (V-M).

Формула используется при небольшом числе наблюдений (n<30), когда в вариационном ряду все частоты р= 1.

При р > 1 используют формулу такого вида:

При наличии вычислительной техники эту формулу приме­няют и при большом количестве наблюдений.

Эта формула предназначена для определения "сигмы" по способу моментов:


где: a - условное отклонение от условной средней (V-A ); p - частота встречаемости для варианты; n - число вариант; i - величина интервала между группами.

Этот способ применяется в тех случаях, когда нет вычислитель­ной техники, а вариационный ряд громоздкий как за счет большого числа наблюдений, так и за счет вариант, выраженных многознач­ными числами. При числе наблюдений, равном 30 и менее, в момен­те второй степени п заменяют за (п -1).

Как видно из формулы среднего квадратичного отклонения (4), в знаменателе стоит (п -1), т.е. при числе наблюдений, равном или меньшем 30 (n£30), необходимо в знаменатель формулы брать (п -1). Если при определении средней арифметической М учиты­вают все элементы ряда, то, рассчитывая а, надо брать не все случаи, а на единицу меньше (п-1).

При большом числе наблюдений (n>30) в знаменатель формулы берут п, так как единица не изменяет результаты расчета и поэтому автоматически опускается.

Следует обратить внимание на то, что среднее квадратическое отклонение - именованная величина , поэтому оно должно иметь обозначение, общее для вариант и средней арифметической вели­чины (размерность – кг, см. км и др).

Расчет среднего квадратического отклонения по способу момен­тов производится после расчета средней величины.

Существует еще один критерий, характеризующий уровень раз­нообразия величин признака в совокупности, - коэффициент ва­риации .

Коэффициент вариации (Сv) - является относительной мерой разнообразия, так как исчисляется как процентное отноше­ние среднего квадратического отклонения (а) к средней арифме­тической величине (М). Формула коэффициента вариации такова:

Для ориентировочной оценки степени разнообразия признака пользуются следующими градациями коэффициента вариации. Если коэффициент составляет более 20%, то отмечают сильное разно­образие; при 20-10% - среднее, и если коэффициент менее 10%, то считают, что разнообразие слабое.

Коэффициент вариации применяют при сравнении степени раз­нообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Допустим, необходимо сравнить степень разнообразия массы тела у новорожденных и 5-летних детей. Понятно, что у новорожденных "сигма" всегда будет меньше, чем у семилетних детей, так как меньше их индивидуальная масса. Среднее квадратическое отклонение будет меньше там, где меньше величина самого признака. В этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение, а на относительную меру разнообразия - коэффициент вариации Сv.

Большое значение коэффициент вариации также имеет для оцен­ки и сопоставления степени разнообразия нескольких признаков с разной размерностью. По среднему квадратическому отклонению нельзя еще судить о различии в сте­пени разнообразия указанных признаков. Для этого необходимо использовать коэффициент вариации – Сv.

Среднее квадратическое отклонение связано со структурой ряда распределения признака. Схематич­но это можно изобразить следующим образом.

Теорией статистики доказано, что при нормальном распределе­нии в пределах М±s находится 68% всех случаев, в пределах М±2s - 95,5% всех случаев, а в пределах М±3s - 99,7% всех случаев, составляющих совокупность. Таким образом, М±3s охва­тывает почти весь вариационный ряд.

Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического при­менения среднего квадратического отклонения. Можно восполь­зоваться этим правилом для выяснения - вопроса о типичности средней величины. Если 95% всех вариант находятся в пределах М±2s, то средняя - является характерной для данного ряда и не требуется увеличивать число наблюдений в совокупности. Для опре­деления типичности средней сравнивается фактическое распреде­ление с теоретическим, путем расчета сигмальных отклонений.

Практическое значение среднего квадратического отклонения заключается также в том, что зная М и s , можно построить необходимые вариационные ряды для практического использования. Сигму (s ) также используют для сравнения степени разнообразия однород­ных признаков, например при сравнении колебаний (вариабель­ности) роста детей в городе и селе местности. Зная сигму (s ), можно рассчитать коэффициент вариации (Сv), необходимой для сравнения степени разнообразия признаков, выраженных в различных единицах измерения (сантиметрах, килограммах и др.). Это позволяет выявить более устойчивые (постоянные) и менее устойчивые признаки в совокупности.

Сравнивая коэффициенты вариации (C v), можно сделать выводы о том, что является наиболее устойчивым признаком в совокупности признаков. Среднее квадратическое отклонение (s) используется также для оценки отдельных признаков у одного объекта. Стандартное отклонение указывает, на сколько сигм (s ) от средней (М) отклоняются индивидуальные измерения.

Среднее квадратическое отклонение (s) может быть исполь­зовано в биологии и экологии при разработке проблем нормы и патологии.

Наконец, среднее квадратическое отклонение является важным компонентом формулы т м - сред­ней ошибки средней арифметической (ошибки ре­презентативности):

где т м - средняя ошибка средней арифметической величины (ошибка репрезентативности), п - число наблюдений.

Репрезентативность. Важнейшие теоретические основы репрезентативности были освещены выше в разделе, посвященном выборочной и генеральной совокупности. Репрезентативность означает представительность в выборочной совокупности всех учитываемых признаков (пол, возраст, профессия, стаж и др.) единиц наблюдения, составляющих генеральную совокупность. Достигается эта репрезентативность выборочной совокупности по отношению к генеральной с помощью специальных методов отбора, которые излагаются ниже.

Оценка достоверности результатов исследования базируется на теоретических основах репрезентативности.

ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Под достоверностью статистических показа­телей следует понимать степень их соответствия отображаемой ими действительности. Достоверными результатами считаются те, которые не искажают и правильно отражают объективную реальность.

Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.

В большинстве исследований исследователю приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом - на генеральную совокупность.

Таким образом, оценка достоверности необходима для того, чтобы по части явления должно было бы судить о явлении в целом, о его закономерностях.

Оценка достоверности результатов исследования предусматривает определение:

1) ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) - т ;

2) доверительных границ средних (или относительных) величин;

3) достоверности разности средних (или относительных) величин
(по критерию
t );

4) достоверности различия сравниваемых групп по критерию c 2 .

1. Определение средней ошибки средней (или относительной) величины (ошибки репре­зентативности) - т.

Ошибка репрезентативности (m ) является важнейшей стати­стической величиной, необходимой для оценки достоверности ре­зультатов исследования. Эта ошибка возникает в тех случаях, когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Они проистекают из сущности выбороч­ного исследования; генеральная совокупность может быть охарак­теризована по выборочной совокупности только с некоторой по­грешностью, измеряемой ошибкой репрезентативности.

Ошибки репрезентативности нельзя смешивать с обычным пред­ставлением об ошибках: методических, точности измерения, ариф­метических и др.

По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генераль­ной совокупности.

Этот единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Ошибки репрезентативности можно свести к достаточно малой величине, т. е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточ­ного количества наблюдений (п).

Каждая средняя величина - М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина - Р (уровень ле­тальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой - т. Так, средняя арифметическая вели­чина выборочной совокупности (М) имеет ошибку репрезентатив­ности, которая называется средней ошибкой средней арифметической (m м) и определяется по формуле:

Как видно из этой формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия (s ) возможно путем увели­чения числа наблюдений.

На этом принципе основан метод определения достаточного числа наблюдений для выборочного исследования.

Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается m р

Для определения средней ошибки относительной величины (Р) используется следующая формула:

где Р - относительная величина. Если показатель выражен в про­центах, то q=100-P, если Р- в промиллях, то q=1000-P, если Р- в продецимиллях, то q= 10000-Р и т.д.; п - число наблю­дений. При числе наблюдений менее 30 в знаменатель следует взять (п – 1 ).

Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представ­лена со своей средней ошибкой. Это дает возможность" рассчи­тать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых пока­зателей (результатов исследования).