Содержание

 

Предисловие

Тема 1.   Сводка и группировка исходных данных.

Тема 2.   Абсолютные и относительные величины.

Тема 3.   Средние величины. Средняя арифметическая, средняя гармоническая, применение в экономическом анализе

Тема 4.   Структурное среднее. Мода, медиана.

Тема 5.   Показатели вариации.

Тема 6.   Изучение неравномерности распределения. Расчет коэффициента концентрации Джини.

Тема 7.   Выборочный метод. Расчет средней, предельной ошибки выборки. Расчет оптимальной численности выборки.

Тема 8.   Расчет показателей анализа рядов динамики.

Тема 9.   Изучение тренда. Метод аналитического выравнивания.

Тема 10. Изучение сезонных колебаний способом переменной средней.    

Тема 11. Изучение сезонных колебаний способом постоянной средней.

Тема 12. Индексный метод в экономических исследованиях, индивидуальные индексы. Агрегатные индексы цен.

Тема 13. Применение агрегатных индексов физического объема в анализе реализации продукции.

Тема 14. Средние индексы, использование в анализе реализации продукции.

Тема 15. Исследование динамики товарооборота. Цепные и базисные индексы с переменными и постоянными соизмерителями.

Тема 16. Изучение структурных сдвигов в анализе реализации продукции с использованием индексного метода.

 

Предисловие

 

В экономической практике умение пользоваться статистическими методами сбора, обработки и анализа данных является важнейшей составной частью совокупных специальных  знаний. В настоящее время, когда в учебных заведениях по экономическим специальностям сокращается число учебных часов в аудиториях  по дисциплине «статистика» и в то же время  увеличивается число часов самостоятельной работы студента по предмету, возникает необходимость более полного методического обеспечения самостоятельных и практических работ студентов в разрезе тем обязательного изучения в соответствии Государственного стандарта.

Данное методическое пособие включает в себя методические указания по изучению и практическому освоению 16-ти тем. Каждая тема состоит из краткой теоретической части изучаемой проблемы, методического указания по практическому применению Теоретических знаний по теме, комплекса задач для самостоятельного решения и перечня контрольных вопросов, на которые полезно дать ответы для самопроверки и закрепления знаний.

Данное методическое пособие предназначено для студентов экономических специальностей, а также может быть полезно для Преподавателей экономических дисциплин и экономистов   – практиков.

 

Тема 1. Сводка и группировка исходных данных.

 

Первым этапом экономического исследования является сбор  данных об объекте исследования, в статистике этот процесс носит название статистического наблюдения.  Теория этого вопроса здесь подробно не рассматривается. Практическому экономисту здесь надо знать, что исследуемые данные об объекте наблюдения должны быть полны и достоверны, иначе теряется объективность и пропадает весь смысл исследования.

Вторым этапом исследования является сводка первичных материалов наблюдения, т.е. проведение их в определенную систему, с группировкой, подсчетом, обобщением. Основным элементом сводки является группировка, которая представляет собой объединение данных в однородные по определенным группировочным признакам  группы. Группировочные признаки (основание группировки) бывают количественными и качественными, а также дискретными и интервальными. Распределение исследуемой совокупности по количественному группировочному признаку называется вариационным рядом.

Рассмотрим методику сводки и группировки на следующих примерах:

 

Пример 1. Пусть имеются следующие данные о проценте выполнения норм у 42 рабочих – станочников цеха:

    

 

90

95

100

120

100

120

110

110

115

105

95

105

95

100

105

105

90

105

110

90

105

100

105

115

100

100

105

110

115

100

100

105

105

110

95

100

105

115

100

115

100

105

 

 

 

 

 

 

 

Исследуем, как распределились рабочие – станочники, по проценту выполнения норм выработки построим вариационный ряд распределения в порядке возрастания варианты (процента выполнения  норм) с указанием соответствующих частот (численность рабочих ) в каждой группе. Тогда получим:  

 

                                                                                                     

% выполнения норм

Численность

Удельный вес (в

Накопление

(варианта xi)

рабочих (частота f i)

долях 1) частость(w)

(кумулятивные) частоты

90

3

0,07

3

95

4

0,09

7

100

11

0,25

18

105

12

0,29

30

110

5

0,14

35

115

5

0,12

40

120

2

0,04

42

Итого

42

1

 

 

Построенный таким образом ряд распределения называют дискретным вариационным рядом, где процент выполнения нормы является  вариантой, а численность рабочих частотой. В ряде случаев в исходных данных частоты могут выражаться в долях единицы или в процентах к итогу. В этом случае их называют частостями (w). При необходимости возможно в практике анализа частоты указывать нарастающим итогом как накопленные (кумулятивные) частоты.

Преобразуем построенный дискретный ряд в интервальный. Для этого необходимо определиться с количеством групп, которые необходимы для анализа. Чтобы определить величину интервала в группе находится разница между максимальным и минимальных значениями признака, затем эта разница делится на число выделяемых групп. Допустим, нам , необходимо объединить рабочих по выполнению норм выработки в три группы.

Тогда величина интервала  (h)=120%-90%/3=10%  Следующим шагом необходимо подсчитать частоты по вновь образуемым группам путем их суммирования.

 

Для нашего случая вариационный ряд будет выглядеть:

  

 В практике анализа нередко прибегают к графическому

изображению вариационного ряда. При этом дискретные ряды изображаются графически в виде полигона, а интервальные – в виде гистограммы.

 

18                                                        18

17                                                        17

 

 

 

 

 

7                                                              7

 

        95          105      115                                              90      100   110   120 

 

Полигон распределения                 Гистограмма распределения

рабочих по выполнению норм      рабочих по выполнению норм                                                

                                                          выработки

 

Возможен также вариант графического изображения вариационного ряда в виде кумуляты. Тогда по горизонтали указываются значения варианты, а по вертикали – накопленные (кумулятивные) частоты в процентах к итогу.

 

% выполнения норм

Численность рабочих

удельный вес (в долях

Накопленные (куму-

(варианта) x i

(частота) f i

1) частотность (w)

лятивные ) частоты

90-100

18

0,42

18

100-110

17

0,41

35

110-120

7

0,17

42

Итого

42

1

 

 

Задачи для самостоятельного решения

 

Задача 1. Имеются следующие данные о тарифных разрядах 42 рабочих станочников механического цеха.

3

5

4

6

5

6

4

5

6

6

5

5

5

5

6

5

5

3

5

5

3

5

6

6

5

4

5

5

6

5

4

6

6

5

6

5

5

6

5

6

5

5

 

Необходимо:

1.Произвести группировку и построить на основе данных дискретный вариационный ряд распределения рабочих по разделам.

2.Построить полигон и кумуляту распределения рабочих по тарифным разрядам.

 

Задача 2. Имеются следующие данные о среднемесячной заработной плате 40 рабочих – станочников цеха (у.д.е.)

 

1310

1300

1240

600

1500

1100

1420

1150

900

1500

640

1480

1310

650

1280

1000

1180

1375

1650

1200

1375

1800

1350

1550

1620

720

1750

1310

1790

800

1390

1540

1280

1730

1360

950

1762

1700

1350

1610

 

      

 

 

 

 

 Необходимо:

1.Произвести группировку и построить интервальный вариационный  ряд распределения, разбив совокупность на три группы.

2.Построить гистограмму и кумуляту распределения рабочих по размеру средней месячной заработной платы.

 

Задача 3. Имеются следующие данные о выполнении плана по выручке на 10 торговых предприятиях фирмы за месяц.

 

# магазина

Выручка (тыс. руб.)

# магазина

Выручка (тыс. руб)

План

Факт

План

Факт

1

2

3

1

2

3

1

250

246

6

200

220

2

340

352

7

1220

1000

3

260

230

8

1420

1020

4

590

620

9

890

900

5

610

590

10

900

840

 

Необходимо:

  1. Произвести группировку торговых предприятий по признаку выполнения плана с подведением итогов по каждой группе.
  2. Рассчитать процент выполнения плана выручки.
  3. Построить полигон распределения предприятий по проценту выполнению плана выручки.

 

Контрольные вопросы:

1. Что такое сводка? В чем её экономический смысл?

2. Что такое Группировочные признак? Какие виды вы знаете?

3. Дайте определение вариационного ряда распределения. 

4. Какие элементы вариационного ряда? Название и определение.

5. Как графически можно отразить дискретный и интервальный вариационные ряды.

 

Тема 2. Использование абсолютных и относительных величин в экономическом анализе.

 

   Теоретическая база.

 

Общая теория абсолютных и относительных величин. Виды, область применения, способы выражения.

Экономический анализ невозможен без использования абсолютных и относительных величин.

      Абсолютные величины – это именованные числа, имеющие определенную размерность. Единицы измерения – абсолютных

величин, в зависимости от обстоятельств и целей анализа, могут быть натуральными, стоимостными (денежными) и трудовыми.

Причем, натуральные единицы измерения включают в себя еще условно-натуральные и условные единицы измерения.

В практике анализа динамики, сравнения, интенсивности, структуры и т.д. общественных явлений невозможно обойтись без применения относительных величин. При этом надо иметь ввиду, что при расчете относительных величин сравниваемая (анализируемая) величина всегда находится в числителе отношения, а величина с которой производится сравнение (знаменатель отношения) принимается за базу для сравнения. Следует также иметь ввиду, что при анализе необходимо тесное взаимодействие абсолютных и относительных величин.

 

    Примеры решения задач:

 

1. Имеются следующие данные о производстве сыра молокозаводом, за месяц.

Таблица 1.

% жирности

Выпуск (тон)

 1

2

50

0,45

45

1,2

40

2,1

35

4

25

5

20

5,6

 

 

 Необходимо:

1.Расчитать % выполнения плана в условно-натуральных единицах измерения если заводу установлен план по выпуску 16,5 тон условного сыра в месяц. В качестве условного, принимается сыр 35 % жирности.

Решение:

1.Расчитаем коэффициенты перевода сыров различной жирности в условный сыр. Тогда:

                  50                                                                                                  

Kn 50% = ---- = 1.43;  

                  35

 

                  45

Kn 45% = ----- = 1.28;  

                  35

 

                   40

Kn 40% = ----- = 1.14

                    35

                                                        25                                   20

Kn 35% = 1.0;             Kn 25% = ----- = 0.7;    Kn 20% = ----- = 0.57

                                                 35                                   35

 

2.Рассчитаем общий выпуск условного сыра за месяц:

0,45 * 1,43 + 1,2 * 1,28 + 2,1 * 1,14 + 1,0 * 4,0 + 5,0 * 0,7 + 5,6 * 0,57 = = 0,64 + 1,536 + 2,394 + 4,0 + 3,5 + 3,192 = 15,265тн ~ 15.3тн

3.Рассчитаем % выполнения плана в условно-натуральных  единиц измерения:

                                     

    15,3

    ---- * 100 = 92,7%

    16,5     

                               

 Вывод: Таким образом, план по выпуску сыра молокозаводом в условно-натуральном исчислении недовыполнен на 7,3%(92,7-100).

 

  Задание 2.

Имеются следующие данные о производстве томатной пасты консервным заводом.

 

Емкость

Тары (кг)

Выпущено

(шт.)

                            Расчетные графы

Удельный вес в %                   к итогу в шт.

Выпуск продукции  в условных банках

 

 10              

 

 

120

 

 120

------ *100 = 5,3  

2280

100

----- * 120 = 2400

 0,5

 

  5

 

 

 

160

 

 

160

------ * 100 = 7,0

2280

 

  5

---- * 160 = 1600

0,5

 

 

  3  

 

 

200

 

200

----- * 100 = 8,8(1)

2280

  3

---- * 200 = 1200

0,5

 

   1

 

 

  350

 350

------ * 100 = 15,4 (1)

2280

 1

--- * 350 = 700

0,5

 

   0,5

 

  500

500

----- * 100 = 21,9

2280

 

1 * 500 = 500

 

 

   0,25

 

 

  950

950

----- *100 = 41,6

2280

0,25

------ * 950 = 475

0,5

 

Итого          

 

  2280

 

100

 

6875

 

        По отчетным данным гр. 1, 2 табл. Требуется рассчитать структуру фактического выпуска продукции в натуральных единицах измерения и процент  выполнения плана в условных единицах измерения (условная банка – 0,5 кг) при плане 6,0 тыс. условных банок за декаду.

  Решение:

 1.Расчет структуры выпуска продукции в натуральных единицах измерения приведен в гр. 3 табл. Как видно из расчетов наибольший удельный вес продукции выпускается в таре (банке) 250 граммов (41,6%).

 2.Расчет коэффициентов перевода и выпуска продукции в условных единицах измерения (усл. банки) приведен в гр. 4 табл.

 3.План по производству продукции в условных банках (составляет 114,5 (6875 : 6000 * 100), т.е. процент перевыполнения составляет 14,5% (114,5-100).

 

Задачи для самостоятельного решения.

 

Задача 1. Имеются следующие данные о выпуске местных консервов консервным комбинатом:

Вес банки (кг)

Выпуск (шт.)

План

Факт

1

1450

1500

0,75

2040

2000

0,5

2000

1800

0,35

2500

2350

0,25

2780

3210

 

Необходимо:

1.Рассчитать плановую и фактическую структуру выпуска консервов в натуральных единицах измерения. Сделать выводы.

 2.Рассчитать выполнение плана по всему ассортименту в условных банках, приняв в качестве условной банку емкостью 0,5 кг.

 

Задача 2.Имеются следующие данные о выполнении плана по товарообороту секциями магазина:

 

Секция

Товарооборот (тыс. руб.)

План

Факт

Ткани

250

245

Галантерея

150

120

Обувь

300

310

Сувениры

200

140

Посуда

420

420

 

Необходимо:

 1.Определить плановую и фактическую структуру товарооборота магазина.

 2.Определить выполнение плана по каждой секции и по магазину в целом.

 3.Сделать выводы по результатам анализа.

 

Задача 3. Имеются следующие данные о составе внеоборотных активов предприятия за год (тыс. руб.):

 

Актив

Код

На начало

На конец

Изменение (+)

строки

года

года

Тыс. руб.

      %

1

2

3

4

5

6

Нематериальные активы

110

1036

5017

 

 

Основные средства

120

3436935

3044743

 

 

Незавершенное

130

10437

606805

 

 

производство

Долгосрочные финансовые  вложения

140

541897

95426

 

 

 

Итого по разделу 1

190

3990305

3751991

 

 

Баланс (итог, актива)

 

 

Необходимо:

 1.Заполнить расчетные графы 5, 6.

 2.Рассчитать структуру внеоборотных активов предприятия на начало и конец года и ее изменение в гр. 6.

 3.Рассчитать удельный вес внеоборотных активов в имуществе предприятия.

 4.Сделать выводы по результатам изменения структуры внеоборотных активов.

Задача 4. Имеются следующие данные о составе основных фондов предприятия.

 

Состав основных средств

Среднегодовая стоимость (тыс.руб.)

1.Здания

2544

2.Сооружения

620

3.Оборудование:

 

_рабочее

8650

_силовое

6440

4.Инструмент, КИПиА

800

5.Производственный инвентарь

100

 

Необходимо:

1.Рассчитать структуру ОПФ предприятия.

2.Определить ее прогрессивность при условии:стр.3+стр4>50%

 

Контрольные вопросы:

1.Абсолютные величины. Область применения.

2.Условно-натуральные. Условные единицы измерения. Область применения.

3.Какие виды относительных величин Вы знаете?

4.Что означает понятие «структура совокупности»?

 

Тема 3. Средние величины. Средняя арифметическая, средняя гармоническая. Область применения в экономическом анализе.

 

 Теоретическая база: Общая теория средних величин, виды средних, способы расчета, свойства.

       В практике экономического анализа часто возникает необходимость расчета показателей, характеризующих общие, средние характеристики исследуемой совокупности. Математическая статистика рассматривает несколько видов средних. В практике анализа наиболее распространенной является средняя арифметическая.

         Средняя арифметическая может быть рассчитана как простая и как взвешенная по формулам:

                                 n

                                 ∑ xi

                               i = 1

                      x = ------------                                            (3.1)     

                                n

Средняя арифметическая для не сгруппированных данных

                  n

                  ∑   xi * fi

               i = 1

         x = ------------                                            (3.2)     

                  n                                                                                                                                                                                                 

                 ∑  fi

                i=1

Средняя арифметическая взвешенная по частотам (fi) (сгруппированные данные)

         n

         ∑   xi * wi

   _  i = 1

   x = ------------                                            (3.3)     

n                                                                                                                              ∑  wi

i=1

 

Средняя арифметическая взвешенная по частостям (wi)  

где: xi – значение усредняемого группировочного признака (варианты);

fi – частота (повторяемость) вариант в ряду распределения;                                                                                                 

wi–частость(уд. вес частот в общем итоге в % или коэффициентах);                                          

n – количество вариант в ряду распределения.

        Средняя арифметическая по формуле 3.1 рассчитывается только для не сгруппированных данных (fi =1). Во всех остальных случаях при расчете средней используются формулы 3.2 и 3.3, т.к. на значение средней помимо значения усредняемого группировочного признака значительное влияние оказывают его частоты.

        В тех случаях, когда в исходных данных для анализа, организованных в виде ряда распределения, частоты ряда отсутствуют явно при наличии общего показателя «V», представляющего произведение варианты на частоту (xi*fi), например, выручка – это сложный показатель, представляющий собой произведение цены единицы товара на количество проданных товаров (pigi).

 В этом случае при расчете средней используется формула средней гармонической

      _     ∑  vi

      x = ---------                                 (3.4)

                 vi

            ∑ -----

                 xi

Это формула является производной формулы(3.2)

 

       В тех случаях, когда исходные данные предоставлены в виде интервального вариационного ряда для расчета средней необходимо предварительно преобразовать  интервальный вариационный ряд в дискретный по следующему правилу:

 

 1.Для определения интервалов дискретное значение варианты определяются как средняя арифметическая нижней и верхней границ, т.е. середина интервала.

 2.Величина первого неопределенного интервала «до» берется равной следующему за ним определенному интервалу.

 3.Величина последнего  неопределенного интервала «больше» берется равной величине предыдущего определенного интервала.

 

Ниже приводятся примеры решения задач с использованием формул 3.1 – 3.4.

 

Задача 1. Имеются следующие данные о заработной плате (в месяц) у 6-ти рабочих-станочников.

 

Номер п/п

1

2

3

4

5

6

Зарплата за месяц (у.д.е.)

700

840

1200

1220

1800

2300

 

Требуется рассчитать среднюю месячную зарплату по данной группе рабочих. Решение:

 Поскольку исходные данные представлены в виде вариационного ряда с одиночными значениями вариант (не сгруппированные данные), то для расчета средней используется ф. 1.3

          n

        ∑   xi

  _     i = 1                700 + 840 + 1200 + 1220 + 1800 + 2300

 x = ------------   = -------------------------------------------------------------

          n                                                 6

 

= 1343,3 руб.                                    

       

т.е. средняя заработная плата в месяц по данной группе рабочих составляет 1343,3 руб.

 

Задача 2. В результате предварительной группировки по квалификации (тарифному разряду) 50-ти рабочих цеха получено следующие распределение:

 

Разряд

2

3

4

5

6

Количество рабочих fi

3

12

19

11

5

 

Требуется рассчитать средний разряд  50-ти рабочих цеха.

 

 

 

Решение:

Поскольку исходные данные представляют дискретный сгруппированный вариационный ряд, для расчета средней используется формула:

 

          n

        ∑   xi * fi

  _     i = 1                    2*3+3*12+4*19+5*11+6*5           6+36+76+55+30

 x = ------------  = ------------------------------------------ = ----------------------                                            

         n                                            50                                          50

        ∑  fi

        i=1

 

     203

= ------- 4,0

      50         

 

 

Т.е. данная группа рабочих цеха имеет в среднем 4-ый квалификационный разряд.

 

Задача 3. Имеются следующие данные о ценах и объемах реализации(выручке) товара М по четырем магазинам города.

    

           

№ магазина

Цена за ед.,руб.(xi)

Выручка в день, руб.(vi)

1

42

900

2

44,2

600

3

41,5

1200

4

45

500

 

Требуется распределить среднюю цену реализации товара М по группе магазинов.

 

Решение:

       В данном случае в ряду распределения отсутствуют явно частоты, тогда для решения данной задачи применяется формула средней гармонической.  

  _     ∑  vi         900+600+1200+500                       3200

  x = --------- = ------------------------------- = -------------------------- =                              

              vi        900    600    1200     500     21,4+13,6+28,9+11,1

         ∑ -----       ----- + ---- + ------ + -----

              xi         42     44,2    41,5     45

    

 

     3200

= -------- = 42,6

     75              

т.е. средняя цена реализации товара М по данной группе магазинов составляет 42,6 руб. за ед.

 

Задачи для самостоятельного решения:

 

Задача 1.Имеются следующие данные о себестоимости производства изделия «А» на предприятиях отрасли:

 

 

Предприятие

1

2

3

4

5

6

7

8

Себестоимость ед.,руб.

2100

1900

2200

1950

2400

2600

1980

2260

 

Требуется определить среднюю себестоимость изделия А по данной группе предприятий отрасли.

 

Задача 2. Имеются следующие данные о возрастных группах детей  спортивном лагере.    

                                      

Возрастная группа (лет)

Кол-во детей в группе

8

25

9

42

10

60

11

38

12

22

13

16

 

 Требуется:

1.Определить средний возраст детей в лагере.

2.Ростроить полигон распределения детей по возрасту.

 

Задача 3.В результате предварительной группировки рабочих цеха по размеру месячной заработной платы получено следующее распределение:

 

Заработная плата за месяц, у.д.е.

Количество рабочих

До 600

12

600 - 800

18

800 - 1000

34

1000 - 1200

45

1200 - 1400

39

1400 - 1600

20

> 1600

16

 

Требуется:

1.Рассчитать среднюю зарплату данной группы рабочих.

2.Построить гистограмму распределения рабочих цеха по размеру заработной платы.

 

Задача 4.Имеются следующие данные о выпуске сыра на молсыркомбинате.

 

Жирность сыра, %

Удельный вес выпуска к общ. Итогу, %

20

20

25

27

30

20

35

15

40

10

45

5

50

3

 

Требуется:

1.Опрделить средний процент жирности выпускаемого комбинатом сыра.

2.Построить полигон распределения выпуска сыра по проценту гистограммы.

 

Задача 5.Имеются следующие данные о затратах на производство продукции «А» на предприятиях отрасли.

 

Предприятие

Себестоимость ед. продукции

Себестоимость выпуска

1

1200

4800

2

900

4500

3

950

4275

4

1300

4940

5

1400

3500

 

Требуется рассчитать среднюю цену реализации шины типоразмера «А» по данной группе регионов.

 

 

Контрольные вопросы:                                                                         

 

1.Какие виды средних величин применяются в экономических

исследования данных, представленных рядами распределения?

2.Как исчисляются средние арифметические: простая и взвешенная?

3.В каких случаях применяется средняя гармоническая?

 

Тема 4. Структурные средние. Мода, медиана.

 

1.Теоретическая база.

 Для выполнения заданий данного практического занятия студент должен знать теорию рядов распределения, средних величин, уметь практически их рассчитывать. Иметь общее представление о структурных средних величинах их значении и месте в процессе экономического исследования, способах их расчета.

 

2.Общие теоретические вопросы, термины, определения, основные расчетные формулы.

        В ряде случаев при анализе данных, представленных в виде распределений еще не достаточно знать значение средней величины группировочного признака. В этом случае исследуются показатели, характеризующие структуру ряда. Показатели колеблемости (вариации), симметрии и др.

        В данной теме рассматривается методика расчета структурных средних – моды и медианы.

        Мода (М0) – наиболее часто встречающееся значение признака в ряду распределения. В дискретном ряду распределения мода – это значение варианты с наибольшей частотой. В интервальном симметричном ряду мода – это серединное значение модального интервала.

В других случаях значение моды определяется по формуле:

                                        f M0 – f M0 - 1

М0 = x M0 + i M0 -------------------------------                        (4.1)

                         ( f M0 -- f M0 -1) + (f M0 - f M0 + 1)

где: x M0 – нижняя граница модального интервала;

i M0 – величина модального интервала;

f M0 – частота модального интервала;

f M0 -1 – частота интервала, предшествующего модальному;

f M0 + 1 – частота интервала, следующего за модальным.

 

        Медиана (Ме) – делит упорядоченный (ранжированный) в порядке возрастания варианты ряд распределения на две равные части. В одновариантном ряду распределения с нечетным числом вариант медиана – это серединная варианта, а с четным числом вариант медиана – это среднее значение двух серединных вариант. В интервальном симметричном ряду распределения медиана – это

середина медианного интервала. В других случаях значение медианы определяется по формуле:

                                       ∑ f

                                   -------- - ∑ f Me -1

                                         2

Ме =  x Mе + i Mе --------------------                                (4.2)

                                       f Mе

где: x Mе – нижняя граница медианного интервала;

i Mе – величина медианного интервала;

f

----- - полусумма частот ряда;

  2

f Me -1 – сумма частот до частоты медианного интервала      (накопленная частота до мед. интервала);

f Mе – частота медианного интервала.

Нахождение медианного интервала. Для нахождения медианного интервала в ассиметричных рядах необходимо вначале определить медианную накопленную частоту (номер медианы) f MЕS:

            ∑ f

f MЕS  = --------                                                         (4.3)

  2

        Затем по значению f MCS  определяется интервал, в котором она находится. Следует иметь в виду, что ранжированный ряд распределения может быть рассечен на 4 части (квартили), на 5 частей (квантили) и на 10 частей (депили), которые нумеруются в порядке вырастания 1я, 2я, 3я, 4я, 5я, …, 9я.

 

Примеры решения задач.

 

Задача 1. В результате предварительной группировки рабочих цеха по размеру заработной платы получено следующее распределение:

 

Заработная плата

Середина интервала

Число рабочих f i

Накопленные частоты

за месяц (у.д.е.)

              S

1

2

3

4

600-800

700

15

15

800-1000

900

35

50

1000-1200

1100

10

60

1200-1400

1300

8

68

1400-1600

1500

6

74

> 1600

1700

4

78

 

 

Требуется:

1.Рассчитать среднюю, модальную и медианную заработную плату.

2.Построить кумуляту и гистограмму распределения рабочих по размеру заработной платы (графическое определения Ме и М0).

3.сделать выводы по результатам расчетов.

 

Решение:

1.Определяем среднюю заработную плату данной группы рабочих по формуле средней арифметической взвешенной: 

 

          700*15+900*35+1100*10+1300*8+1500*6+1700*4

Зпл =                                                                                          =

                                               78

    79200

= -------- = 1015 руб.

            78

2.Опрделяем модальную зар. плату по ф. 4.1:

 

                                           13 -15

Зпл М0 = 800 + 200 ------------------------- = 800 + 200*0,44 =889 руб.

                                 (35 – 15) + (35 -10)

 

3.Определяем медианную зар. плату для чего:

 

3.1.Находим медианную накопленную частоту по ф.4.3:

             78

f MЕS  = -------- = 39

              2

 

Это частота находится в интервале заработной платы от 800 до 1000 у.д.е.

 

3.2.Определим медианную заработную плату

 

                                   39 - 15

Ме зпл = 800 + 200 ---------- = 800 + 200*0,68 = 937 у.д.е.

                                      35

4.Построим кумуляту распределения рабочих по размеру заработной платы (графическое определение медианы).

                                      

f i

 

 

78

50

 

39

15

                      889                            X i

     Общий вид кумуляты

 

Рис.1. Кумулята распределения рабочих (78 чел.) по размеру заработной платы.

 

        Построим гистограмму распределения рабочих по размеру заработной платы (графическое определение моды). Самостоятельно определить точки.

 

35

 

15

10

  8

  6

  4

 

       600.800.1000.1200.1400.1600.1700

Общий вид гистограммы

 

Рис. 2.Гистограмма распределения рабочих (78 чел.) по размеру заработной платы.

 

 

6.Выводы:

        Таким образом, исследование показало, что основная часть рабочих получает заработную плату значительно ниже средней (889 у.д.е. < 1015 у.д.е.), а у половины рабочих цеха заработная плата не достигает одной тысячи рублей в месяц при среднем ее значение в данной группе 1015 у.д.е..

                                                    

Задачи для самостоятельного решения.

 

Задача 1. По результатам предварительного обследования населения районного центра по уровню среднемесячного дохода получено следующее распределение:

 

Среднемесячный доход, у.д.е.

Уд. Вес населения в %

До 500

5

500-1000

25

1000-1500

35

1500-2000

15

2000-2500

6

Более 2500

2

 

Требуется:

1.Определить средний модальный и медианный доход, отобразить их графически.

2.Сделать выводы по результатам анализа.

 

Задача 2.Предварительная группировка предприятий региона по эффективности использования основных фондов (показатель фондоотдачи) дала следующее распределение:

 

 

 

Коэффициент фондоотдачи

Кол-во предприятий

 1

2

0,15-0,35

12

0,35-0,55

22

0,55-0,75

7

0,75-0,95

4

0,95-1,15

3

>1,15

2

 

 Требуется:

1.Рассчитать среднее, модальное и медианное значение рентабельности предприятий концерна. Отобразить ситуацию графически.

2.Сделать выводы по результатам исследования.

 

Задача 4.Имеются следующие данные о выполнении норм выработки 10-ти рабочих-станочников цеха:

 

 

 

Таб. № рабочего

1

2

3

4

5

6

7

8

9

10

% вып. Норм выработки

92

110

96

115

120

110

97

98

100

105

 

 

 

 

 

 

Требуется:

1.Средний и медианный процент выполнения норм данной группы рабочих. Отобразить ситуацию графически.

2.Сделать выводы по результатам исследования.

                                                   

Контрольные вопросы.

1.Для каких целей рассчитываются показатели моды и медианы?

2.Как определяются мода и медиана для дискретных и интервальных вариационных рядов распределения.

3.Каким образом графически определить моду и медиану.

Тема 5.Показатели вариации.

 

1 Теоретическая база.

 

         Для выполнения заданий данной практической работы студент должен изучить лекционный материал и рекомендованную литературу по данной теме, в особенности (1) и (2), а также выполнить предыдущие практические работы.

 

2 Общие теоретические вопросы, термины,  определения, методы (способы), основные формулы расчета показателей вариации.

       Как уже можно было убедится на примерах предыдущих практических работ, что среднее значение количественного группировочного признака изучаемой совокупности достаточно абстрактно и поэтому ограничиваться его расчетом при анализе было бы неправильно. Поэтому для получения более полных и точных результатов исследования совокупностей. Организованных в виде распределений, рассчитываются дополнительные показатели и среди них показатели вариации (колеблемости) количественного группировочного признака. В общем виде эти показатели подразделяются на абсолютные, средние и относительные.

 

2.1 Абсолютный показатель вариации – размах вариации (R), который рассчитывается как разность между max min значениями варианты в ряду распределения. Т.е. R = X max  - X min                      (5.1)

 

2.2 Средние показатели вариации.

         Среднее линейное отклонение (d), которое представляет собой среднюю арифметическую (простую или взвешенную) абсолютных отклонений (без учета знака) индивидуальных значений вариант (Xi) от среднего значения (X).

Рассчитывается по формулам:

         n             _

        ∑ ( X iX)

_          i=1

D =           

             n                          (5.2)-для несгруппированных данных

        

        n                    _

        ∑ ( X iX)*f i

_          i=1

d =       n                               (5.3)-для сгруппированных данных

            ∑ f i

             i=1

Дисперсия (ơ²), которая представляет собой среднюю арифметическую (простую или взвешенную) из квадратов абсолютных отклонений индивидуальных значений вариант (X i) от среднего значения (X).

 

         n                    _

        ∑ ( X iX

            i=1

σ² =  ---------------               (5.4) – для не сгруппированных данных  

                n

             n                    _

        ∑ ( X iX)² * f i

            i=1

σ² =            n                          (5.5)- для сгруппированных данных  

                  ∑ f i

                  i=1

 

Используя свойство минимальности дисперсии для её расчета, при условии равных интервалов, может быть применим способ моментов.

             n                  

        ∑  Xi² * f i                           2

            i=1               ∑  Xi * f i                _

σ² =                      -                       = X² - X                                        

            ∑ f i               ∑ f i

                  

т.е. дисперсия рассчитывается как разность среднего квадрата значении признака X² и квадрата среднего его значения. Здесь нужно заметить, что в смысле достоверности результата, формула (5,6) дает меньшую точность, чем формула (5,5). Используется, как правило, для простоты расчета при ручном способе.

В тех случаях, когда совокупность детализирована на отдельные группы и возникает необходимость расчета общей дисперсии по совокупности в целом, применяется правило сложения дисперсий, которое формулируется так:

σ²общ  = σ²вн.гр. + σ²м.гр.                     (5,7)

где:

 

σ²общ  -   общая дисперсия признака по всей совокупности в целом;

σ²вн.гр – средняя внутригрупповая дисперсия, которая представляет собой среднюю арифметическую групповых дисперсий и рассчитывается по формуле:

 

 

                      n                 

              σ²iгр * ∑fi гр               

                     i=1                    σ²1гр*∑f1гр+σ²2гр*∑f2гр +…+ σ²nгр*∑fnгр

σ²вн.гр = ------------------ = -------------------------------------------------------

                      n                                   ∑f1гр + ∑f2гр + … + ∑fnгр

                      ∑ f i                          

                     i=1                                

                                                                                             (5.8)

 

где :

f i - сумма частот всех групп

f iгр - сумма частот 1й группы

 

σ²м гр - межгрупповая дисперсия, которая рассчитывается как средняя арифме­тическая отклонений средних значений признака групп от общей средней, т.е.:

                      n     _              _

              ∑ (Xi гр - Xо)² * ∑ fi гр               

                     i=1

σ²м гр = ----------------------------                             (5.9)

                            ∑ fi

где:

 

Xi гр - среднее значение признака по отдельным группам

Xo -   общая средняя, рассчитываемая как средняя арифметическая из средних значении признака совокупности групп –

 

                      n  _               

              ∑Xi гр  * ∑fi гр               

 _                  i=1                

                                              X1гр*∑f1гр+X2гр*∑f2гр+…+Xn гр*∑fn гр   

Xобщ = ------------------ = ------------------------------------------------------------

                       ∑fi                    ∑f1гр + ∑f2гр + … + ∑fn гр

 

 (5.10)

 

Среднее  квадратическое  отклонение  (σ),  рассчитывающееся  как  корень квадратный из дисперсии, т.е.: σ = Öσ²    (5.11)         

 

2.3         Относительные показатели вариации.

 

          Коэффициент осцилляции (Ко) — характеризует относительную колеблемость крайних значений признака от среднего значения. Рассчитывается как:

 

          R

Ко = --- 100%                                                                                   (5.12)

          X          

                                                

         Относительное линейное отклонение (Kd) - характеризует долю среднего линейного отклонения признака в значение средней. Рассчитывается как:

          _

          d

Ко = --- 100%                                                                          (5.13)

          X                                                                                                                                     

 

         Коэффициент    вариации    (г)    -    характеризует    удельный    вес    среднего квадратичного отклонения признака в значение средней.

Рассчитывается как:

      σ

r = --- 100%                                                                                     (5.14)

  

 

% выполнения норм выработки Xi

Численность рабочих

 

1-я группа fi

2-я группа fi

3-я группа fi

80

5

 

 

90

7

 

 

100

10

15

 

110

6

20

8

120

4

10

12

130

 

8

6

Итого:

32

53

26

 

Относительные показатели вариации используются, как правило, в сравнительном анализе вариации признака в разрезе групп, совокупностей и т.д.

        Ниже приводится методика и последовательность действий по расчёту показателей вариации с учётом современного применения компьютерной техники.

 

3.Примеры расчёта показателей вариации.

 

 

Проведено обследование выполнения норм по трём группам рабочих-станочников цеха. В результате получено следующее распределение:

 

Требуется:

1.   Рассчитать   абсолютные,   средние   и   относительные   показатели вариации процента выполнения норм по каждой группе.

2.  Произвести сравнительный анализ показателей вариации по группам.

 

3. Рассчитать общую дисперсию по всей совокупности рабочих.

Решение по вопросу 1: Первая группа рабочих

 

1.   Определим размах вариации (R) по формуле (5.1)

       R1rp. = 120% - 80% = 40%

2.  Определим средний процент выполнения норм по формуле     3.2

 

_            80 * 5 + 90 * 7 + 100 * 10 + 110 * 6 + 120 * 4            3170

X1гр = --------------------------------------------------------- = ------ =                 100%

                                                32                                                   32

 

=  99.06

 

 3. Определим   среднее   линейное   отклонение   индивидуальных процента выполнения норм от среднего значения по формуле (5.3)

 

_       (80-100)*5 +(90-100)*7 +0+(110-100)*6 +(120-120)*4  310

d1гр = ------------------------------------------------------------ =     ----    =

                                                              32                                  32

 

 = 9, 68%

 

 4. Определим дисперсию выполнения норм по формуле (5.5)

 

           (-20)² *5+(-10)² *7+0+10² *6+20² *4     4900

σ²1гр = ------------------------------------------- = -------- = 153                           

                                              32                            32

5. Определим среднее квадратичное отклонение по формуле (5.11)

σ1гр =  Ö153 = 12,3%

 

6. Определим коэффициент осцилляции по формуле (5.12)

               

                40

Ко 1гр = ----- * 100% = 40%

               100

7.Определим относительное линейное отклонение по формуле(5,13)

                9.68

Кd 1гр = ------- * 100% = 9.68%

                100

8. Определим коэффициент вариации по формуле (5.14)

               12.3

Кr 1гр = ------- * 100% =12,3%

               100

Используя приведённую выше методику расчёта, аналогично, определим показатели вариации для второй и третьей групп рабочих (предполагается самостоятельно выполнить расчёты и сверить результаты).

Вторая группа

 

R2rp=30%        Х2гр=112%        d2гр=8,5%      σ²2гр=76%

σР=8,7%       Ko2rp=26,7%        Kd2rp=7,6%      Kr2rp=7,7%

 

Третья группа рабочих

 

R3rp=30%        Х3гр=112%        d3гр=8,5%      σ²3гр=76%

σР=8,7%       Ko3rp=26,7%        Kd3rp=7,6%      Kr3rp=7,7%

 

 

Решение по вопросу 2:

 

        Таким образом, сравнительный анализ расчётных показателей вариации выполнения норм выработки показывает, что наименьшие показатели рассеивания индивидуальных значений процента выполнения норм выработки вокруг значения средней в третьей группе рабочих наименьший, а в первой группе рабочих наибольший.

Это означает, что третья группа рабочих по производительности труда наиболее однородна, а первая группа наиболее разнородна.

 

Решение по вопросу 3:

  1. Определим внутригрупповую дисперсию по формуле (5.8)

 

             153*32 + 76*53 + 53*26        10302

σ²вн.гр = -------------------------------- = ---------- = 93

                      32 + 53 + 26                     111

2.   Определим общую среднюю по формуле (5.10) 

 

 

 

_           100*32 + 112*53 + 119*26      12230

Xобщ = --------------------------------- = ---------- = 110%

                          32 + 53 + 26                   111

3.Определим межгрупповую дисперсию по формуле (5.9)

 

            (100-110)² *32+(112-110)² *53+(119-110)² * 26     5518

σ²м гр = ---------------------------------------------------------- = ------- =                

                                          32 + 53 + 26

 

= 49.7

 

4.   Определим общую дисперсию по всей совокупности в целом по формуле (5.7)

 

5.   Определим среднее квадратичное отклонение по всей совокупности в целом

 

σобщ = Ö142,7 =11,9

 

Задачи для самостоятельного решения

 

Задача 1. По результатам предварительной группировки работающих на предприятии по размеру заработной платы, получено следующее распределение:

Месячная зарплата

Удельный вес численности (в %), по группам работающих

 

1

2

3

500-1000

5

14

 

1000-1500

25

35

 

1500-2000

60

40

 

2000-2500

10

6

15

2500-3000

 

4

45

3000-3500

 

2

30

>3500

 

1

10

 

Требуется:

1. Рассчитать  абсолютные,  средние и  относительные показатели вариации

признака по группам работающих.

2. Рассчитать общую дисперсию и среднее квадратическое отклонение по всей

совокупности работающих.

3. Сделать выводы по результатам расчётов.

 

Задача 2. По результатам предварительной группировки населения по среднемесячному доходу сложилось следующее распределение:

 

Доход в месяц

Удельный вес населения (в % к итогу), по группам

 

1

2

3

До 600

4

 

5

600-1200

25

18

8

1200-1800

55

42

12

1800-2400

10

30

30

2400-3000

6

10

25

3000-3600

 

 

12

3600-4200

 

 

6

>4200

 

 

2

 

Требуется:

1.   Рассчитать   абсолютные,   средние   и   относительные   показатели   вариации месячного дохода по группам населения района.

2.   Рассчитать общую дисперсию и среднее квадратическое отклонение по всей совокупности населения района в целом.

3.   Сделать выводы по результатам расчётов.

 

Задача 3.   Предварительная группировка предприятий отрасли по фондоотдаче дала следующее распределение:

 

Фондоотдача

Количество предприятий

0,15-0,35

12

0,35-0,55

22

0,55-0,75

7

0,75-0,95

4

0,95-1,15

3

>1,15

2

Требуется:

1. Рассчитать все показатели вариации признака.

2. Сделать выводы о колеблемости рентабельности на предприятиях отрасли.

 

5.   Контрольные вопросы:

1.Что означает показатель "колеблемость" применительно к вариационному ряду распределения?

2.Как подразделяются показатели вариации?

3.Что такое размах вариации, дисперсия, среднее квадратическое отклонение?

4.Что такое относительные показатели вариации и как они рассчитываются?

5.Какие способы расчёта дисперсии Вы знаете?

6.Как формулируется правило сложения дисперсий?

7.Какие показатели вариации с Вашей точки зрения являются наиболее существенными при экспресс-анализе?

 

Тема 6. Показатели исследования распределений. Коэффициент концентрации Джин.

 

1. Теоретическая база

Для выполнения данной практической работы студент должен владеть лекционным материалом по данной теме, а также быть знакомым с литературой! данному вопросу. При предварительном изучении теории и практики в разрезе данной темы рекомендуется внимательно ознакомиться с[1]стр. 10-14, 32-35.

 

2   Основы теории по данной теме.

Очень важным моментом при анализе распределений является изучение степ их неравномерности. Степень неравномерности распределений может быть охарактеризована показателями моды, медианы, квартальных, квантильных и цедильных коэффициентов дифференциации, а также коэффициента концентра] Джини.

Методика расчёта структурных средних рассматривалась в практических работах по теме 4, поэтому здесь рассматривается методика расчёта коэффициента концентрации Джини и децильных коэффициентов дифференциации.

Расчёт коэффициента Джини (Gджи) основан на исследовании кривой Лоренца, которая строится в осях кумулятивных частостей (ось абсцисс) и кумулятивных суммарных показателей варианты (в % к итогу).

 

 

Кумулятивные доли частот

 

В сущности, коэффициент Джини (Gджи) рассчитывается как отношение площади (S1), ограниченной линией равномерного распределения (диагональ квадрата) и кривой Лоренца, к половине площади квадрата, которую можно представить как

                                  S1

(S1 + S2), т.е. G = --------             (6.1)

                              S1 + S2

Поскольку S1 + S2 = 0,5 , то

 

       0,5 – S2

G = ---------- = 1 – 2S2           

          0,5

 

Для упрощения расчётов коэффициента Джини приближённо может быть использована формула, предложенная проф. Громыко Г. Л.[2], по которой G = åcumWi * cumYi+1 - åcumWi+1 * cumYi, (6.2), где:

 

cum Wi - кумулятивные доли частот (частости) распределения

cum Yi, - кумулятивные доли суммарного показателя

 

Для оценки дифференциации ряда распределения при анализе могут рассчитываться децильные коэффициенты дифференциации (ДКД)

 

             Д9

ДКД = ----       (6.3)

             Д1      ,

 

где Д9 и Д1-соответсвенно девятая и первая децилы.

 

Причём:

 

                 SД1 - 10

Д1=XB1-i -----------                          (6.4)

                   WД1

 

                         90% - SД9 - 1

Д9 = XH9+ i -----------------              (6.5)                 

                           WД9

 

где: XB1 и XH9 - верхняя и нижняя границы интервалов соответственно первой и девятой децилей. i - величина интервала

SД1 - кумулятивная частость 1-го интервала

SД9-1 - кумулятивная частость, предшествующего (предпоследнего), 8-го интервала.

 

Пример расчёта показателей неравномерности распределения. Имеются следующие данные о среднемесячной зарплате работников учреждения

 

Зарплата (руб.) Xi;

Количество работников fi

150-600

25

600-1050

30

1050-1500

28

1500-1950

20

1950-2400

14

2400-2950

7

>2950

3

Требуется:

1.   Рассчитать коэффициент концентрации Джини.

2.  Рассчитать децильный коэффициент дифференциации.

3.   Сделать выводы по результатам расчётов.

 

Решение:

1. Построим расчётную таблицу

Зарплата

 

 

 

 

Xi

Сере­дина интер­вала

Xi

Кол-во работы.

 

fi

Суммар­ная зарплата

 

Xi, fi

Доля суммарной зарплаты в общем

итоге %

Накопл. итоги суммарной зарплаты cum Уi

Частост кол-ва работни­ков

Wi

Кумуля­тивные частости

 

cum Wi

150-600

375

25

9375

5,8

5,8

19,6

19,6

600-1050

825

30

24750

15,3

21,1

23,6

43,2

1050-1500

1245

28

34860

21,7

42,8

22,0

65,2

1500-1950

1725

20

34500

21,4

64,2

15,8

81,0

1950-2400

2175

15

32625

20,2

84,4

11,8

92,9

2400-2950

2625

6

15750

9,7

94,1

4,7

47,4

>2950

3175

3

9525

5,9

100

2,4

100

2.   Рассчитаем коэффициент концентрации Джини по формуле   6.2 (предварительно переведём проценты в коэффициенты делением на 100)

G = (0,196-0,211 + 0,432-0,428 + 0,652-0,642+ 0,81-0,844 + 0,929-0,941+ 0,974-1) - (0,432 * 0,058 + 0,652 * 0,211 + 0,81 * 0,428 + 0,929 * 0,642 + 0,976 * 0,844 +1 * 0,941) = 0,296

3.   Для расчёта децильного коэффициента дифференциации по формуле 6.3. предварительно определим:

4.   Децильную зарплату первой децили по формуле (6.4)

                     19.6 – 10%

Д1=600-450 -------------- = 379.5руб.

                         19.6

5. Зарплату девятой децили по формуле (6.5)

                          90 - 81

Д9=1950+450 ------------  = 2293руб.,тогда

                            11,8

                2293

ДКД = ----------- = 6

               379,5

6. Таким образом, коэффициент Джини в данном коллективе довольно значителен, а зарплата высокооплачиваемой категории превышает зарплату низкооплачиваемой категории в 6 раз.

 

3   Задачи для самостоятельного решения

 

Задача 1 .   В результате предварительной группировки населения рабочего посёлка по возрастному составу получено следующее распределение:

 

Возраст (лет)

Уд. вес в % от общей численности

Возраст (лет)

Уд. вес в % от общей численности

1

2

1

2

1-8

3

29-36

12

8-15

4

36-43

15

15-22

7

43-50

28

22-29

9

>50

22

 

Требуется:

1.   Рассчитать коэффициент концентрации.

2.   Рассчитать децильный коэффициент дифференциации.

3.   Рассчитать модальный и медианный возраст жителей посёлка.

4.   Сделать выводы о демографической ситуации в рабочем посёлке.

 

Задача 2.  Имеются следующие данные о распределении доходов населения районного центра;

 

Среднемесячный доход (руб.)

Численность насе­ления в % к итогу

Среднемесячный доход (руб.)

Численность насе­ления в % к итогу

1

2

1

2

500-1000

20

2500 - 3000

8

1000-1500

30

3000 - 3500

7

1500-2000

15

3500-4000

4

2000 - 2500

10

>4000

6

 

Требуется:

1.   Определить среднемесячный доход, моду, медиану.

2.   Рассчитать децильный коэффициент дифференциации.

3.   Определить коэффициент Джини.

4.   Сделать выводы по результатам исследования.

 

      Задача 3.  Имеются следующие данные о распределении предприятий отрасли по уровню рентабельности:

 

Рентабельность

(%)

Количество предприятий

Рентабельность (%)

Количество предприятий

1

2

1

2

до 10

2

50-70

5

10-30

4

70-90

4

30-50

8

90-110

3

 

 

>110

2

       

      Требуется:

1.  Определить средние, модальные и медианные показатели распределения.

2.   Определить квантильный коэффициент дифференциации.

3.   Определить коэффициент концентрации.

4.   Сделать выводы по результатам анализа.

 

          Задача 4.  Предварительная группировка предприятий отрасли по фондоотдаче дала следующее распределение:

 

Фондоотдача

Количество предприятий

Фондоотдача

Количество предприятий

1

2

1

2

0,15-0,35

12

0,75 - 0,95

4

0,35 - 0,55

22

0,95-1,15

3

0,55-0,75

7

>1Д5

2

       

Требуется:

1. Определить средние, модальные и медианные показатели распределения.

2. Определить квантильный коэффициент дифференциации.

3.Определить коэффициент концентрации.

4. Сделать выводы по результатам анализа.

 

Задача 5. По результатам предварительной группировки населения по среднемесячному доходу сложилось следующее распределение:

 

Доход в месяц

Удельный вес населения (в % к итогу), по группам

 

1

2

3

90-600

4

 

5

600-1200

25

18

8

1200-1800

55

42

12

1800-2400

10

30

30

2400-3000

6

10

25

3000-3600

 

 

12

3600-4200

 

 

6

>4200

 

 

2

 

Требуется:

1.   Произвести сравнительный анализ, в разрезе трёх групп населения, коэффициентов дифференциации (децильных) и показателей концентрации.

2.   Сделать выводы по результатам расчётов.

 

 

4   Контрольные вопросы:

 

1.    Что представляет собой кривая Лоренца, как она строится?

2.    Что будет означать примерное равенство Sin S2?

3.    Если рассчитывать квантильный коэффициент дифференциации, то какое значение % будет в числителе соответственно формул (6.4) и (6.5)?

Тема7. Выборочный метод. Расчёт средней, предельной ошибки выборки. Расчёт оптимальной численности выборки.

 

1. Теоретическая база.

 

Для выполнения данной работы студент должен владеть лекционным материалом по данной теме, а также должен быть знаком со специальной литературой по данному вопросу, особенной 124-154.

 

2. Основы теории по данной теме. Определение, терминология.

 

         Выборочный метод статистического наблюдения (СН) - это метод изучения социально-экономических явлений и процессов, при котором основные характеристики совокупности определяются на основе изучения какой-то ее части, базируясь на методах случайного отбора. Обычно обследуется 5-10 % единиц изучаемой совокупности, реже 15-25 %(стр. 124)

        При этом различают понятия генеральной совокупности и выборочной совокупности (выборки). Генеральная совокупность ~ это совокупность экономических явлений, которая подлежит изучению.

        Выборочная совокупность (выборка) - это часть, единиц генеральной совокупности, которая подвергается сплошному изучению.

        Между характеристиками выборки и генеральной совокупности объективно имеются расхождения, которые называются ошибкой выборки. Поэтому основной задачей выборочного наблюдения является минимизация ошибки выборки.

В выборочном методе исследования социально-экономических явлений используются в основном следующие показатели:

а)Средняя величина альтернативного количественного признака "X";

б)Относительная величина альтернативного признака " w ".

Средняя величина количественного признака - это усреднённое значение варианты (X) в ряду распределения, которым представлены изучаемые данные. Для генеральной совокупности обозначает-

            _                                   ~

ся как X , для выборки - как X .

 

          Относительная величина альтернативного признака - это удельный вес (в % или коэффициентах) в общей совокупности единиц наблюдения, обладающих изучаемым признаком. Для генеральной совокупности - обозначается как "Р", для выборки - как " W". Эту величину в статистике называют ещё "частостью".

         Методический алгоритм применения выборочного метода сбора данных об изучаемой социально-экономической совокупности поясним на следующем примере.

 

         Исходные данные:

при анализе уровня доходов населения районного центра М было проведено 5% выборочное обследование населения бесповторным методом, механическим способом. При этом в выборку попало 250 человек, для которых удельный вес населения с годовым доходом 500 рублей составил 200 человек. Средний годовой доход в выборке составил 5000 рублей при среднем квадратическом отклонении σ = ±2000 рублей.

 

     Требуется:                                                                       _

1.   На основе исходных данных определить значение X и Р для генеральной совокупности.                                                    _

2.   Определить значение средней ошибки выборки для X и Р.

3.   Определить достоверность значений ошибки выборки с вероятностью 0,9545.

4.   Определить предельную ошибку выборки с учётом коэффициента доверия по указанной вероятности.

 

Алгоритм решения задачи:

                                                  m

1 .Определим   "W" как W = ----                     (7.1)

                                                   n

 

m - количество единиц совокупности населения, которое имеет годовой доход < 5000 рублей.

 

N - количество населения в выборке.

 

 Тогда                             200

                             W = ------- = 0.8

                                       250

 

Средний доход 5000 рублей определен по формуле

 

 

         n

        ∑   Xi * fi

  ~     i = 1                   

 X = --------------------                                (7.2)

                n                                           

        ∑  fi

        i=1

 

где: Xi - варианта; f - частота распределения

 

 

2. Определяется средняя ошибка выборки (М)

           σo²

m = Ö -----                                                        (7,3)

            n

         В формуле (7.3) величина σo² - генеральная дисперсия. Определение её значения составляет суть выборочного метода. Между дисперсиями генеральной и выборочной совокупности существует следующее соотношение

                     n

σo² = σ² *  -------

                   n – 1                                              (7,4)

                          n

т.е. σ² < σo² в -------- раз, где σ² дисперсия выработки

                        n – 1

                     ~

        ∑(XiX)² * f

σ² = ------------------

               ∑ f   

        ~        ~                     (7.5) или

σ² = X² - (X)²                                 (7,6)

                                                                               n

Если n достаточно велико, то отношение  -------- близко к единице, т. е.                                                                      n - 1

σx² = σ²                        (7.7)

В этом случае значение средней ошибки выборки по формуле

 


           σ²

m =    -----                                                        (7,8)

      Ö   n

При этом для доли альтернативного признака дисперсия в выборочной совокупности определяется:

σx²=w*(l-w)                                                           (7.9)

Для показателя средней величины количественного признака в выборке может

                                                                             ~

                                                                ∑(XiX)

быть определена по формуле : σx² = ------------             (7.10) либо по формулам (7.5) и (7.6)                           n

         Надо иметь в виду, что формула (7.8) используется только при повторном отборе (каждая изучаемая единица наблюдения после фиксации снова возвращается в генеральную совокупность), но повторный отбор используется крайней редко. Для бесповоротного отбора в формулу (7.8) включается дополнительный множитель

     n

1- ---, где n - количество единиц в выборке.

    N

N - количество единиц в генеральной совокупности.

Тогда формула средней ошибки выборки принимает следующий вид :

     

            σ²          n

mw =  ----- (1 - --- )                                                        (7,11)

     Ö     n           N

 

 

Для нашего случая определим значение средней ошибки выборки : а) для показателя W

 

 

 

 

     

           w*(1-w)      n              0.8(1-0.8)        250

 mw =   -------- (1 - ---)  =      ------------  (1 - ------ ) = ±0.025     (7.12)                                                                

     Ö      n               N       Ö        250              5000

 

                                                            ~

б) для показателя среднего дохода X

 

 

 


             σx²         n               200²               250

 mx =   ----- (1 - ---)  =     ------------  (1 - ------ ) =  ±12.3     (7.13)                                                                

     Ö      n           N       Ö      250               5000

 

(значение 2002 из условия задачи)

Полученные в результате расчётов (7.12), (7.13) значения «W» и

   ~

«X» будут использованы для установления возможных значений «Р» и «X ».

Одно из возможных значений «Р» определяется по формуле

 

P = W ± mw               (7.14),

 

т. е. Р = 0.8 ±0.025     

                   _

Одно из возможных значений «X » определяется по формуле

 _      ~

X = X ± mw                 (7.15),

        _

т. е. X = 5000p ± 12,3руб.  

                        _

Таким образом, характеристики «Р» и « X » отличаются от «W» и

    ~

«X» на величины средней ошибки выборки ± m .

                                                                    _

Причём доказано, что пределы «Р» и « X » отличаются от «W» и

   ~

«X» на величину ± m лишь с вероятностью 0,683.

Вероятность суждения можно повысить, если увеличить m в t раз. Тогда при t=2 вероятность суждения достигает 0,954 при t=3-0.9973 и т. д.

 

 В этом случае

P = W + t *mw   (7.16)

_      ~

X = X + t*mx     (7.17)

         Множитель t называется коэффициентом доверия. Конкретные значения множителя t для различных степеней вероятности определяется по функции Ляпунова А. М.

 

 

              1         +1   -1²

F(t) = ---------   ò e ²     *  dt                            (7.18)

         Ö  2*p     -1

         На практике пользуются готовыми таблицами, которые вычислены для различных значений t по нормальным распределениям. Выписка из таблицы.

 

Кратность ошибки t

Вероятность f(t)

Кратность ошибки t

Вероятность f(t)

0,0

0,0000

2,0

0,9545

0,1

0,0797

2,5

0,9876

0,5

0,3829

2,6

0,9907

1,0

0,6827

3,0

0,9973

1,5

0,8664

4,0

0,999937

        

В нашем случае по условию задачи мы должны рассчитать среднюю ошибку выборки с вероятностью суждения 0,9545. По таблице этому значению вероятности соответствует коэффициент доверия t = 2,0.

 

Тогда:    

Р = 0.8±2-0.025

 _

X= 5000±2-12.3 руб.

Это и будет ответом на 3 вопрос задачи. В практике выборочных наблюдений также используется показатель - предельная ошибка выборки (Δ).

Δ = t - m    (7.19).

         Если в формулу (7.19) подставить конкретные m при бесповторном отборе, то предельную ошибку можно записать следующим образом:

 а) Для

                w * (1 – w)             n 

ΔX = t   ---------------  *   1 - ----          (7.20)

         Ö    n                             N

                

 

 

б) для X

 


   ˜             σx²            n 

ΔX = t   ------ * 1 - ----

         Ö    n              N

 

Тогда для нашего случая предельная ошибка доли альтернативного признака Aw=2 (±0,025)= ±0,05т.е. ±5% Ах = 212,3 р) = ±24,6руб

 

Расчёт оптимальной численности выборки.

 

         При использовании выборочного метода сбора информации об объекте наблюдения следует иметь ввиду, что размер ошибки выборки зависит, прежде всего, от численности выборочной совокупности, т.е. чем больше численность выборки, тем меньше средняя ошибка выборки m<