Величина равного интервала определяется по формуле

Величина интервала — разность между наибольшим и наименьшим значениями признака в каждой группе, называемыми границами интервала.

Интервалы групп могут быть равными и неравными. Интервалы устанавливаются в зависимости от характера распределения единиц совокупности по данному признаку. Если вариация (изменение) признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то целесообразно устанавливать равные интервалы. В этом случае величину интервала определяют по формуле:

где хтах , хт1п— соответственно максимальное и минимальное значения признака в ряду;

к -число интервалов (групп).

Часто строят ряды с равновеликими интервалами. При построении вариационного ряда с равными интервалами определяют число групп (к) и величину интервала (h).

Оптимальное число групп (интервалов) может быть определено по формулеСтерджесса:

K=1+3.322 lg n, (1)

где n — число единиц совокупности.

Сами интервалы могут быть закрытыми(с указанием нижней и верхней границ) и открытыми(с указанием лишь одной из границ интервала).

При количественных группировках следует обращать внимание на правильное обозначение нижней и верхней границ интервала. При образовании интервалов по дискретным признакам это достигается посредством обозначения верхней и нижней границ смежных интервалов значениями признаков, отличных на единицу.

При построении интервальных вариационных рядов по непрерывным признакам необходимо указать, в какой интервал входит значение признака, являющегося границей смежных интервалов. То есть для устранения неопределенности необходимо решить вопрос о том, считать ли верхние границы каждой группы «включительно» или «исключительно».

После того как в результате сводки, материал статистического наблюдения сгруппирован, он, как правило, представляется в виде таблиц.

Статистическая таблица (подлежащее статистической таблицы, сказуемое статистической таблицы, групповая таблица, комбинационная таблица, простая таблица, сложная таблица).

Статистическая таблица форма наиболее рационального, наглядного и систематического изложения числовых результатов сводки и группировки статистических, материалов в виде ряда строк и столбцов. Основными элементами статистической таблицы являются подлежащее и сказуемое.

Подлежащее статистической таблицы — объекты изучения или перечень групп совокупности, характеризуемые цифровыми данными.

Сказуемое статистической таблицы — это цифровые показатели, которые характеризуют изучаемый объект. Сказуемое таблицы отражает то, что в ней говорится о подлежащем с помощью цифровых данных.

В зависимости от характера построения подлежащего различают простые, групповые и комбинационные таблицы.

Простой называется таблица, в подлежащем которой содержится перечень объектов наблюдения, например перечень работников предприятия.

Групповойназывается таблица, в подлежащем которой объекты наблюдения разгруппированы по одному признаку, например по профессиям работников предприятия. Комбинационной называется таблица, в подлежащем которой объекты наблюдения разгруппированы по двум и более признакам в комбинации, например, по категориям работников, в том числе и по полу.

По структуре сказуемого различают простые и сложные таблицы.

Простая таблицапредусматривает разработку показателей, характеризующих изучаемые объекты независимо друг от друга.

Сложная таблица предусматривает разработку показателей, характеризующих изучаемые объекты в комбинации.

Например, при характеристике объема перевозок в сказуемом таблицы можно дать перечень признаков, характеризующих объем перевозок по типам тяги и по видам движения. Это будет таблица с простой разработкой сказуемого.

Можно построить таблицу, сказуемое которой будет содержать перечень признаков по типам тяги и в том числе по видам движения. Это будет таблица со сложной разработкой сказуемого.

Наряду с таблицами, для наглядного изображения данных наблюдения и сводки, в статистике используются графики.


Предыдущая271272273274275276277278279280281282283284285286Следующая


Дата публикования: 2014-11-04; Прочитано: 987 | Нарушение авторского права страницы



studopedia.org — Студопедия.Орг — 2014-2018 год.(0.001 с)…

Определение числа групп и величины интервалов группировки

⇐ ПредыдущаяСтр 6 из 13Следующая ⇒

 

Если группировка строится по атрибутивному признаку, то число групп, как правило, будет столько, сколько имеется градаций, видов состояний у этого признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации.

Если группировка проводится по количественному признаку, то число групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака, в каждом отдельном случае его необходимо обосновать. Чем больше вариация группировочного признака, тем больше образуется групп, и наоборот.

Количество образуемых групп не должно быть меньше 3 и не должно превышать 15.

В ряде случаев невозможно предварительно установить количество образуемых групп, в этом случае используют формулу Стерджесса:

n=1+3,322lgN (3.1),

где n – количество образуемых групп, N – объем совокупности (количество единиц).

Пример связи числа групп и объема совокупности, полученный по формуле (3.1), представлен в таблице 3.6.

Таблица 3.6

Связь числа групп и объема совокупности

N 15-24 25-44 45-89  
n и т.д.

После определения числа групп определяются интервалы группировки.

Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей– наибольшее значение признака в интервале.

Величина интервала представляет собой разность между верхней и нижней границами:

. (3.2)

Интервалы могут быть равными и неравными.

Равные, когда количественный признак внутри совокупности изменяется равномерно.

Неравные применяются в том случае, когда вариация неравномерная и имеет очень широкие пределы вариации.

При равных интервалах величина интервала рассчитывается:

, (3.3)

где n – количество групп.

При расчете h мы можем получить нецелое число, поэтому необходимо использовать следующие правила округления:

— если значение h имеет:

✓ один знак до запятой, то до десятых долей:

0,787→0,8

2,486→2,5

✓ 2 знака до запятой, то до целых чисел:

12,4256→12

34,7496→35

✓ 3 и больше знаков до запятой, то до числа ближайшего кратного 50 или 100.

248,3745→250

3874,4263→3900

Неравные интервалы могут быть прогрессивно-возрастающими или прогрессивно-убывающими в арифметической или геометрической прогрессии.

Величина интервалов, изменяющихся в арифметической прогрессии, определяется по формуле:

hi+1 = hi + а, (3.4)

где а — константа, имеющая для прогрессивно-возрастающих интервалов знак «+», а для прогрессивно-убывающих знак «–».

Для геометрической прогрессии величина интервалов определяется:

, (3.5)

где q –константа (для прогрессивно-возрастающих интервалов q>1 , а для прогрессивно-убывающих – q<1.

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница несущественна.

Например, при построении группировки промышленных предприятий строительного комплекса по показателю численности работающих, который варьирует от 400 до 2800 чел., нецелесообразно рассматривать равные интервалы. Поэтому следует образовывать неравные интервалы:

400 – 800; 800 – 1600; 1600 –2800,

т. е. величина каждого последующего интервала больше предыдущего на 400 чел. и увеличивается в арифметической прогрессии.

Интервалы могут быть открытыми и закрытыми.

Открытыми могут быть первый и последний интервалы. Открытые интервалы имеют одну обозначенную границу. Например, группы коммерческих банков по уровню дохода работающих в них сотрудников (тыс. руб.):

до 10; 10 – 20; 20 – 30; 30 – 40; 40 и более.

Для закрытых интервалов известны верхняя и нижняя границы.

Если основанием группировки служит непрерывный признак, например, группы строительных фирм по объему работ (млн.

руб.):

12 – 14; 14 – 16; 16 – 18; 18 – 20,

то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов. При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом работ 16 млн. руб. Если нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй.

Для того чтобы правильно отнести к той или иной группе единицу объекта, значение признака у которой совпадает с границами интервалов, можно использовать открытые интервалы. Возможны два случая обозначения открытого последнего интервала:

1) 18 млн. руб. и более;

2) более 18 млн. руб.

В первом случае строительные фирмы с объемом работ 18 млн. руб. попадут в третью группу; во втором случае – во вторую группу.

Если в основании группировки лежит прерывный признак, то нижняя граница i-го интервала равна верхней границе (i –1) интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала будут иметь вид (чел.): 100 – 150, 151 – 200, 201 – 300.

 

Статистические таблицы

 

Результаты сводки и группировки обычно представляются в виде таблиц. Таблица – это наиболее рациональная, наглядная и компактная форма представления статистического материала.

Статистическая таблица– таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существующим признакам, взаимосвязанным логикой экономического анализа.

Основными элементами статистической таблицы являются:

Графа – четко сформулированный заголовок по вертикальному столбцу.

Строка – название горизонтальной полосы. Пересечение графы и строки образует клетку. Перечень граф и строк образуют остов (скелет) таблицы. Остов таблицы с наличием заголовков образует макет таблицы (рис. 3.1).

Название таблицы (общий)

Содержание строк Наименование граф (верхние заголовки)
А
Наименования строк (боковые заголовки)            
           
Итоговая строка           Итоговая графа

Рис. 3.1. Основа статистической таблицы

 

Статистическая таблица содержит три вида заголовков:

общий отражает содержание всей таблицы по центру и является внешним;

верхний (внутренний) характеризует содержание граф;

боковой (внутренний) характеризует содержание строк.

Если числовое значение не имеет реального смысла, то в клетке ставят «х». Если явление отсутствует, то ставят «–». Если в клетке стоит 0,0 или 0,00, то отображается очень малое число.

Подлежащее статистической таблицы представляет ту совокупность, которая исследуется, то есть перечень отдельных или всех единиц совокупностилибо их групп, обычно дается в наименовании строк.

Сказуемое – это те показатели, с помощью которых дается характеристика явления, отображаемого в таблице, формирует верхние заголовки.

Принципы построения статистических группировок.

Т.е. характеризует единицы статистической совокупности.

Подлежащее и сказуемое могут меняться местами.

В зависимости от структуры подлежащего и вида группировки различают:

1) простые подлежащие – дается простой перечень каких-либо объектов:

монографические – характеризуют какую-либо группу из совокупности (табл. 3.7);

Таблица 3.7

Исполнение бюджетов государственных внебюджетных социальных фондов в 2008 г. (млрд. руб.)

  Поступление Расходование
Государственные внебюджетные социальные фонды 607,9 497,4

перечневые – подлежащее содержит перечень единиц объекта по различному признаку (видовому, территориальному, временному);

Пример перечневой таблицы по видовому принципу представлен в таблице 3.8.

Таблица 3.8

Характеристика марок бензина ООО «Автобаз» на 31.12.10

Марка бензина Средневзвешенная цена, руб./л Суммарный объем предложений, т Минимальный объем партии, т
А-76 А-92 А-95 А-98 9,8 10,5 11,0 12,5

Подлежащее – марка бензина.

Перечневая таблица по территориальному принципу представлена в таблице 3.9

Таблица 3.9

Распределение убыточных предприятий и организаций по административным округам Москвы в июне 2010г.

 

Административный округ Количество убыточных предприятий, ед. В том числе распределение по отраслевой принадлежности
Промышленных предприятий Строительных организаций Транспортных организаций
Центральный Северный Восточный
Всего

Подлежащее – перечень административных округов.

Простая перечневая таблица по временному принципу представлена в таблице 3.10

Таблица 3.10

Динамика инвестиций в основной капитал в одном из регионов РФ за период 2007-2011 гг.

Год Инвестиции в основной капитал, млн. руб. Индекс физического объема инвестиций в основной капитал, % к предыдущему году Инвестиции в основной капитал на душу населения, тыс. руб.
43,9 5,1
53,4 6,2
65,2 7,6
96,1 11,3
150,6 17,6

Подлежащее – годы.

2) сложные подлежащие:

групповые – подлежащее содержит группировку единиц совокупности по одному количественному или атрибутивному признаку (табл. 3.11);

Таблица 3.11

Распределение эмитентов фондового рынка по величине котировки банковских долгов, выставленных на продажу в одном из вексельных центров в 2008 г.

Группы эмитентов по величине котировки банковских долгов, млн. руб. Число эмитентов Общая сумма долга, млн. руб. Средневзвешенная ставка
97 – 1745 1745 – 3393 3393 – 5041 9264,5 8574,8 21311,1 73,4
Итого 39150,4

Подлежащее – группы эмитентов фондового рынка по величине котировки банковских долгов.

комбинационные– подлежащее содержит группировку единиц совокупности одновременно по двум и более признакам (табл. 3.12).

Подлежащее – группы предприятий по стоимости ОФ и по объему произведенной продукции.

В сказуемом статистической таблицы приводятся показатели, которые характеризуют изучаемый объект. Эту характеристику можно давать небольшим числом показателей или целой системой показателей.

По структурному строению (по характеру разработки) сказуемого различают статистические таблицы с простой и сложной его разработкой.

При простой разработке сказуемого показатель не подразделяется на подгруппы, итоговое значение получают суммированием.

 

Таблица 3.12

Группировка предприятий одной из отраслей промышленности РФ по стоимости ОФ и объему производства продукции предприятий в 2010 г.

№ п/п Группы предприятий по стоимости ОФ, млн. руб. Подгруппы предприятий по объему произведенной продукции, млрд. шт. Число предприятий Стоимость ОФ, млн. руб. Объем произведенной продукции, млрд. шт. Средне-списочная численность ППП, тыс. чел.
1,1-6,0 3,0-11,6 11,6-20,2 45,2 6,3 61,8 27,9 7,9 0,9
Итого по группе: 51,5 89,7 8,8
6,0-10,9 3,0-11,6 11,6-20,2 55,7 17,4 49,9 25,0 3,7 1,1
Итого по группе: 73,1 74,9 4,8
Всего: 124,6 164,6 13,6

Сложнаяразработка сказуемого предполагает деление признака, формирующего его на подгруппы (табл. 3.13).

Таблица 3.13

Распределение численности экономически активного населения одного из регионов РФ в 2010-2011гг.

(на конец года, млн. руб.)

 

 

Год Экономически-активное население, всего В том числе по категориям
занятые в экономике безработные
м ж всего м ж всего
73,0 72,9 34,6 33,9 31,3 30,7 65,9 64,6 3,9 4,5 3,2 3,7 7,1 8,2

В анализе данных наряду со статистическими таблицами применяются и другие виды таблиц, одним из которых является матрица.

Матрицей называется прямоугольная таблица числовой информации, состоящая из m-строк и n-столбцов.

К основным правилам построения статистических таблиц относят:

1.

Компактность.

2. Заголовки должны быть четкими.

3. Наличие итоговой строки.

4. При повторении названий граф им присваивается общий заголовок.

5. Взаимосвязанные и взаимозависимые данные целесообразно располагать рядом.

6. Графы и строки должны иметь единицы измерения.

7. При округлении чисел целесообразно по графам и строкам выдерживать одинаковую степень точности.

В случае необходимости дополнительной информации, разъяснений к таблице, к таблице могут быть даны примечания.

 

⇐ Предыдущая12345678910Следующая ⇒

Читайте также:


2) постоянного и переменного состава

3) агрегатные и средние

4) динамические и территориальные

По формуле рассчитывается общий индекс цен _____________

O Ласпейреса

O Фишера

O Эджворта-Маршалла

O Паше

По формуле рассчитывается индекс

O ожидаемой продолжительности жизни при рождении

O развития человеческого потенциала

O реального объема ВВП на душу населения

O достигнутого уровня образования

По форме организации обработки данных различают сводку

О централизованную и децентрашпованную

О ручную и механическую

О сплошную и выборочную

О типологическую и аналитическую

Предметом изучения статистики являются статистические ____________.

1)единицы

2)совокупности

3)показатели

4)таблицы

При анализе динамики цен на единицу однородной продукции по совокупности регионов или субрынков применяются …

О индивидуальные индексы цен

О групповые индексы

О индексы средних цен

О агрегатные формы индексов

При заключении договора страхования страхователь выплачивает страховой организации

O сумму нагрузки

O брутто-ставку

O нетто-ставку

O рисковую надбавку

При использовании зависимости , при N=1000 оптимальное число групп (при округлении до целого числа) равно …

O 34

O 8

O 22

O 11

При определении стоимости продукции сельского хозяйства в ее состав помимо готовых продуктов растениеводства и животноводства включают ________

O прирост остатков незавершенного производства

O продукцию лесоводства

O стоимость дикорастущих плодов

O продукцию промышленного производства

При _____________ способе работы строительство осуществляет подрядная организация по заказу инвестора

O хозяйственном

O подрядном

O специальным

O техническим

При проведении статистического наблюдения критическим моментом является____________

O дата окончания наблюдения

O дата начала наблюдения

O период проведения наблюдения

O время, по состоянию на которое регистрируются данные

При производственном методе расчета валовой внутренний продукт в рыночных ценах определяется как сумма

O расходов на конечное потребление, валового накопления и чистого экспорта

O доходов хозяйственных единиц от экономической деятельности

O добавленной стоимости всех отраслей экономики и чистых налогов на продукты и импорт

O валовой добавленной стоимости всех секторов экономики

При расчете индекса реального (скорректированного) ВВП на душу населения (при расчете ИРЧП), его минимальное значение равно, дол.

США …

— 1200

— 500

100

— 1000

При расчете среднего коэффициента роста с помощью средней

геометрической подкоренное выражение представляет собой ______ цепных коэффициентов роста.

— произведение

частное

— сумму

— разность

При случайном бесповторном отборе средняя ошибка выборки определяется по следующей формуле

O

O

O

O

При уменьшении процента отбора с 36 до 19 %, а также неизменных дисперсии и объеме выборки ошибка выборки увеличится …

O результат предсказать невозможно

O на 12,5%

O на 26,6%

O в 1,9 раза

Программа статистического наблюдения представляет собой_______

O перечень ответов, полученных в результате проведения наблюдения

O перечень работ, которые необходимо провести в процессе подготовки и проведения наблюдения

O перечень работ, которые необходимо провести в процессе проведения наблюдения

O перечень вопросов, на которые….

Программное обеспечение относится к активам …

O нефинансовым произведенным материальным

O финансовым

O нефинансовым не произведенным не материальным

O нефинансовым произведенным не материальным

Продажа государственных запасов и материалов относится к __________поступлениям

O невозвратным, возмездным

O невозвратным, безвозмездным

O возвратным, текущим

O возвратным, копательным

Продукция, обработка которой начата, но не закончена в пределах любого цеха предприятия, называется __________

O готовой продукцией

O работами промышленного характера

O незавершенным производством

O полуфабрикатами

Произведение цепных индивидуальных индексов…

ü 1 равно последнему базисному индексу

2. меньше последнего базисного индекса

3. равно единице

4.

Величина интервала определяется по формуле

больше последнего базисного индекса

Производство промышленной продукции в натуральном выражении приводится в статистических сборниках, как правило, по валовому выпуску, т.е. включая продукцию, израсходованную на промышленно-производственные нужды внутри данной организации и выработанную из давальческого сырья. Давальческое сырье – это сырье переданное на промышленную…..

O государству

O заказчику

O предприятию-конкуренту

O соседней промышленной организации

Процент охвата населения при проведении микропереписи равен …

— 2

— 10

— 5

1

Прямой полезный результат промышленно-производственной деятельности предприятий, который выражается либо в форме продуктов, либо услуг или работ промышленного характера, называется _______.

— товарной продукцией

— валовым оборотом

промышленной продукцией

— реализованной продукцией

Р

Размахом вариации называется _____ максимального и минимального значений признака

— частное от деления

— сумма

— произведение

разность

Размер потребления различных видов продуктов на душу населения является частным случаем относительной величины

1)интенсивности

2)координации

3)сравнения

4)динамики

Разница между валовым внутренним продуктом и потреблением основного капитала называется

О чистым национальным доходом

О чистой прибылью экономики

О чистым внутренним продуктом

О чистым национальным сбережением

Разница между выпуском товаров и услуг и промежуточным потреблением называется

О конечным потреблением товаров и услуг

О валовой добавленной стоимостью

О чистой добавленной стоимостью

О валовым национальным доходом

Разность между валовым национальным располагаемым доходом и конечным потреблением дает____

О национальное сбережение

О чистое кредитование

О валовое накопление

О чистое заимствование

Разность между количеством прибывших на данную территорию и количеством выбывших с этой территории за исследуемый период характеризуют показатели _____ движения населения

О внешнего

О механического

О внутреннего

О естественного

Разность уровней ряда динамики называется …

O абсолютным приростом

O темпом роста

O коэффициентом роста

O темпом прироста

Расходная часть бюджета РФ классифицируется по следующим признакам…

по экономическому назначению

□ по функциональному назначению

О по отраслевой принадлежности

О по территориальной принадлежности

по ведомственному назначению

Расходы бюджета состоят из

O текущих и капитальных расходов

O текущих расходов

O других расходов

O капитальных расходов

Расхождения между расчетными значениями признака в выборочной совокупности и действительными значениями признака в генеральной совокупности является ________

O ошибка вычислительного устройства

O ошибка метода расчета

O ошибка репрезентативности (представительности)

O ошибка регистрации (измерения)

Расчетные категории, предназначенные для обеспечения равенства между объемами ресурсов и их использованием в каждом счете, называются

О обобщающими показателями


⇐ Предыдущая123456789Следующая ⇒


Дата публикования: 2015-01-09; Прочитано: 472 | Нарушение авторского права страницы



studopedia.org — Студопедия.Орг — 2014-2018 год.(0.007 с)…

Вопрос 10. Вторичная группировка, методы ее проведения.

Группировка— это расчленение изучаемой статистической совокупности на части по одному или нескольким группировочным признакам.

Определение величины интервала. Формула Стерджесса

Правильно проведенная группировка в значительной мере обеспечивает достоверность всего статистического исследования.

Первичная группировкапроизводится на основе сортировки первичных исходных данных.

Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. В таком случае необходима перегруппировка данных с помощью вторичной группировки.

Вторичная группировка— операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп.

1.наиболее простой и распространенный способ — изменение (чаще укрупнение) первоначальных интервалов.

2. Долевая перегруппировка — способ состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.

Пример. Необходимо провести перегруппировку данных, образовав новые группы с интервалами до 500, 500 — 1000,1000 — 2000, 2000 — 3000, свыше 3000 руб. по данным о распределении контрактов строительной фирмы по величине прибыли.

Таблица. Распределение контрактов строительной фирмы по величине прибыли¹

В первую новую группу войдет полностью 1-я группа контрактов и часть 2-й группы. Чтобы образовать группу до 500 тыс. руб., необходимо от интервала 2-й группы взять 100 тыс. руб. Величина интервала этой группы составит 600 тыс. руб. Следовательно, необходимо взять от нее 1/6 (100 : 600).Аналогичную же часть во вновь образуемую новую группу надо взять и от числа контрактов, т. е. 20 • 1/6 — 3 контракта. Тогда в 1-й группе будет контрактов 16 + 3 = 19 контрактов. Вторую новую группу образуют контракты 2-й группы за вычетом отнесенных к 1-й, т. е, 20 — 3 = 17 ед. Во вновь образованную третью группу войдут все контракты 3-й группы и часть контрактов 4-й. Для определения этой части от интервала 1800 -3000 (ширина интервала равна 1200 тыс. руб.) нужно добавить к предыдущему 200 тыс. руб. (чтобы верхняя граница интервала была равна 2000 руб.). Следовательно, необходимо взять часть интервала, равную 200 :1200, т. е. 1/6. В этой группе 74 контракта, значит, надо взять 74 ¦ (1 : 6) = 12 ед. В третью новую группу войдет: 44 Н-12 — 56 контрактов. Во вновь образованную четвертую группу войдет: 74 — 12 =62 контракта, оставшихся от прежней 4-й группы. Пятую, вновь образованную группу составят контракты 5-й и б-й прежних групп: 37 + 9 = 46 контрактов. Техника перегруппировки показана в таблице.

Построение статистических группировок осуществляется по следующим этапам:

1. Определение группировочного признака.

2. Определение числа групп.

3. Расчёт ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы.

От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качественные признаки. Количественные признаки – это признаки, которые имеют числовое выражение (объём выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признаки отражают состояние единицы совокупности (пол, отраслевая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количестве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объёма изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков.  Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объём совокупности и степень колеблемости группировочного признака.

При небольшом объёме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта.

Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

 Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оценить вариацию признака между крайними значениями признака – максимальным () и минимальным () и определяется по следующей формуле: 
                                                                                          (2.1)

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп.

При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы наблюдения. 

Построение большого числа групп позволит, с одной стороны, точнее воспроизвести характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенностей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами.

Формально-математический способ предполагает использование формулы Стерджесса:

 

n = 1 + 3,322 × lg N,                                                                                  (2.2)

где: n – число групп; 

N – число единиц совокупности.

 

Согласно этой формуле выбор числа групп зависит только от объёма изучаемой совокупности. Когда определено число групп, то следует определить интервалы группировки.

Интервал – это значения варьирующего признака, лежащие в определённых границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границей интервала называется наименьшее значение признака   в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Величина интервала — разность между верхней и нижней границами интервала.

Интервалы группировки бывают: 

• равные и неравные;

• открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах. 

 Ширина равного интервала определяется по следующей формуле:

                                                                                  (2.3)
где: ,  — максимальное и минимальное значения признака в совокупности;

 n — число групп.

 

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (2.3) величину округляют, и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (2.3) представляет собой величину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до целого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами. Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных  интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определённых типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрессивно-убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической и геометрической прогрессии, определяется следующим образом:

,         

где: а – константа: для прогрессивно-возрастающих интервалов   имеет знак «+», а при прогрессивно-убывающих – знак «-».

q – константа: для прогрессивно-возрастающих – больше «1»; для прогрессивно-убывающих – меньше «1».

 

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города, по показателю численности работающих, который варьирует от 500 человек до 3500 человек, нецелесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и крупнейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии.

Выбор исследователя в построении равных или неравных интервалов зависит от степени  заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае – объединять.

 Интервалы группировок могут быть закрытыми и открытыми.

 Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

 Открытые – это интервалы, у которых указана только одна граница: как правило, верхняя – у первого интервала и нижняя – у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более.

Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.

 При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

 Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объёму строительно-монтажных работ, выполненных собственными силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объём работ 1400 тыс. руб.

составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. – соответственно второго и третьего и т.д., т.е. верхняя граница i – го интервала равна нижней границе (i+1) – го интервала.

 При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов.

Например, во вторую или третью группу должна войти строительная фирма с объёмом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй.

Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строительных фирм по объёму строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала.

Возможны два случая обозначения последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб.

21. Величина равного интервала определяется по формуле:

В первом случае, строительные фирмы с объёмом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае – во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1.

Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества.

В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы интервалов для разных отраслей народного хозяйства. Это достигается путём использования группировок со специализированными интервалами. Специализированные интервалы – это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности.

  • 1. Основное содержание и задачи статистической сводки
  • 2. Сущность и классификация группировок
  • 3. Принципы построения группировок
  • ЛЕКЦИЯ № 3. Сводка и группировка статистических данных

    1. Основное содержание и задачи статистической сводки

    Сведения о каждой единице анализируемой совокупности, полученные в результате первой стадии статистического исследования, характеризуют статистическое наблюдение с различных его сторон, так как они обладают многочисленными признаками и свойствами, которые изменяются во времени и пространстве. Для получения сводной характеристики всего объекта при помощи обобщающих показателей нужно систематизировать и обобщить результаты, которые были получены в ходе статистического наблюдения. Это даст нам возможность выявить особенности и черты статистической совокупности в целом и отдельных ее составляющих, обнаружить закономерности изучаемых социально–экономических явлений и процессов. Данную систематизацию называют сводкой первичного статистического материала.

    Второй этап статистической работы – статистическая сводка – это обработка первичных данных в целях получения обобщенных характеристик изучаемого явления или процесса по ряду существенных для него признаков для выявления типичных черт и закономерностей, присущих явлению или процессу в целом.

    Статистическая сводка – это переход от единичных данных к сведениям о группах единиц и совокупности в целом.

    Проведение сводки включает три этапа:

    1) предварительный контроль – это проверка данных;

    2) группировка данных по заданным признакам – это определение производных показателей;

    3) оформление результатов сводки в виде статистических таблиц, они являются удобной формой для восприятия полученной информации.

    Смысловая согласованность статистических сведений – это предварительный контроль. В соответствии с программой статистической сводки для того, чтобы в дальнейшем предоставить полученную информацию в доступном для восприятия виде, используется статистическая группировка данных.

    Полученные результаты группировки оформляются в виде группировочных таблиц, содержащих сводную характеристику исследуемой совокупности по одному или нескольким признакам, которые взаимосвязаны логикой анализа. Различают сводку простую и сложную. Сведения об отдельных единицах подытоживаются в целом по совокупности без разделения их на однородные группы. Итоги простой статистической сводки предназначаются для дальнейшей обработки материала, простая сводка также имеет самостоятельное познавательное значение.

    Простая статистическая сводка – это операция по подсчету общих итоговых и групповых данных по совокупности единиц наблюдения и оформление этого материала в таблицах.

    Простая статистическая сводка дает нам возможность определить число единиц изучаемой совокупности и объем изучаемых признаков, но тем самым простая сводка не дает нам представления о целостности состава изучаемой совокупности.

    Если единицы совокупности разбивают на однородные группы, после этого подсчитывают итоги по каждой группе, а затем по всей совокупности в целом, такую статистическую сводку называют сложной. Сложная сводка позволяет нам изучить состав совокупности и выявить влияние одних признаков на другие, т. е раскрыть свойственные данной совокупности закономерности.

    Сложная статистическая сводка – это комплекс операций. включающих распределение единиц наблюдения изучаемого социально–экономического явления или процесса на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц. На основе всестороннего теоретического анализа сущности и содержания изучаемых явлений и процессов проводится статистическая сводка. Программой и планом проведения статистической сводки обеспечивается достоверность и обоснованность ее результатов.

    Программа статистической сводки содержит перечень групп на которые может быть разбита или разбивается совокупность единиц статистического наблюдения, а также систему показателей, характеризующих изучаемую совокупность явлений и процессов как в целом, так и отдельных ее частей. От целей и задач исследования зависит программа статистической сводки. Разработка программы включает следующие этапы:

    1) выбирается группировочный признак для образования однородных групп;

    2) определяется порядок формирования и число групп;

    3) разрабатывается система статистических показателей для характеристики групп и объекта в целом;

    4) создаются макеты статистических таблиц для предоставления результатов сводки.

    Вместе с программой статистической сводки составляют план ее проведения. План должен содержать информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц.

    Сводка также бывает децентрализованной и централизованной.

    Децентрализованная статистическая сводка – это способ обобщения материала, который осуществляется снизу доверху по иерархической лестнице управления и на каждом из этапов подвергается обработке. Обработка данных производится на местах, т. е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а затем выводятся итоговые показатели в целом по социально–экономическому положению страны.

    Централизованная статистическая сводка – это способ, при котором все первичные данные, полученные в результате статистического наблюдения, сосредоточиваются в одной центральной организации и подвергаются обработке от начала до конца.

    По технике выполнения статистическая сводка бывает механизированная (с использованием электронно–вычислительной техники) и ручная.

    2. Сущность и классификация группировок

    Научно обоснованное распределение на группы дает возможность сделать правильные выводы об изучаемой совокупности и происходящих в ней процессах.

    Принципы научной группировки были изложены в работах В. И. Ленина. Статистическая группировка, как указывал В. И. Ленин, не является второстепенным вопросом. Она требует всестороннего социально–экономического анализа изучаемых явлений, Решающее значение в статистической группировке имеет правильный выбор группировочных признаков в соответствии с задачами статистического исследования. В основу группировки должны быть положены самые существенные, самые важные для изучаемого вопроса признаки, которые позволят выявить социально–экономические типы явлений. Блестящим примером применения статистических группировок для выявления социально–экономических типов может служить таблица из работы В. И. Ленина «Развитие капитализма в России».

    Статистическая группировка – это один из основных этапов проведения статистического исследования.

    Процесс образования однородных групп на основе разделения статистической совокупности на части или объединение изучаемых статистических единиц в совокупности по определенным для них признакам называют статистической группировкой Важнейшим статистическим методом обобщения данных являются статистические группировки.

    Три основных типа задач, решаемых с помощью метода статистической группировки:

    1) выделение социально–экономических типов явлений;

    2) изучение структуры явления и структурных сдвигов, происходящих в явлении;

    3) выявление взаимосвязей и взаимозависимостей между явлениями и признаками, характеризующими эти явления.

    Различают следующие виды статистических группировок:

    1) типологические;

    2) структурные;

    3) аналитические.

    Качественно однородные группы совокупностей, т. е. объекты, которые по своим группировочным признакам близки друг к другу, называют типологической группировкой.

    Примером типологической группировки являются: группировка земель, по формам собственности. Основное внимание в типологической группировке должно уделяться идентификации типов и выбору группировочного признака.

    Величина интервала

    Для построения типологической группировки необходимо воспользоваться количественными и качественными (атрибутивными) признаками.

    Группировка по атрибутивному признаку предполагает, что число выделенных групп соответствует фактическому числу градаций этого признака. По количественному признаку необходимо правильно установить интервал группировки, определить необходимое число групп. Проблема определения интервалов типологической группировки решается на основании выделения таких количественных границ изменения группировочного признака, при которых явление изменяет или приобретает новое качество.

    В типологической группировке от числа существующих социально–экономических типов зависит число групп. От состава, структуры однородных групп и изучения вариации признаков внутри однотипной совокупности и однотипных групп на основе построения структурной группировки зависят социально–экономические типы явлений. Разделение однородной совокупности на определенные группы, которые в дальнейшем будут характеризовать структуру по определенному группировочному признаку, называют структурной группировкой. Здесь также рассматриваются количественные и атрибутивные признаки. Примером является группировка рабочих склада по квалификации.

    По атрибутивному признаку группы отличаются друг от друга по характеру признака. Количественный признак также предполагает определение числа групп и ширины интервала.

    Основная задача статистических группировок – исследование связей и зависимостей между признаками единиц статистической совокупности, которая решается с помощью построения аналитических группировок. Аналитическая группировка – это группировка, выявляющая взаимосвязи и взаимозависимости между изучаемыми социально–экономическими явлениями и признаками, их характеризующими.

    Все признаки в статистической науке можно подразделять на факторные и результативные. Признаки, которые оказывают большое влияние на изменение результативных признаков, называют факторными.

    Признаки, изменяющиеся под влиянием факторных признаков, называют результативными.

    Важная задача при построении аналитической группировки – выбор числа групп, на которые необходимо разбить изучаемую совокупность единиц наблюдения, и определение их границ.

    Требования, которые необходимо соблюдать в процессе построения аналитических группировок, это: каждая изучаемая группа должна содержать однородные единицы совокупности по груп–пировочному признаку, и количество единиц в каждой изучаемой группе должно быть достаточным для того, чтобы получить статистические характеристики изучаемого объекта.

    Простой называется группировка, если группа образована только по одному признаку. Если разбить группу на подгруппу в соответствии с определенными признаками, то такую группировку называют комбинированной.

    Комбинационной считается группировка, когда разбивка совокупности на группы производится по двум и более группировоч–ным признакам, взятым в сочетании (комбинации) друг с другом Комбинационные группировки позволяют изучать единицы совокупности одновременно по нескольким признакам.

    При изучении сложных социально–экономических явлений и процессов применяются комбинационные группировки. Для того чтобы построить комбинационную группировку, необходимо выявить наличие достаточно большого числа наблюдений.

    Для того чтобы найти скопление (в мерном пространстве) объектов (точек), необходимо применить многомерную группировку Различают группировки по используемой информации:

    1) первичные – производятся на основе исходных данных которые были получены в результате статистического наблюдения;

    2) вторичные – это результат соединения или расчленения группировки.

    3. Принципы построения группировок

    Для построения статистических группировок нужно выбрать группировочный признак, далее определить количество групп, на которые разбивают изучаемую статистическую совокупность и зафиксировать границы интервалов группировки. Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.

    Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом. Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования.

    В группировку входят количественные и атрибутивные (качественные) признаки. Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.). Атрибутивные признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака. Число групп, на которые расчленяется статистическая совокупность, зависит от количества градаций атрибутивного признака.

    Важно изучить экономическую сущность исследуемого явления при построении группировки по количественному признаку.

    Для определения числа групп можно воспользоваться формулой Стерджесса:

    h + 3,322 ? lg N,

    где h – число групп;

    N – число единиц совокупности;

    lgN – десятичный логарифм от N.

    Данная формула говорит о том, что выбор числа групп объектно зависит от объема совокупности. После установления числа групп решается вопрос об определении интервалов группировки.

    На основе интервала группировки можно количественно различить одни группы от других и наметить границы выделения их нового качества. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы.

    Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.

    Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.

    Ширина интервала – это разность между верхней и нижней границами. Интервалы группировки в зависимости от их ширины бывают равными и неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.

    Величина равного интервала определяется по следующей формуле:

    h = R/n = ( х мах – х min ) / n,

    гдех мах ,х min – максимальное и минимальное значение признака в совокупности;

    n – число групп.

    Данную формулу называют шагом интервала. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов. Выбор равных или неравных интервалов зависит от степени заполнения интервалов. Интервалы группировок могут быть закрытыми и открытыми Закрытыми интервалами являются интервалы, в которых указаны верхняя и нижняя границы. Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего). К количественным признакам можно отнести непрерывный признак, или дискретный. Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.

    В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы. Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях. По роли, которую играют признаки во взаимосвязи изучаемых объектов, процессов или явлений, их можно подразделить на факторные и результативные. Факторные признаки воздействуют на другие признаки, а результативные испытывают на себе влияние других признаков.

    Оглавление

    Добавить комментарий