• объединение мелких групп в более крупные;
• выделение определенной доли единиц совокупности.
В научно обоснованной группировке общественных явлений необходимо учитывать взаимозависимость явлений и возможность перехода постепенных количественных изменений в явлениях к коренным качественным изменениям. Группировка может быть научной лишь в том случае, если не только определены познавательные цели группировки, но и правильно выбрано основание группировки – группи-ровочный признак. Если группировка – это распределение на однородные группы по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по какому-либо признаку, то группировочный признак – это признак, по которому происходит объединение отдельных единиц совокупности в отдельные группы.
При выборе группировочного признака важным является не способ выражения признака, а его значение для изучаемого явления. С этой точки зрения для группировки следует брать существенные признаки, выражающие наиболее характерные черты изучаемого явления.
Самая простая группировка – ряд распределения. Рядами распределения называются ряды чисел (цифр), характеризующие состав или структуру какого-либо явления после группировки статистических данных об этом явлении, другими словами, это группировка, в которой для характеристики групп применяется один показатель – численность группы. Пример использование ряда распределения приведен в табл. 3.4.
Таблица 3.4
Применение рядов распределения
Приведенный ряд распределения содержит три элемента: разновидность атрибутивного признака (мужчины, женщины); численность единиц в каждой группе, называемая частотами ряда распределения; численность групп, выраженная в долях (процентах) от общей численности единиц, называемая частостями. Сумма частостей равна 1, если они выражены в долях единицы, и равна 100 %, если они выражены в процентах.
Ряды, построенные по атрибутивному признаку, называют атрибутивными.
Ряды распределения, построенные по количественному признаку, называются вариационныыми рядами. Числовые значения количественного признака в вариационном ряду распределения называются вариантами и располагаются в определенной последовательности. Варианты могут выражаться числами положительными и отрицательными, абсолютными и относительными. Вариационные ряды делятся на дискретные и интервальные.
Дискретныге вариационныге рядыг характеризуют распределение единиц совокупности по дискретному (прерывному) признаку, т. е. принимающему целые значения. При построении ряда распределения с дискретной вариацией признака все варианты выписываются в порядке возрастания их величины, подсчитывается, сколько раз повторяется одна и та же величина варианта, т. е. частота, и записывается в одной строке с соответствующим значением варианта, например распределение семей по числу детей (табл. 3.5).
Частоты в дискретном вариационном ряду, как и в атрибутивном, могут быть заменены частостями.
Таблица 3.5
Применение дискретного ряда распределения
В случае непрерывной вариации величина признака может принимать любые значения в определенном интервале, например распределение работников фирмы по уровню дохода (табл. 3.6).
Таблица 3.6
Случай непрерывной вариации
При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Оптимальное число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Чаще всего число групп устанавливается по формуле
k = 1 + 3,32lg N = 1,44ln N + 1,
где k – число групп; N – численность совокупности.
Например, необходимо построить вариационный ряд сельскохозяйственных предприятий по урожайности зерновых культур. Число сельскохозяйственных предприятий – 143. Как определить число групп?
k = 1 + 3,32lg N = 1 + 3,32lg143 = 8,16.
Число групп может быть только целым числом, в данном случае – 8 или 9.
Пример. Минимальная урожайность составляет 30 ц/га, максимальная – 70 ц/га, а число намеченных групп – 10. Величину интервала можно рассчитать по формуле (3.1):
Если полученная группировка не удовлетворяет требованиям анализа, то можно произвести перегруппировку. Не следует стремиться к очень большому количеству групп, так как в такой группировке часто исчезают различия между группами. Также надо избегать образования и слишком малочисленных групп, включающих несколько единиц совокупности, потому что в таких группах перестает действовать закон больших чисел и возможно проявление случайности. Когда не удается сразу наметить возможные группы, собранный материал сначала разбивают на значительное количество групп, а затем укрупняют их, уменьшая количество групп и создавая качественно однородныле группыл.
Таким образом, группировки во всех случаях должны быть построены так, чтобы образованные в них группы как можно полнее отвечали действительности, были видны различия между группами и в одну группу не объединялись существенно различающиеся между собой явления.
3.3. Статистические таблицы
После того как данные статистического наблюдения собраны и даже сгруппированы, их трудно воспринимать и анализировать без определенной, наглядной систематизации. Результаты статистических сводок и группировок получают оформление в виде статистических таблиц.
Статистическая таблица дает количественную характеристику статистической совокупности и представляет собой форму наглядного отображения полученных в результате статистической сводки и группировки числовых (цифровых) данных. По внешнему виду таблица представляет собой комбинацию вертикальных и горизонтальных строк. В ней обязательно должны быть общие боковые и верхние заголовки. Еще одной особенностью статистической таблицы является наличие подлежащего (характеристика статистической совокупности) и сказуемого (показатели, характеризующие совокупности). Статистические таблицы являются наиболее рациональной формой изложения результатов сводки или группировки.
Подлежащее таблицы представляет ту статистическую совокупность, о которой идет речь в таблице, т. е. перечень отдельных или всех единиц совокупности либо их групп. Чаще всего подлежащее помещается в левой части таблицы и содержит перечень строк. Сказуемое таблицы – это те показатели, с помощью которых дается характеристика явления, отображаемого в таблице. Подлежащее и сказуемое таблицы могут располагаться по-разному, главное, чтобы таблица была легко читаемой, компактной и легко воспринималась.
В статистической практике и исследовательских работах используются таблицы различной сложности. Это зависит от характера изучаемой совокупности, объема имеющейся информации, задач анализа. Если в подлежащем таблицы содержится простой перечень каких-либо объектов или территориальных единиц, таблица называется простой. В подлежащем простой таблицы нет каких-либо группировок статистических данных. Эти таблицы имеют самое широкое применение в статистической практике, например характеристика городов РФ по численности населения, средней зарплате и т. п. Если подлежащее простой таблицы содержит перечень территорий, например областей, краев, автономных округов, республик и т. д., то такая таблица называется территориальной. Простая таблица содержит только описательные сведения, ее аналитические возможности ограничены. Глубокий анализ исследуемой совокупности, взаимосвязей признаков предполагает построение более сложных таблиц – групповых и комбинационных.