| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
МЕНЮ
| Анализ российских домохозяйств по структуре потребления товаров и услугОтметим, что для нахождения конечного решения по алгоритму k-средних потребовалось провести 71 итерацию: такое большое их количество естественно обусловлено большим количеством наблюдений в файле данных. Центры кластеров в стандартизированных показателя представлены в табл. 5, а в исходных - в табл. 6. Таблица 5. Центры кластеров (в стандартизированных переменных)
Таблица 6. Центры кластеров (в исходных показателях - долях от общей суммы потребительских расходов)
Таблица 7. Матрица расстояний между кластерными центрами (в стандартизированных показателях)
Таблица 8. Средние расстояния до центра в каждом из кластеров (в стандартизированных показателях)
На основе изучения соотношений расстояний в табл. 7 и 8 можно назвать решение с 4 кластерами приемлемым, так как средние расстояния до центра своего кластера в полученных кластерах не превосходят расстояния между кластерными центрами. Вместе с тем, на основе стандартного отклонения из табл. 8 можно судить, что самый большой (третий) кластер является, в то же время, самым компактным (наименьшее среднее расстояние до центра при наименьшем стандартном отклонении), а наименьший кластер (4-й) является одновременно и самым разнородным. Таким образом, потенциально можно было бы попробовать кластерное решение с большим числом кластеров, однако в данном эссе мы остановимся на четырёхкластерном решении. Размеры кластеров 1-4 получены, соответственно, следующие: 5106, 18021, 26856, 3176, или, в процентах от общей выборки: 9,6%, 33,9%, 50,5%, 5,9%. Содержательную интерпретацию построим, прежде всего, на основе табл. 6. Итак, кластерный анализ выделяет большую (половина выборки) группу домохозяйств с типичным для России характером потребительских расходов (кластер №3): около 60% составляют потребительские расходы, расходы на питание вне дома практически отсутствуют, уровень трат на непродовольственные товары достаточно низок, значительна доля платных услуг; на спиртные напитки отводится примерно 1% потребительских расходов (чуть ниже среднероссийского показателя). Сюда устойчиво попадают более половины домохозяйств из первых четырёх децилей по располагаемым ресурсам (табл. 9). Близок к кластеру №3 как по размерам, так и по расстоянию между кластерными центрами, кластер №2. Эту группу домохозяйств тоже можно назвать типичной, однако модель потребления здесь иная: только треть потребительских расходов идёт на покупку продуктов питания, тогда как немногим меньше половины расходов приходится на непродовольственные товары. Различий в доле затрат на алкогольную продукцию с третьим кластером не наблюдается. Можно предполагать, что подобная модель потребления в большей степени характерна для более состоятельных домохозяйств, что и подтверждается данными табл. 9. Первый и четвёртый кластеры невелики по объёму (9,6 и 5,9% выборки, соответственно) и отличаются от «основных» групп домохозяйств выраженным преобладанием незначительных в среднем расходных статей бюджетов: алкогольных напитков и питания вне дома. Эти статьи не получили бы сколько-нибудь значимого проявления, если бы исходные данные не были бы стандартизированы. Кластер №4 характеризуется весьма высокими расходами на питание вне дома, тогда как доли расходов на продукты питания и непродовольственные товары опускаются чуть ниже средневыборочного уровня. Кластер №1, вероятно, объединяет активных потребителей алкоголя, доля расходов на который здесь составляет более 10%, что делает её сопоставимой с расходами на непродовольственные товары и услуги в этом же кластере. Доля же расходов на продукты питания также значительна: более половины потребительского бюджета, что приближает эту группу домохозяйств к третьему кластеру. Если судить по расстояниям между кластерными центрами, наиболее обособленным является четвёртый кластер (удалён от всех прочих, а в особенности от кластера №1). Рассмотрим распределение по кластерам домохозяйств различной численности, разного числа детей, разной ресурсной обеспеченности (по децильным группам), а также - разной местности проживания (город/село) и проживающих на разных территориях (в разных регионах). Согласно критерию хи-квадрат независимости признаков в таблицах сопряжённости, на уровне значимости p<0,001 можно говорить о наличии зависимости всех исследованных переменных и номера кластера. Таким образом, построенная на основе долей расходов потребительского бюджета 4-кластерная группировка отчасти объясняется учётом перечисленных признаков домохозяйств, определяющих характер потребления. В распределении децильных групп по кластерам, очевидная связь отмечается для второго и третьего кластеров. Во второй кластер входит значительная часть обеспеченных домохозяйств (начиная с 8 дециля - более половины всех домохозяйств), третий же кластер, преимущественно, объединяет низкодоходные домохозяйства: туда попадают ¾ представителей первого дециля, 2/3 - второго и т.д. Вместе с тем, из-за значительного размера третьего кластера, сюда же относится примерно четверть домохозяйств-представителей верхнего дециля (с наибольшими располагаемыми ресурсами). Вероятность попадания в первый кластер также несколько выше для высокоресурсных домохозяйств. Сюда попадают примерно 10% домохозяйств из 5-го дециля и выше, и примерно 7-8% домохозяйств ниже 5-го дециля. Взаимосвязь доходов и вероятности попадания домохозяйства в кластер №4 практически не прослеживается, за исключением относительно низких процентов попадания в данный кластер для первых 2-3 децилей. Таким образом, второй кластер можно коротко охарактеризовать как «зажиточные домохозяйства», третий - «малоресурсные», первый кластер тяготеет к зажиточным, но все децили представлены в нём более или менее ровно, а четвёртый кластер практически иррелевантен к переменной дохода (дециля располагаемых ресурсов). Таблица 9. Распределение децильных групп по кластерам, % по строке
Таблица 10. Распределение домохозяйств городской и сельской местности по кластерам, % по строке
Что касается различий между городской и сельской местностью в разделении по кластерам, они не слишком велики. Тем не менее, первый и второй кластеры, как видно, чуть активнее притягивает к себе сельские домохозяйства, а третий и четвёртый - городские. При этом, учитывая заметный перевес городских домашних хозяйств в выборке (равно как и в российском обществе в целом), первый и второй кластеры неверно было бы назвать «сельскими». Таблица 11. Распределение домохозяйств разного размера по кластерам, % по строке
Значительные различия в составе кластеров наблюдаются по размеру домохозяйств. Основная часть хозяйств, состоящих из одного человека (70%) относятся к третьему кластеру. Можно предположить, что в существенной степени такой перевес формируется домохозяйствами одиноких пенсионеров (что хорошо согласуется с характеристикой третьего кластера как малоресурсного). Напротив, менее 20% из домохозяйств-одиночек нашли своё место в первом кластере. Первый кластер интенсивно притягивает к себе расширенные домохозяйства, состоящие из 3 и более человек (более 40% таких семей). Первый кластер выделяется тем, что в него входит каждое десятое домохозяйство из 2 человек. Четвёртый же кластер вновь оказывается практически иррелевантен к данной группировке; можно лишь отметить, что чаще прочих к этой группе принадлежат не маленькие и не большие семьи (по 3-4 человека). Таблица 12. Распределение домохозяйств по числу детей до 16 лет по кластерам, % по строке
|
ИНТЕРЕСНОЕ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|