В «Вышке» – о кластерном анализе

Начальник Лаборатории анализа данных ФОМа Ефим Галицкий рассказал, как правильно делать кластеры на факторах

qr-code
В «Вышке» – о кластерном анализе

В середине мая прошел открытый семинар Международной лаборатории прикладного сетевого анализа ANR-Lab под названием «Можно ли все-таки строить кластеры на факторах, и если можно, то как?». Ведущим спикером на нем выступил начальник Лаборатории анализа данных ФОМа Ефим Галицкий.

Онлайн-семинар НИУ ВШЭ был посвящен обсуждению вечной проблемы прикладных социологических и маркетинговых исследований – кластерному анализу данных, полученных с помощью факторного анализа. Такой подход к сегментации применяется некоторыми исследователями, но построение кластеров на факторах может быть связано с серьезными методическими проблемами. В частности, результаты, полученные в ходе такого анализа, могут оказаться совершенно не пригодными для интерпретации.

Мероприятие было приурочено к грядущему 20-летию дискуссии о возможности построения кластеров на факторах, развернувшейся между социологом, математиком Александром Крыштановским и исследователями, математиками Еленой и Ефимом Галицкими. В начале 2000-х вышла статья Александра Крыштановского «Кластеры на факторах – об одном распространенном заблуждении», в которой он доказывал, что, опираясь на подобного рода классификации, невозможно делать обоснованные выводы. В своей ответной статье «Кластеры на факторах: как избежать распространенных ошибок» Елена и Ефим Галицкие проанализировали, почему результаты применения кластерного анализа в факторном пространстве бывают неадекватны структуре экспериментального материала, и предложили методику, позволяющую избежать искажений.

«С начала дискуссии прошла почти четверть века, и все это время разные поколения студентов «Вышки» были уверены, что кластерный анализ на факторах делать нельзя. И вот организатор семинара, бывший сотрудник ФОМа Иван Климов, который сейчас работает в ANR-Lab, предложил мне рассказать о том, что кластеры на факторах при соблюдении некоторых правил делать все-таки можно. Получился очень душевный разговор. Аудитория положительно восприняла мой доклад. В частности, один из наших бывших студентов, ныне исследователь, отметил, что за свою карьеру он строил много разных типологий и что наша с Еленой Геннадьевной методика – самая лучшая».

Ефим Галицкий, начальник Лаборатории анализа данных

Иван Климов поблагодарил Ефима Галицкого за участие и отметил, что супруги Галицкие обладают уникальной способностью видеть за математическими решениями важные содержательные смыслы и общение с ними обогащает представления о культуре работе с данными.

Валентина Глянцева
© 2025 ФОМ