Начальник Лаборатории анализа данных ФОМа Ефим Галицкий рассказал, как правильно делать кластеры на факторах
В середине мая прошел открытый семинар Международной лаборатории прикладного сетевого анализа ANR-Lab под названием «Можно ли все-таки строить кластеры на факторах, и если можно, то как?». Ведущим спикером на нем выступил начальник Лаборатории анализа данных ФОМа Ефим Галицкий.
Онлайн-семинар НИУ ВШЭ был посвящен обсуждению вечной проблемы прикладных социологических и маркетинговых исследований – кластерному анализу данных, полученных с помощью факторного анализа. Такой подход к сегментации применяется некоторыми исследователями, но построение кластеров на факторах может быть связано с серьезными методическими проблемами. В частности, результаты, полученные в ходе такого анализа, могут оказаться совершенно не пригодными для интерпретации.
Мероприятие было приурочено к грядущему 20-летию дискуссии о возможности построения кластеров на факторах, развернувшейся между социологом, математиком Александром Крыштановским и исследователями, математиками Еленой и Ефимом Галицкими. В начале 2000-х вышла статья Александра Крыштановского «Кластеры на факторах – об одном распространенном заблуждении», в которой он доказывал, что, опираясь на подобного рода классификации, невозможно делать обоснованные выводы. В своей ответной статье «Кластеры на факторах: как избежать распространенных ошибок» Елена и Ефим Галицкие проанализировали, почему результаты применения кластерного анализа в факторном пространстве бывают неадекватны структуре экспериментального материала, и предложили методику, позволяющую избежать искажений.
«С начала дискуссии прошла почти четверть века, и все это время разные поколения студентов «Вышки» были уверены, что кластерный анализ на факторах делать нельзя. И вот организатор семинара, бывший сотрудник ФОМа Иван Климов, который сейчас работает в ANR-Lab, предложил мне рассказать о том, что кластеры на факторах при соблюдении некоторых правил делать все-таки можно. Получился очень душевный разговор. Аудитория положительно восприняла мой доклад. В частности, один из наших бывших студентов, ныне исследователь, отметил, что за свою карьеру он строил много разных типологий и что наша с Еленой Геннадьевной методика – самая лучшая».
Ефим Галицкий, начальник Лаборатории анализа данных
Иван Климов поблагодарил Ефима Галицкого за участие и отметил, что супруги Галицкие обладают уникальной способностью видеть за математическими решениями важные содержательные смыслы и общение с ними обогащает представления о культуре работе с данными.