«С данными Хаба можно работать бесконечно и получать разные результаты»

Анастасия Егорова – о Хабе СМБиз, который открывает широкие возможности для аналитиков и студентов

qr-code
«С данными Хаба можно работать бесконечно и получать разные результаты»

В конце 2023 года ФОМ представил Хаб СМБиз – хранилище данных, предназначенных для использования учеными, экспертами и студентами в целях изучения российского малого бизнеса. В Хаб выкладываются данные различных исследований ФОМа. На сегодняшний день он содержит результаты всех проведенных волн Лонгитюда Малого Бизнеса ФОМ. Предполагается, что на их основе будут защищаться диссертации, готовиться научные публикации или аналитика для корпоративных, государственных, публицистических или иных целей. Хаб способствует использованию данных Лонгитюда в научной сфере для образовательных, академических и практических разработок по тематике предпринимательства, малого бизнеса. О новом начинании ФОМа разговариваем с координатором Проекта СМБиз, специалистом по долгосрочным исследованиям Анастасией Егоровой. 

Что послужило толчком к созданию Хаба? 

В 2022 году руководитель Департамента социологии факультета социальных наук и Лаборатории исследований предпринимательства НИУ ВШЭ, профессор Александр Юльевич Чепуренко предложил ФОМу поучаствовать в конкурсе «Вышки» по созданию баз данных. Мы подали заявку, а позже организаторы отменили этот конкурс и анонсировали другой – на проведение фундаментального научного исследования. Мы решили принять в нем участие. Условием было наличие актуальных и уникальных данных, а также исследовательской группы, которая анализирует эти данные для подготовки научных статей и публикации их в журналах. Александр Юльевич предложил ФОМ в качестве источника данных и привлек кафедру менеджмента из филиала «Вышки» в Нижнем Новгороде для их анализа. 

Летом 2023 года мы провели трехдневный мараФОМ «Проект СМБиз и возможности использования базы данных Лонгитюда для исследований в области предпринимательства». На него мы пригласили студентов, аспирантов и преподавателей кафедры менеджмента из нижегородской «Вышки». Познакомились с коллегами, представили им проекты СМБиз и Лонгитюд Малого Бизнеса, показали свои научные результаты в рамках академических работ, а также рассказали, как Лаборатория анализа данных ФОМа работает с этими данными. На мараФОМе президент ФОМа Александр Анатольевич Ослон впервые публично рассказал о Хабе – об идее, о данных, которые он будет содержать, и пошутил: «Хаб – хороший анализ будет». После этого мы решили до конца года разработать систему предоставления доступа к нашим данным. 

То есть Хаб изначально зарождался для участия в конкурсе, а не как бизнес-проект? 

Ценность Лонгитюда Малого Бизнеса – в его первичных данных. На их основе нельзя построить таблицу распределения, сделать обычный график и сказать, что этот результат репрезентирует всю совокупность предпринимателей. Зато можно детально проанализировать массивы, найти в них что-то уникальное, написать на основе анализа научную работу. Идея раздавать эти данные для продвижения Проекта СМБиз и продавать для его монетизации зрела давно, просто конкурс «Вышки» помог ее оформить. 

Хаб предоставляет пользователям более широкие возможности по сравнению с пак-сайтом СМБиз, частью которого он является? 

Да. Хаб содержит в первую очередь массив первичных данных Лонгитюда Малого Бизнеса, сейчас там результаты 10 волн. Это сырые данные, которые можно изучать и интерпретировать по-разному, в зависимости от задач и интересов. Мы делаем анализ – то, что публикуем на сайте СМБиз, опираясь на собственный фокус и свои ресурсные возможности. У других аналитиков может быть свой взгляд. С данными можно работать бесконечно долго и получать разные результаты. На сайте – лишь малая часть того, что позволяют данные, которые размещены в Хабе. 

На чем основана уверенность, что в первичных данных Лонгитюда и соответственно в Хабе есть потребность? 

Во-первых, Лонгитюд Малого Бизнеса – уникальный проект, аналогов которому в России нет. Во-вторых, мы знаем о проблеме студентов, аспирантов, профессоров, ученых социологических и смежных факультетов. У них недостаточно данных для проведения количественного анализа, а без этих данных невозможно писать научные статьи, вести научную деятельность. Поэтому мы уверены, что Хаб будет востребован. 

Какова роль в создании Хаба твоего научного руководителя Александра Чепуренко? 

Он наш Партнер в рамках Проекта СМБиз, а сейчас играет роль связующего звена между ФОМом и нижегородской «Вышкой». Но разработкой Хаба занималась большая команда внутри ФОМа. 

Чем было обусловлено участие в работе большого числа сотрудников? 

Впервые в ФОМе мы организовали систематическое предоставление доступа к данным. Мы сразу поняли, что данные в том виде, в котором мы сами привыкли с ними работать, передавать внешним пользователям нельзя. Их объем и сложность могут вызвать затруднения. Поэтому мы проделали колоссальную подготовительную работу. Ефим Борисович Галицкий и Екатерина Пушкина из Лаборатории анализа данных ФОМа обработали и структурировали массивы. А еще мы подготовили инструкции по работе с массивами, анкету, которая содержит все волны, таблицу с распределениями ответов респондентов за все волны. 

Хаб обещает бесплатный доступ к данным Лонгитюда за 2021–2023 годы, а результаты исследований, полученные в текущем году, будут платными до окончания года, потом также станут бесплатными. Для получения доступа к бесплатным данным нужно заполнить анкету. А как получить доступ к свежим данным и сколько это стоит? 

Процедура получения доступа к бесплатным и платным данным – одинаковая. Будущий пользователь заполняет форму запроса, мы рассматриваем ее и отправляем ему письмо с дальнейшими инструкциями и ссылкой на данные. Условия предоставления доступа к платным данным обговариваем дополнительно. Стоимость зависит от количества запрашиваемых данных – нужны ли пользователю все четыре волны или какая-то одна – и отличается для юридических и физических лиц. 

Как защищены платные данные от распространения? 

На этапе заполнения формы запроса будущий пользователь подписывает соглашение о нераспространении. Кроме того, наши данные хранятся на внутреннем ФОМ-диске, и перед скачиванием пользователь принимает пользовательское соглашение. А еще он обязуется ссылаться на наши данные в своей научной работе и информировать нас о ее результатах, будь то защита диссертации или выход статьи в научном журнале. 

Что планируете делать для продвижения Хаба? 

Мы хотим рассказать о Хабе и его возможностях исследователям из других вузов, научных, аспирантских школ. Кроме того, есть планы записать проморолик с демонстрацией особенностей Хаба и сформировать программу проведения межрегиональных школ-тренингов по работе с данными. 

Что будете считать успехом Хаба? 

На данных Лонгитюда подготовлены и защищены курсовые, бакалаврские работы, магистерские диссертации. Их количество может увеличиться благодаря Хабу. Если данные окажутся востребованными коллегами не только из нижегородской «Вышки», но и из других университетов, Хаб можно будет считать успешным. Мы понимаем, что не у всех есть возможность платить за свежие данные, но даже если исследователи будут пользоваться бесплатными данными, значит, Хаб мы сделали не зря. 

Интервью подготовил Михаил Володин
© 2025 ФОМ