Александр Суринов, Росстат: Анализ big data и возможности для замены официальных статист. наблюдений
Есть серьезные сложности в использовании больших данных, потому что фактически это побочный продукт деятельности коммерческих структур. Она не структурирована. Если же мы говорим о статистике, налоговой и бухгалтерской отчетности, то это все-таки уже структурированная информация. И мы как служба статистики, привыкли работать с такой информацией, которая описана, формализована, структурирована.
Александр Суринов, д-р экон. наук, руководитель Федеральной службы государственной статистики.
В случае же с большими данными – не так. Каждый ритейлер, к примеру, использует собственный классификатор для описания структуры продаж, более удобный для себя. В некотором смысле это определенный вызов. Что же делать? Мы прекрасно понимаем, что есть определенная информация, которую не замечать нельзя и предлагать обществу это использовать. Это касается не только цен или объемов продаж, но и многих других сфер. К примеру, сегодня коллеги на конференции говорили о медицинской статистике. То есть это серьезный вызов перед нами: сделать из неструктурированной информации структурированную. Надо подумать, чем можно заменить официальные статистические наблюдения.