Промышленные данные и НТИ: от прикладных задач к стандартизации
Гарбук Сергей, И.о. директора, ВИНИТИ РАН.
Конференция ЦИПР 2026, «Цифровая индустрия промышленной России». Организатор компания ООО «ОМГ».
Ценность промышленных данных определяется только через прикладные задачи, а не сама по себе; их разумно соотносить с крупными проектами научно-технологического развития страны и рассматривать на всём жизненном цикле — от фундаментальных исследований до эксплуатации и утилизации.
Для корректной интерпретации данных нужны связные классификаторы, рубрикаторы и онтология предметных областей.
Промышленные и цифровые данные входят в состав научно-технической информации, а государственная система НТИ включает федеральные организации и предусматривает создание отраслевых центров; в этом контексте отдельно отмечена роль ЦИТО и Минпромторга.
В стандартизации промышленных данных предлагается опираться на подходы, разработанные для ИИ и машинного обучения, поскольку данные сейчас рассматриваются именно в контексте таких задач.
Большая часть уже разработанных стандартов — гармонизированные: 10 из 14, что важно для совместимости с международным сообществом и обмена данными.
Международная совместимость — отдельный приоритет: приводится пример договорённости с Китайским институтом стандартизации о едином взгляде на форматы промышленных данных.
Абстрактного “качества данных” не существует: качество нужно определять только в связи с конкретной задачей; учитываются вариативность наборов данных, объём, метаданные и точность описания источников.
Накопленный опыт Технического комитета по качеству данных для ИИ предлагается развивать дальше, ориентируясь на текущие задачи промышленности

