×
Луис Морено Кампос, директор направления Big Data, Oracle ЕМЕА

Эксперты ИТ-индустрии уверены в том, что 2015 год станет переломным в сфере Big Data. Oracle сформировал прогноз наиболее актуальных в этом году трендов больших данных для компаний. В области применения больших данных наша страна не отстает от остального мира, и в перспективе эти тренды не менее значимы для российского рынка.



Появится информационный капитал. Стоит забыть термин большие данные и последовать примеру крупных корпораций, которые уже оперируют новым понятием - data capital (информационный капитал). Большие данные - это уже не только технология, но и определенный подход к бизнесу, который приносит дополнительный доход. Он преобразует разрозненную информацию в инструмент, повышающий эффективность компании. Технологии будут меняться, но сам принцип останется. Данные - это капитал, который необходим для создания новых продуктов, запусков сервисов и который сам впоследствии монетизируется. Для руководителей важно приумножать использование информационного капитала за счет оцифровки и сбора данных от ключевых процессов взаимодействия с партнерами, клиентами и поставщиками до того, как это сделают конкуренты. В свою очередь, ИТ-директорам необходимо обеспечивать ликвидность данных, то есть предоставление компании данных в том виде, в котором они требуются, за минимальное время, с минимальной стоимостью и рисками. Data capital - удобный и экономичный вариант потребления инфокоммуникационных технологий не только для корпораций, но и для SMB-сектора, который всегда ищет возможность оптимизировать расходы на аналитику и обработку данных. Тем более, если учесть трудности, которые испытывает мировая и российская экономика. В такой ситуации информационный капитал становится серьезным конкурентным преимуществом.



Big Data выйдет из экспериментальной стадии. Многие компании уже добились положительных результатов от применения Hadoop и NoSQL (not only SQL). Для них это уже стандартные инструменты корпоративного управления данными, наряду с реляционными БД. Но большинство воспринимает Big Data в качестве смелого эксперимента. По нашим расчетам, в течение года крупные компании придут к наилучшим сценариям использования новых компонентов. Спрос на ликвидность данных вдохновит системных инженеров на поиски новых путей реализации полноценной экосистемы больших данных (на основе Hadoop, NoSQL и реляционных технологий).


SQL никуда не уйдет. SQL - не просто технологический стандарт. Это язык с сорокалетней историей, вобравший в себя все лучшие идеи по работе с данными. Аналитики и разработчики алгоритмов полностью доверяют SQL. C его помощью решается огромное количество задач, начиная с анализа мошеннических схем и заканчивая экспедированием грузов. Поэтому логично, что компании ждут от SQL бесшовной совместимости с любыми большими данным, а не только с данными в Hadoop, NoSQL или в реляционном хранилище. Они также будут требовать от ИТ-поставщиков, чтобы большие данные в SQL работали так же, как полноценные современные базы данных SQL, уже используемые их приложениями и разработчиками. Это заставит зарождающуюся связку Hadoop и SQL "созреть" в сжатые сроки. Именно эту задачу выполняет Oracle Big Data SQL. Она интегрирует данные разных типов, при этом выполняя один SQL-запрос к данным, содержащимся в Hadoop, NoSQL и Oracle Database.



Трансформация на лету. Работа в оперативной памяти ускорит процессы работ с данными (извлечение, преобразование, загрузка). Специалисты по работе с данными все чаще будут выбирать инструменты для репликации данных в реальном времени, вместо уже привычных для Hadoop пакетно-ориентированных инструментов. Также появится возможность в полной мере воспользоваться распределенной моделью для проведения всех операций по обработке данных в оперативной памяти, что в свою очередь ускорит преобразование данных для поддержки интерактивного поиска и позволит создавать новые комбинации данных "на лету". А такая, казалось бы, очевидная вещь, как извлечение скрытой информации (не всегда доступной по первому же, простому запросу) - это реальная помощь в повышении доходности активов, поскольку планировать те же закупки становится проще, если располагаешь дополнительными данными.



Средства самообслуживания в обнаружении и визуализации данных доберутся до Big Data. Не стоит также забывать, что данные становятся все более разрозненными - это затрудняет их анализ и получение знаний, а также ограничивает реальный потенциал технологии. Но мы верим, что инструменты визуализации и самообслуживание в обнаружении данных доберутся до Big Data. Они помогут бизнес-экспертам принимать ежедневные решения на основе больших данных. Особенно актуально это в случаях, когда данные приходят в компанию извне и, как следствие, не подвергаются жесткой обработке на основе существующих корпоративных политик. Технологии, совмещающие простоту использования со сложными алгоритмами классификации, анализа и обогащения данных, помогут упростить обращение к неструктурированной и разнородной информации, которая еще не прошла фильтрацию. В результате корпоративные пользователи получают легкий доступ к Big Data - они уже знают, где "копать, прежде чем взять в руки лопату".



Требования безопасности только усилят инновации в области Big Data. На текущий момент многие крупные компании обнаружили, что их пилотные проекты по большим данным блокируются менеджерами по внутреннему контролю из соображений юридических или нормативных разногласий. Этот вопрос стоит особенно остро, когда новые комбинированные хранилища включают в себя информацию о клиентах компании. Но вот новый, интересный поворот сюжета: организациям, если они "посадят данные под замок", станет легче заниматься экспериментами с Big Data и перераспределять данные в рамках существующих политик. Такой подход распространит современные практики информационной безопасности - например, маскирование данных - на среду больших данных и дополнит такие жизненно необходимые инструменты, как контроль доступа, авторизация и аудит.



Большие данные и гибридные облака - лучше вместе. Как только компании увидят, что корпоративное управление и контроль безопасности переходят в высокопроизводительные облачные среды, они станут перераспределять нагрузку на производственные мощности так, как им это надо. Например, у производителя автомобилей, который хочет скомбинировать полученные из облака данные от автодилера с собственными данными с заводского склада, теперь появляется возможность "перегнать" складские данные в облако для преобразования и анализа, а потом отослать результат на склад для обработки запросов в режиме реального времени.