Хранение данных в 2019: тренды, проблемы и потенциальные решения в ежегодном исследовании от Panoply
13 сентября 2019
Мы в Room42 ежедневно работаем с данными и стараемся действовать не на основе собственных предположений, а на точных числах и показателях. Поэтому увидев, что наши коллеги из Panoply выпустили ежегодный отчет о пользовательском опыте в сфере хранения данных, тут же отправились его изучать.

Data Warehouse Trends Report выпускается с 2017 года. В рамках исследования Panoply опрашивают дата инженеров, ученых и IT-специалистов из разных отраслей о том, куда они выгружают данные, и насколько это удобно. В этом году удалось поговорить аж с 800 респондентами, которые помогли убедиться в том, что рынок хранения данных находится в стагнации и срочно требует инноваций. Оригинал можно прочитать здесь.

Для тех, кто не хочет его читать или не говорит по-английски, мы перевели отчет, собрали самую важную информацию и готовы рассказать об основных выводах. Вот что удалось выяснить:
Сторонние хранилища данных нужны
Профессионалы всё активнее отказываются от серверных хранилищ и ищут то облако, которое будет несложным в использовании и удобным. Собственным хранилищам до сих пор доверяет треть опрошенных (по сравнению с 39% годом ранее), остальные предпочитают Redshift, Azure SQL Server, BigQuery и другие SaaS-решения.

Можно заметить, что за последние три года самый востребованный сервис Redshift значительно сдал позиции: в 2017 году 60% специалистов сообщили, что предпочитают его, а в 2019 — лишь 40%. Можно заметить, что "другие" облачные хранилища набирают обороты: их доля увеличилась на 13% с прошлого отчетного периода.

Source: Panoply Data Warehouse Trends Report © Panoply Ltd. 2019
Сейчас работать с данными сложно
Один из важных выводов, который можно сделать после прочтения отчета — нынешние решения категорически не подходят людям любого уровня продвинутости. Более того, до 80% сотрудников как совсем маленьких компаний, так и крупных корпораций описывают свой опыт работы с хранилищами как "сложный" или "очень сложный".

Что примечательно, число недовольных растет с каждым годом и не планирует стабилизироваться.
Source: Panoply Data Warehouse Trends Report © Panoply Ltd. 2019
Если смотреть на выборку респондентов, становится понятно, что проблема кроется не в подготовленности сотрудников к работе с базами данных, а скорее в функциональных проблемах самих хранилищ. Большинство из опрошенных заняты в сферах финансов, B2B, электронной коммерции или государственных органах.
Source: Panoply Data Warehouse Trends Report © Panoply Ltd. 2019
Также около 40% из них — сотрудники больших организаций (от 5000 человек), около 19% работают на бизнес с размером штата от 1000 до 5000 человек.
Source: Panoply Data Warehouse Trends Report © Panoply Ltd. 2019
Что именно не устраивает пользователей?
Прежде всего, перегруженность интерфейса. Этот пункт занимает лидирующую позицию для всех представленных хранилищ: от Redshift до Azure SQL Server. Стоимостью и работоспособностью специалисты недовольны примерно в одинаковой мере.
Source: Panoply Data Warehouse Trends Report © Panoply Ltd. 2019
Что касается уровня общего разочарования, все "участники голосования" показывают себя не самым лучшим образом: от 50% до 64% участников опроса расстроены их зависанием или медленной работой.
Source: Panoply Data Warehouse Trends Report © Panoply Ltd. 2019
Что все это значит?
Как минимум, огромные возможности для новых, простых, быстрых решений в этой области. Нынешние лидеры пока не торопятся устранять проблемы, а молодые компании еще не успели захватить рынок. Так что, дорога для свежих и пока неизвестных data solutions свободна, как никогда.

К счастью, решить часть насущных проблем можно уже сейчас, используя недорогие сервисы для автоматизации забора, обработки и передачи данных, например Differture.com

Будьте в курсе последних новостей!
Раз в месяц мы будем высылать вам подборку наших лучших материалов. И никакого спама.