Повышайте скорость и качество аналитики с CedrusData
Работайте со всеми данными компании через единый интерфейс доступа
Узнать больше
О решении
CedrusData
CedrusData это распределенная SQL-система для создания аналитических платформ уровня предприятия на основе open-source проекта Trino. Работает с любыми источниками и объемами данных, в облаке и on-premise
Единая точка доступа ко всем данным организации
Снижение затрат на инфраструктуру
Собственные наборы вычислительных узлов, которые обрабатывают запросы, но не хранят данные
Возможность быстрого развёртывания
Задачи, которые решает система
1
Интеграция существующих систем для построения data fabric и data mesh платформ, и упрощения доступа к данным в масштабах всей организации
2
Управление метаданными data lake, и гарантия высокой производительности при чтении сырых данных
3
Создание и масштабирование множественных вычислительных кластеров без перемещения данных и создания дополнительных копий
4
Перераспределение нагрузки из более дорогих аналитических систем в пользу дешевых файловых хранилищ
Возможности
Функциональные возможности
SQL интерфейс
Анализируйте данные, подключайте BI платформы, и создавайте интеграции с другими системами с помощью ANSI SQL. Минимум кастомного кода
Технология Trino
Проверенная технология, которая используется ведущими мировыми технологическими компаниями и обеспечивает высочайшую производительность на масштабах до сотен петабайт
Быстрое внедрение
Разделение compute и storage и нативная интеграция с Kubernetes позволяют быстро проверять гипотезы, и итеративно внедрять новый функционал в рамках существующей инфраструктуры
Инфраструктура
Уменьшайте количество копий данных и переносите нагрузку из дорогих в поддержке систем в дешевые файловые хранилища без потери функционала и производительности
Открытые стандарты
Cedrus работает с открытыми форматами данных, предотвращая vendor lock-in, и обеспечивая доступ к данным предприятия из различных систем без усложнения инфраструктуры
Гибкость
Внедряйте новые сценарии анализа данных из существующих систем с помощью федеративной модели выполнения запросов
Архитектура системы
Как это работает?
Наши эксперты расскажут о системе подробнее на онлайн-консультации
Значительное сокращение времени внедрения изменений с недель и месяцев до дней и часов
Снижение потребности в дорогостоящих хранилищах данных, дублирование данных и уменьшение нагрузки на высококвалифицированных инженеров платформы данных
Возможность в любой момент добавлять или выводить узлы из кластера
Разворачивание в течение нескольких минут и моментальное получение анализа данных из подключённых источников
Аудит текущей ИТ-системы, разработка рекомендаций и дорожной карты
2
Планирование проекта
Постановка целей, формирование архитектуры, планирование этапов, сроков и ресурсов
3
Разработка
Разработка и настройка системы, доработка необходимых модулей, серия тестов и отладка системы
4
Внедрение и поддержка
Запуск системы, обучение персонала, техническое сопровождение
Часто задаваемые вопросы
FAQ
Он состоит из вычислительных узлов, которые обрабатывают SQL-запросы, но не хранят данные. Такая архитектура обеспечивает эластичное масштабирование в облаке и on-premise
Богатый набор коннекторов позволяет извлекать данные из популярных источников: озёр данных под управлением HiveMetastore или Apache Iceberg, хранилищ Greenplum, ClickHouse, Druid, Pinot, реляционных СУБД Postgres, MySQL/MariaDB, Oracle, SQL Server, нереляционных источников Cassandra, MongoDB, Redis, Kafka, Elasticsearch, Prometheus
Они могут формировать SQL-запросы вручную или через сторонние инструменты. Например, бизнес-аналитики строят отчёты на основе данных через BITableau, Apache Superset, исследователи данных проектируют сложные ML-модели, подключившись к CedrusData из Python, а разработчики создают новые приложения, которые работают с CedrusData через интерфейс JDBC
Остались вопросы?
Если не нашли ответ на свой вопрос, напишите нам — мы поможем!