Яндекс публикует исходный код СУБД ClickHouse

Яндекс публикует исходный код СУБД ClickHouse

Компания Яндекс сообщила об открытии для сторонних разработчиков исходного кода СУБД ClickHouse, который способен хранить и быстро обрабатывать большие объемы информации для создания аналитических отчетов в любых разрезах. Технология может быть использована в телекоммуникациях, рекламе, RTB-системах и онлайн-торговле, для обработки данных мониторинга и телеметрии, а также для задач информационной безопасности.

Яндекс разработал свою систему управления базами данных — ClickHouse в 2012 году специально для Яндекс.Метрики. На сегодняшний день это одна из самых производительных в мире реляционных баз данных на аналитических запросах в реальном времени. Главная особенность ClickHouse в том, что это столбцовая СУБД, наиболее удобная для работы с аналитическими данными.

Система ClickHouse, разработанная в команде Метрики и для ее нужд, оказалась полезна и для других задач Яндекса. В том числе СУБД используется в Маркете, рекламных технологиях, системе мониторинга серверов и внутренней бизнес-аналитике. ClickHouse сравнительно прост для изучения, так как для запросов используется язык SQL.

Алексей Миловидов, руководитель группы разработки ClickHouse:

«Открытых СУБД с такими возможностями на рынке сейчас нет. Публикация исходного кода ClickHouse — это наш вклад в open-source, один из самых значимых в истории компании. У нас было несколько причин для этого, в том числе и чисто прагматических. Применение технологии в областях, которыми Яндекс не занимается, помогает шире взглянуть на её возможности. У нас, например, уже есть положительный опыт использования ClickHouse в совместном проекте с ЦЕРН. К тому же расширение пользовательской базы позволяет узнавать о проблемах, о которых иначе было бы трудно догадаться, и улучшать продукт».

Яндекс не впервые публикует исходный код своей технологии. Среди прочего, в открытом доступе находятся предназначенный для нагрузочного тестирования Яндекс.Танк, технология разработки сайтов БЭМ и инструмент для извлечения структурированных данных из текста Томита-парсер.

Источник