Быстрый старт по DataStore
Начните работу с DataStore за считанные минуты. В этом руководстве рассматриваются установка, миграция с pandas и основные сценарии использования.
Установка
Установите chDB с помощью pip:
Для необязательных зависимостей:
Проверка установки
Однострочная миграция с Pandas
Самый простой способ начать работу с DataStore — просто изменить строку импорта:
Вот и всё! Теперь ваш существующий код на pandas будет использовать DataStore и выигрывать от оптимизации SQL.
Пример переноса данных
Основы использования
Создание хранилища данных DataStore
Фильтрация данных
Выбор столбцов
Сортировка
Группировка и агрегирование
Объединение хранилищ данных
Получение результатов
DataStore использует отложенное вычисление (lazy evaluation) — операции не выполняются, пока не потребуются результаты.
Запуск выполнения запроса
Просмотр сгенерированного SQL-кода
Результат:
Работа с разными источниками данных
Локальные файлы
Облачное хранилище
Базы данных
Операции со строками и типом DateTime
Строковые операции
Операции с датой и временем
Расширения ClickHouse
Рекомендации
1. Используйте формат Parquet для больших файлов
2. Фильтруйте как можно раньше
3. Выбирайте только нужные столбцы
4. Используйте SQL для сложных операций
Дальнейшие шаги
- Узнайте обо всех Factory Methods для создания DataStore
- Изучите Query Building для операций в стиле SQL
- Ознакомьтесь с Accessors для строк, дат и времени и многого другого
- Прочитайте Performance Guide с советами по оптимизации