Как работает Athena
Python
Middle
Без компании
Как работает Athena
Ответы
Athena — это сервис от AWS для выполнения SQL-запросов к данным, хранящимся в S3, без необходимости разворачивать инфраструктуру. Он использует Presto под капотом и работает по принципу pay-per-query (плата только за обработанные данные).
**Ключевые особенности:**
- **Бессерверный** — не требует управления серверами.
- **Поддержка форматов** — CSV, JSON, Parquet, ORC и др.
- **Интеграция с Glue** — использует его Data Catalog как метаданные.
**Пример запроса:**
```
SELECT * FROM my_database.my_table
WHERE date = '2023-01-01'
LIMIT 10;
```
**Нюансы:**
- **Производительность** зависит от партиционирования данных в S3.
- **Стоимость** рассчитывается за объем просканированных данных.
- **Не для OLTP** — запросы могут занимать секунды/минуты.
Оптимально для аналитики на больших данных без ETL.