Beacon ARCO Data lake Query Engine

Beacon is a lightweight, high-performance ARCO data lake query engine for discovering, reading, transforming, and serving scientific array and tabular datasets. It focuses on Arrow + DataFusion interoperability and supports formats such as Parquet, NetCDF, Zarr, ODV, and CSV.

Quick start (Docker)

version: "3.8"

services:
  beacon:
    image: ghcr.io/maris-development/beacon:latest
    container_name: beacon
    restart: unless-stopped
    ports:
      - "8080:8080"
    environment:
      - BEACON_ADMIN_USERNAME=admin
      - BEACON_ADMIN_PASSWORD=securepassword
      - BEACON_VM_MEMORY_SIZE=4096
      - BEACON_DEFAULT_TABLE=default
      - BEACON_LOG_LEVEL=INFO
      - BEACON_HOST=0.0.0.0
      - BEACON_PORT=8080
    volumes:
      - ./datasets:/beacon/data/datasets
      - ./tables:/beacon/data/tables

Start and open the API docs at http://localhost:8080/swagger/

Add datasets by placing files (e.g., .nc, .zarr, .parquet, .csv) into ./datasets so the container can discover them via the mounted volume.

Query examples

SQL

curl -X POST http://localhost:8080/api/query \
  -H 'Content-Type: application/json' \
  --output results.parquet \
  --data-binary @- <<'JSON'
{
  "sql": "SELECT TEMP, PSAL, LONGITUDE, LATITUDE FROM read_netcdf(['data/2020.nc', 'data/2021.nc']) WHERE time > '2020-01-01T00:00:00'",
  "output": {"format": "parquet"}
}
JSON

JSON

curl -X POST http://localhost:8080/api/query \
  -H 'Content-Type: application/json' \
  --data-binary @- <<'JSON'
{
  "query_parameters": [
    {"column_name": "TEMP", "alias": "temperature"},
    {"column_name": "PSAL", "alias": "salinity"},
    {"column_name": "TIME"},
    {"column_name": "LONGITUDE"},
    {"column_name": "LATITUDE"}
  ],
  "filters": [
    {"for_query_parameter": "temperature", "min": -2, "max": 35},
    {"for_query_parameter": "salinity", "min": 30, "max": 42},
    {"and": [
      {"for_query_parameter": "LONGITUDE", "min": -20, "max": 20},
      {"for_query_parameter": "LATITUDE", "min": 40, "max": 65}
    ]}
  ],
  "from": {
    "netcdf": {"paths": ["data/2020.nc", "data/2021.nc"]}
  },
  "output": {"format": "csv"}
}
JSON

Name		Name	Last commit message	Last commit date
Latest commit History 287 Commits
.cargo		.cargo
.github		.github
beacon-api		beacon-api
beacon-arrow-netcdf-mpio		beacon-arrow-netcdf-mpio
beacon-arrow-netcdf		beacon-arrow-netcdf
beacon-arrow-odv		beacon-arrow-odv
beacon-arrow-zarr		beacon-arrow-zarr
beacon-binary-format @ 9c14fdd		beacon-binary-format @ 9c14fdd
beacon-binary-format-toolbox		beacon-binary-format-toolbox
beacon-common		beacon-common
beacon-config		beacon-config
beacon-core		beacon-core
beacon-data-lake		beacon-data-lake
beacon-example @ ea9c141		beacon-example @ ea9c141
beacon-formats		beacon-formats
beacon-functions		beacon-functions
beacon-nd-arrow		beacon-nd-arrow
beacon-object-storage		beacon-object-storage
beacon-planner		beacon-planner
beacon-py @ 957ca81		beacon-py @ 957ca81
beacon-query		beacon-query
beacon-studio @ e48c80b		beacon-studio @ e48c80b
docs		docs
mappings		mappings
test-datasets		test-datasets
vocab-generation-tooling		vocab-generation-tooling
.gitignore		.gitignore
.gitmodules		.gitmodules
.local.env		.local.env
.minio.env		.minio.env
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
c17_codes.json		c17_codes.json
callsign_map.json		callsign_map.json
rust-toolchain		rust-toolchain
zarr.ipynb		zarr.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Beacon ARCO Data lake Query Engine

Quick start (Docker)

Query examples

SQL

JSON

About

Uh oh!

Releases 14

Packages

Uh oh!

Uh oh!

Contributors 3

Uh oh!

Languages

License

maris-development/beacon

Folders and files

Latest commit

History

Repository files navigation

Beacon ARCO Data lake Query Engine

Quick start (Docker)

Query examples

SQL

JSON

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 14

Packages 0

Uh oh!

Uh oh!

Contributors 3

Uh oh!

Languages

Packages