Pour les développeurs

API OpenAI-compat drop-in. GPU souverain Québec. Zéro vendor lock-in.

Changez `base_url`, gardez votre code. Accédez par défaut au seul GPU 100 % souverain canadien (Qwen3.5-35B sur V100S à Beauharnois) ou aux modèles tiers (Claude, Gemini) en opt-in. Streaming SSE, function calling, embeddings, virtual keys, fallback inter-provider, monitoring usage.

Drop-in en 30 secondes — premier appel sur GPU souverain Québec

Migrez depuis OpenAI sans toucher à votre logique métier. L'alias `secuai-local-large` cible directement le pool V100S au Québec.

Avantpython
from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
)

chat = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello"}],
)
Avec secuAI (GPU souverain QC)python
from openai import OpenAI

client = OpenAI(
    api_key="sk-secuai-...",
    base_url="https://api.secuai.ca/v1",
)

# secuai-local-large = Qwen3.5-35B sur GPU V100S
# à OVH Beauharnois (Québec, 100 % souverain).
chat = client.chat.completions.create(
    model="secuai-local-large",
    messages=[{"role": "user", "content": "Hello"}],
)

SDK officiels

Réutilisez les SDK OpenAI existants — la compatibilité est totale.

Python

openai Python SDK 1.x — compatible drop-in. Streaming, async, batching.

Node.js / TypeScript

openai NPM package — compatible drop-in. ESM + CJS, types stricts.

Go

github.com/sashabaranov/go-openai — pointer base_url vers api.secuai.ca.

Streaming SSE prêt à l'emploi

Server-Sent Events natifs sur /v1/chat/completions avec stream=true.

const stream = await client.chat.completions.create({
  model: "secuai-claude-sonnet",
  messages: [{ role: "user", content: "Explique la Loi 25" }],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

Fonctionnalités plateforme

Virtual keys

Provisionnez des clés API par projet, par environnement, par membre d'équipe — quotas et budgets indépendants.

Fallback automatique

Si Anthropic est down, secuAI route automatiquement vers Gemini ou Llama selon votre politique. SLA renforcé.

Monitoring d'usage

Dashboard temps réel : tokens consommés, coûts CAD, latence p50/p95/p99, taux d'erreur par modèle.

100 % OpenAI-compatible

/v1/chat/completions, /v1/completions, /v1/embeddings, /v1/models. Aucune extension propriétaire requise.

Prêt à coder ?

Compte gratuit en 30 secondes. 5K tokens/mois sans CB.

Prêt à essayer ?

5 000 tokens gratuits chaque mois, sans carte de crédit. Plan Free permanent.