Loi 25 — pseudonymisation contextuelle

Pseudonymisation Loi 25 — vos PII remplacées par des valeurs synthétiques réalistes

Plutôt que de masquer vos données par des tokens cassants comme [PERSON_1], secuAI substitue chaque renseignement personnel par une valeur synthétique réaliste qui préserve format ET sémantique. Le LLM répond cohéremment, vous récupérez vos données originales — sans qu'aucune PII ne quitte la zone Canada.

  • Loi 25
  • RGPD
  • OVH BHS

Trois cas d'usage emblématiques Loi 25

Cabinets juridiques

Analyse de jurisprudence et rédaction d'opinions juridiques sans exposer le nom des parties, le numéro de dossier de la cour, ni les données du client à un fournisseur LLM hors juridiction.

Secteur médical

Synthèse de dossiers patients (notes cliniques, rapports radiologiques) en effaçant RAMQ, dates de naissance et identifiants de dossiers avant l'inférence — réversion uniquement côté professionnel autorisé.

Ressources humaines

Pré-filtrage de candidatures et analyse de rétention sans transmettre nom, NAS, ou courriel personnel aux LLM tiers. Audit RPRP complet, conforme à la Loi 25 et au RGPD.

Comment ça marche

Six étapes, zéro PII en clair chez les fournisseurs, sémantique préservée pour le LLM.

  1. 1. Détection PII

    À la réception de votre requête, le moteur secuAI scanne le prompt et identifie chaque entité sensible (8 catégories : noms, NAS, RAMQ, téléphones NANP, courriels, dates, adresses, numéros de dossier).

  2. 2. Pseudonymisation contextuelle

    Chaque PII est remplacée par une valeur synthétique réaliste qui respecte son format : « Jean Dupont » devient « Marc Tremblay », « 514-555-1234 » devient « 438-921-7856 ». Le mapping est stocké en mémoire dans Redis BHS, TTL < 30 s, jamais persisté sur disque.

  3. 3. Inférence LLM

    Le prompt pseudonymisé — qui garde sa structure, son format et sa cohérence sémantique — est envoyé au modèle (GPU souverain V100S, Claude, Gemini, etc.). Le LLM raisonne normalement, comme s'il voyait des données réelles.

  4. 4. Réponse cohérente

    Le modèle répond avec les pseudo-valeurs (« Marc Tremblay a signé le... »). Aucune dégradation de qualité comparé à du texte non anonymisé : le contexte est préservé.

  5. 5. Restitution réversible (Pro+)

    À la sortie, secuAI re-substitue chaque pseudo-valeur par la PII originale en consultant le mapping Redis. Vous récupérez la réponse avec vos vraies données — exactement comme un appel direct à OpenAI, mais sans avoir exposé la moindre PII.

  6. 6. Audit RPRP & expiration

    Chaque substitution est tracée dans l'audit log Loi 25 (NDJSON, rétention 7 ans). Le mapping Redis expire automatiquement après la requête. La reverse opt-in payante (Pro+) ajoute une trace KMS OVH (Phase 3+).

8 catégories d'entités détectées

Détection multilingue FR/EN, profils standard ou custom Pro+. Format préservé pour chaque catégorie.

Identité personnelle

Noms, prénoms, alias, surnoms — substitution par des noms synthétiques cohérents avec la culture détectée (Québec, France, anglophone).

Identifiants gouvernementaux

RAMQ, NAS canadien, NEQ, numéros d'assurance, permis de conduire — format respecté (NAS valide cryptographiquement, mais sans correspondance réelle).

Coordonnées

Adresses postales, téléphones (NANP +1 / E.164), courriels personnels et professionnels — domaine remplacé par un domaine pseudonyme `*@anonyme.local`.

Dossier médical

Numéros de dossier patient, médicaments, diagnostics codés (CIM-10) — codes médicaux pseudonymisés à granularité préservée.

Données financières

IBAN, transit + folio bancaire, numéros de carte (PAN passant Luhn mais non émis), montants confidentiels — devise et ordre de grandeur conservés.

Avant / Après — exemple concret

Comparez l'approche par tokens cassants (que nous évitons) avec la pseudonymisation contextuelle secuAI.

Approche tokens cassants (autres outils)http
# Texte original
"Jean Dupont, 514-555-1234, jean.dupont@exemple.com
 a signé le contrat le 2026-05-07."

# Texte envoyé au LLM (tokenisation cassante)
"[PERSON_1], [PHONE_1], [EMAIL_1] a signé
 le contrat le [DATE_1]."

# Problèmes :
# - Le LLM perd le contexte sémantique des noms
# - Le format des données est cassé
# - Les workflows downstream attendant un format précis échouent
# - La qualité de réponse du modèle se dégrade
Pseudonymisation contextuelle secuAIhttp
# Texte original
"Jean Dupont, 514-555-1234, jean.dupont@exemple.com
 a signé le contrat le 2026-05-07."

# Texte envoyé au LLM (pseudonymisation contextuelle)
"Marc Tremblay, 438-921-7856,
 marc.tremblay@anonyme.local a signé le contrat
 le 2026-05-07."

# Avantages :
# - Format et sémantique préservés (le LLM voit un humain)
# - La réponse du modèle reste cohérente et utile
# - Aucune PII originale ne quitte le Canada
# - Restitution réversible côté Gateway via mapping Redis TTL <30s
#   (reverse opt-in Pro+, audit log RPRP Loi 25)

Prêt à tester la pseudonymisation contextuelle ?

Plan Free inclut 5K tokens/mois. Plan Anonymize Pro pour profils custom + restitution réversible via KMS.

Prêt à essayer ?

5 000 tokens gratuits chaque mois, sans carte de crédit. Plan Free permanent.