Passer au contenu principal

🔱 Vectorisation des donnĂ©es

M
Écrit par Maxime Renault
Mis à jour il y a plus de 3 semaines

Outmind s’appuie sur Ragie (prestataire tiers) pour indexer ces vecteurs et synchroniser les mises à jour.

  • DonnĂ©es traitĂ©es : texte extrait des fichiers + metadata.

  • Chiffrement : donnĂ©es chiffrĂ©es en transit (TLS) et au repos (AES‑256) cĂŽtĂ© Ragie.

  • HĂ©bergement : Ragie hĂ©berge ses services aux États‑Unis.

  • Activation : la vectorisation est dĂ©sactivĂ©e par dĂ©faut et activable source par source dans Outmind.

  • Effets immĂ©diats : meilleure comprĂ©hension des requĂȘtes imprĂ©cises, retrieval multi‑documents, extraits plus pertinents.


đŸ§© À quoi sert la vectorisation dans Outmind ?

La vectorisation permet d’effectuer des recherches par sens (sĂ©mantiques) plutĂŽt que par mots‑clĂ©s stricts.

Elle permet Ă©galement de retrouver des Ă©lĂ©ments, mĂȘme si l’utilisateur n’emploie pas la mĂȘme terminologie que le document.

⇒ Meilleure tolĂ©rance au flou (synonymes, formulations orales, mĂ©moire partielle).

Enfin, elle permet d’agrĂ©ger des extraits issus de plusieurs documents pertinents pour rĂ©pondre Ă  une question.

⇒ RĂ©ponses enrichies par des extraits contextuels prĂ©cis (top chunks), avec la possibilitĂ© d’assembler des passages issus de sources diffĂ©rentes.

Exemples concrets :

« Tu peux me retrouver le fichier oĂč on avait eu des problĂšmes avec le client sur le bĂ©ton vibrĂ© ? »
Sans vectorisation : recherche exacte par mots‑clĂ©s, risque d’oubli si le terme exact n’apparaĂźt pas.
Avec vectorisation : compréhension du sujet et des proches sémantiques, meilleure remontée des lettres pertinentes.
Recherche de lettres / courriers dans des dossiers volumineux (1 000–3 000 docs) à partir de formulations floues.
PrĂ©paration de rĂ©ponses d’offre : retrouver des projets similaires et produire une synthĂšse rapide (objet, mĂ©thode, chef de projet, etc.).

⚙ Comment ça marche (Outmind)

CrĂ©ation d’une source vectorisĂ©e

Deux types de sources existent :

  • Sources personnelles & partagĂ©es :

    • Une option « Vectorisation » est disponible dans la modale de crĂ©ation pour les administrateurs sur Outmind uniquement pour cette premiĂšre version.

Pour les sources partagées, pas de prise en compte des permissions par la source vectorisée partagée.

Le dropdown des permissions est positionné sur « Sans permissions » et désactivé (non modifiable).

Par dĂ©faut : l’option est dĂ©sactivĂ©e. L’activation relĂšve d’un choix explicite de l’admin (conformitĂ© : transfert vers un tiers).

Utilisation et expérience

  • Les sources vectorisĂ©es coexistent avec les non vectorisĂ©es :

    • sĂ©lection dans une discussion, dans un assistant ou dans DocChat sans diffĂ©rence visuelle ;

    • peuvent ĂȘtre utilisĂ©es seules ou en combinaison avec d’autres sources.

Supprimer une source vectorisée

  • Manipulation identique aux autre sources.


📊 DonnĂ©es traitĂ©es

Qu’est‑ce qui est envoyĂ© Ă  Ragie ?

  • Le fichier complet

  • MĂ©tadatas (arborescence, chemin du parent, dates, etc)

Qu’est‑ce que Ragie stocke ?

  • Les binaires des fichier.

OĂč vont les donnĂ©es ?

  • HĂ©bergement : les services de Ragie sont situĂ©s aux États‑Unis.

  • Transfert international : activer la vectorisation implique un transfert vers un pays tiers. Les admins doivent vĂ©rifier la base lĂ©gale et les mĂ©canismes de transfert appropriĂ©s (ex. SCC), au regard de leurs obligations (RGPD).

Sécurité et conformité

  • Chiffrement : TLS en transit, AES‑256 au repos.

  • Certifications : SOC 2 Type I et CASA ; SOC 2 Type II annoncĂ©.

  • Bonnes pratiques : isolation virtuelle par partition.

Conservation & suppression

  • Conservation : tant que la source est active, ses chunks/embeddings restent indexĂ©s chez Ragie.

  • Suppression : par suppression de la source ou outillage d’effacement Ă  la demande (purge). L’effacement chez Ragie est irrĂ©versible et peut nĂ©cessiter un dĂ©lai de propagation.

Références utiles

Avez-vous trouvé la réponse à votre question ?