đŻ Objectif
Rendre recherchable et analysable un document qui contient du texte non sĂ©lectionnable (ex : scan papier, PDF image). Une fois OCRisĂ©, le document peut ĂȘtre interrogĂ© avec un assistant LLM comme nâimporte quel autre fichier texte.
đ§ Câest quoi lâOCR ?
OCR signifie Optical Character Recognition, ou reconnaissance optique de caractĂšres.
ConcrĂštement, câest une technologie qui permet de reconnaĂźtre et transcrire automatiquement le texte visible dans une image (par exemple : une page scannĂ©e, une photo de contrat ou de note manuscrite).
Exemples de documents nécessitant une OCRisation :
PDF scannĂ©s (comptes rendus, courriers, documents juridiquesâŠ)
Fichiers issus de fax ou dâimpressions papier
đ Pourquoi câest important ?
Un document non-OCRisé :
nâest pas indexĂ© par les moteurs de recherche
est invisible pour les assistants LLM
ne permet pas la sĂ©lection ou lâextraction de contenu
GrĂące Ă lâOCR, Outmind convertit automatiquement ces documents âmuetsâ en fichiers intelligents et exploitables.
â BĂ©nĂ©fices
Exploitez enfin les documents dormants : scans, archives, impressions PDFâŠ
Unifiez votre base documentaire (papier, numérique, image) dans une seule interface
Gagnez du temps grĂące Ă la recherche sur tout type de support
Posez vos questions directement Ă des documents auparavant inaccessibles
đ Ă retenir
LâOCR est un prĂ©-requis clĂ© pour pouvoir utiliser la puissance des LLM sur tous vos documents.
Avec Outmind, vous nâavez rien Ă faire : lâOCR est intĂ©grĂ© par dĂ©faut, silencieusement, pour que vous puissiez interroger nâimporte quel document â mĂȘme sâil vient dâun scanner des annĂ©es 2000.
âïž Que fait Outmind avec lâOCR ?
đ Ă lâingestion
DĂšs quâun document est ajoutĂ© Ă Outmind, il est automatiquement analysĂ© pour dĂ©tecter sâil contient du texte sĂ©lectionnable.
Si des pages n'en contiennent pas, un moteur dâOCR est appliquĂ© pour transformer la page en texte.
đ En recherche
Une fois OCRisĂ©, le document devient interrogeable via la recherche plein texte. Vous pouvez retrouver un contrat ou un rapport client Ă partir dâun mot-clĂ© contenu dans le scan.
đŹ Avec un assistant LLM
LâOCR permet Ă©galement dâinterroger un document scannĂ© avec un assistant IA. Par exemple, vous pouvez poser les questions suivantes :
âPeux-tu me rĂ©sumer ce rapport scannĂ© ?â
ââQuels sont les Ă©lĂ©ments sensibles Ă anonymiser dans cette lettre papier ?â
ââQuelles sont les dates importantes dans cette facture ?â
Lâassistant LLM accĂšde alors au texte extrait via OCR, comme sâil sâagissait dâun document natif.
đ§Ș Exemple de cas dâusage
Vous disposez dâun rapport de mission signĂ©, uniquement au format papier scannĂ©. GrĂące Ă Outmind :
Le fichier est OCRisé automatiquement
Il devient recherchable par mot-clĂ© (ex : âincident rĂ©seauâ, ârecommandationâ, etc.)
Vous pouvez lancer un assistant LLM pour :
Résumer le contenu
Extraire les entreprises citées
Identifier les prochaines actions
Repérer des risques ou alertes