SharePoint OCR

Fonctionnalité très peu connue de SharePoint mais qui peut avoir un intérêt pour toutes les personnes qui exploitent de vieux logiciels de production qui génèrent, par exemple, des factures ou autre fichier en Tiff !!! (comment ça ? ça sent le vécu ? ;-))

Nous savons (ou pas) que l’indexation des binaires de SharePoint se fait également dans le contenu des documents (format Office et PDF en majorité). Comprenez par là que tous les mots, même à l’intérieur des documents, sont indexés.

Cas pratique : Un  “vieux ” progiciel de production me génère des fichiers TIFF que je vais charger dans une Bibliothèque SharePoint afin de retrouver des factures, des codes, des suivis de qualité …

Dans ce monde où le repositery prime sur l’organisation de contenu, nous faisons les beaux jours des moteurs de recherche … mais je m’égare ! J’y reviendrai un jour !

Ce n’est pas SharePoint qui fournit cette fonctionnalité mais plutôt Windows Serveur 2008 et 2012.

Dans WIndows Server, ajoutez la fonctionnalité Windows TIFF IFilter.

Windows Tif iFilter

Activez la reconnaissance de texte (OCR) dans la GPedit.msc (Computer Configuration->Administration Template-> OCR)

GPedit

Activez : “Force TIFF IFilter to perform OCR …”

Force TiffRedémarrez le service de recherche, puis réindexation complète et voilà nos fichiers TIFF indexés dans le “search”.

Mon collaborateur va pouvoir chercher ses données imbriquées dans un Tiff via SharePoint .
N’oubliez pas que le Search peut indexer un contenu SMB mais pourquoi se priver des fonctionnalités de GED se SharePoint 😉 !

 

 

 

Published by

Jérôme Folliot

Jérôme Folliot

Infographiste, Webdesigner, technicien réseau, responsable Informatique, formateur, Consultant en SSII ... SharePoint m'a quasi toujours suivi dans mon parcours. On me connaît par ce genre de phrases : "les usages, les usages ...", "Keep it Simple", "SharePoint est un produit pas une plateforme de Dev", "le Dev : c'est le mal" ;-) Il est temps aujourd'hui de vous faire partager toute mon expérience d'infrastructure et d'usages fonctionnels ;-)

Leave a Reply

Your email address will not be published. Required fields are marked *