|
Pourquoi une solution ouverte ?
Lorsqu’une entreprise postale passe du tri manuel au tri automatique du courrier, elle achète généralement des machines de tri avec des systèmes de reconnaissance automatique et de vidéocodage intégrés. Ce dispositif fonctionne bien jusqu’à ce que le besoin de machines supplémentaires apparaisse pour trier les lettres, les objets plats ou les paquets ou jusqu’à ce que la vétusté des machines nécessite leur remplacement. Ceci soulève le problème de la coexistence entre différents types ou différentes versions de machines. Les Postes veulent éviter d’être liées à un seul fournisseur de machines, ce qui conduit à des solutions de reconnaissance d’adresses incompatibles, des extensions complexes et onéreuses, impliquant des formations coûteuses de leurs opérateurs sur un ou plusieurs systèmes de vidéocodage incompatibles.
Pour résoudre ce problème, de nombreuses Postes ont commencé à intégrer une solution de reconnaissance d’adresses unique, qui communique avec leurs différentes machines. Ceci résout une partie du problème, mais laisse la Poste liée à l’éditeur de la solution logicielle. Lorsqu’elle va chercher à augmenter la performance de son système de reconnaissance ou à développer un nouveau service, la Poste ne pourra pas tirer avantage d’une mise en compétition et acquérir la meilleure offre du marché, sauf à engager des budgets conséquents avec son éditeur originel pour l’intégration et le déploiement.
Les systèmes ouverts apportent un véritable changement de paradigme aux Postes en fournissant des technologies à l’état de l’art qui garantissent les mêmes performances de reconnaissance sur l’ensemble des machines de tri, tout en leur fournissant la liberté de maintenir, d’améliorer ou d’ajouter les meilleurs solutions du moment.
Le modèle CEN
Le Comité Européen de Normalisation (CEN) a défini un modèle ouvert avec des interfaces pour bâtir une architecture ouverte. Ce modèle est construit autour d’un “Contrôleur d’Images ”, qui reçoit les images de différentes machines de tri et les dispatche en vue d’être traitées vers des « Moteurs d’Enrichissement » . Le Contrôleur d’Images supporte deux interfaces principales, l’une avec les Moteurs d’Enrichissement et l’autre avec les machines. L'existence d'une interface standard avec les machines fournit l'indépendance entre elles et le logiciel de reconnaissance, mais l’ouverture du logiciel de reconnaissance provient de l'interface standard aux moteurs d'enrichissement, qui permet aux Postes de faire évoluer leur solution en intégrant des moteurs d'enrichissement additionnels sans impact sur les machines traitant le courrier.

Intégration d’un OCR
Les solutions d'automatisation du courrier d'AddressVision Inc. (AVI), filiale de Bull, sont conformes au modèle ouvert et aux interfaces du CEN. Afin d'illustrer ceci, nous examinerons maintenant comment une Poste utilisant la solution d'AVI peut améliorer ses performances de reconnaissance en ajoutant un OCR sans nécessiter d'intervention de la part d'AVI. L'objectif n'est pas de traiter des rejets par un OCR ‘secondaire’ mais plutôt de profiter pleinement des forces d'un OCR additionnel.
Le contrôleur d'images d'AVI inclut une gestion de flux configurable, qui permet un ordonnancement des moteurs d'enrichissement à partir de règles prenant en compte la capacité du système, les attributs de l'image et la confiance dans les résultats déjà obtenus. Ces règles sont écrites dans un langage interprétatif et les intégrateurs de la Poste les modifient, afin d'appeler l’OCR additionnel dans les circonstances exactes qu’ils ont choisies. En outre, chaque nouvel OCR tire profit des attributs des lots de courrier et des résultats partiels des OCRs précédemment appelés grâce au concept de la ‘pré-connaissance’ défini par le CEN. Par exemple, si un moteur d'enrichissement est consacré à la localisation du bloc d'adresse, ses résultats seront transmis à l’OCR additionnel en tant que ‘pré-connaissance’.
Dans le cas où l’OCR additionnel donne un résultat différent de celui des OCRs existants, le système de vote choisit le résultat correct. Le système de vote ou d’arbitrage d’AVI comporte une phase d’apprentissage pour chaque OCR, utilisant une technique de machine à induction. Suivant les indications du schéma ci-dessous le moteur d’apprentissage de l’arbitrage exécute une analyse des possibilités de l’OCR, basée sur l’étude des résultats fournis par cet OCR sur un ensemble d'images correspondant à des adresses connues. Le résultat de cette analyse est un arbre de décision à l'usage du moteur d'arbitrage pour choisir un résultat de reconnaissance entre ceux publiés par les différentes OCRs. Ce processus d’apprentissage n'implique aucune modification du logiciel d'arbitrage et peut également être exécuté par la Poste.
Cet exemple montre comment une solution véritablement ouverte déplace la maîtrise de l'automatisation du courrier du fournisseur vers la Poste. Une solution ouverte permet des améliorations des performances de reconnaissance ou l'introduction de nouveaux services en intégrant la meilleure solution du marché dans la solution existante, sans être lié à un quelconque fournisseur.

|