::: Agenda ::: ::: Lire ::: ::: Jouer ::: ::: Cliquer ::: ::: Bouger ::: ::: Consommer ::: ::: Zapper :::





*** A ne pas rater ***

Pas de conseil particulier pour l'instant.

*** Conseillé par WEEK-ENDS.BE ***

Pas de conseil particulier pour l'instant.
Pour accéder à l'agenda complet cliquer ici

[:::: Imprimer cet article :::: ]

::: Des logiciels qui nous simplifient (vraiment) la vie :::

  

Les logiciels de reconnaissance de caractères (OCR) apportent une aide précieuse lorsqu’il s’agit d’insérer dans un traitement de texte des extraits d’un document imprimé, ou d’encoder des textes et des tableaux qui n’existent qu’en format papier.

L’emploi d’un traitement de texte en milieu scolaire et professionnel s’est désormais généralisé. Ce type de logiciel fait partie des quelques incontournables de l’informatique d’aujourd’hui. En moins de dix ans, par le biais des ordinateurs et des imprimantes, il a totalement relégué aux oubliettes les machines à écrire pourtant très sophistiquées des années 80. Par ses nombreuses options de mise en pages, par les possibilités de corriger aisément toute portion du texte sans être obligé de retaper ensuite tout ce qui la suit ou d’utiliser des produits toxiques pour camoufler la correction, il nous permet désormais de réaliser des travaux, des rapports, etc. parfaitement présentés et sans trop d’efforts.

Droit de citation
Mais ce gain de confort a amené aussi de nouveaux besoins. Il est souvent nécessaire, dans un travail, d’insérer des extraits de textes trouvés dans la presse, dans des ouvrages de référence, voire même dans des travaux précédents qui avaient été préalablement tapés à la machine. Parfois, aussi, il est nécessaire de revoir un texte dont on n’a que l’impression papier, l’original ayant été effacé du disque dur. Cela impose de fastidieuses séances de dactylographie, et tout le monde n’a pas un entraînement de dactylo qui lui permet d’effectuer cette tâche en papotant avec son voisin ou en écoutant le " Jeu des dictionnaires " à la radio.

Les programmes de reconnaissance de caractères (O.C.R.) sont là pour ça. Associés à un scanner, ils transforment des documents papier en fichiers électroniques, que l’on peut alors utiliser dans n’importe quel logiciel de traitements de texte ou de mise en pages.

L’O.C.R., comment ça marche ?
Pour transformer un texte imprimé en fichier électronique, il faut d’abord le digitaliser, grâce à un scanner. Le procédé le plus répandu est le scanner à plat, un appareil dont le prix a considérablement chuté ces dernières années, et qui fait désormais partie de la plupart des configurations moyennes d’ordinateurs familiaux. En moins d’une minute, il communique à l’ordinateur auquel il est raccordé une copie de n’importe quel texte, une image que l’on peut considérer comme une photocopie parfaite de l’original.

Il est bien sûr possible d’insérer cette image dans un rapport. Mais, en général, si on scanne du texte, c’est plutôt pour pouvoir en retirer des extraits et les retravailler. C’est le rôle du logiciel O.C.R. Il lit l’image et analyse chaque ligne pour en reconnaître, un à un, les différents caractères, grâce à des procédures extrêmement complexes. À la fin de l’analyse, il exporte un fichier que l’on peut alors ouvrir dans un traitement de texte, pour le vérifier, corriger les erreurs éventuelles (aucun O.C.R. n’est parfait) et l’utiliser en fonction de ses besoins.

Le canif suisse de l’O.C.R.
"Readiris" est l’un de ces outils "gain de temps", dont il affirme être le leader mondial. Cocorico ! C’est une société belge, I.R.I.S. [1], créée en 1987, qui a développé ce produit, et qui ne cesse, depuis, de le perfectionner. Il en est aujourd’hui à sa version 7. Il reconnaît 93 langues (issues des alphabets latin, grec et cyrillique), avec tous leurs caractères spéciaux, mais peut encore faire mieux, grâce à des programmes additionnels qui traitent les langues asiatiques. Il est tout à fait capable d’analyser des documents comprenant plusieurs langues différentes.

Tous ceux qui doivent faire des photocopies le savent : une copie d’un original en couleurs ou de qualité médiocre peut donner une bouillie à la limite de la lisibilité. Le logiciel parvient à analyser ce type de pages, et parvient même à s’en sortir lorsqu’elles sont très foncées ou très claires. Il se débrouille également avec les impressions issues des imprimantes à aiguilles, où les caractères sont dessinés avec des points proches mais non continus.

Enfin, il reconstitue le formatage des pages par chapitres et colonnes, le style des polices, et il met donc les textes en grasses, en italiques ou en soulignés lorsqu’ils figurent ainsi dans le document original.

Son utilisation est vraiment simple. D’un clic, il lance le scanner ou ouvre un fichier scanné via une autre application, et lance l’analyse. Il s’arrête sur les lettres qui lui posent problème, et demande alors l’aide de l’utilisateur, afin d’apprendre par lui-même à les reconnaître.

Une fois l’analyse effectuée, il peut les exporter dans divers formats, dont le RTF (pour Word) et le PDF, un format qui permet une lecture sur n’importe quel type d’ordinateur.

Pr..vez woue frevsaie ?
Nos tests ont été convaincants : Read Iris reconnaît une multitude de polices et de styles de caractères. Mais, étonnamment, il a parfois des faiblesses, qui donnent des résultats assez déroutants.

Comme cet extrait d’un communiqué de presse, imprimé pourtant correctement par une imprimante à jet d’encre, et que l’O.C.R. a analysé comme suit :
"Sept ane aprèe le tome 4, s ur Marle-Thérèee dee 6 lgnollee revient... en pleine (e) forme (e) I..sane DioGèee Fbce" eet ralbum d’une C\u3te trèe peu epir\1 ;uelle au GOure de laC\uelle s ur Marle-Thérèee part eur lee routee et prend la défenee dee opprimée, tant C\u.lle ne ee mettent pae en travere de eon Ghemin..."

Difficile, derrière ce charabia, de deviner le texte initial :
"Sept ans après le tome 4, Sœur Marie-Thérèse des Batignolles revient... en pleine (s) forme (s) ! "Sans Diocèse Fixe" est l’album d’une quête très peu spirituelle au cours de laquelle Soeur Marie-Thérèse part sur les routes et prend la défense des opprimés, tant qu’ils ne se mettent pas en travers de son chemin..."

Mais ce genre d’expérience malheureuse ne nous est heureusement pas arrivée souvent : en général, le logiciel s’en sort bien et restitue un texte ne comprenant plus que quelques coquilles.

Le scanner à peine plus grand qu’un stylo
Lorsqu’il s’agit de transformer de courts extraits de textes, l’utilisation d’un scanner à plat n’est pas très pratique. Il faut positionner le livre ou l’article sur la vitre, attendre la fin du scan avant d’indiquer au logiciel quelle partie du texte doit être interprétée. I.R.I.S. a donc créé un petit scanner-crayon, l’I.R.I.S. Pen II, qui peut digitaliser un texte ligne par ligne. Il suffit de le passer sur une ligne de texte ou de chiffres, et ils sont directement insérés dans n’importe quelle application.

Ce petit bijou, qui s’installe automatiquement et se branche sur un port USB (disponible sur les IMAC, les G3 et tous les PC récents), ne nécessite aucune alimentation supplémentaire. Son utilisation est très aisée. On le positionne au début du texte et on l’incline légèrement. Une lumière rouge indique qu’il est prêt à travailler. On le glisse alors de gauche à droite (à une vitesse pouvant atteindre, paraît-il, les 8 centimètres à la seconde) , grâce à une petite roulette. Puis on passe à la ligne suivante, etc. En simultané, les images scannées sont interprétées par le l’O.C.R., puis exportées dans le logiciel de son choix.

A la main, il est difficile de scanner droit. C’est pourquoi l’IRISPEN intègre des fonctions qui rectifient les défauts du passage manuel. La vitesse de reconnaissance est étonnante et lorsque le nombre de lignes à scanner est inférieur à vingt, cette solution est clairement plus rapide que toute autre solution.
Un bouton à l’avant du scanner peut être programmé pour accomplir toute forme d’action.

L’IRISPenII est également capable de lire des codes à barres et des caractères manuscrits. Mais, vu mon écriture de vieux médecin ayant trop consommé d’absynthe, j’ai préféré ne pas lui imposer ce tour de force. Il existe également en version " Translator ", qui traduit automatiquement le texte scanné dans une autre langue. Nous n’avons pas non plus testé cette version. Et, pour PC uniquement, un " package " I.R.I.S Office comprend Readiris Pro, l’Iris Pen II, et un logiciel Cardiris d’indexation de cartes de visites.

Et les fôtes ?
Les O.C.R. restituent les textes tels quels, mais n’en corrigent pas les erreurs. Et on ne peut pas dire que les correcteurs automatiques des traitements de texte aient fait faire à l’évolution de l’orthographe des progrès étonnants. Le correcteur de Word, par exemple, qui est pourtant l’un des traitements de texte les plus répandus, est très limité et laisse passer énormément de fautes. Il existe peu d’alternatives assez douées pour en justifier l’achat. " Antidote " [2] est sans doute la plus performante à ce jour.

Cet ensemble d’outils, centrés autour d’un correcteur très puissant, analysent la phrase et recherchent tous les types d’erreurs possibles : de syntaxe, d’accord, de genre, mais aussi phrases trop longues, anglicismes (il est d’origine québecoise) ou expressions contestables. Par rapport à la version 4, que nous avions testée l’année passée, la version MP (pour " multiphrases ") a encore fait un bond en avant.

Il s’installe sans aucun problème sur un Macintosh, et va se loger dans la barre des menus du traitement de textes. Là, il suffit de cliquer sur le petit signe " v " pour commencer l’analyse. Une fenêtre s’ouvre, et la première phrase s’y affiche, avec une mise en évidence des problèmes rencontrés par Antidote. On peut ignorer les commentaires, ou lui demander de corriger. Le texte original est modifié en même temps. Un petit encadré, sous le mot, indique le type de problème. En cliquant dessus, on obtient une explication complète. Et une autre fenêtre donne toute l’analyse de la phrase, mot à mot. Impressionnant !

Les autres outils qui complètent ce correcteur sont un dictionnaire de définitions (il est étonnant qu’on y trouve encore, par-ci, par-là, dans cette cinquième version du logiciel, des définitions manquantes, annoncées pour une prochaine mise à jour), un dictionnaire de synonymes, un conjugueur de verbes et une grammaire des difficultés.

Enfin, Antidote effectue un diagnostic de vos erreurs et vous situe sur une échelle qualitative qui va de " novice " à " druide " !

Et, cela mérite d’être souligné, Antidote peut fonctionner sur des ordinateurs qui ne sont pas des bêtes de course. Une caractéristique inestimable mais qui devient trop rare de nos jours.

Article paru dans "Le Ligueur" en 2001.


[1http://www.irislink.com/
10 Rue du Bosquet, 1348 Louvain-La-Neuve
Tél : 010/45.13.64 Fax 010/45.34.43
Les produits IRIS sont distribués par ABC SOFT. Les prix sont de 6212 FB pour Read Iris Pro (attention : la version Mac et la version PC sont vendues dans des boîtes spécifiques), 6199 FB pour IRIS pen II standard Executive (PC/MAC) et 8499 FB pour l’Iris Office suite ( PC ).

[2Distribué par Mediamix - 4800 FB.
Pour ordinateurs Macintosh (Power PC) et PC (486 et suivants), 16 Mo RAM, 26 Mo sur le disque dur.

(par Patrick Pinchart)


[:::: Imprimer cet article :::: ]


Rechercher sur le site: