Aller au contenu

Un peu de Regex (ou expression régulière)


tbr

Messages recommandés

Il a lu, et il est arrivé après la guerre pour donner son coup de main à la faire (et après, y'avait plus rien à dire ou ajouter), parce que même s'il n'en est pas expert, ça lui est arrivé 2/3/4/5/+ fois de devoir se prendre la tête à trouver la bonne regexp pour .NET et/ou Javascript et de quoi la tester :D

Lien à poster

Selon lui, et si j'ai bien pigé ses propos, les pipe (dans ce truc ALC) séparent les éléments donc tu ne les auras pas en même temps (merci La Palisse) même si le test les présente comme étant tous ensemble, d'où le fait que le résultat final (en réel) n'affiche que le 1er élement (que la formule avec Pipe a trouvé) mais ne peut faire de même pour les autres éléments.

Cette usine à gaz est un "machin" (chercher à EMC Captiva InputAccel, 6.5 si ça vous intéresse) composé de plusieurs modules :

1/ module de scan avec OCR plus poussé que le truc de base mais le principe reste le même

2/ module de modélisation de facture comprenant des sous-modules de regex, scripts, base de filtres divers, etc.

3/ tout ce qui va transformer ensuite l'image TIFF OCRisée en champs texte (date, n° de facture, HT, TVA, TTC, siret, etc.)

...

Et le tout interagit avec le non moins lourd SAP.

Moi, j'interviens de 1 à 2 et je modélise des factures afin que les champs scannés soient reconnus et qu'il ne suffise plus qu'à vérifier que c'est bon (reconnu par le OCR avec les bons filtres, regx -- éventuellement --, scripts s'il faut)

par exemple, si on cherche le mot Facture sur une feuille, le module prend le TIFF (scan de la facture en question) et balaye l'ensemble et trouve ce fameux mot selon des formules (voir § précédent).

Lien à poster

Et sous linux tu peux faire tout ça en ligne de commande en chainant sane puis tesseract ( par exemple ) à sed dans un bon vieux script bash pour faire classieux... :p

Et là, ( même si le moteur OCR est loin d'être parfait ) on a l'avantage d'avoir un support complet des regexps ! :D

Lien à poster

Beuh, en vrai, OSEF car si on voulait faire dans le rapide (et virer 25 fonc... enfin, je voulais dire. Non, rien :) ), on aurait qu'à scanner le qrcode (ou le barcode) que beaucoup de fournisseurs impriment déjà sur leurs factures (contenant eux tout ce qu'il nous faut) et hasta la vista... Beillebiii !.

Mais bon, non. En plus, je suis sûr que ce que j'utilise a été considérablement restreint par la hiérarchie (vu tout ce que j'ai vu en démo et auquel je n'ai pas accès en terme de possibilités, hors "tout ce qui est du domaine de l'admin de ce bouzin"), juste au niveau des automatisations (batch, toussah).

Et là, ( même si le moteur OCR est loin d'être parfait ) on a l'avantage d'avoir un support complet des regexps

Ben oui. Que dire ? Windows, EMC, ceux qui ont concocté les modules spécial "Ville de Paris" (en leur coupant les couilles) "parce qu'un Adjoint Admin, c'est un con et donc qu'il faudrait pas qu'il appuye sur un bouton rouge. On sait jamais"

Pas d'bol, j'aime pas qu'on me bloque DONC, je fouille

Et ça les fait ch***

Et amha, c'est pour ça que le type m'a sorti cette connerie, que j'aurai pu/dû traduire par un "touche pas, t'y connais que dalle (et en passant avale c'te vanne, ça te calmera)"

... Donc je RE-fouille encore en lui demandant comment il a fait, lignes de son prog/script (ou que sais-je) à l'appui. Travail de sape, jusqu'à ce qu'il pige que j'ai aussi eu d'autres boulots que grouillot sans cerveau. :)

Lien à poster

En combien de formulaires CERFA (pour l'avoir, cette banderolle) ?

42 ? :)

Me rappelle d'un ingé qui me prenait pour un con. J'avais remarqué que ce type bidouillait -- pas possible de décrire autrement ce qu'il faisait vu que ça fichait à chaque fois tout par terre -- et nous envoyait des tonnes de mails (plusieurs centaines par jour ! Du Spam intranet). Un jour, j'en ai eu marre de ses conneries, j'ai trouvé un enregistreur pour faire des vidéo d'écran (sans droit admin pour l'installer) et j'ai filmé le résultat "avant-après" (qu'il soit passé pour tout foutre en l'air) et je l'ai eu au téléphone par la suite (en mode haut-parleur), devant ma chef qui connaissait le côté farfelu du bonhomme.

Moi : "on a encore un problème avec la reconnaissance des N° de Bon de Commande. Ils ne se mettent plus en relation avec les n° de siret des fournisseurs

Lui : Euh, y a aucun problème... Ca marche parfaitement.

(ma chef se demande s'il nous prendrait pas par hasard pour des cons. je le vois dans son regard)

Moi : Mmh, oui. Ok. Vous bidouillez quoi.

(ma chef ne peut s'empêcher de rire mais heureusement, il n'entend pas)

Lui : je ne bidouille pas ! (avec le ton du type qui s'est fait choper la mai dans le pot de confiture)

Moi (l'air de dire "mais ouais, à d'autre !) : bon d'accord, vous ne bidouillez pas (mais c'est pire en fait). N'empêche que ça marchait... et maintenant plus"

Fin de la conversation et ma chef qui, enfin, peut rigoler sans souci.

Et comme il m'avait vraiment pour pour le dernier des cons... PAF et pandansagl !... Envoi de la p'tite vidéo bien démonstrative (au staff techno & Informatique dont il fait partie) parce que son "ca marche parfaitement" ne marchait justement pas du tout parfaitement... vu que ça ne marchait pas du tout et qu'on ne me l'a fait pas.

... Comme par hasard, ça s'est mis à remarcher. :)

Le mec bidouillait "portnawakement", tellement qu'à chaque fois qu'un truc déconnait chez nous (toilettes bouchées, ascenseurs en panne, plus de papier dans la photocopieuse, etc.) on disait "ah, c'est Machin qui doit encore faire des conneries. On va recevoir 462 mails d'ici midi. :)

Alors le coup du simpliste, c'est plutôt simplet qu'il a cru que j'étais.

Lien à poster
×
×
  • Créer...