EPFL-ENAC | Informatique ENAC-IT

Station de numérisation d'images de l'espace ENAC-Environnement

Ce document constitue une brève introduction à l'usage du poste de travail de numérisation d'images (format A3/A4 avec chargeur) de ENAC-IT situé dans le local des imprimantes du bâtiment GR (GR C0 504). Rappelons que l'accès à ce local et à ses équipements est réservé aux collaborateurs de l'IIE.

Les étudiants SSIE ont, quant à eux, accès à un poste de travail spécifique avec scanner situé dans la petite salle de PCs SSIE (GR C0 02) (voir ce document).

Table des matières

  1. Caractéristiques des équipements
  2. Généralités sur l'usage de ce poste de travail
  3. Logiciels installés
  4. Choix du mode et de la résolution de numérisation
  5. Numérisation d'images avec EPSON GT 20000
  6. Reconnaissance de texte (OCR) avec ABBYY
  7. Numérisation de diapos/négatifs 35 mm
  8. Transfert de vos fichiers de ce poste vers votre machine

1. Caractéristiques des équipements

L'équipement initial acquis en 2001, a été renouvelé en 2009 (sauf scanner diapos Nikon), puis en 2013 (sauf scanner EPSON GT-20000).

1.1 Poste de travail

1.2 Scanner A3/A4

2. Généralités sur l'usage de ce poste de travail

Ce poste de travail est exclusivement destiné aux travaux nécessitant l'utilisation de ses périphériques (scanners A3/A4). On ne l'utilisera donc pas pour des tâches informatiques générales (telles que bureautique, traitement d'images, surf internet, etc...)

2.1 Procédure d'utilisation

Le PC et les périphériques doivent être déclenchés en dehors des période d'utilisation (ils se mettent en veille en cas d'oubli). Le scanner USB EPSON (A3/A4) doit être enclenché après le PC.

Les différentes étapes d'utilisation se résument donc à :

  1. enclencher le PC et l'écran et attendre la fenêtre de logon
  2. enclencher le scanner A3/A4
    ............................
  3. faire son logon (utiliser le nom d'utilisateur et le mot de passe affichés sur l'écran)
  4. scanner ses documents et les sauvegarder sur l'espace de travail D:\ (ou par défaut dans Mes Documents)...
  5. transférer par le réseau ou via support de stockage amovible USB les documents numérisés vers une autre machine
  6. faire le ménage sur D:\ (ou Mes Documents)
    ............................
  7. arrêter le PC (faire Démarrer > Arrêter), puis éteindre le scanner
  8. éteindre l'écran

2.2 Autres règles d'utilisation

L'utilisateur respectera en outre les règles suivantes :

3. Logiciels installés

Les logiciels suivants sont disponibles sur ce poste de travail (via les raccourcis déposés sur le bureau, ou via le menu Démarrer) :

4. Choix du mode et de la résolution de numérisation

Chacun a déjà expérimenté que les images numérisées occupent passablement d'espace disque. Une copie d'écran 1024x768 pixels en vraies couleurs (16 mio couleurs = 24 bits/pixels) occupe par exemple, sans compression (p.ex. format Windows Bitmap .bmp), 2.3 MB d'espace disque. Le choix des paramètres de numérisation est donc particulièrement important pour ne pas gaspiller son espace disque.
  1. Il faut tout d'abord correctement choisir le mode de numérisation en tenant compte de la nature du document : il est par exemple inutile de numériser en couleur une image qui est en tons de gris (elle occuperait 3x plus de place), ou numériser en niveau de gris un dessin noir-blanc au trait (il prendrait 8x plus de place). En ce qui concerne les images en couleurs, il faut aussi distinguer les photographies, pour lesquelles on numérisera en vraies couleurs (24 bits/pixel), des illustrations (256 couleurs ou moins) pour lesquelles on pourra travailler en couleurs indexées (8 bits/pixel => stockage 3x moins volumineux).
  2. La difficulté suivante du processus de numérisation d'une image réside dans le choix de la bonne résolution de numérisation pour obtenir le fichier image le plus petit possible offrant une qualité d'affichage ou d'impression optimale. Il ne sert à rien de scanner à la résolution maximale possible du scanner : il en résulterait une image très volumineuse d'une très haute définition dont votre imprimante ou votre écran ne saurait tirer profit ! Il s'agit plutôt de trouver le meilleur compromis entre une résolution de numérisation adaptée au périphérique d'affichage ou d'impression utilisé et une taille acceptable du fichier.
  3. Lors de la sauvegarde de l'image sur disque, il faut finalement opter pour le format de fichier le plus approprié en fonction de la nature de l'image numérisée (illustration, photographie...) : sans compression (p.ex. format Windows Bitmap .bmp), avec compression moyenne sans dégradation de qualité (lossless) (p.ex. TIFF, GIF), avec forte compression mais dégradation de qualité (lossy) (p.ex. JPEG, MrSID).

4.1 Mode de numérisation (fonction de la nature de l'image à numériser)

1 2 3 4

Type d'image Mode de numérisation
1) Photos couleur Vraies couleurs (24 bits/pixel)
2) Illustrations composée moins de 256 couleurs (dessin) 256 couleurs (8 bits/pixel)
3) Photos noir-blanc (avec niveaux de gris) Niveaux de gris (8 bits/pixel)
4) Illustrations, schémas, figures au trait (noir-blanc pur) Noir et blanc (1 bit/pixel)

Pour ce qui est des illustrations simples, on peut tenter les techniques de vectorisation (conversion d'image raster en fichier de dessin-objet par reconnaissance automatique de contours) offerte par les logiciels spécialisés tels que Adobe Illustrator/StreamLine, Adobe PhotoShop, Jasc PaintShop Pro, Deneba Canvas, etc...

En ce qui concerne le texte, on utilisera le procédé dit de "reconnaissance de caractère" (OCR) qui transforme l'image d'un texte en un fichier-texte éditable (voir description du logiciel ABBYY Fine Reader ci-dessous).

4.2 Résolution de numérisation (fonction de l'usage de l'image numérisée)

A) Numérisation de photographies destinées à être imprimées

Qu'elles soient noir-blanc ou couleur, les imprimantes ne sont capables d'imprimer qu'un nombre très limité de couleurs basées sur les encres ou toners : le noir pour les imprimantes noir-blanc, et les couleurs jaune + magenta + cyan (+ noir) pour les imprimantes couleur (quadrichromie). Les nuances de gris ou les différentes teintes sont obtenues à partir de ces couleurs de base par un procédé dit de "tramage" (dithering) qui diminue la résolution effective de l'imprimante. Davantage que la résolution, le paramètre important qui défini les capacités d'impression d'images d'une imprimante est sa "linéature" qui tient non seulement compte de la résolution mais du procédé de tramage (nombre de couleurs de base, taille des trames, tramage aléatoire...).

Pour les documents photographiques (noir-blanc ou couleur), les graphistes définissent donc la résolution de numérisation optimale en fonction de la linéature de l'imprimante utilisée. Ce paramètre étant rarement connu de l'utilisateur final, c'est la formule simplifiée suivante qui est généralement utilisée :

A) Rn = Ri * G / 4 Rn = résolution de numérisation de documents photographiques [DPI]
        Ri = résolution de l'imprimante [DPI]
        G = rapport d'échelle : image imprimée / image originale

Les résolutions d'imprimantes typiques sont (voir liste des imprimantes ENAC-IT1) (DPI = Dots Per Inch = points par pouce) :

Sur cette base-là, on peut calculer les exemples de résolution de numérisation suivants : Partant de cette formule, on peut aussi déduire le tableau ci-dessous (pour d'autres dimensions ou résolutions, faites simplement une règle de trois) :

 
Pour une photographie dont le coté devrait mesurer 10 cm à l'impression,
le coté du fichier image n'a pas besoin de faire davantage que :
Résolution imprimante 300 DPI 600 DPI 900 DPI 1200 DPI
=> coté de l'image 295 pixels 590 pixels 885 pixels 1'180 pixels

Numériser à une résolution supérieure à celle donnée par la formule ci-dessus est non seulement inutile mais en plus pénalisant en terme de taille de fichier à transférer à l'imprimante et de temps de traitement (durée du transfert réseau et de la rastérisation dans l'imprimante). Si l'on prend l'exemple d'une photo couleur au format A4 (20x30 cm) qui doit être imprimée en qualité "photo" (1200dpi) sur la Xerox 8560 : elle devrait être idéalement scannée à 300 DPI => 2362 x 3544 pixels à 3 octets/pixels => occupe 25.1 MB (non compressée) ; alors que scannée à des résolutions supérieures (parfaitement inutiles !) elle occuperait : 100.4 MB à 600 DPI et 401.6 MB à 1200 DPI (qui est la résolution optique max. du scanner EPSON GT 20000).

B) Numérisation d'images noir-blanc "au trait" destinées à être imprimées

Par documents "au trait", on entend les images en noir et blanc pur (illustrations, schémas, plans...), c'est-à-dire sans nuances de gris. Dans ce cas-là, on peut faire correspondre à chaque pixel de l'image un point élémentaire de l'imprimante. L'imprimante n'a donc pas besoin de faire de tramage et peut ainsi être utilisée en pleine résolution.

B)
Pour les documents noir-blanc au trait, on numérisera en mode noir-blanc pur (1 bit par pixel)
à la pleine résolution de l'imprimante

C) Numérisation d'images destinées à être affichées (p.ex. images dans pages Web ou projections PowerPoint)

Par opposition aux imprimantes, les écrans et projecteurs vidéo sont capables, pour chaque point d'image (pixel), d'afficher 256 niveaux de gris et des milliers voire millions de couleurs (dépendant des capacités de la carte vidéo, essentiellement la quantité de VRAM). Ces dispositifs n'ont donc pas besoin de faire du tramage et l'on peut exploiter leur pleine résolution. La résolution de ces dispositifs est cependant passablement inférieure à celle des imprimantes, se situant, pour les écrans typiques ("pitch" de 0.35 à 0.25 mm), entre 70 et 100 DPI.

C)
Les images à insérer à l'échelle 1/1 dans des PréAO (PowerPoint...) ou des pages Web seront numérisées
à une résolution comprise entre 70 à 100 DPI

Pour davantage d'information sur ces questions de résolution, on se réfèrera à l'article "Scanners : la bonne résolution pour imprimer" de Aymar de Brossin paru dans le Flash Informatique EPFL 3/2000.

4.3 Format de fichier

Les formats d'images raster les plus courants sont décrits dans le tableau ci-dessous.

Format et extension Nb couleurs
ou niv. gris
Compression Dégratation
de qualité
Caractéristiques, usage...
Tagged Image File Format
.TIF (TIFF)
16 mio coul. ou moins
(en fait de 1 à 64 bits)
oui
non
Photos, illustrations...
Multi-plateforme
Joint Photographic Experts Group
.JPG (JPEG)
16 mio coul. (24 bits)
256 niv. gris (8 bits)
oui
oui
Photos couleur ou noir-blanc volumineuses
Multi-plateforme, Web
Portable Network Graphics
.PNG
16 mio coul. ou moins
(en fait de 1 à 48 bits)
non
non
Photos, illustrations...
Multi-plateforme, Web
The GIMP
.XCF
16 mio coul. ou moins
256 niv. gris ou moins
oui
non
Format natif du logiciel libre The Gimp
Pour inclusion de masques, calques, objets vectoriels...
(mais pas l'historique des modifications)
Adobe PhotoShop
.PSD
16 mio coul. ou moins
256 niv. gris ou moins
non
non
Format propriétaire Adobe PhotoShop
Pour inclusion de masques, calques, objets vectoriels...
(y compris l'historique des modifications)

Autres formats raster qui vont prendre de l'importance dans le futur :

Il est important important de savoir jouer, dans les logiciels de retouche d'image, avec les paramètres relatifs au tableau ci-dessus. A titre d'exemple, en ce qui concerne Gimp 2.8.x :

5. Numérisation d'images avec EPSON GT 20000

Pour numériser des images sur le scanner A3/A4 EPSON GT 20000, on utilise l'application EPSON Scan. La procédure sommaire d'utilisation de cette application est la suivante :

  1. Vérifier que le scanner est enclenché, AVANT de démarrer l'application de numérisation. Si ce n'est pas le cas, attendre quelques secondes après enclenchement que le périphérique soit reconnu par Windows (signalé par un son)

  2. Placer le document sur la vitre du scanner et refermer le couvercle (ATTENTION à ne pas presser sur le couvercle, le couvercle et la vitre du scanner étant fragiles !)
    ou placer les documents dans le chargeur automatique (face à numériser vers le haut)

  3. Démarrer EPSON Scan (via le raccourci se trouvant sur le bureau) : une fenêtre EPSON Scan apparaît et éventuellement une fenêtre d'aperçu (si le précédent utilisateur l'a laissée ouverte)

  4. Dans la fenêtre EPSON Scan, sélectionner le mode Mode bureautique dans la liste déroulante 1.
    En choisissant le mode Professionnel, vous avez accès à plus d'options et de réglages (consulter l'Aide en ligne pour plus de détails).

  5. Lancer la prévisualisation de l'image en cliquant le bouton Aperçu (2); la fenêtre "Aperçu" apparaît.

  6. Dans la fenêtre d'aperçu, utiliser le cadrage automatique (bouton , ou à l'aide du curseur croix, tracer un cadre autour de la zone qui devra être définitivement scannée. Ce cadre apparaît en trait-tillé
    Le cas échéant, pour faire une nouvelle sélection, effacer la sélection courante avec le bouton gomme , puis tracer un nouveau cadre.

  7. Ensuite, préciser le type d'image (3): ATTENTION : la taille du document scanné sera directement influencée par ce choix (elle est proportionnelle au nombre de bits/pixel indiqué ci-dessus !)

  8. Définir la source du document (4):

  9. Définir la résolution finale de numérisation (5):
    Pour ce scanner, les valeurs personnalisables possibles vont de 50 à 1200 dpi.

    IMPORTANT : Choisissez judicieusement la résolution en fonction du but final (type d'imprimante...) et en suivant les conseils ci-dessus. N'optez pas pour une résolution trop élevée, il en découlerait un document très volumineux (la taille de celui-ci variant au carré de la résolution !). Une résolution de 150 à 300 dpi est généralement largement suffisante (pour des images couleurs destinées à des imprimantes couleurs classiques...). La taille de l'image, en fonction des paramètres ci-dessus, s'affiche au bas de la fenêtre Aperçu.

  10. Suivant la nature de votre document original, vous avez encore quelques options possibles (6) (mais vous pouvez aussi réaliser ces opérations après coup, avec votre logiciel de traitement d'image favori) :

  11. Avec le bouton [Numériser] (7), vous démarrez alors la numérisation définitive.

    Une fois celle-ci effectuée, la fenêtres Enregistrement des fichiers apparaît. Y sont définis les emplacement et format des images numérisées:

Pour plus de détails, voyez l'aide en ligne de EPSON Scan (bouton [Aide (H)] ).

Il est aussi possible d'utiliser le scanner et l'application EPSON Scan en mode TWAIN depuis PhotoFiltre avec :

  1. Fichier > Importation TWAIN > Selectionner la source : choisir "EPSON GT-20000 3.41", puis
  2. Fichier > Importation TWAIN > Numériser une image : ouvre une fenêtre EPSON Scan, puis :

6. Reconnaissance de texte (OCR) avec ABBYY Fine Reader

Si vous devez récupérer un texte imprimé pour l'introduire dans un document, plutôt que de le scanner et l'introduire sous forme d'image (donc texte non éditable) dans votre document, vous pouvez le convertir automatiquement en texte éditable avec le logiciel d'OCR (Optical Character Recognition) ABBYY FineReader 6.0 installé sur cette machine.

La démarche est la suivante :

  1. Démarrer l'application Démarrer > Programmes > ABBYY FineReader 6.0 Sprint > ABBYY FineReader 6.0 Sprint
  2. La première étape consiste à numériser le document dont on veut récupérer le texte. Deux possibilités:

  3. La seconde étape consiste à exécuter la reconnaissance du texte. Pour ceci, cliquer le bouton 2 Lire. Avant de lancer l'opération, vérifier que la langue de reconnaissance est appropriée (menu Langue. Le résultat de la reconnaissance apparaît dans la fenêtre Texte.

  4. La dernière étape est celle de la sauvegarde. Cliquer sur le bouton 3 Enregistrer. Les formats de stockage possibles sont .rtf (Rich Text Format), .PDF, .txt (Document texte, UTF-8 ou UTF-16) et .xls (Microsoft Excel).

Remarques:

Pour plus d'explications sur cette applications d'OCR, voyez le manuel sous Démarrer > Programmes > ABBYY FineReader 6.0 Sprint > Guide de l'utilisateur

7. Numérisation de diapos/négatifs (formats 35mm, 6x6, 6x7, 6x12, 6x17 ou 4x5")

Notre ancien scanner de dias Nikon LS-2000 n'étant plus compatible avec le matériel et le système actuels, et au vu de la demande quasi-inexistante, nous n'avons pas renouvelé ce matériel. Pour les rares cas où une numérisation de dias ou de films négatifs (35mm, 6x6, 6x7, 6x12, 6x17 ou 4x5") serait nécessaire, nous effectuons pour vous la numérisation au moyen d'un scanner à plat de type Epson V750 photo.

Pour ceci, veuillez vous adresser au service enac-it1.

8. Transfert de vos fichiers de ce poste vers votre machine

Depuis cette station de numérisation d'image, plusieurs possibilités de transfert de fichiers s'offrent à vous :

Via le réseau

Important: une fois le transfer terminé, n'oubliez pas de déconnecter le partage que vous avez ouvert (sans quoi, un utilisateur suivant pourrait en examiner le contenu!) ou de fermer la session de travail (ce qui ferme automatiquement les partages réseau ouverts).
Par support de stockage amovible