
| Conversion d'un document Word en PDF |
| ou comment rendre accessible à tous des documents avec un format propriétaire |
1.Avant-propos
1.1. Licence
1.2. Raisons qui ont poussé à écrire cette petite documentation
1.3. Le format PDF : quelques liens
1.4. Configuration utilisée
2.La procédure étape par étape
2.1. Installation d'une pseudo-imprimante dite "PostScript" AVEC le CDROM de Windows
2.2. Installation d'une pseudo-imprimante dite "PostScript" SANS le CDROM de Windows
2.3. Installation de Ghostscript version 8.14:
2.4. Installation de GhostView version 4.6:
2.5. Conversion du .doc en .pdf
3.Spécificités liées à Windows XP
4.Qualité "graphique" du fichier PDF créé
4.1. Correction des problèmes liés à l'utilisation de polices de caractères spécifiques
4.2. Amélioration au moment de la conversion PS-PDF dans GhostView
Bookmarks
Permission vous est donnée de copier, distribuer et/ou modifier ce document selon les termes de la licence GNU Free Documentation License. version 1.1 ou ultérieure publiée par la Free Software Foundation (traduction française disponible sur Idealx.org).
Les problèmes de format lors des échanges de fichiers est un problème réel pour toute personne ayant fait le choix de ne pas utiliser dans la mesure du possible d'outils "propriétaires" (en opposition aux logiciels libres en général basés sur des formats de fichiers dits "ouverts"). Aussi, il devenait trop fréquent de trouver sur Internet une multitude de documents de différentes natures (notices explicatives, documentations techniques, rapports de stage, ...) qui ne pouvaient pas être consultés correctement si on ne disposait pas des outils adéquats, ne fonctionnant qu'avec des licences d'utilisation honéreuse, sur des systèmes d'exploitation critiqués. S'il existe des outils dans le monde du libre qui offrent une certaine compatibilité avec ces formats propriétaires (je pense notamment à OpenOffice.org pour les documents issus de Microsoft Word), des pertes sensibles dans la mise en page se ressentent assez fréquemment, rendant le document consulté difficilement lisible voire inexploitable.
J'ai eu connaissance par Fabien S., un collègue du CRI74, d'une méthode permettant, sous Windows et sans aucun coût, de transformer un grand nombre de documents en PDF (Portable Document Format), un format de fichier qui, s'il est souvent lié à la société Adobe qui fournit notamment un lecteur PDF sur de nombreux environnements (le fameux "Acrobat Reader"), appartient au domaine public. Je me suis alors empressé de rédiger cette notice explicative à partir de ces informations en faisant en sorte de la rendre la plus simple possible à utiliser, sans qu'elle soit alourdie par de multiples captures d'écran.
Les multiples encouragements et remerciements que j'ai pus avoir en retour depuis témoignent que cette document avait un réel intérêt et que le principe de pouvoir communiquer avec le plus grand nombre était une volonté des internautes dans le monde entier (des "merci" ou des demandes de renseignements complémentaires sont déjà parvenues de la France évidemment, mais aussi : Burkina Faso, Nouvelle Calédonie, New Jersey (USA), Inde, Belgique, Texas (USA), Canada, Espagne, Australie, ...).
A chaque question pertinente, j'essaie de répercuter la réponse dans un chapitre de cette documentation. Si certains points ne vous semblent pas clairs ou si vous souhaitez participer à cette documentation par votre expérience personnelle avec des trucs et astuces que vous auriez découverts, n'hésitez pas à me contacter par mail.
Voici une liste non exhaustive de liens qui traitent du format de fichier PDF. Plutôt que de recopier leur contenu dans cette documentation dont ce n'est pas l'objet, je vous invite à consulter ces sites si vous voulez en savoir plus sur ce format de fichier :
Démonstration sous Windows 98 avec Word 2000 (on peut estimer que toutes les manipulations et termes employés sont très proches avec d'autres versions légèrement différentes du système d'exploitation ou du logiciel).
Néanmoins, concernant Windows XP, il existe tout de même des différences assez lourdes qui font l'objet d'un chapitre dédié.
Au cours de la manipulation, le CDROM d'installation de Windows sera très certainement demandé. Il faut donc en avoir un à disposition qui corresponde à la version installée sur la machine concernée. Si vous ne disposez pas de ce CDROM, une autre méthode peut être envisagée (voir chapitre sur installation d'une imprimante postscript)
La manipulation était intéressante pour la conversion d'un document MS Word en PDF. Elle peut normallement être appliquée pour transformer n'importe quel document imprimable en fichier PDF.
La manipulation inverse (PDF->DOC) n'est pas du tout abordée ici car :
- elle me paraît totallement inutile (même si la question m'a été posée de nombreuses fois...)
- on ne peut pas y répondre avec des outils gratuits (à ma connaissance, seule l'utilisation de bons logiciels d'O.C.R. comme ScanSoft Omnipage Pro sont capables de faire cela)
Pour convertir un fichier issu de MS Word (extension .doc) en un fichier PDF (extension .pdf; Portable Document Format), suivez les instructions ci-dessous :
Elle permettra la transformation du document Word en un format imprimable/exploitable.
- allez dans "Démarrer/Paramètres/Imprimantes"
- double-clic sur "Ajout d'imprimante"
- l'assistant se lance, cliquez sur "Suivant"
- sélectionner "Imprimante locale" et cliquez sur "Suivant"
- choisir le constructeur "Apple" et par exemple le modèle "Apple Color LaserWriter" (normallement, toutes les imprimantes Apple doivent fonctionner => si vous n'avez pas l'imprimante donnée ici à titre d'exemple, choisissez-en une autre dans la liste) et cliquez sur "Suivant" (à noter que si vous choisissez un modèle d'imprimante prévue pour le noir et blanc ("Apple LaserWriter" simple par exemple), vous ne pourrez produire que des PDF en noir et blanc...)
- dans les ports disponibles, choisir "FILE: Crée un fichier sur le disque" et cliquez sur "Suivant"
- pour le nom de l'imprimante, on peut mettre ce qu'on veut (ex: "Impression dans un fichier"), si vous avez une imprimante "réelle" que vous utilisez et que vous souhaitez la conserver comme prioritaire lorsque vous faites des impressions, répondre "Non" à la question concernant la mise de l'imprimante comme imprimante par défaut et cliquez sur "Suivant" (si vous n'avez pas d'autre imprimante installée, la question ne vous sera logiquement pas posée).
- il n'est a priori pas la peine d'imprimer une page de test, donc cochez "Non" à la question posée et cliquez sur "Terminer"
- l'assistant va alors demander le CDROM d'installation de Windows 98, insérez-le et suivez les inscructions
- une nouvelle icône particulière va alors apparaître dans la liste des imprimantes. Elle représente une imprimante accompagnée d'une disquette (=> impression dans un fichier).
- première phase terminée, vous pouvez fermer la fenêtre où sont listées l'ensemble des imprimantes installées sur la machine.
IMPORTANT : il est évident que cette étape n'est pas à suivre si vous avez pu installer l'imprimante PostScript avec le CDROM de Windows. Cette méthode qui nécessite le téléchargement de 2 fichiers supplémentaires n'est à réserver qu'aux personnes n'ayant pas le CDROM de leur Windows.
La société Adobe fournit un utilitaire pour installer une imprimante PostScript sous Windows à partir d'un fichier PPD (PostScript Printer Description).
Donc, pour installer une pseudo-imprimante PostScript, il suffit de :La nouvelle imprimante "virtuelle" apparaît alors dans les imprimantes installées sous Windows avec un petit symbôle représentant une disquette à côté d'une imprimante.
- télécharger les fichiers adobe-winstfre.exe (7,6 MO!) et LaserWriter-Color-12-600.ppd (quelques kO) présents sur ftp://ftp.pub.cri74.org/pub/pc/win9x/driver/printer/apple/Installateur-PostscriptDriver/
- lancer le fichier adobe-winstfre.exe qui correspond à l'installeur d'imprimante PostScript fourni par Adobe sur http://www.adobe.com/support/downloads/detail.jsp?ftpID=1503
- dans la procédure d'installation, il est demandé plusieurs choses :
- imprimante locale/réseau : choisissez "locale"
- port sur lequel l'imprimante est connectée : choisissez "FILE"
- type d'imprimante : L'assistant propose un type d'imprimante par défaut "Generic Postscript printer" et indique en dessous qu'il utilisera le fichier "DEFPRTR2.PPD". Cliquez sur "Parcourir" au niveau de ce nom de fichier et allez rechercher le fichier .PPD que vous avez téléchargé à l'adresse mentionnée ci-dessus (ftp.cur-archamps.fr.../LaserWriter-Color-12-600.ppd). Lorsque vous serez dans le répertoire où le fichier .ppd est placé, vous verrez apparaitre "Apple Color LaserWriter 12/600". Sélectionnez-la et cliquez sur "OK"; suivez la procédure d'installation.
- vous pouvez alors préciser le nom donné à cette imprimante (ex : "Impression dans un fichier"), si vous voulez en faire votre imprimante par défaut (si une autre imprimante est déjà installée) et si vous voulez imprimer une page de test (ce n'est pas nécessaire)
- pour finir, cliquez sur "Installer"
- l'assistant vous propose alors de configurer votre imprimante à ce moment là (paramètres par défaut pour toutes les impressions à venir). Vous pouvez le faire à cet instant ou plus tard (à travers "Démarrer/Paramètres/Imprimantes"...)
- il est proposé de lire un fichier d'explications (fichier LisezMoi). A vous de voir si ça vous intéresse...
- téléchargez le fichier d'installation de Ghostscript 8.14 (il fait 7 MO)
- lancez l'exécutable récupéré (double-clic à partir de l'Explorateur Windows sur le fichier récupéré)
- cliquez sur "Setup"
- renseignez le répertoire d'installation ("Install to directory") ou le laisser par défaut (c:\gs normallement), cocher "Install fonts" et cliquez sur "Install". Si vous avez un Windows NT/2000/XP, vous pouvez indiquer de créer un accès à GhostScript dans le menu Démarrer/Programmes pour tous les utilisateurs de la machine en cochant "all users", mais cela n'est pas nécessaire pour que la conversion fonctionne.
- l'installation va se faire sans rien demander d'autre. Une fenêtre avec 2 icônes apparaît. Vous pouvez la fermer.
- téléchargez le fichier d'installation de GhostView 4.6 (il fait 1,6 MO)
- lancez l'exécutable récupéré (double-clic à partir de l'Explorateur Windows sur le fichier récupéré)
- cliquez sur "Setup"
- choisir le langage (=> Français)
- cliquez sur "Suivant" (2 fois)
- GS view propose d'être associé à certains formats de fichiers. Cochez pour les fichiers PostScript, décochez pour les fichiers PDF (il vaut mieux utiliser Acrobat Reader pour cela pour se rapprocher de ce que les futurs lecteurs des documents ont comme logiciel), cliquez sur "Suivant".
- renseignez le répertoire d'installation ou le laisser par défaut (c:\program files\Ghostgum), cliquez sur "Suivant". Le répertoire n'existant certainement pas, le processus d'installation vous demande de confirmer sa création, cliquez sur suivant
- l'installation propose de créer un dossier qui apparaîtra sous "Démarrer/Programmes", ne rien changer (les 2 options doivent être cochées) et cliquez sur "Démarrer"
- l'installation va se faire sans rien demander d'autre. Une fenêtre avec 2 icônes apparaît. Vous pouvez la fermer. L'assistant d'installation dit normallement que l'installation a réussi. Cliquez sur "Fin".
A partir de là, tout ce qui était nécessaire est en place (les 3 points décrits ci-dessus ne seront pas à faire à chaque fois, bien entendu).
- Ouvrir le document .doc avec Word (je rappelle que ça fonctionne avec toutes les applications où on peut imprimer ce qu'on a à l'écran => quasiment toutes les applications...)
- lancer l'impression à travers le menu "Fichier/Impression" (ou en tapant le raccourci clavier "CTRL+P")
- sélectionnez dans la liste déroulante l'imprimante installée dans le 1/ et cliquez sur "OK" pour lancer l'impression "virtuelle"
- votre machine va alors vous demander quel fichier (extension .prn) vous voulez créer. Allez dans le répertoire de votre choix et nommez le fichier résultat comme vous souhaitez et cliquez sur "OK". Le fichier va être créé (s'il est gros, cela prendra quelques secondes; pendant ce temps, une icône représentant une imprimante doit apparaitre dans la barre des tâches de Windows). Vous pouvez alors quitter Word.
- lancez GhostView (menu "Démarrer/Programmes/Ghostgum/GS View 4.6") et cliquez sur OK dans la fenêtre "Registration"
- ouvrir le fichier .prn créé à partir de l'impression sous Word (menu "Fichier/Ouvrir")
- vous devez avoir un aperçu du document Word (idem à l'aperçu avant impression sous Word)
- allez dans "Fichier/Convert", sélectionnez le type "pdfwrite", choisissez n'importe quelle résolution proposée (72, 300, 600; ce paramètre n'a pas d'incidence. Pour améliorer le rendu, consultez le chapitre correspondant), vous pouvez aussi choisir de ne prendre que certaines pages du document et cliquez sur "OK" (par défaut, elles sont toutes sélectionnées)
- GS View vous demande le nom du fichier PDF destination et son emplacement, renseignez ces paramètres et cliquez sur "Enregistrer"
- un "sablier" en % apparaît dans la barre des tâches de Windows pour montrer la progression de la conversion jusqu'à 100% (ça peut aller très vite et ne pas apparaître si le document est très léger)
- vous pouvez fermer GS View, le document PDF est créé.
- vous pouvez vérifier le document ainsi créé en l'ouvrant avec Adobe Acrobat Reader (versions téléchargeables d'Adobe Acrobat Reader)
A la suite de plusieurs demandes concernant cet OS et son fonctionnement particulier, une mise à jour de cette documentation a semblé nécessaire afin que les utilisateurs ne se trouvent pas dépourvus devant ces singularités liées à cet OS relativement nouveau.
Sous Windows XP, lorsque vous lancez l'impression virtuelle ("Fichier/Imprimer/Impression dans un fichier"), vous spécifiez normallement simplement un "nom de fichier de sortie" => WinXP ne demande pas quel répertoire et l'extension du fichier n'est pas mise automatiquement => en fait, ça crée un fichier dans le répertoire "utilisateur" de Windows avec exactement le nom que vous avez entré, sans extension particulière.
Exemple: vous êtes loggué sur votre Windows avec l'identifiant "joel". Si votre Windows XP est installé "normallement", vous devriez trouver votre fichier de sortie dans "c:\documents and settings\joel\". Etant donné que l'extension n'est pas ajoutée automatiquement lors de l'impression, il est conseillé de choisir comme nom de fichier de sortie "nom_du_fichier.ps" (le .ps étant normallement associé avec GhostView, le fichier s'ouvrira directement avec l'application permettant de le transformer en PDF lors d'un double-clic dessus).
Si vous voulez pouvoir spécifier le répertoire destination lors d'une impression virtuelle, il faut cocher, au moment de l'impression sur l'imprimante virtuelle, la case "Imprimer dans un fichier". A ce moment-là, lorsque vous validerez l'impression, une fenêtre de dialogue s'ouvrira vous proposant de spécifier le répertoire destination, et le fichier se verra affecter l'extention ".prn" qui correspond au format d'impression sous Windows.
Etant donné qu'on ne fait ici qu'une impression PostScript, vous pouvez faire en sorte d'ouvrir tous les fichiers .prn avec l'application GhostView (par défaut, les .prn ne sont affectés à aucune application sous Windows). Pour cela, une fois l'impression virtuelle réalisée, allez dans l'explorateur Windows et faites un double-clic sur le fichier créé. Windows va normallement vous demandez ce que vous voulez utilisez pour ouvrir ce fichier. Choisissez "Sélectionner un programme dans la liste" et cliquez sur "OK". Choisissez dans la liste l'application "gsview32" (qui a une icone représentant une espèce de "fantôme binoclard"), laissez cocher l'option "Toujours utiliser ce programme..." et validez avec "OK". Le fichier va s'ouvrir avec GhostView et vous retombez dans le processus classique au niveau de l'ouverture de GhostView.
Merci à Pierre Conti pour cette contribution qui m'est parvenue par mail le 02/12/2003.
A priori, cette manipulation n'est possible que sous Windows 95/98 (Me ?). On ne retrouve pas ces options sous XP.
Voici ses indications suffisamment claires pour qu'elles soient retranscrites telles quelles :
"Je pense qu'il est utile d'apporter une information complémentaire concernant la qualité du fichier PDF obtenu.
En effet dans le cas où vous utilisez des polices (fontes) "true type" non standard (ex: toronto) dans votre document word, le rendu sera par défaut assez mauvais lors de la construction du fichier postscript par la pseudo-imprimante préconisée par Adobe (Apple Color LaserWriter 12/600).
Cela est dû au fait que par défaut la plupart des polices vont être traduites par le pilote de l'imprimante en format "bitmap", c'est-à-dire en points. Pour éviter les effets de "bavures" ou de "crénelages" qui apparaissent alors, il est possible de modifier les paramètres par défaut de cette pseudo-imprimante.
Pour cela il faut :
- aller dans "Démarrer/Paramètres/Imprimantes"
- sélectionner l'imprimante "Apple Color LaserWriter 12/600" (ou "Impression dans un fichier" si vous l'avez nommée comme cela lors de l'installation)
- cliquer avec le bouton droit de la souris et sélectionner "Propriétés"
- sélectionner dans le panneau de propriétés de l'imprimante l'onglet "Polices"
- cocher "Ne pas utiliser les polices d'imprimante"
- cliquer sur le bouton "Envoyer les polices en tant que..."
- vérifier que le champ "Envoyer les polices True Type en tant que:" est bien à "Contours" (liste déroulante)
- diminuer le seuil de basculement du téléchargement de police (ex : le mettre à 10)
- cliquer sur "Appliquer"
Ces opérations forceront le pilote de l'imprimante à inclure la définition des polices dans le fichier postscript généré lors de l'impression, et permettront donc à Ghostscript de convertir correctement les caractères du document Word."
Par défaut, si on ne change aucune option lors d'une conversion en PDF, la qualité du document PDF (les images notamment) est très moyenne.
Pour obtenir une qualité de conversion en PDF de bonne qualité (pour les images notamment), il semble obligatoire d'aller modifier certaines options au moment de la conversion PRN/PS->PDF. Par exemple, dans GhostView, quand on choisit "File/Convert", qu'on choisit "pdfwrite", peu importe la résolution choisie dans le cadre juste à droite, en allant dans "Properties" et en choisissant pour le critère "PDFSETTINGS" l'option "/printer" ou même "/prepress" on a une bonne qualité pour les images présentes dans le PDF créé par rapport à la même conversion sans spécifier cette valeur. Ca se sent d'ailleurs car le fichier créé est nettement plus gros (attention donc si le fichier est destiné à être téléchargé par des internautes n'ayant pas forcément de connexion à haut débit...). Voici un exemple concret (utilisation d'une double capture d'écran convertie avec plusieurs options différentes en PDF) :
Taille du fichier Spécificités fichier 8.0 MO fichier PostScript issu de l'impression virtuelle 340 kO PDF avec résolution "72" 340 kO PDF avec résolution "300" => idem 72 340 kO PDF avec résolution "600" => idem 72 : qualité image médiocre 360 kO PDF avec PDFSETTINGS=/screen) : qualité image médiocre 504 kO PDF avec PDFSETTINGS=/printer) : qualité image bonne 688 kO PDF avec PDFSETTINGS=/prepress) : qualité image très bonne
| GNU Free Documentation License | http://www.gnu.org/licenses/fdl.html |
| Présentation du format PDF par Adobe (en français) | http://www.adobe.fr/products/acrobat/adobepdf.html |
| explications issues d'un document de Jean-Pierre Depétris | http://jdepetris.free.fr/load/eao_folder/eao/eao2.html |
| The PDF Corner (anglais) | http://www.prepressure.com/pdf/overview.htm |
| The PDFZone (anglais) | http://www.pdfzone.com/ |
| Adobe | http://www.adobe.fr/ |
| fichier d'installation de Ghostscript 8.14 | ftp://ftp.pub.cri74.org/pub/pc/win9x/viewer/GhostScript/gs814w32.exe |
| fichier d'installation de GhostView 4.6 | ftp://ftp.pub.cri74.org/pub/pc/win9x/viewer/GhostScript/gsv46w32.exe |
| Adobe Acrobat Reader | ftp://ftp.pub.cri74.org/pub/pc/win9x/viewer/Acrobat-Reader/ |