Relecture et mise en forme

Sommaire

Retour à « Passage des scans à l’OCR »

La réalisation d’un livre est un métier qui est plus difficile qu’on ne croit, tout aussi difficile que celui d’écrivain. Pour nos réalisations on aura besoin de maîtriser quelques arcanes du métier d’éditeur. Les règles de typographie, de la mise en forme et la correction d’erreur sont à respecter si l’on veut avoir un rendu confortable à lire.

1 – La typographie :

Faut-il mettre une espace avant ou après une virgule ? Comment effectuer la césure d’un mot en fin de ligne ? Faut-il mettre le point à l’intérieure de la parenthèse ou à l’extérieure ? etc… Si vous vous posez ce genre de question quand vous écrivez, les règles de typographies sont là pour vous aider. Pour une définition plus complète je vous renvoie à l’article de wikipedia « Typographie » .

La typographie, même si elle paraît un peu rigide par moment, permet de faciliter la lecture d’un texte grâce à des conventions connues intuitivement de tout bon lecteur. Ne pas l’utiliser dans ses textes peut provoquer un décrochage du lecteur. On peut considérer la typographie comme de l’huile qui lubrifie les rouages de la lecture.

Au lieu de vous faire un cours sur la typographie je vais vous donner des liens où vous pourrez puiser à loisir les réponses à vos questions (non je ne suis pas fainéant ^^) :

Voilà brièvement mes sources qui me guide dans les bonnes pratiques typographiques. J’en profite pour vous donner une astuce que je trouve très utile quand un point d’interrogation ou un point d’exclamation se retrouve orphelin à ligne. On utilise un espace insécable (sur windows la combinaison de touche est « ctrl + espace » et sur linux « ctrl + alt + espace ») pour que le dernier mot de la phrase tienne compagnie à la ligne au point d’exclamation ou au point d’interrogation. Théoriquement on devrait l’utiliser systématiquement pour cette ponctuation.

En typographie le mot « espace » est du genre féminin, ne soyez pas surpris, « une espace » c’est bien du français.

Il y a une autre chose importante au sujet de la typographie des livres de poches traduits de l’étranger, et notamment ceux traduits de l’américain. Il arrive que les traducteurs gardent dans la version française la typographie américaine, qui est sur certains points assez différente de celle française. Les dialogues dans la typographie française commencent par des tirets, alors que dans la version américaine ils sont mis entre parenthèses.

Je suis conscient que nous ne sommes que des amateurs c’est un fait. Mais, même si votre typographie n’est parfaite essayez au moins d’être homogène sur tout le texte car le lecteur aime bien avoir une structure sur laquelle se reposer.

2 – La mise en forme du texte :

Dans tous les livres numériques que j’ai pu rencontrer sur le net (même certains eBooks vendus dans le commerce), la partie de la mise en forme est toujours la plus bâclée. Il n’y rien de plus énervant que de lire un texte qui n’est pas « justifié » . Et je ne parle pas non plus des polices de caractère fantaisistes qui rendent quasi impossible la lecture rapide ou globale du texte.

Avant de partir tête baissée dans la mise en forme du document il est important d’établir une fiche contenant tous les paramètres de style à appliquer pour chaque type de texte. La mise en forme d’un livre de 500 pages peut s’étaler facilement sur 2 à 3 semaines, si on la combine à la correction des fautes d’orthographe et à la modification de la typographie. Il n’est pas sûr que vous vous souveniez de la taille de police de caractère de la première lettre d’un chapitre au bout d’une semaine.

Qui plus est, si vous vous attaquer à une collection de livre (ex: Romans d’Aghata Christie), vous serez content de retrouver votre fiche pour que votre collection aie une présentation homogène.

Les points essentiels à prendre en compte dans une mise forme sont :

    - La police de caractère identique dans tout le texte. Et de préférence une police simple et lisible (ex: Time New Roman pour une police avec serif et Verdana, ou Arial si vous voulez une police sans serif. MS comic est une police à éviter absolument, comme son nom l’indique c’est une écriture pour bande dessinée).
    - Dans les traitements de texte comme MS Word ou Open Writer, utilisez les styles paramétrables « corps de texte » « titre1″ « titre2″ etc… Paramétrez-les une bonne fois pour toute est appliquez les au textes.
    - Les interlignes doivent être à « 1″. C’est la valeur optimum pour une bonne lecture. L’interligne entre les paragraphes doit être aussi de « 1″.
    - Les paragraphes doivent tous commencer par un retrait positif. La plupart du temps ce retrait est de 0,5 cm. La ligne d’un dialogue se comporte comme un paragraphe.
    - Il se peut que dans certaines éditions la première lettre Majuscule d’un chapitre soit deux fois plus grande que le texte qui suis. Dans ce cas il n’y a pas de retrait positif au premier paragraphe.
    - La taille des caractères doit rester identique tout le long du corps de texte.
    - Pour les textes en prose il faut toujours justifier le texte. Si les espaces sont trop important, il faut recourir à une césure. (Une césure se fait toujours entre deux syllabes, avec un tiret simple correspondant à la touche « 6″ d’un clavier « azerty » français.)
    - Les tirets des dialogues sont des tirets longs, ils s’obtiennent sur MS Word ou Open Writer en faisant deux tirets simples puis une espace. Les mêmes tirets sont parfois utiliser pour marquer une digression à la manière de parenthèses. (remarque : c’est de la typographie mais ça mérite d’être précisé ici)
    - Les majuscules avec accent ne doivent pas être utilisées dans les textes littéraires.

Ceci n’est pas exhaustif, mais ce sont majoritairement les défauts que j’ai pu rencontrer régulièrement dans des eBooks et même dans certains livres papier. Si vous avez chez vous un vieux livre du genre Jules Vernes d’une édition Jean François Beauval, regardez et inspirez-vous de sa présentation et sa mise en forme particulièrement agréable à l’œil.

La mise en forme est un travail laborieux et rigoureux, mais je le trouve assez plaisant car lorsqu’on est lecteur, on a rarement l’occasion de s’y attarder. Pourtant c’est en travaillant la forme du texte qu’on réussira à mettre en valeur le fond.

3 – Correction des erreurs d’OCR et des erreurs de frappes originales :

Les erreurs de reconnaissances de caractères sont quasiment toujours les mêmes :

    - La confusion entre « Il » et « II », les « i » majuscule sont souvent confondu avec des « l » minuscule.
    - La confusion entre un « c » et un « e ». Ainsi en combinant la confusion précédente « i » et « e » on peut obtenir par exemple le mot « clic » en lieu et place du mot « elle ».
    - Des taches d’encres peuvent induire en erreur l’OCR, il est donc indispensable de suivre la lecture du texte avec les pages originales en parallèle. Si vous voyez une tache sur la page, vérifiez si l’OCR ne s’est pas trompé.
    - Il arrive aussi que les livres recèlent quelques coquilles que les correcteurs ont laissées passer. (ne riez pas, vous en ferez certainement aussi) C’est l’occasion de les corriger si vous les repérer.
    - Ne faites pas une confiance aveugle aux correcteurs orthographiques, si vous avez un doute, vérifiez dans un dictionnaire ou dans un Bescherelle.
    - Il peut y avoir parfois des erreurs de traduction qui rend une phrase totalement incohérente, si vous avez la version originale, jetez y un coup d’œil on ne sait jamais. Ces erreurs sont toutefois très difficiles à repérer et à réparer.

Il faut faire attention aussi entre ce que l’œil voit et ce que le cerveau interprète. Pour le cerveau dans une phrase où « clic » est écrit, il l’interprétera comme « elle » parce que le sens de la phrase est évident. Résultat, l’erreur ne sera pas corrigée. Je conseil d’écrire sur la fiche de mise en forme les erreurs d’OCR couramment rencontrer. A la fin de la relecture il suffira de faire une recherche (ctrl+F) sur les formes relever. Si « clic » est trouvé et que le contexte ne colle pas il suffira de le remplacer par « elle ».

L’erreur est humaine, c’est un fait, donc ne vous attendez pas à avoir un résultat parfait. Si vous avez une erreur non corrigée tous les 20 pages c’est déjà un bon résultat.

4 – Relecture entière du texte :

La relecture est soumise à la loi statistique de Pareto du 80%-20%. Ce qui signifie qu’à la première relecture 80% des erreurs seront corrigées. Il restera alors 20% d’erreur. La seconde relecture éliminera 80% des 20% restant. Le texte comportera encore 4% des erreurs initiales. La troisième relecture abaissera ce taux d’erreur à 0,8% des erreurs initiales (ce qui est tout à fait acceptable si le nombre d’erreur initiale est faible, on voit ici l’importance d’avoir un OCR fiable ^^).

Cette petite explication prouve que la relecture a une importance majeure dans la réduction des erreurs. Il faut donc 3 relectures sérieuses (par 3 lecteurs différents de préférence) pour obtenir un texte corrigé. 2 relectures laisseraient trop d’erreurs et 4 ce serait du temps perdu.

5 – Exemple de fiche de mise en forme :

Tout d’abord ma technique consiste à prendre un document .doc ou .odt vierge comme document de départ. Ensuite je commence à réaliser la mise en page des première et quatrième de couverture. Je définie les marges de la page.

Je copie le texte brut du premier chapitre dans le nouveau document. Je fais la mise en forme de tout le chapitre. Et je fige les paramètres dans la fiche de mise en forme.

Ci-dessous voici un exemple de fiche de mise en forme une fois les relectures terminées :

    ##Fiche de mise en forme "Messie de Dune"

    #Paramétre page par défaut

    Format de la feuille= A4 portrait
    Marge gauche = 2 cm
    Marge droite = 2 cm
    Marge du haut = 2 cm
    Marge du bas = 2 cm

    #Paramètre Paragraphe citation avant chapitre

    Police = Time New Roman 12 justifié
    Paragraphe "Avant le texte"= 9,00 cm
    Paragraphe "Première ligne"= 0,5 cm
    Paragraphe "Interligne" = Simple

    #Paramètre signature citation avant chapitre

    Police = Time New Roman 12 alignement droite (source du texte en italique)
    Paragraphe "Au dessus du paragraphe"= 0,13 cm
    Paragraphe "Interligne" = Simple

    #Paramètre premier paragraphe du corps de texte

    Premier mot entièrement en Majuscule
    28 de taille de police pour la première lettre
    14 de taille de police pour le reste des lettres
    Police = Time New Roman 14 justifié
    Paragraphe "Première ligne"= 0,0 cm
    Paragraphe "Interligne" = Simple

    #Paramètre reste du corps de texte

    Police = Time New Roman 14 justifié
    Paragraphe "Première ligne"= 0,5 cm
    Paragraphe "Interligne" = Simple

    #Paramètre chanson en vers dans corps de texte

    Retour à la ligne avant et après la chanson
    Guillemet au premier vers et au dernier vers
    Police = Time New Roman 14 alignement gauche
    Paragraphe "Avant le texte" = 2,0 cm
    Paragraphe "Première ligne" = 0,0 cm
    Paragraphe "Interligne"= Simple

    #Paramètre chapitre
    10 retours à la ligne avant début du chapitre
    Saut de page entre chaque chapitre

    #Remarque sur la relecture
    erreur OCR:
    clic-->elle
    II-->Il
    omis-->ornis
    bcnc gcsscrit-->bene gesserit

    Page à rescanner: 17, 96, 175, 347

L’autre avantage de cette fiche est de transmettre les paramètres de mise en forme aux 2 autres relecteurs qui pourront rectifier vos erreurs de mise en page plus facilement.

Maintenant, il ne vous reste plus qu’à continuer dans les autres chapitres, en ne dérogeant pas à votre fiche, tout en faisant attention à la typographie et au erreurs de frappes de l’OCR. Il se peut qu’en chemin vous rencontriez un style de paragraphe particulier comme ceux d’un poème ou d’une chanson. Ajouter les nouveaux paramètres définies dans la fiche.

De toutes les étapes celle-ci est de loin la plus longue, il faut compter entre 2 à 3 semaines pour un livre de 500 pages à raison de 2 à 3 heures par jours pour la première relecture. Ensuite il faut compter entre 3 et 5 jours pour chaque relecture suivant la cadence du lecteur.

Mais personnellement c’est l’étape que je préfère. J’ai d’ordinaire une cadence de lecture assez rapide donc je m’attarde rarement sur la finesse et la structure d’un texte. La relecture permet de prendre son temps et parfois de redécouvrir un texte qu’on a déjà lu plusieurs fois.

Un dernier petit conseil, dans le cas d’une œuvre libre de droit que vous diffusez sur le net, pensez à laisser votre adresse mail dans le document (créez en une spécifique avec Gmail par exemple) pour que les éventuelles erreurs vous soient remontées par vos lecteurs. Et pensez aussi à leur renvoyez le document corrigé pour les remercier.

Une fois le document relu et corrigé il faut le convertir au moins en .pdf pour que sa mise en forme ne plus altérer.

N.B.: Certains professionnels de l’édition préfèrent éviter l’utilisation de MS Word ou Open Office. Le type de logiciel, qu’ils utilisent, s’apparente plutôt à Tex dont le représentant le plus connu s’appelle LaTex. Il s’agit de mettre en forme un texte à partir de balise (un peu comme le xhtml). La représentation se fait dans la tête de l’utilisateur. Il faut un certain temps pour en saisir le fonctionnement, mais il a l’avantage d’être extrêmement puissant comparé à un éditeur de texte WYSIWYG tel que MS Word ou Open Writer. (un jours il va falloir que je me mette sérieusement à LaTex ^^)

Suivant – « Convertir le document en PDF »

Mithrandir79

2 commentaires

2 comments

  1. Warniiiz 17 mai, 2010, à 14 h 26 min

    L’article est intéressant et aborde de nombreuses facettes de la relecture.

    Toutefois, il est farfelu qu’il contienne autant de fautes. Soit la méthode exposée n’est pas efficace, soit la relecture n’a pas été réalisée.

  2. mithrandir79 17 mai, 2010, à 16 h 50 min

    Bonjour désolé pour les fautes d’orthographe et de grammaire, j’avoue ne pas être un exemple dans ce domaine. Mais je me soigne. D’ailleurs cette article est plus une méthode personnelle qui me sert à palier mes errances orthographiques et grammaticales.

    Effectivement je n’ai pas fait de relectures sérieuses de ce texte pour l’instant, il me reste encore un ou deux articles à écrire dans ce dossier avant qu’il ne soit achevé et annoncé dans mon blog. Cependant je vous remercie d’abord pour l’intérêt que vous portez à mon article, ensuite pour les remarques constructives qui me poussent à être plus vigilant.

    NB: J’ai corrigé quelques fautes mais il y en a sûrement encore. N’hésitez pas à me les faire remonter.