07. Little Book in C Major
H.L. MenckenIk verzamel elektronische boeken sinds 1992 of ’93. En de voornaamste bron van digitale teksten toen, Project Gutenberg, bestaat al sinds 1971. Vandaar dat ik het wat onzinnig vind om me bij het onderwerp e-boeken te focussen op de waan van de dag, zoals een nieuw gadget dat toevallig overdreven veel pers krijgt.

Er zijn twee belangrijke verschuivingen in het maken van elektronische boeken sinds 1971.

De eerste is de manier waarop bestaande teksten worden gedigitaliseerd. Het zou me niet verbazen als de eerste e-boeken gewoon nog door vrijwilligers zijn overgetypt uit de papieren uitgaven. Tegenwoordig zijn er machines te koop die een boek volautomatisch scannen, zo’n afbeelding dan lezen met optische karakterherkenning (OCR), en omzetten naar een tekstdocument.

En toch is daarna altijd nog een proeflezer nodig om zo’n gedigitaliseerde tekst te corrigeren.

Hoe schoon de teksten zijn die Project Gutenberg oplevert, blijkt eigenlijk pas bij het bekijken van e-boeken die wel zijn ingescand, maar niet nog eens door een menselijk oog bekeken. Zonder kan eigenlijk niet.

De tweede belangrijke verschuiving is dat digitaliseren ineens niet alleen het werk meer is van vrijwilligers, of zonderlingen. Hele bedrijven zijn er brood in gaan zien; nog afgezien van alle overheden die hun erfgoed gingen veiligstellen. Maar, hoe ambitieus de projecten van Google en Microsoft ook zijn, of waren — zij wilden alle menselijke kennis uit boeken digitaal ontsluiten — het blijft nog steeds een crime om een elektronisch boek te lezen dat slechts door een machine is aangevat.

Wat de grootschalige scanprogramma’s, zoals Google Books, en Microsoft Live Search Books, wel al hebben opgeleverd, is dat er steeds meer facsimile’s online zijn komen staan van papieren boeken. Dus is zelfs een ongecorrigeerd boek dan nog altijd goed leesbaar. Het menselijke oog heeft nog altijd veel minder moeite om de juiste letters en worden op een afbeelding te zien dan elektronische tekstherkenning. [De Digitale Bibliotheek voor de Nederlandse letteren laat de oude boeken dan ook overtypen, in een lagelonenland; waar geen van de typisten of typistes de taal kent].

Vind ik PDF in de praktijk wel een rampzalig onhandig formaat voor facsimilé’s. Zijn me gewone plaatjes, of Djvu-toepassingen liever.

En in de browser, middels de plaatjes van Djvu, las ik Mencken’s Little Book in C Major.

boeklog 7 ii 2010

[lees de hele serie over e-boeken in de praktijk]


[x]#7178 fan zondag 7 februari 2010 @ 00:59:00