Ewoud Sanders: maak je eigen digitale bibliotheek

[Bijgewerkt 26-09-2017]. Dinsdag 1 september.  – Vandaag ben ik aanwezig bij de 18e Bert van Selm-lezing, locatie: Lipsiusgebouw, Leiden. Het is een jaarlijks terugkerende lezing ter nagedachtenis van Bert van Selm (1945-1991), een Nederlandse neerlandicus, boekhistoricus en bibliograaf. Hij was o.a. een specialist op het gebied van de boekwetenschap. In 1989 werd hij bijzonder hoogleraar in de geschiedenis van de boekhandel en uitgeverij vanwege de Dr. P.A. Tiele Stichting.
Dit keer wordt de lezing verzorgd door Ewoud Sanders (link), taalhistoricus en journalist bij NRC Handelsblad. Hij schrijft vooral over de geschiedenis van bepaalde woorden uitdrukkingen. De titel van zijn voordracht luidt: De reïncarnatie van het boek: in zeven stappen een eigen digitale bibliotheek.

sanders boekenkastVoor zijn werk heeft Sanders in de loop der jaren een enorme boekencollectie over de Nederlandse taal verzameld.  Zijn bibliotheek omvatte wel dertig boekenkasten. Maar die veelheid ging vaak ten koste van het overzicht. Sommige boeken waren bovendien moeilijk toegankelijk, door het ontbreken van registers. Hij had bijvoorbeeld zo’n 200 spreekwoordenboeken. Maar hij gebruikt er meestal maar vier van, waar hij de beste informatie in vond. Hoe kon hij àl zijn boeken goed toegankelijk maken en meer rendement uit zijn bibliotheek halen?

De methode waar Sanders op uit kwam is eigenlijk al bekend sinds nov. 2007, toen de Koninklijke Bibliotheek ermee in het nieuws kwam. Hans Jansen, Directeur Research & Development, wilde vaart brengen in het digitaliseren van alle titels die in Nederland tussen 1800 en 1950 verschenen. Hij bedacht het plan om van elke titel één exemplaar uit de band te halen en de rugzijde ervan af te snijden. Daarna kon dat boek als een stapeltje losse vellen aan de scanner worden gevoerd.

sanders digitale bibliotheekSanders heeft deze methode op zijn eigen bibliotheek toegepast en verfijnd. Het resultaat is indrukwekkend. In plaats van die dertig boekenkasten heeft hij nu een draagbare harde schijf met 444 gigabyte aan gedigitaliseerde boeken. Alles in OCR gescand PDF formaat en geïndexeerd. De PDF’s zijn voorzien van handige titels (jaartal voorop) en opgeborgen in thematische mappen. Het zoeken naar bepaalde thema’s of sleutelwoorden is nu een kwestie van seconden. Het indexeringsprogramma waar Sanders voor koos, Isys Personal Edition, laat geavanceerde zoekacties toe, met truncaties, wildcards, Booleaanse operatoren etc. Ik ken het pakket niet, maar het lijkt mij voor dit doel zeker interessant. Zelf zou ik zelf geneigd zijn om in een vergelijkbare situatie (ook) AskSam, nu versie 7, in de strijd te gooien.

Voor een digitale bibliotheek moet je niet alleen, en zeker niet in de eerste plaats, denken aan het kapotsnijden van papieren boeken.
Sanders wijst er terecht op dat er al een wereld aan digitaal materiaal vrij beschikbaar is. Gratis te downloaden van het internet of over te nemen uit andere bronnen. Zijn devies: ga oogsten!

Meer

  • Website Bert van Selmlezing.
  • Het boekje met Sanders’ lezing De reïncarnatie van het boek is helaas uitverkocht (webpagina met eerdere uitgaven van de Bert van Selm lezing op de site van Universteit van Leiden)
  • Ewoud Sanders: Maak je eigen zoekmachine. (Artikel n.a.v. de Van Selmlezing, Informatie professional, 2009, 10, 22-25)

[Toevoeging 05-09-2010, aangepast 30-09-2017]  In 2010 leek het erop dat Isys Personal Edition na versie 9.7 uit dat jaar niet meer zou worden gecontinueerd. Isys werd in 2012 overgenomen door Lexmark. En sinds voorjaar 2017 is Lexmark  overgenomen door Hyland, een softwarebedrijf van de Thoma Bravo groep. Op de voormalige Lexmark site werd het voor mij onbekende Enterprise Search genoemd, dat verwant zou zijn met het vroegere Isys Personal Edition. Ook op de Hyland site wordt Enterprise Search nog genoemd (Perceptive Enterprise Search). Het lijkt erop dat Hyland’s OnBase Enterprise Search de voortzetting is.

Er zijn nog websites die verwijzen naar Isys Personal Edition, bv. deze, met een download link naar de laatste versie 9.7. Maar doorklikken brengt je uiteindelijk bij de website van Hyland.

Hier laat ik het verder maar bij. Ik zal voorlopig geen verdere zoektocht ondernemen naar andere, alternatieve indexeringssystemen of content management software. Zie echter onderstaande voetnoten.

[30-09-2017] De website Outliner Software is gewijd aan notitieprogramma’s (outlining software), software voor persoonlijk informatiebeheer (personal information managers) of kennismanagement. Op het OS forum wordt o.a. gespeculeerd over de stille dood van AskSam, laatste bericht 2015. Daarbij worden ook een aantal andere programma’s genoemd, o.a. InfoSelect, MyInfo en Ultra Recall. Over zulke alternatieven is op de OS site en elders op het web wel meer informatie (en discussie) te vinden.
[02-04-2018] Bij toeval ontdekt: Onbase Enterprise Search van Hyland. Waarschijnlijk bedrijfsmatige software, niet voor particulier gebruik?