Ewoud Sanders: maak je eigen digitale bibliotheek

[Bijgewerkt 26-09-2017]. Dinsdag 1 september.  – Vandaag ben ik aanwezig bij de 18e Bert van Selm-lezing, locatie: Lipsiusgebouw, Leiden. Het is een jaarlijks terugkerende lezing ter nagedachtenis van Bert van Selm (1945-1991), een Nederlandse neerlandicus, boekhistoricus en bibliograaf. Hij was o.a. een specialist op het gebied van de boekwetenschap. In 1989 werd hij bijzonder hoogleraar in de geschiedenis van de boekhandel en uitgeverij vanwege de Dr. P.A. Tiele Stichting.
Dit keer wordt de lezing verzorgd door Ewoud Sanders (link1, link2), taalhistoricus en journalist bij NRC Handelsblad. Hij schrijft vooral over de geschiedenis van bepaalde woorden uitdrukkingen. De titel van zijn voordracht luidt: De reïncarnatie van het boek: in zeven stappen een eigen digitale bibliotheek.

sanders boekenkastVoor zijn werk heeft Sanders in de loop der jaren een enorme boekencollectie over de Nederlandse taal verzameld.  Zijn bibliotheek omvatte wel dertig boekenkasten. Maar die veelheid ging vaak ten koste van het overzicht. Sommige boeken waren bovendien moeilijk toegankelijk, door het ontbreken van registers. Hij had bijvoorbeeld zo’n 200 spreekwoordenboeken. Maar hij gebruikt er meestal maar vier van, waar hij de beste informatie in vond. Hoe kon hij àl zijn boeken goed toegankelijk maken en meer rendement uit zijn bibliotheek halen?

De methode waar Sanders op uit kwam is eigenlijk al bekend sinds nov. 2007, toen de Koninklijke Bibliotheek ermee in het nieuws kwam. Hans Jansen, Directeur Research & Development, wilde vaart brengen in het digitaliseren van alle titels die in Nederland tussen 1800 en 1950 verschenen. Hij bedacht het plan om van elke titel één exemplaar uit de band te halen en de rugzijde ervan af te snijden. Daarna kon dat boek als een stapeltje losse vellen aan de scanner worden gevoerd.

sanders digitale bibliotheekSanders heeft deze methode op zijn eigen bibliotheek toegepast en verfijnd. Het resultaat is indrukwekkend. In plaats van die dertig boekenkasten heeft hij nu een draagbare harde schijf met 444 gigabyte aan gedigitaliseerde boeken. Alles in OCR gescand PDF formaat en geïndexeerd. De PDF’s zijn voorzien van handige titels (jaartal voorop) en opgeborgen in thematische mappen. Het zoeken naar bepaalde thema’s of sleutelwoorden is nu een kwestie van seconden. Het indexeringsprogramma waar Sanders voor koos, Isys Personal Edition, laat geavanceerde zoekacties toe, met truncaties, wildcards, Booleaanse operatoren etc. Ik ken het pakket niet, maar het lijkt mij voor dit doel zeker interessant. Zelf zou ik zelf geneigd zijn om in een vergelijkbare situatie (ook) AskSam, nu versie 7, in de strijd te gooien.

Voor een digitale bibliotheek moet je niet alleen, en zeker niet in de eerste plaats, denken aan het kapotsnijden van papieren boeken.
Sanders wijst er terecht op dat er al een wereld aan digitaal materiaal vrij beschikbaar is. Gratis te downloaden van het internet of over te nemen uit andere bronnen. Zijn devies: ga oogsten!

Meer

  • Website Bert van Selmlezing.
  • Het boekje met Sanders’ lezing De reïncarnatie van het boek is helaas uitverkocht (webpagina met eerdere uitgaven van de Bert van Selm lezing op de site van Universteit van Leiden)
  • Ewoud Sanders: Maak je eigen zoekmachine. (Artikel n.a.v. de Van Selmlezing, Informatie professional, 2009, 10, 22-25)

[Toevoeging 05-09-2010, aangepast 30-09-2017]  In 2010 leek het erop dat Isys Personal Edition na versie 9.7 uit dat jaar niet meer zou worden gecontinueerd. Isys werd in 2012 overgenomen door Lexmark. En sinds voorjaar 2017 is Lexmark  overgenomen door Hyland, een softwarebedrijf van de Thoma Bravo groep. Op de voormalige Lexmark site werd het voor mij onbekende Enterprise Search genoemd, dat verwant zou zijn met het vroegere Isys Personal Edition. Ook op de Hyland site wordt Enterprise Search nog genoemd (Perceptive Enterprise Search). Het lijkt erop dat Hyland’s OnBase Enterprise Search de voortzetting is.

Er zijn nog websites die verwijzen naar Isys Personal Edition, bv. deze, met een download link naar de laatste versie 9.7. Maar doorklikken brengt je uiteindelijk bij de website van Hyland.

Hier laat ik het verder maar bij. Ik zal voorlopig geen verdere zoektocht ondernemen naar andere, alternatieve indexeringssystemen of content management software. Zie echter onderstaande voetnoot.

[30-09-2017] De website Outliner Software is gewijd aan notitieprogramma’s (outlining software), software voor persoonlijk informatiebeheer (personal information managers) of kennismanagement. Op het OS forum wordt o.a. gespeculeerd over de stille dood van AskSam, laatste bericht 2015. Daarbij worden ook een aantal andere programma’s genoemd, o.a. InfoSelect, MyInfo en Ultra Recall. Over zulke alternatieven is op de OS site en elders op het web wel meer informatie (en discussie) te vinden.
[02-04-2018] Bij toeval ontdekt: Onbase Enterprise Search van Hyland. Waarschijnlijk bedrijfsmatige software, niet voor particulier gebruik?

4 thoughts on “Ewoud Sanders: maak je eigen digitale bibliotheek

  • Avatar
    20/06/2016 at 14:18
    Permalink

    @Johan, ik had kunnen weten dat jij als AskSam kenner hier nog eens langs zou komen. Nog even gekeken bij web.archive.org: vanaf zomer 2013 werd op de AskSam website melding gemaakt van onderhoudsproblemen. Vanaf nov 2014 was de site niet meer bereikbaar. Maar er bestaat nog steeds een bedrijf Seaside Software Solutions. Niet helemaal duidelijk of dit de oude producent van AskSam is, in een nieuwe jas? Wel dat AskSam nu toch wel ter ziele is.
    Helaas…

    Reply
  • Avatar
    20/06/2016 at 13:13
    Permalink

    Nog eens op Internet zoekend naar AskSam, mijn Zwitserse zakmes (NVB Online Conf. R’dam) voor informatiebeheer, trof ik deze mooie nabeschouwing. Isys tekst indexeer programma (proefversie) heb ik begin jaren jaren negentig wel eens losgelaten op honderden tekstbestanden. Dat werkte verbluffend maar vergde wel het accepteren van een stroeve interface. AskSam importeerde schichtig Asci bestanden maar WP etc. kwam later pas. Qua snelheid en handigheid blies het bijv. dBase en een speciaal postregistratie programma van het scherm. Ook de Windows versie was imponerend maar de vrijheid van inrichting van databases strookte absoluut niet met de benadering van IT-ers. Daar was voordefiniering van velden uitgangspunt.
    AskSam heeft het zakelijk vast verloren door acceptatiegebrek.

    Reply
  • Avatar
    02/09/2009 at 14:57
    Permalink

    Ik was er gister ook bij aanwezig. Ik moet zeggen dat ik niet echt heel erg onder de indruk was. In deze tijd van web 2.0 en bijna 3.0 was dit wel een heel erg 0.1 verhaal. Ieder zijn eigen digitale bibliotheekje en daar blijft iedereen verder van af… Ik snap de voordelen ervan, maar ik heb niet zo’n zin om 10.000en documenten te hernoemen en in mapjes met gestructureerde namen te stoppen. Denk aan iTunes en allerlei programma’s om muziek te taggen. Laten we boeken toch gewoon online taggen…?
    Misschien zijn er in de wetenschap teveel specialistische eilandjes waardoor kennisdelen niet nodig is. In mijn vakgebied is er een veel grotere groep mensen met vergelijkbare dingen bezig…

    Reply
    • Avatar
      05/09/2009 at 23:43
      Permalink

      Ud0,
      blijkbaar heb je dan een punt gemist. Sanders gaf duidelijk aan wat het belang is van een goed ontsloten maar ook duidelijk begrensde verzameling teksten (corpus). Dat lijkt mij toch wat anders dan het taggen van boektitels op het web. Zijn lezing vond ik een prima voorbeeld van kennisdeling.

      Reply

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.