Ayuda
Ir al contenido

Dialnet


Resumen de The Technological Developments of the Dutch Folktale Database (1994–2016)

Theo Meder

  • català

    L’any 1994, la base de dades holandesa de contes populars va començar com una base de dades independent i es va posar en línia el 2004. Des de l’any 2016 i després de dos projectes importants, tots els tipus de metadades es poden afegir de manera automàtica i semisupervisada: idiomes, noms, paraules clau, resums, subgèneres, motius i tipus de contes. Amb aquesta finalitat, la base de dades va analitzar una nova plataforma anomenada Omeka que s’adapta a les necessitats de moltes bases de dades en les humanitats, i que pot gestionar tot tipus de connectors. S’han utilitzat les tècniques següents: n-grames, detecció del llenguatge, reconeixement d’entitats nombrades, extracció de paraules clau, resum, bossa de paraules, aprenentatge automàtic i processament de llenguatge natural. A més de MOMFER, també s’ha afegit un motor de cerca de motius. La interpretació de dades es facilita amb els nous mitjans de visualització: mapes geogràfics, línies de temps, una xarxa de contes similars i núvols de paraules. Com que la base de dades compleix els requisits de Dublin Core, es pot connectar a bases de dades similars o a un recol·lector de dades. Recentment, s’ha creat una aplicació de mineria de dades transatlàntica per construir un recol·lector anomenat ISEBEL: Intelligent Search Engine for Belief Legends (motor de cerca intel·ligent de llegendes de creences). El recol·lector ha de ser capaç de buscar en una  base de dades holandesa, danesa i alemanya simultàniament. Més endavant s'hi poden afegir altres bases de dades.

  • English

    In 1994 the Dutch Folktale Database started as a stand-alone database and went online in 2004. Since 2016, and after two major projects, all kinds of metadata can be added automatically and semi-supervised: languages, names, keywords, summaries, subgenres, motifs and tale types. To this end, the database went over to a new platform called Omeka that fits the needs of many databases in the humanities, and which can handle all kinds of plug-ins. The following techniques have been used: n-grams, language detection, named entity recognition, keyword extraction, summarization, bag of words, machine learning and natural language processing. Furthermore MOMFER, a search engine for motifs has also been added. The interpretation of data is facilitated by new means of visualisation: geographical maps, timelines, a network of similar tales, and word clouds. Since the database meets the requirements of Dublin Core, it can be connected to similar databases or a data harvester. Recently, a Trans-Atlantic Digging into Data application has been made to build a harvester called ISEBEL: Intelligent Search Engine for Belief Legends. The harvester should be able to search in a Dutch, Danish and German database simultaneously. Later, other databases can be added.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus