Resumen de The Technological Developments of the Dutch Folktale Database (1994–2016)

Ayuda

Resumen de The Technological Developments of the Dutch Folktale Database (1994–2016)

Theo Meder

català
L’any 1994, la base de dades holandesa de contes populars va començar com una base de dades independent i es va posar en línia el 2004. Des de l’any 2016 i després de dos projectes importants, tots els tipus de metadades es poden afegir de manera automàtica i semisupervisada: idiomes, noms, paraules clau, resums, subgèneres, motius i tipus de contes. Amb aquesta finalitat, la base de dades va analitzar una nova plataforma anomenada Omeka que s’adapta a les necessitats de moltes bases de dades en les humanitats, i que pot gestionar tot tipus de connectors. S’han utilitzat les tècniques següents: n-grames, detecció del llenguatge, reconeixement d’entitats nombrades, extracció de paraules clau, resum, bossa de paraules, aprenentatge automàtic i processament de llenguatge natural. A més de MOMFER, també s’ha afegit un motor de cerca de motius. La interpretació de dades es facilita amb els nous mitjans de visualització: mapes geogràfics, línies de temps, una xarxa de contes similars i núvols de paraules. Com que la base de dades compleix els requisits de Dublin Core, es pot connectar a bases de dades similars o a un recol·lector de dades. Recentment, s’ha creat una aplicació de mineria de dades transatlàntica per construir un recol·lector anomenat ISEBEL: Intelligent Search Engine for Belief Legends (motor de cerca intel·ligent de llegendes de creences). El recol·lector ha de ser capaç de buscar en una base de dades holandesa, danesa i alemanya simultàniament. Més endavant s'hi poden afegir altres bases de dades.
English
In 1994 the Dutch Folktale Database started as a stand-alone database and went online in 2004. Since 2016, and after two major projects, all kinds of metadata can be added automatically and semi-supervised: languages, names, keywords, summaries, subgenres, motifs and tale types. To this end, the database went over to a new platform called Omeka that fits the needs of many databases in the humanities, and which can handle all kinds of plug-ins. The following techniques have been used: n-grams, language detection, named entity recognition, keyword extraction, summarization, bag of words, machine learning and natural language processing. Furthermore MOMFER, a search engine for motifs has also been added. The interpretation of data is facilitated by new means of visualisation: geographical maps, timelines, a network of similar tales, and word clouds. Since the database meets the requirements of Dublin Core, it can be connected to similar databases or a data harvester. Recently, a Trans-Atlantic Digging into Data application has been made to build a harvester called ISEBEL: Intelligent Search Engine for Belief Legends. The harvester should be able to search in a Dutch, Danish and German database simultaneously. Later, other databases can be added.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Coordinado por: