Resumen de CrawNet: Crawler de Recursos Multimedia para la Web Superficial y Oculta

español
La web es la fuente de información de mayor uso en el ámbito académico, científico e industrial. Su crecimiento explosivo ha generado billones de páginas con información de los cuales se categorizan como web superficial, integrado por páginas estáticas que pueden ser indexados; y web oculta, accesibles a través de formularios de búsqueda. En este artículo se presenta el desarrollo de un crawler que permite realizar búsquedas, consultas y análisis de información en la web superficial y oculta en dominios específicos de la web.
English
The web is the most used information source in both academic, scientific and industry forums. Its explosive growth has generated billions of pages with information which may be categorized as surface web, composed of static pages that are indexed into a hidden web, accessible through search templates. This paper presents the development of a crawler that allows searching, queries, and analysis of information in the surface web and hidden in specific domains of the web.

Acceso de usuarios registrados

¿Es nuevo? Regístrese

Coordinado por: