Fernando Pech May, Alicia Martínez Rebollar, Hugo Estrada Esquivel, Eduardo Pedroza Landa
La web es la fuente de información de mayor uso en el ámbito académico, científico e industrial. Su crecimiento explosivo ha generado billones de páginas con información de los cuales se categorizan como web superficial, integrado por páginas estáticas que pueden ser indexados; y web oculta, accesibles a través de formularios de búsqueda. En este artículo se presenta el desarrollo de un crawler que permite realizar búsquedas, consultas y análisis de información en la web superficial y oculta en dominios específicos de la web.
The web is the most used information source in both academic, scientific and industry forums. Its explosive growth has generated billions of pages with information which may be categorized as surface web, composed of static pages that are indexed into a hidden web, accessible through search templates. This paper presents the development of a crawler that allows searching, queries, and analysis of information in the surface web and hidden in specific domains of the web.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados