|
SABER UCV >
2) Tesis >
Pregrado >
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10872/13696
|
Título : | Desarrollo de una solución de inteligencia de negocio para la obtención de indicadores para apoyar la preservación web |
Autor : | López, Adriana Sarno, Rosangela |
Palabras clave : | Archivo Web Formato WARC Datos Estadísticos |
Fecha de publicación : | 16-Mar-2016 |
Citación : | Biblioteca Alonso Gamero Facultad de Ciencias;TG-20325 |
Resumen : | Los Archivos Web son sistemas de información que surgen para archivar, de manera histórica, documentos que están publicados en la Web, considerados parte del patrimonio digital de las naciones, y tienen como objetivo preservar conjuntos seleccionados de páginas, o sitios web, y sus documentos mediante su replicación y/o migración de su formato original a otra representación. El formato de archivo utilizado para esta tarea es el formato WARC, el cual es un contenedor de documentos Web estandarizado y desarrollado con la finalidad de soportar la preservación. Actualmente, se está desarrollando un prototipo de Archivo Web en Venezuela, en la Facultad de Ciencias de la Universidad Central de Venezuela, como una iniciativa de Preservación Web para sitios web en Venezuela. En esta iniciativa de preservación web, se generan constantemente una gran cantidad de metadatos a partir de los rastreos realizados al conjunto de sitios web venezolanos seleccionados, sin embargo, estos metadatos están embebidos en los archivos WARC o en los logs de rastreo, por lo que no son accesibles de manera directa. Los metadatos son definidos como información estructurada que describe, explica, localiza o, de cierta forma, facilita la obtención, uso o manejo de algún recurso, y aunque pueden ser categorizados como descriptivos, administrativos y estructurales, son los metadatos administrativos quienes poseen la mayoría de los metadatos sobre los rastreos realizados dentro del Prototipo de Archivo Web. El objetivo de este Trabajo Especial de Grado, el cual forma parte de dicho prototipo, es definir los datos estadísticos e indicadores útiles para los diferentes usuarios, para apoyar y facilitar las tareas de administración del sistema. Este trabajo forma parte del Prototipo de Archivo Web de Venezuela, y fue realizado bajo una adaptación del método ciclo de vida de Ralph Kimball, para la extracción de los metadatos se utilizó la librería WAT, para el almacenamiento de dichos metadatos, se utilizaron archivos en formato JSON y MongoDB, y para mostrar los indicadores y datos estadísticos se utilizó la herramienta Pentaho.
Palabras Claves: Archivo Web, preservación Web, Formato WARC, Indicadores, Datos Estadísticos. |
Descripción : | Tutoras: Profa. Mercy Ospina; Profa. Concettina Di Vasta |
URI : | http://hdl.handle.net/10872/13696 |
Aparece en las colecciones: | Pregrado
|
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
|