jueves, 13 de noviembre de 2008

QUE ES UN ABODEGA DE DATOS

Un Data Warehouse es un conjunto de datos integrados orientados a una materia, que varían con el tiempo y que no son transitorios, los cuales soportan el proceso de toma de decisiones de la administración. (W.H. Inmon, considerado como el padre del data warehouse). Esta orientada al manejo de grandes volúmenes de datos, provenientes de diversas fuentes, de muy diversos tipos. Estos datos cubren largos períodos de tiempo, lo que trae consigo que se tengan diferentes esquemas de los datos fuentes. La concentración de esta información esta orientada a su análisis para apoyar la toma de decisiones oportunas y fundamentadas. Previo a su utilización se debe aplicar procesos de análisis, selección y transferencia de datos seleccionados desde las fuentes.

Componentes de un Data Warehouse

Como se puede observar en el esquema, cuando un auditor se enfrenta a un Sistema de Bodega de Datos (Data Warehouse), su labor debe tener en cuenta muchos elementos que influyen en la seguridad y buen funcionamiento.
En particular resaltamos:
Datos Antiguos: Tienen gran importancia en los procesos iniciales de población de la bodega de datos. Son datos de periodos anteriores. Pueden provenir de 20 años atrás, en algunos casos. La dificultad de ubicación, recuperación y transformación a los formatos requeridos (pueden estar incluso en documentos en papel) es uno de los problemas mas usuales en proyectos de este tipo.
Datos Operacionales: Datos operativos actualizados por aplicaciones OLTP (On Line Processing Transaction. Procesamiento de transacciones en línea.). Están almacenados en las bases de datos en producción.

Extractores de Datos: Encargados del copiado y distribución de los datos de acuerdo con el diseño. Se determinan los datos a copiar, desde donde y hacia donde, periodos para las actualizaciones. Se determina si se realiza una regeneración (copia de la fuente de datos en su totalidad) o una actualización (solo se propagan los cambios). Los datos externos son adecuados y limpiados antes de ser sumados a la bodega de datos.Son los enlaces entre los datos en producción y el Data Warehouse (generalmente de tipo relacional)

Bodega de Datos: El repositorio de datos actual. Organizadas orientada a intereses concretos. Información histórica reflejando transacciones OLTP, acumuladas por años o en general por periodos largos. Se dice que son servidores de datos para apoyo de decisiones, que añade valor a los datos procedentes de las fuentes en producción. Contienen información detallada y agregada.
Metadatos: Los metadatos llevan registros de los datos almacenados, integrados en la misma base de datos. Describen el contenido de los objetos de la bodega de datos: las tablas, índices y el contenido de los datos. Los metadatos definen los formatos, significado y origen de los datos y facilitan el acceso y administración a los datos en la bodega.Contienen la información de la fuente antes de ingresar a la bodega, el mapeo de los datos fuentes a datos en la bodega, historia de las extracciones, logica y algoritmos usados para los procesos de datos (sumarizacion, organización, etc.) y la historia de los cambios en la bodega.Herramientas de Consultas y Extracción de
Información: Proveen la interfaz humana con la bodega de datos. En el procesamiento de la información se pasa de simples consultas SQL a OLAP y de esta a Minería de Datos.


2 comentarios:

inges dijo...

Hola Chavos, buen trabajo, ya que nos permite concocer que es y como funciona una bodega de datos, ademas de su utilidad.
Me gusto mucho la estructura que le dieron al documento pues permite seguir muy bien la lectura y una mejor comprension.
ATTE:
Alexander Pacheco de la Torre.
Juan Alberto Huerta Castillo.
Equipo 3

Equipo Cinco dijo...

Hola, Soy Raul Solorzano. Creo que es uno de los temas mejor desarrollados que pude leer y el Blog ps muy bien usado, sobre el tema, esta bastante claro solo algunas dudas ke deje plasmadas en algunas entradas del blog pero en gral bn, les falto el uso de videos enbebidos a su pagina k kiero dedicir con esto? por ejemplo en una de las entradas tienen un enlace a este video..

http://es.youtube.com/watch?v=qZ2st4eebYo

pues es tedioso andar consultando en vez de verlo en el mismo blog...
en la pag d youtube hay una seccion donde estan los datos del video k dice INSERTAR y luego un cuadro de texto con codigo... este codigo...
(sustituyo las "<" por "(" porke aki no me deja usar TAGS el Blogger)

(object width="425" height="344")(param name="movie" value="http://www.youtube.com/v/qZ2st4eebYo&hl=es&fs=1")(/param)(param name="allowFullScreen" value="true")(/param)(param name="allowscriptaccess" value="always")(/param>(embed src="http://www.youtube.com/v/qZ2st4eebYo&hl=es&fs=1" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="425" height="344")(/embed)(/object)

si editan la entrada al blog en forma HTML y pegan ese codigo donde esta la direccion, podran ver el video desde la misma entrada del blog sin entrar a youtube.