jueves, 13 de noviembre de 2008

CARACERITICAS DE LAS BODEGAS DE DATOS

Por definición, las Bodegas de Datos son bases de datos caracterizadas por
ser:
•Integradas: porque consolidan y centralizan datos derivados de toda la organización.
•Orientadas a un tema particular: ya que los datos que contienen, están organizados por temas, totalizados y optimizados para dar respuestas a preguntas de diversas áreas funcionales de la organización.
•Variantes en el tiempo: porque contrario a las Bases de Datos Operacionales que se centran en los datos actuales, las Bodegas de Datos representan el flujo de información a través del tiempo.
•No volátiles: Una vez que los datos son almacenados, estos nunca son removidos pues representan la historia de la organización.

Data Mining

Datamining es una tecnología de soporte para usuario final, cuyo objetivo es extraer conocimiento útil y utilizable a partir de la información contenida en las bases de datos de las empresas.
Los objetivos de un sistema Datamining nos permitirían analizar factores de influencia en determinados procesos, predecir o estimar variables o comportamientos futuros, sementar o agrupar ítems similares, además de obtener secuencias de eventos que provocan comportamientos específicos.
Los sistemas Datamining se desarrollan bajo lenguajes de ultima generación basados en la inteligencia artificial y utilizando métodos matemáticos, tales como:
•Redes neuronales
•Introducción de reglas
•Arboles de decisión
•Conjunto de reglas por clase
Soporta tambien sofisticadas operaciones de análisis tales como los
sistemas Scoring y aplicaciones de detección de fraude.

ETL (Extraction, Transformation and Load - Extracción, Transformación y Carga)

•La fase de Extracción de Información utiliza herramientas que facilitan el acceso y la extracción de datos almacenados en múltiples plataformas y bases de datos (SQL Server, DB2, Informix, Sybase, Oracle, etc.) que permiten interpretar y definir de forma sencilla las reglas de negocio
necesarias para la transformación de los datos de información.
•La fase de Transformación consiste en el proceso de convertir los datos a formatos consistentes.
•La fase de Carga automatiza las tareas de preparación de la información para un análisis eficiente, que garantiza al usuario un acceso eficiente a los datos y le permite generar sus propias consultas.