lunes, 16 de abril de 2007

Ejemplo

A modo de ejemplo del modelo de interfaz de acceso a una compleja base de datos estructurada, imaginemos el repositorio formado por todas las base de datos de un banco, con datos sus clientes, empleados, productos, proveedores de servicios, etc... Lo lógico es que haya un conjunto de sistemas transaccionales, que gestionen el flujo de información (altas, bajas y modificaciones), y que dicha información se vuelque, en su totalidad o parcialmente a un datawarehouse periodicamente para análisis. Centrándonos en el datawarehouse, típicamente se utilizará un motor OLAP, que presente la información organizada en atributos categóricos, dimensiones y magnitudes, facilitando la realización de operaciones de desglose, agregación etc...

Si se quiere volcar toda la información del banco, es fácil que se tengan varios miles de dimensiones y magnitudes, dificultando encontrar aquellas con las que se quiere operar. Ahora imaginemos que toda la metadata, datos acerca de los datos, contenida en el diccionario del motor OLAP se utiliza para alimentar un motor de indexación de los objetos del datawarehouse, a partir de los términos que figuren en las descripciones de los objetos, así como los términos de los valores de los dominios de las dimensiones, e incluso de las magnitudes.

Con los elementos descritos anteriormente es fácil imaginar un interfaz de acceso al datawarehouse tipo google, que a partir de un conjunto de términos, keywords, localize los objetos del datawarehouse a los que se quiere acceder.

Por ejemplo, ante un texto de entrada del tipo Sevilla sucursal 10020, el sistema podría contestar proponiendo realizar un desglose por la variable sucursales y establecer una condición de filtro para con el valor de la sucursal 10020 de Sevilla. O, por poner otro ejemplo, ante un texto pepe.nieto@terracom.es, proponer un filtro sobre las variables, dimensiones, que contengan dicho valor, y recuperar todos los registros de las tablas de hechos con dicho valor en algún campo utilizado para almacenar correos electrónicos.

Si todo lo anterior lo aderezamos con información de contexto, o de un modelo del usuario, que influya en el algoritmo de puntuación del buscador, tendríamos una idea del tipo de sistemas de los que me gustaría tratar en este blog.

No hay comentarios: