BASES DE DATOS DISTRIBUIDAS
Es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas en diferentes espacios lógicos (pej. un servidor corriendo 2 máquinas virtuales) e interconectados por una red de comunicaciones. Dichas BDD tienen la capacidad de realizar procesamiento autónomo, esto permite realizar operaciones locales o distribuidas. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones de tal forma que, un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red exactamente como si estos fueran accedidos de forma local.
Un sistema distribuido de bases de datos se almacenan en varias computadoras. Los principales factores que distinguen un SBDD de un sistema centralizado son los siguientes:
Hay múltiples computadores, llamados sitios o nodos.
Estos sitios deben de estar comunicados por medio de algún tipo de red de comunicaciones para transmitir datos y órdenes entre los sitios.
CONCEPTOS BASICOS
Base de Datos Distribuidas
Es un conjunto de múltiples bases de datos lógicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones.
Sistema de Basede Datos Distribuida
Es un sistema en el cual múltiples sitios de bases de datos están ligados por un sistema de comunicaciones, de tal forma que, un usuario en cualquier sitio puede accesar los datos en cualquier parte de la red exactamente como si los datos estuvieran almacenados en su sitio propio.
Un sistema de manejo de bases de datos distribuidas
Es aquel que se encarga del manejo de la BDD y proporciona un mecanismo de acceso que hace que la distribución sea transparente a los usuarios. El término transparente significa que la aplicación trabajaría, desde un punto de vista lógico, como si un solo SMBD ejecutado en una sola máquina, administrara esos datos.
Un sistema de base de datos distribuida
Es entonces el resultado de la integración de una base de datos distribuida con un sistema para su manejo.
CARACTERÍSTICAS DE LAS BASES DE DATOS DISTRIBUIDAS
*Los datos deben estar físicamente en más de un ordenador (distintas sedes)
*Las sedes deben estar interconectadas mediante una red (cada sede es un nodo de la red)
*Los datos han de estar lógicamente integrados (recuperación y actualización) tanto en local como remoto (esquema lógico global y único)
*En una única operación se puede acceder (recuperar o actualizar) datos que se encuentran en más de una sede (acceso a datos locales o remotos)
*Todas las acciones que necesiten realizarse sobre más de una sede serán transparentes al usuario (transparencia de distribución para el usuario)
VENTAJAS DE LAS BDD
ORGANIZATIVAS:
- Adaptación a la organización de la institución (unión de compañías/descentralización), respondiendo a cambios
- Almacenar los datos donde son generados y/o usados, la mayor parte locales
- Proporcionar autonomía local, controlándose desde cada nodo. Política general contra política local
ECONÓMICAS:
- Costos de comunicación y de creación de pequeños sistemas
TÉCNICAS:
- Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez
- Fiabilidad/disponibilidad, en un determinado momento / intervalo. Varios sitios, duplicaciones, evitan fallos
- Modularidad
- Mejora del rendimiento, BD más pequeñas, operaciones de menor volumen
- Crecimiento incremental, añadiendo poder de procesamiento y almacenamiento
DESVENTAJAS DE LAS BDD
- Complejidad del sistema, desarrollo de software más costoso, problemas de sincronización, dificultad para conocer la corrección de los algoritmos paralelos, detección de caídas de nodos
- Dependencia de la red de comunicaciones, sobrecarga deprocesamiento de mensajes
- Dificultad de diseño, fases adicionales
- Poca madurez de los productos comerciales, orientados a replicación
- Funciones de administración compleja, sincronización y coordinación
- Dificultad de cambio, inexistencia de metodologías
- Personal especializado
ESTRUCTURAS DE LAS BASES DE DATOS DISTRIBUIDAS
Un sistema de Base de datos distribuidas se compone de un conjunto de localidades, cada una de las cuales mantiene un sistema de base de datos local. Cada localidad puede procesar transacciones locales, es decir, aquellas que sólo acceden a datos que residen en esa localidad. Además una localidad puede participar en la ejecución de transacciones globales, es decir, aquellas que acceden a datos de varias localidades.
La ejecución de transacciones globales requiere comunicación entre las localidades, esta comunicación puede ser, por ejemplo, mediante líneas telefónicas o cables de alta velocidad.
Cabe destacar que en un sistema de BDD tiene las siguientes características:
Cada sitio es un sistema de base de datos en sí mismo.
Los sitios han convenido en trabajar juntos (si es necesario) con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red tal como si todos estuvieran almacenados en el sitio propio del usuario.
En consecuencia, la llamada “base de datos distribuida” es en realidad una especie de objeto virtual, cuyas partes componentes se almacenan físicamente en varias bases de datos “reales” distintas ubicadas en diferentes sitios. De hecho, es la unión lógica de esas bases de datos.
Los sitios pueden conectarse físicamente, a modo de grafo, de diversas formas, como por ejemplo:
Red totalmente conectada
Red prácticamente conectada
Red con estructura de árbol
Red de estrella
Red de anillo
La ejecución de transacciones globales requiere comunicación entre las localidades, esta comunicación puede ser, por ejemplo, mediante líneas telefónicas o cables de alta velocidad.
Cabe destacar que en un sistema de BDD tiene las siguientes características:
Cada sitio es un sistema de base de datos en sí mismo.
Los sitios han convenido en trabajar juntos (si es necesario) con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red tal como si todos estuvieran almacenados en el sitio propio del usuario.
En consecuencia, la llamada “base de datos distribuida” es en realidad una especie de objeto virtual, cuyas partes componentes se almacenan físicamente en varias bases de datos “reales” distintas ubicadas en diferentes sitios. De hecho, es la unión lógica de esas bases de datos.
Los sitios pueden conectarse físicamente, a modo de grafo, de diversas formas, como por ejemplo:
Red totalmente conectada
Red prácticamente conectada
Red con estructura de árbol
Red de estrella
Red de anillo
En la figura siguiente se da un ejemplo de la estructura (un sistema distribuido de bases representativo):
Las diferencias principales entre estas configuraciones son:
Costo de instalación: El costo de conectar físicamente los sitios del sistema
Costo de comunicación: El costo en tiempo y dinero que implica enviar un mensaje desde el sitio A al B.
Fiabilidad: La frecuencia con que falla una línea de comunicación o un sitio.