lunes, 14 de noviembre de 2011

Particionamiento


El Particionamiento es una técnica utilizada para distribuir el almacenamiento de tablas, índices y vistas materializadas en más de estructura de almacenamiento que se administren de forma independiente. Esta división de almacenamiento es lo que llamamos Particionamiento.

¿Cuál es el beneficio de particionar?
Ya hemos escuchado el dicho "Divide y vencerás", pues eso es lo que lograremos con el Particionamiento, logrando mejorar el rendimiento, disponibilidad y mejor manejabilidad de los datos en la base de datos.

Oracle ofrece esta utilidad desde la versión 8i y desde que se introdujo con cada nueva versión han aplicado mejoras y nuevas técnicas de particionamiento.

En la imagen se muestra la tabla 1 que no esta particionada y la tabla 2 que se muestra particionada. La tabla 1 tiene se guarda en una sola partición mientras que la tabla 2 se almacena en tres particiones que agrupan la información por mes.

Este particionamiento se lo realiza utilizando una clave de particionado (Partitioning Key) que es la que identifica a que parte de la partición se almacenara el dato, en el ejemplo anterior la tabla particionada usa como clave de particionamiento el campo MES para direccionar a que partición se almacenara el dato. Esta llave sir durante la inserción o actualización del registro.

Oracle ofrece tres técnicas básicas de particionamiento según su la necesidad de la organización y es totalmente transparente para las aplicaciones que accedan a los datos y estas son:

Range Partitioning.- Esta técnica usa un rango de valores para determinar a qué partición de datos se almacenara el registro. Este es el método más común de particionar los datos y se usa a menudo como clave de partición los campos fechas.

Método de particionamiento Range
List Partitioning.- Para esta técnica se define una lista de valores para la clave de particionado, la ventaja de este particionamiento es que podemos agrupar y organizar los datos que tengan una relación común, como por ejemplo podemos definir como clave de partición el dato de PAIS.

Método de particionamiento List
Hash Partitioning.- Esta se basa en un algoritmo hash sobre la columna que se definió como clave de partición, esto es una técnica que distribuye a los datos en las particiones de manera equitativa y es usado cuando no se encuentra claros criterios de particionados.

Método de particionamiento Hash
A partir de esta tres técnica básica se definieron dos técnica mas que no son nada más que la combinación de las anteriores y estas son:

Composite Partitioning.- Esta es una técnica que se compone de las tres técnicas básicas anteriormente mencionadas, con esto podemos seleccionar para un primer nivel de partición una técnica y para el otro nivel de partición otra técnica, las combinaciones que podemos realizar son:
  • Range-Range Partitioning
  • Range-Hash Partitioning
  • Range-List Partitioning
  • List-Range Partitioning
  • List-Hash Partitioning
  • List-List Partitioning

Método de particionamiento Composite

En la imagen que se muestra dos ejemplos particionamiento compuesto Range-Hash y Range-List.

Ejemplo del uso de la partición Range
Como describimos hace un momento, esta técnica se basa en que se asigna la partición según el rango de valores en que coincida la clave de partición. Supongamos que tenemos una tabla de ventas con información del 2009 al 2011 y deseamos realizar el particionamiento tipo rango utilizando como llave la fecha, definiendo para cada año una partición.
CREATE TABLE pos_ventas
(
id_venta NUMBER,
fecha DATE,
valor NUMBER
)
PARTITION BY RANGE (fecha)
(
PARTITION pos_ventas_p1 VALUES LESS THAN (TO_DATE('01/01/2010','DD/MM/YYYY')) TABLESPACE ts_datos2009,
PARTITION pos_ventas_p2 VALUES LESS THAN (TO_DATE('01/01/2011','DD/MM/YYYY')) TABLESPACE ts_datos2010,
PARTITION pos_ventas_p3 VALUES LESS THAN (TO_DATE('01/01/2012','DD/MM/YYYY')) TABLESPACE ts_datos2011
);


Lo que realizamos es crear particiones por años, para esto seleccionamos como clave de particionamiento al campo fecha y se definió para cada partición un tablespace, con esto logramos una clara distribución de los datos.
Cada una de estas particiones se las puede administrar de manera independiente, ¿a que me refiero? Que podemos trabajarlos como estructuras independientes como si fueran tablas diferentes. Podemos establece definiciones de storage para cada partición, borrar una partición (Solo afectara a los datos contenidos dentro de la partición) y truncar la partición.
Si queremos ver que datos están contenidos en alguna de las particiones de la tabla Oracle nos proporciona la forma de hacerlo usando la clausula PARTITION(Nombre de la partición):
SELECT * FROM pos_ventas PARTITION(pos_ventas_p1);


Ejemplo del uso de la partición List
Este método se caracteriza por que la clave de particionamiento se define por una lista de valores. Tenemos una tabla de ventas, pero queremos realizar la división por el código de almacén de tal manera que tengamos los agrupemos por sector norte, sur y centro.
CREATE TABLE pos_ventas
(
id_venta NUMBER,
id_almacen VARCHAR2(5),
fecha DATE,
valor NUMBER
)
PARTITION BY LIST (id_almacen)
(
PARTITION pos_norte VALUES ('10','20','30') TABLESPACE ts_datos_nor,
PARTITION pos_sur VALUES ('40','50') TABLESPACE ts_datos_sur,
PARTITION pos_centro VALUES ('90','120','130','150') TABLESPACE ts_datos_cen
);


Vemos que las agrupaciones de las particiones dependerán de la lista de datos que se defina en la sección VALUES y que también podemos definir tablespaces o no para cada una de las particiones.


Ejemplo del uso de la partición Hash
Esta es una forma de distribución equitativa de datos definiendo un campo como llave de particionado para que la función Hash nos indique a que partición irá el dato.
Tenemos la tabla detalle de ventas y vamos a usar id_producto como clave de particionamiento para la función hash.
CREATE TABLE pos_ventas_detalles
(
id_venta NUMBER,
id_detalle_venta NUMBER,
id_producto VARCHAR2(20),
cantidad number,
valor number
)
PARTITION BY HASH (id_producto) PARTITIONS 4;


De esta manera definimos que se crearan hasta 4 particiones para la tabla POS_VENTAS_DETALLES y la clave de particionado esta definida por el campo ID_PRODUCTO, de esta manera distribuiremos de manera equitativa los datos. Con esto de manera implícita se crearan las particiones hasta un máximo de 4 particiones, pero también podemos especificar de manera especifica el nombre de las particiones con sus respectivos tablespaces.
CREATE TABLE pos_ventas_detalles
(
id_venta NUMBER,
id_detalle_venta NUMBER,
id_producto VARCHAR2(20),
cantidad number,
valor number
)
PARTITION BY HASH (id_producto)
(
PARTITION pos_vta_det_p1 TABLESPACE ts_datos_01,
PARTITION pos_vta_det_p2 TABLESPACE ts_datos_02
);
    
¿Cuando se necesita particionar una tabla?
Hay varios criterios a considerar para determinar si se necesita particionar una tabla:
  • El tamaño de la tabla supera los 2G de tamaño.
  • La tabla contiene información histórica que tiende a ser modificada, un ejemplo es en la facturación donde se genera mucha información por año y mucha de esta información se mantiene para análisis de los históricos, dicha información podríamos dividirla en dos particiones una histórica y otra actual.
En algunas ocasiones me ha tocado revisar base de datos cuyas técnicas de particionamiento es el uso de programación para traspasar datos de una tabla transaccional a una histórica y esta dependerá de que una persona sea la encargada de ejecutar el proceso, lo cual es un desperdicio ya que con el uso del particionamiento de Oracle esta tarea se la define una vez y es transparente para los usuarios. Solo tenemos que realizar un buen plan de distribución para aplicarla en nuestro particionamiento.


¿Cuál es la mejor técnica de particionamiento?
No hay repuesta especifica para esta pregunta, ya que se tomará la que mejor se adapte a nuestro requerimientos es como cuando jugamos al golf(solo en play station lo he jugado) seleccionamos el palo que se adapte al terreno en el que nos encontramos.

viernes, 4 de noviembre de 2011

¿Cómo reemplazar el uso de Sinónimos?


Una de las desventajas del uso de sinónimos privados es que ocupa mas espacio en el diccionario del SYS y en memoria, ya que para cada usuario de base de datos se deberá crear los sinónimos privados para que este pueda ver los objetos sin necesidad de escribir la ruta absoluta.
¿Ruta absoluta? Con esto quiero indicar que no debemos anteponer el nombre del esquema propietario seguido de un punto y el nombre del objeto, pero para entenderlo mejor veamos un ejemplo.
Vamos a crear una tabla BD_USUARIOS con el usuario SISOWN.
C:\>sqlplus sisown@orcl
Introduzca la contrase±a:
SQL> create table bd_usuarios as select * from dba_users;
Tabla creada.
SQL> select count(*)cantidad from bd_usuarios;
CANTIDAD
----------
23

Creamos al usuario PRUEBA_1 con los permisos de consulta a la tabla BD_USUARIOS.
SQL> create user prueba_1 identified by hola;
Usuario creado.
SQL> grant connect to prueba_1;
Concesi¾n terminada correctamente.
SQL> grant create synonym to prueba_1;
Concesi¾n terminada correctamente.
SQL> grant select on bd_usuarios to prueba_1;
Concesi¾n terminada correctamente.
SQL> connect prueba_1/hola
Conectado.
SQL> select count(*)cantidad from bd_usuarios;
select count(*)cantidad from bd_usuarios
*
ERROR en lÝnea 1:
ORA-00942: la tabla o vista no existe
SQL> select count(*)cantidad from sisown.bd_usuarios;
CANTIDAD
----------
23

Al conectarnos con PRUEBA_1 y realizar la consulta a la tabla BD_USUARIOS nos da error de que la tabla o vista no existe ya que a nivel de usuario PRUEBA_1 no existe la tabla, pero en la segunda consulta lo realizamos anteponiendo el nombre del usuario propietario SISOWN.BD_USUARIOS y no nos da error la consulta.

El error se presenta por que al realizar la consulta lo primero que se hace es ver si la tabla existe a nivel en el esquema PRUEBA_1 y al no encontrarlo se produce el error.
Para evitar ubicar el nombre del esquema antes del objeto en toda la programación tenemos 3 opciones:
  1. Utilizar sinónimos privados
  2. Utilizar sinónimos públicos
  3. Cambiar la variable de sesión CURRENT_SCHEMA
Utilizar sinónimos privados
Los sinónimos privados son objetos que pertenecen a cada usuario de la base y son alias que le damos a los objetos de base de datos y nos evitaría llamar a los objeto por rutas absolutas.

C:\>sqlplus prueba_1@orcl
Introduzca la contrase±a:
SQL> select count(*)cantidad from bd_usuarios;
select count(*)cantidad from bd_usuarios
*
ERROR en lÝnea 1:
ORA-00942: la tabla o vista no existe
SQL> create or replace synonym bd_usuarios for sisown.bd_usuarios;
Sin¾nimo creado.
SQL> select count(*)cantidad from bd_usuarios;
CANTIDAD
----------
23

Vemos como creando el sinónimo privado ya no se necesita de ubicar ruta absoluta (Esquema y objetos) para poder llamar a la tabla BD_USUARIOS. Esto deberá definirse para cada usuario de todos los objetos (Tablas, procedimientos, vistas, secuencias, etc) del usuario propietario 

Utilizar sinónimos públicos
Los sinónimos públicos a diferencias de los privados es que son de dominio público, es decir que solo se necesita definir una sola vez y todos para que sean visto por los demás usuarios, la ventaja de esto es que no debemos definirlo por cada usuario sino una sola vez.

C:\>sqlplus sisown@orcl
Introduzca la contrase±a:
SQL> create or replace public synonym bd_usuarios for sisown.bd_usuarios;
Sin¾nimo creado.
SQL> connect prueba_1/hola
Conectado.
SQL> select count(*)cantidad from bd_usuarios;
CANTIDAD
----------
23

Cambiar la variable de sesión CURRENT_SCHEMA
Esta manera es más eficiente que las dos anteriores, ya que no se necesita de crear objetos adicionales, solo se debe de indicar a la sesión de usuario que esquema de datos se va usar(Es decir en donde primero debe de buscar el objeto). La variable de sesión que modificamos es la CURRENT_SCHEMA la cual indica hacia que esquema se debe de buscar los objetos. Por default el CURRENT_SCHEMA es igual al nombre de la sesión de usuario.

C:\>sqlplus prueba_1@orcl
Introduzca la contrase±a:
SQL> select count(*)cantidad from bd_usuarios;
select count(*)cantidad from bd_usuarios
*
ERROR en lÝnea 1:
ORA-00942: la tabla o vista no existe
SQL> alter session set current_schema=SISOWN;
Sesi¾n modificada.
SQL> select count(*)cantidad from bd_usuarios;
CANTIDAD
----------
23

 Si me preguntaran cual es la mejor método a implementar, pues les daría el siguiente orden: Cambiar CURRENT_SCHEMA, Creación de sinónimos públicos y creación de sinónimos.

¿Por qué es mejor alterar el CURRENT_SCHEMA?
Es mejor porque no se necesita la creación de objetos en el diccionario del SYS, además de que en la memos ocupación de la Library Cache(Ya que por cada usuario no se cargaria metadata del objeto sinonimo) lo que es una ventaja por que dejamos más espacio disponible en la shared pool.

Si tenemos un ambiente de base de datos con 100 usuarios y esos usuario hacen uso de un promedio de 3,000 objetos de un esquema propietario (Tablas, vistas, procedimientos, secuencias, etc), para esto tendriamos que crear 300,000 sinonimos y considerar que cada vez que se cree un usuario el tiempo que nos tomará crear todos los sinonimos para este usuario.

Ademas otro punto en contra de los sinónimos es que cada vez que realices un cambio en los objetos del esquema propietario ya se estructural o de progrmación, los sinonimos relacionados a estos objeto se invalidan por lo que hay que recrearlos para evitar problemas.

¿Se puede hacer de manera automática el cambio del CURRENT_SCHEMA?
Si no deseas cambiar código de programación en tu sistema y deseas que esto se haga de manera automática en la base de datos lo que puede usar es un trigger de base de de datos AFTER LOGON:
CREATE OR REPLACE TRIGGER SISOWN.DB_CONTROL_SESION
AFTER LOGON
ON DATABASE
DECLARE
/***********************************************************
Desarrollado por : Víctor Endara
Objetivo : Cambiar de manera automática la el CURRENT_SCHEMA
************************************************************/
BEGIN
  if user not in ('SYS','SYSTEM','SYSAUX','SYSMAN') then
   execute immediate 'alter session set current_schema=SISOWN';
  end if;
  EXCEPTION
  WHEN OTHERS THEN
   RAISE;
END ;
/