Docstoc

UNIDAD IV - BASE DE DATOS Y ARCHIVOS

Document Sample
UNIDAD IV - BASE DE DATOS Y ARCHIVOS Powered By Docstoc
					     Universidad de Oriente
        Núcleo de Sucre
       Escuela de Ciencias
 Departamento de Matemáticas
 Introducción a la Informática


Desarrollado por Luis Hernández




     Unidad IV – Base de datos
            Y archivos
ARCHIVOS
Un archivo o fichero es una estructura de datos que reside en
memoria secundaria, consistente en un conjunto de informaciones
estructuradas en unidades de acceso denominadas registros, todos
del mismo tipo y en número indeterminado.

CARACTERÍSTICAS DE LOS ARCHIVOS

      •Residencia en los soportes de información externos.
      •Independencia respecto de los programas.
      •Permanencia de las informaciones almacenadas.
      •Gran capacidad de almacenamiento.
REGISTROS
Un registro lógico, articulo o simplemente registro es cada uno de los
componentes del archivo, conteniendo el conjunto de informaciones que se
acceden y se tratan de manera unitaria.
Está constituido por uno o más elementos denominados campos de diferentes tipos y
que a su vez pueden estar compuestos por subcampos.

Ejemplo: en el archivo de personal de una empresa cada registro contiene la
información de un empleado y los campos contienen su número de DNI, nombre,
dirección, fecha de ingreso, otros. La calle en que vive será un subcampo y el campo
clave puede ser el número de DNI.
Ejemplo de Registro Lógico


   NÚMERO DE DNI                  2 . 198 . 365
   NOMBRE                         LUÍS ORTIZ RUBIO
   DIRECCIÓN                      PS. OLMOS        MADRID
   LOCALIDAD                      28099             16
   DEPARTAMENTO                  PRODUCCIÓN
   CATEG. LABORAL                TECNICO AUXILIAR
   FECHA DE INGRESO             15     09       1988

                     Registro Personal
CAMPOS
Los campos almacenan, calculan y presentan los datos que se han introducido en los
registros . La información que se coloca en un campo constituyen su valor . Cada
parte de la información de un registro (nombre, dirección numero de teléfono) se
almacena en un campo
                               TIPOS DE CAMPOS


           Numéricos     Alfabéticos      Alfanuméricos      Lógicos


SUBCAMPOS
Contiene información que identifica a los campos vinculados y puede también
proponer su secuencia. El subcampo puede repetirse para vincular otro grupo de
campos.
CAMPO CLAVE
 Es el campo del registro lógico que sirve para identificar el
 registro al que pertenece. Se usa para localizar un registro
 dentro de un fichero y para ordenar el mismo. No todos
 los ficheros tiene un campo clave. De igual forma pueden
 existir mas de un campo clave en un registro (clave
 primaria, secundaria y así sucesivamente). Ejemplo: el
 número de DNI.

CLAVE PRIMARIA

  Se llama clave primaria a un campo, o a una combinación de campos, que
  identifican en forma única a cada registro.
REGISTRO FÍSICO
Es la cantidad de información que el sistema operativo puede enviar o recibir en un
soporte de memoria secundaria a través de una operación de lectura o escritura.



                 Bloque Factor de Bloqueo 3)
               Bloque ( (Factor de Bloqueo = = 3 )


        Registro 1          Registro 2              Registro 3



         Registro 1         Registro 2             Registro 3          Registro 4
                       Campo 1 Campo 2 Campo 3

                                             Subcampo 1   Subcampo 2

                                                    Campo 2
BLOQUEO DE REGISTROS (Registro Físico)

  Se llama factor de bloqueo al número de registros lógicos contenidos en un
  registro físico


  Ejemplo de un Bloqueo de Registros

       •   Campo NIF (10 caracteres) = 10 bytes
       •   Campo Nombre (30 caracteres) = 30 bytes
       •   Campo Apellidos (40 caracteres) = 40 bytes
       •   Campo Teléfono (entero largo) = 8 bytes
       •   Campo Dirección (40 caracteres) = 40 bytes
       •   TOTAL = 128 bytes
ESTRUCTURA DE LOS REGISTROS
 • Registros de longitud constante: son aquellos que ocupan un mismo espacio a lo
 largo de un archivo.

 • Registros de longitud indefinida: es un simple registro lógico formado por varios
 campos (segmentos) de longitud variable.

 • Registros de longitud variable

    Pueden contener cualquier número de bytes, hasta un determinado valor máximo,
 que ha de fijarse previamente.
VENTAJAS DE AGRUPAR VARIOS REGISTROS LÓGICOS EN UN REGISTRO FÍSICO

    • Ahorro de Soporte
     -Surge de disminuir la cantidad de espacio entre registros físicos.


    • Ahorro de Tiempo
     -Las cabezas se moverán en trayectos más cortos si el archivo tiene menor
    extensión como consecuencia del punto anterior.
DIFERENCIAS ENTRE REGISTRO LÓGICO Y FÍSICO

                                       Diferencias

              Registro Físico                               Registro Lógico
  El registro físico representa al lógico en    El registro lógico es la información que
 medidas de memoria.                           ve el usuario en su pantalla.
  El registro físico es la cantidad física del El registro lógico esta internamente en
 archivo, es decir, su tamaño.                 el físico.


  Se graba en el dispositivo de                 Es el conjunto de datos que se refiere a
 almacenamiento secundario.                    una misma entidad o cosa.


  Puede constar de un numero variable           Contiene la información con la que
 de registros lógicos.                         trabaja la aplicación.
ORGANIZACIÓN SECUENCIAL
       Es aquella en la cual los registros ocupan posiciones consecutivas de
  memoria, y solo se puede acceder a ellos de uno en uno a partir del primero.
ORGANIZACIÓN SECUENCIAL

 •   VENTAJAS
     - Acceso eficiente a todos o gran parte de los datos.
     - Menor uso de espacio de almacenamiento.
     - Se puede utilizar con cualquier soporte y cualquier tipo de organización, en cuanto
     a organizaciones secuenciales.

 •   DESVENTAJAS
     - Acceso lento a registros específicos.
     - Cuando se lee no se puede escribir, y cuando se escribe no se puede leer.
ORGANIZACIÓN DIRECTA O ALEATORIA

           En un archivo con esta organización, también denominada relativa, las
   informaciones se colocan y se acceden aleatoriamente mediante su posición, es
   decir, indicando el lugar relativo que ocupan dentro del conjunto de posiciones
   posibles


                                                           Acceso Directo

                  Registro 2°               Registro 1°        Registro 3°
Posiciones   01                 02     03                 04                 05
ORGANIZACIÓN DIRECTA O ALEATORIA

•   VENTAJAS
    - Se pueden leer y escribir los registros en cualquier orden y posición.
    - Rapidez de acceso a un registro cualquiera, ya que para ello no es preciso pasar
    por los registros anteriores.

•   DESVENTAJAS
    - Ineficiente acceso a la totalidad o gran parte de los registros.
    - Mayor uso de espacio de almacenamiento.
    - Puede desaprovecharse parte del espacio destinado al archivo, ya que pueden
    quedar huecos libres entre unos registros y otros.
ORGANIZACIÓN SECUENCIAL INDEXADA

Esta organización está diseñada para utilizar la combinación de la
organización relativa y la secuencial, obteniendo la ventaja de poder acceder
a los registros en forma secuencial y relativamente de manera directa.


Esta organización consta de tres áreas:

     •Área de índices
     • Área primaria
     •Área de excedentes.
ORGANIZACIÓN SECUENCIAL INDEXADA
ORGANIZACIÓN SECUENCIAL INDEXADA

•   VENTAJAS
    - Más veloz que la secuencial.
    - Más eficiente que la directa.
    - Rápido acceso por medio de la clave del registro.

•   DESVENTAJAS
    - Menos eficiente que la secuencial.
    - Menos rápida que la directa.
    - Desaprovechamiento del espacio que resulta de quedar huecos intermedios
    libres después de sucesivas actualizaciones.
ORGANIZACIÓN SECUENCIAL INDEXADA

                                                                  Archivo Secuencial
                                  Índice
                                                                       de datos
                                       MAMUT N/2
                                                                    1    ARDILLA

                                                                    2    BORREGO

                  CEBRA       4
                                                                    3    CAIMAN

                                                                    4    CEBRA

      BORR.   2               DELF.    5                            5    DELFIN

                                                                    6    ERIZO
                                                   ZOPILOTE   N
                                                                    …    ...

   ARD. 1         CAI.    3           ERIZ. 6                       N    ZOPILOTE
MODOS DE ACCESO
  Se denomina modo de acceso a la forma en el que el dispositivo que maneja el
  soporte se posiciona en un determinado lugar del mismo para realizar una
  operación de lectura o escritura de un registro. El modo de acceso lo decide el
  programador de la aplicación en función del soporte utilizado y del tipo de
  organización. Los modos básicos son: secuencial y directos.
ACCESO SECUENCIAL
   Supone acceder inicialmente al primer registro del archivo y después,
   consecutivamente, a todos los sucesivos hasta llegar al registro deseado. Se puede
   utilizar en cualquier soporte y organización.
ACCESO DIRECTO
   Consiste en el posicionamiento sobre cualquier registro sin necesidad de haber
   accedido antes a los anteriores. Solamente se puede realizar en los soportes
   direccionables. El acceso a un registro se consigue proporcionando la posición del
   registro deseado a partir del campo clave.
GESTIÓN DE ARCHIVOS

Consiste en una serie de pasos interrelacionados, diseñados para asegurar la fácil
identificación, organización, acceso y mantenimiento de los archivos. Un sistema de
gestión de archivo es un sistema software que provee servicios a los usuarios y
aplicaciones en el uso de archivos .

OBJETIVOS DE LA GESTIÓN DE ARCHIVOS
  •Garantizar que la información del archivo sea válida.
  •Optimizar el acceso a los archivos.
  •Proveer soportes E/S a gran variedad de dispositivos de almacenamiento.
  •Entregar los datos que el usuario pide.
  •Minimizar o eliminar perdida de datos.
  •Proveer un conjunto estándar de rutinas E/S.
  •Proveer soporte de E/S a múltiples usuarios.
BASE DE DATOS

 Una base de datos es un “almacén” que nos permite guardar grandes cantidades
 de información de forma organizada para que luego podamos encontrar y utilizar
 fácilmente.

 Desde el punto de vista informático, la base de datos es un sistema formado por
 un conjunto de datos almacenados en discos que permiten el acceso directo a
 ellos y un conjunto de programas que manipulen ese conjunto de datos. Cada
 base de datos se compone de una o más tablas que guarda un conjunto de datos.

 Conjunto integrado de datos interrelacionados,
 junto con una serie de aplicaciones para su
 manejo, accesibles simultáneamente         por
 diferentes usuarios y programas.
CARACTERÍSTICAS DE LAS BASES DE DATOS
     Control centralizado de los datos.
     Integridad de los datos.
     Minimización de las redundancias.
     Independencia de los datos y las aplicaciones.
     Acceso concurrente de los datos.
     Costo mínimo de almacenamiento y mantenimiento.
     Versatilidad para la presentación de las relaciones.
     Establecimiento de medidas de seguridad.
     Facilidad para el cambio (hardware y software).
                    ELEMENTOS DE UNA BASE DE DATOS




                Datos      Atributos    Campos       Registros

ARQUITECTURA DE UNA BASE DE DATOS

                 Usuario
                                 NIVEL EXTERNO

                 Diseño                           Correspondencias
                               NIVEL CONCEPTUAL

                 Almacenamiento                  Correspondencias
                                 NIVEL INTERNO
MODELOS DE BASE DE DATOS

Son conocidos como Modelos de Datos, algunos de estos modelos son:
    •Modelo Relacional de Datos.
    •Modelo de Red.
    •Modelo Jerárquico.
    •Modelo de Datos por Objetos (object oriented).
MODELOS RELACIONALES

Las base de datos relacionales son las que almacena la
información en varias tablas (filas y columnas de datos) o
ficheros independientes y realiza búsquedas que permiten
relacionar datos que han sido almacenados en más de una
tabla.

En las tablas de una base de datos relacionales, las filas
representan registros (conjuntos de datos acerca de individuos
o elementos separados) y las columnas representan campos
(atributos particulares de un registro).

Las tablas o ficheros de la base de datos relacional deben tener
un campo común, es decir, un campo que almacena, en cada
una de ellas, la misma información para cada registro y que va a
ser el que permita establecer la relación al realizar las consultas.
MODELO RELACIONAL
MODELO DE RED
Utiliza la estructura de red o grafo, que permite definir entre todos los nodos relaciones
n:n (muchos a muchos). Mediante el establecimiento de apuntadores entre nodos se
puede relacionar cualquier unidad de datos con cualquiera de las otras.



     CONDUCTOR                                                           CIUDAD


                                       AUTOCAR



       AGENCIA                                                          PASAJERO
 MODELO JERÁRQUICO
Utiliza la estructura de árbol para establecer relaciones del tipo 1:n (uno a muchos).
Cada árbol tiene un nodo distinguido denominado raíz y, a partir de el se establecen
relaciones de sucesión denominándose nodos hijos a los descendientes de otro. El
nodo padre puede tener solo una ocurrencia, mientras que los hijos varias.


                                     CONDUCTOR




CONDUCTOR               PASAJERO                 CIUDAD                  CONDUCTOR
MODELO DE DATOS POR OBJETO (OBJECT ORIENTED)

Está representado por un conjunto de clase que definen las características y el
comportamiento de los objetos que poblarán la base de datos. En este modelo los
objetos memorizados en la base de datos contienen tanto los datos como las
operaciones posibles de los mismos
MANEJADOR DE BASE DE DATOS
Es la porción más importante del software de un sistema de base de datos. Un DBMS
es una colección de numerosas rutinas de software interrelacionadas, cada una de las
cuales es responsable de alguna tarea específica. Es también llamado sistema de
gestión de base de datos (DBMS).

OBJETIVOS DEL DBMS                            FUNCIONES PRINCIPALES DEL DBMS
   •Abstracción de la información                  •Descripción
   •Independencia                                  •Manipulación
   •Redundancia mínima                             •Utilización
   •Consistencia
   •Seguridad
   •Integridad
   •Respaldo y recuperación
   •Control de la concurrencia
   •Tiempo de respuesta
VENTAJAS DEL DBMS

  •Facilidad en el manejo de grandes volúmenes de información
  •Gran velocidad en muy poco tiempo
  •Independencia en el tratamiento de la información
  •Seguridad de la información (acceso a usuarios autorizados)
  •Evita la duplicidad de información
  •Mejora en los servicios de copias de seguridad y de recuperación ante fallos

 LENGUAJES DE DBMS


        Lenguaje de descipción o definición de datos (DDL)
        Lenguaje de manejo de datos (DML)
        Lenguaje de consulta
TIPOS DE DBMS
  ORACLE
Es manejador de base de datos relacional que hace uso de los recursos del sistema
informático en todas las arquitecturas de hardware, para garantizar su
aprovechamiento al máximo en ambientes cargados de información.

CARACTERÍSTICAS
  •DBMS empresarial más popular del mundo.
  •Ofrece una suite de aplicaciones grandes, herramientas y lenguaje que se pueden
  utilizar para resolver problemas empresariales y administrar datos.
  •Más flexible.
  •Es capaz de ser ejecutada en distintos sistemas operativos (independencia de la
  plataforma).
DB2
Es un motor de base de datos relacional que integra XML de
manera nativa, lo que IBM ha llamado pureXML, que permite
almacenar documentos completos dentro del tipo de datos xml para
realizar operaciones y búsquedas de manera jerárquica dentro de
éste, e integrarlo con búsquedas relacionales.

CARACTERÍSTICAS
•Perteneciente a IBM.
•Sus versiones se ejecutan en Windows, Linux y distintas versiones de los sistemas.
operativos UNIX.
•Ofrece un sistema estable y robusto e incluye la garantía y soporte de IBM.
•Posee una suite de aplicaciones asociada para ayudar en la extracción, análisis e
integración de datos además de la administración empresarial y almacén de datos
SQL Server
Es un sistema y herramienta de administración de bases de datos
para SERVIDORES SQL. Con una interfaz gráfica de usuario amigable
sobre Windows, que por medio de iconos se representa a las diferentes
tareas que suele desempeñar un administrador.
CARACTERÍSTICAS
 •Similar al Oracle con la diferencia que solo se ejecuta en sistema operativo
 Windows.
 •Posee características avanzadas de lenguaje y mayor velocidad y eficiencia de
 acuerdo con algunas pruebas de escritorio.
 •Precio accesible que satisfacen las necesidades de diferentes organizaciones.
 •Esta diseñado para manejar enormes cargas de datos hasta versiones básicas para
 pequeños dispositivos.
 •Escalabilidad.
My SQL
Es un sistema de gestión de base de datos relacional, multihilo y multiusuario con
más de seis millones de instalaciones


CARACTERÍSTICAS

•DBMS empresarial más popular entre la comunidad de código abierto.
•Existen más de 4 millones de aplicaciones MySQL instaladas.
•Es el DBMS líder en la plataforma Linux.
•Bajo costo.
•Ofrece características de transacciones.
•No es escalable.
VENTAJAS DE LAS BASE DE DATOS

       REFERIDAS                              VENTAJAS
                        •Independencia de estos respecto de los tratamientos
                        y viceversa.
       Los Datos        •Mejor disponibilidad de los mismos.
                        •Mayor eficiencia en la recogida, codificación y
                        entrada.
                        •Mayor coherencia.
                        •Mayor valor informativo.
     Los Resultados
                        •Mejor y más normalizada documentación de la
                        información.
                        •Acceso más rápido y sencillo de los usuarios finales.
                        •Más facilidades para compartir los datos por el
      Los Usuarios      conjunto de los usuarios.
                        •Mayor flexibilidad para atender a demandas
                        cambiantes.
LIMITACIONES DE LAS BASE DE DATOS


        REFERIDAS                               VENTAJAS

                          •Costosa en equipos (lógico y físico).
                          •Ausencia de estándares.
      La Implantación
                          •Larga y difícil puesta en marcha.
                          •Rentabilidad a mediano plazo.


                          •Personal especializado.
        Los Usuarios
                          •Desfase entre teoría y practica.
La protección que se pueden establecer sobre los datos se distinguen según:


      •Seguridad contra fallos del sistema o el soporte.
      •Seguridad contra usos incorrectos o no autorizados.


SEGURIDAD CONTRA FALLOS DEL SISTEMA O EL SOPORTE.

Es necesario proteger los datos y las actualizaciones que se realizan con ellos para
evitar la perdida de información en el momento que se produce una caída del
sistema o rotura del soporte. Para ello se emplean las siguientes técnicas:

     1. Copias de seguridad (Back-up).
     2. Registro de operaciones .
     3. Procedimientos de recuperación.
SEGURIDAD CONTRA USOS INCORRECTOS O NO AUTORIZADOS.
Se denomina también privacidad. Incluye aspectos legales, sociales y éticos, políticas
de la empresa, niveles de información pública y privada, controles de tipo físico,
acceso a las instalaciones, identificación de usuarios, controles de sistema operativo.

Las medidas de seguridad son:
•Autentificación: consiste en identificar a los usuarios que entran
al sistema, se puede basar en posesión (llave o tarjeta),
conocimiento (clave) o en un atributo del usuario (huella digital).
•Criptografía: su propósito es proteger el mensaje. Para este caso
•se utiliza un cripto-sistema que lo codifique para que sea leído solo por el destinatario
del mismo. Generalmente los sistemas de encriptación dependen de una clave (una
contraseña como un número o una frase) que pueda usarse para encriptar o
desencriptar el mensaje.
•Firewarlls: permiten asegurar las redes internas al comunicarse con el resto de
internet.

				
DOCUMENT INFO
Shared By:
Tags:
Stats:
views:30
posted:5/25/2012
language:
pages:40