Concepto Basico de Archivos

98,293 views

Published on

Se explicaràn los diferentes tipos de archivos y su utilizacion

2 Comments
10 Likes
Statistics
Notes
  • como `puedo descarar la informacion ??????????
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • no frieges nada k ver
    hehehee
    asi k byeee


    cyaoo....
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
No Downloads
Views
Total views
98,293
On SlideShare
0
From Embeds
0
Number of Embeds
1,288
Actions
Shares
0
Downloads
1,111
Comments
2
Likes
10
Embeds 0
No embeds

No notes for slide

Concepto Basico de Archivos

  1. 1. “ Conceptos Básicos de Archivos” Instituto Tecnológico de Hermosillo
  2. 2. <ul><li>Al igual que en otras disciplinas la información se esquematiza como un sistema de Entrada , Proceso y Salida . </li></ul><ul><li>En donde los datos (entrada) son el insumo que requieren del procesamiento (proceso) para producir la Información (salida). </li></ul>
  3. 3. <ul><li>  </li></ul><ul><li>  </li></ul><ul><li>  </li></ul><ul><li>                           </li></ul>Entrada de Datos Procesamiento de Datos Salida de Información
  4. 4. <ul><li>Datos : Sucesos, hechos, eventos que son REGISTRADOS a través de medición (cuantitativa o cualitativa), observación, etc. </li></ul><ul><li>Información : Son datos manipulados o procesados que son presentados de manera adecuada a los usuarios para servir de soporte a la toma de decisiones (organizaciones) con las características de Exactitud, Relevancia y Oportunidad </li></ul>
  5. 5. <ul><li>Capacitación. </li></ul><ul><li>Captura. </li></ul><ul><li>Registro. </li></ul><ul><li>Ordenamiento. </li></ul><ul><li>Op. Aritméticas. </li></ul><ul><li>Op. Lógicas. </li></ul><ul><li>Presentaciones de Reportes. </li></ul><ul><li>Condensados. </li></ul><ul><li>Consultas. </li></ul><ul><li>Sumarios </li></ul><ul><li>Usuarios Directos. </li></ul><ul><li>Usuarios Indirectos </li></ul>
  6. 6. Tipo de Datos Estructura de Datos Organización de Archivos Primitivos Compuestos Simple Compuesto Entero Arreglo Lineal No lineal Secuencial Booleano Registro Cola Árbol Binario Relativo Carácter Cadena Pila B-Tree Indexado Real Lista B+Tree Multillave Árbol General
  7. 7. <ul><li>Campo : Los datos pueden ser representados por números y caracteres, de tal manera que un dato como el nombre de un empleado, el número de control de un alumno o un precio pueden ser identificados por un elemento que se le llama campo, entonces obtendríamos los campos, nombre, control y precio. </li></ul><ul><li>Registro : Un registro es el conjunto completo de datos relacionados pertenecientes a una entrada, tal como un cheque bancario. Al ser considerado como una unidad única, el cheque bancario es, por lo tanto, un registro que consta de 7 campos separados, todos ellos relacionados con la transacción de pago. </li></ul><ul><li>Archivo : Un archivo es una colección de registros relacionados. Se incluye cada registro en un archivo ya que pertenece a la misma entidad. Por ejemplo un archivo de cuentas está formado solamente por las cuentas de los clientes. </li></ul>
  8. 8. <ul><li>En computación el término Archivo tiene varios significados y clasificaciones: </li></ul><ul><li>Archivos de texto : secuencia de caracteres (ASCII). </li></ul><ul><li>Archivos de datos : Son estructurados, o también conocido como FORMATEADOS ( con comas, espacios fijos puntos y comas etc.) </li></ul>
  9. 9. <ul><li>Archivo Maestro : Contiene los datos que representan el estado actual de una organización o empresa. </li></ul><ul><li>Archivo Trabajo : Son los archivos auxiliares utilizados por los programas y que son regularmente borrados por estos una vez que son utilizados. Se dice que son transparentes para el usuario. </li></ul><ul><li>Archivo Respaldo : Es una copia obtenida del archivo maestro con el sentido de proteger los datos en caso de que el maestro se deteriore. </li></ul><ul><li>Archivo Fuente : Contiene el código de algún lenguaje de programación que utiliza los datos para procesarlos en alguna solución para la empresa </li></ul><ul><li>Archivo de Transacciones: También es auxiliar en el proceso de Actualización del archivo maestro (siempre y cuando sea archivo Secuencial). </li></ul>
  10. 10. <ul><li>Archivos de Entrada ( input ): Son los archivos que “alimentan” un procesamiento de datos, o sea solo son leídos, ejemplo: El archivo de transacciones en el procesamiento de la actualización del maestro en la organización secuencial. </li></ul><ul><li>Archivos de Salida ( output ): son los archivos que solo son escritos, y son donde los datos de salida de un procesamiento son escritos. Ejemplo el archivo de transacciones rechazadas en la actualización del maestro en la organización secuencial. </li></ul><ul><li>Archivo de Entrada/Salida ( input/output ): Estos archivos son leídos y escritos en el procesamiento de datos, o sea proporcionan los datos de entrada al proceso y también los datos procesados son escritos en el mismo. Ejemplo los archivos directos implementados en dispositivos de acceso aleatorio, presentan esta característica. </li></ul>
  11. 11. <ul><li>Archivos Secuenciales : (datos en forma contigua, se puede guardar tanto cinta, como en discos magnéticos, impractico para el acceso directo de un dato) </li></ul><ul><li>Archivos Directos : Necesitan se guardados en dispositivos de acceso directo( disco, etc.) , el acceso directo a un  solo dato si puede ser efectuado. </li></ul><ul><li>Archivos Indexados : También se puede conseguir el acceso directo a un dato especifico sobre un archivo secuencial que es el de datos, aunque se requiere para hacerlo de un archivo auxiliar llamado índice. </li></ul><ul><li>Archivos Multillave : El acceso directo puede realizarse con características distintas de los datos, para hacerlo requiere de varios índices organizados en un archivo. </li></ul>
  12. 12. <ul><li>Creación : Esta operación hace “nacer” un archivo con los datos que son escritos por algún procesamiento. Existen dos formas: Cargado de registros y Creación de estructura(esqueleto) previa al guardado de datos. </li></ul><ul><li>Actualización : Es el procesamiento en el cual los registros pueden tener las siguientes modificaciones: baja o eliminación de registros de datos, modificación de registros de datos o Alta o agregación de registros. </li></ul><ul><li>Mantenimiento : Es el proceso que permite agregar, modificar o eliminar CAMPOS del archivo. Existen dos tipos de mantenimiento: </li></ul><ul><ul><li>Reorganización : cambiar la organización a otra. </li></ul></ul><ul><ul><li>Reestructuración : cambios con los tipos y/o tamaños de campos </li></ul></ul><ul><li>Recuperación : Es el acceso a un archivo con el propósito de extracción de información, si el volumen a extraer es bajo se dice que es una consulta y normalmente se despliega por pantalla, su modo de procesamiento es interactivo. Si el volumen es alto, es la generación de reportes, el modo de procesamiento </li></ul><ul><li>es en Lote. </li></ul>
  13. 13. <ul><li>Volatilidad : se refiere a las supresiones, adiciones y cambios que se efectúan en un periodo determinado. Cuando se acceda a un archivo varias veces en una jornada, se dice que tiene elevada volatilidad. Ejemplo: sistemas de reservación, bancos, etc. </li></ul><ul><li>Actividad : Es la medida de proporción de registros que se accedan en un lote de actualización. La proporción de actividad es igual al numero de registros procesados en un Lote, comparado con el numero de registros total del archivo. </li></ul><ul><li>Tamaño : Se refiere al espacio ocupado por el archivo en el medio de almacenamiento. Debe considerarse no solo la ocupación actual del archivo sino también la posibilidad de un crecimiento futuro. </li></ul>
  14. 14. <ul><li>Abrir : Esta operación permite tener acceso posteriormente a los registros de datos para acceder. </li></ul><ul><li>Cerrar : esta operación busca proteger los datos de los archivos a posibles accesos por error. </li></ul><ul><li>Leer registro : Esta operación de lectura lleva información (bloque de datos) del registro leído en el medio de almacenamiento a la memoria. </li></ul><ul><li>  Grabar registro : Esta operación lleva un ( bloque de datos ) registro de la memoria hasta el medio de almacenamiento. </li></ul><ul><li>Saltar al registro N : Esta operación lleva el puntero hasta un registro especifico ( N ). Solo para archivos organizados directos. </li></ul><ul><li>  Reinicio de apuntador : esta operación lleva el apuntador a hasta el inicio del archivo. </li></ul>
  15. 15. <ul><li>El registro es un tipo de dato estructurado  constituido por un conjunto de elementos (campos) que pueden ser de diferentes tipos de datos, ejemplo: </li></ul><ul><li>Registro: empleado </li></ul><ul><li>             Elementos del registro empleado:       Numero (Entero) </li></ul><ul><li>                                                                        Nombre (Cadena[30]) </li></ul><ul><li>                                                                        Departamento (Entero) </li></ul><ul><li>                                                                        Puesto (Entero) </li></ul><ul><li>                                                                        Sueldo (Real) </li></ul><ul><li>Definición de registros : </li></ul><ul><li>                        Declaraciones </li></ul><ul><li>                                    Variables </li></ul><ul><li>                                                NomRegistro: Registro </li></ul><ul><li>                                                            Dato1: Tipo de dato </li></ul><ul><li>                                                            Dato2: Tipo de dato </li></ul><ul><li>                                                            . </li></ul><ul><li>                                                            DatoN: Tipo de dato </li></ul><ul><li>                                                FinRegistro </li></ul>
  16. 16. <ul><li>Abrir archivo Escritura “X” </li></ul><ul><li>Leer datos A , B </li></ul><ul><li>DO </li></ul><ul><li>ESCRIBIR REGISTRO CON DATOS A Y B EN EL ARCHIVO            “X” </li></ul><ul><li>Leer datos A, B </li></ul><ul><li>WHILE A <> 0 </li></ul><ul><li>                        </li></ul><ul><li>El siguiente algoritmo permite agregar registro a un archivo previamente creado: </li></ul><ul><li>  </li></ul><ul><li>Abrir archivo Agregación “X” </li></ul><ul><li>Leer datos A , B </li></ul><ul><li>DO </li></ul><ul><li>AGREGAR REGISTRO CON DATOS A Y B EN EL ARCHIVO “X” </li></ul><ul><li>Leer datos A, B </li></ul><ul><li>WHILE A <> 0 </li></ul>
  17. 17. <ul><li>INICIO </li></ul><ul><li>Abrir el archivo para lectura X. </li></ul><ul><li>LEER REGISTRO DEL ARCHIVO. </li></ul><ul><li>WHILE no sea fin de archivo </li></ul><ul><li>            1. IF es una bandera de control </li></ul><ul><li>                        THEN </li></ul><ul><li>                                    A. Imprimir resumen  y pie de página </li></ul><ul><li>            2. ENDIF </li></ul><ul><li>            3. Imprimir detalle para este registro </li></ul><ul><li>            4. Acumular a totales </li></ul><ul><li>            5. Leer siguiente registro DEL ARCHIVO </li></ul><ul><li>ENDWHILE </li></ul><ul><li>Imprimir resumen y pie de página </li></ul><ul><li>Fin </li></ul>
  18. 18. <ul><li>Al estar utilizando un  archivo secuencial como MAESTRO, el realizar las operaciones de actualización se llevará con el auxilio de un archivo de transacciones, debido a que se realizará el proceso en lote para que sea mas eficiente. El proceso se muestra en la siguiente figura: </li></ul>Archivos Transacciones Modificado Archivo Maestro Nuevo Archivo Maestro Viejo Archivo Transacciones Rechazadas Actualización
  19. 19. <ul><li>Abrir archivo Lectura “X” </li></ul><ul><li>Colocar puntero al inicio del archivo </li></ul><ul><li>Solicitar Numero registro a buscar </li></ul><ul><li>Leer N </li></ul><ul><li>Mover puntero hasta registro N </li></ul><ul><li>IF existe Registro THEN </li></ul><ul><li>            Leer Registro Datos en el archivo en REG </li></ul><ul><li>            |Imprimir REG </li></ul><ul><li>else </li></ul><ul><li>            Imprimir “no se encontró el registro buscado” </li></ul><ul><li>endif </li></ul><ul><li>fin </li></ul>
  20. 20. <ul><li>La transmisión de información entre memoria primaria y secundaria se lleva a cabo a través de operaciones básicas de lectura y escritura de registros pero con unidades de tamaño fijo denominados lotes, de tal manera que se pueden definir de la siguiente manera: </li></ul><ul><li>Bloque:  Es la cantidad más pequeña de datos que puede ser transferida entre memoria secundaria y primaria en un acceso a un archivo. </li></ul>
  21. 21. <ul><li>Los datos son arreglados de acuerdo a alguna relación abstracta, esto es, depende de la aplicación requerida. El usuario siempre ve el archivo como una secuencia de registro continuo o elementos lógicos. </li></ul><ul><li>            Los registros pueden ser de longitud fija o longitud variable, los cuales pueden tener llave o no tenerla, los registros fijos son elementos lógicos del mismo tamaño, y los registros variables son elementos lógicos de diferentes tamaños. </li></ul><ul><li>            La longitud fija en el tamaño del campo produce un desperdicio de espacio, pero en cambio facilita la localización y extracción de la información en dicho campo, al no tener que preocuparse por su tamaño. </li></ul><ul><li>            </li></ul>
  22. 22. <ul><li>En el caso de longitud variable sucede al revés, hay un mejor aprovechamiento en espacio, pero se complica la localización y extracción de información. </li></ul><ul><li>·         Si el registro contiene un número fijo de campos de longitud fija cada uno de ellos, entonces será de longitud fija. </li></ul><ul><li>·         Si el registro contiene un número variable de campos de longitud fija cada uno de ellos, entonces será de longitud variable. </li></ul><ul><li>·         Si el registro contiene un número variable de campo en que alguno de ellos sea de longitud variable, entonces será de longitud variable. </li></ul>
  23. 23. <ul><li>Los datos son arreglados por su adyacencia física, esto es, dependiente del dispositivo de almacenamiento secundario; cintas magnéticas o discos magnéticos (discos flexibles, discos duros, paquete de disco, etc.). Los registros son de tamaño fijo o tamaño variable y pueden organizarse de varia formas para constituir archivos físicos. </li></ul>
  24. 24. <ul><li>En este dispositivo el archivo físico está formado por un conjunto de registros físicos, los bloques están organizados en forma contigua, ya que se asignan en forma consecutiva. </li></ul><ul><li>            La cinta magnética es uno de los medios más conocidos y menos caros de almacenar datos en sistemas de todos los tamaños. Este método de almacenamiento secundario de archivos tiene ventajas y desventajas específicas que se deben superar. </li></ul><ul><li>            Los datos se almacenan a lo largo de la superficie de la cinta en una densidad específica, medida en bytes/pulgada (bpi). La densidad estándar del registro se mide por el número de bpi. La densidad de los sistemas de red principal es de 1600 y 6250 bpi. </li></ul>
  25. 25. <ul><li>La densidad de registros de una unidad de cinta magnética es fija y no se puede alterar, pero muchos modelos tienen la opción de almacenar en dos tipos de densidad distintas. </li></ul><ul><li>  Los datos se leen o se miden en la cinta en bloques de registros físicos y solo cuando la cinta se mueve hacia delante, a través de la unidad de cinta, esta pasa por la cabeza de lectura y escritura de la unidad. La cinta, para y recomienza cuando el sistema le dice ala unidad cinta que lea el siguiente registro físico. </li></ul><ul><li>   Con el fin de permitir un espacio para que la unidad de cinta se detenga y recomience el movimiento de la cinta sin perder datos, se utiliza espacios entre los bloques para separar cada bloque. Un espacio entre los bloques (también llamado espacio entre los registros) es un longitud de cinta en blanco que mide 0.3 pulgadas. </li></ul>
  26. 26. <ul><li>Para hacer un mejor uso del espacio de almacenamiento, usualmente los analistas en sistemas reducen el número de los espacios necesarios entre los lotes mediante la creación de bloques. </li></ul><ul><li>            Cada registro físico, ya sea que contenga 1 byte de datos o una entidad mucho mayor, es precedido y seguido por un espacio entre los bloques. </li></ul><ul><li>La creación de bloques ocurre cuando el sistema almacena varios registros lógicos dentro de un único  registro físico. El número de registro en el bloque se llama factor de bloqueo. Si almacenar un archivo de registros médicos en una cinta magnética, el analista especifica un factor de 30, el sistema almacenará 30 registros lógicos dentro de cada bloque. </li></ul><ul><li>            Todos los bloques en un archivo de cinta magnética utilizan el mismo factor de bloqueo.  Así, si un bloque es registrado con un factor de 30, todos juntan en bloques de 30.un bloque puede ser tan grande como sea necesario, siempre que se pueda leer en la memoria principal aun tiempo. </li></ul><ul><li>            La longitud máxima de cualquier bloque esta determinada, por el </li></ul><ul><li>número que puede contener el buffer. </li></ul>
  27. 27. <ul><li>Los datos se escriben o se leen de los discos solo cuando esta girando dentro de la unidad de disco. La rotación del disco varía de aproximadamente 200 a varios miles de revoluciones por minuto, dependiendo del drive que se utilice </li></ul><ul><li>            Las cabezas de lectura y escritura detectan en forma electrónica los datos almacenados en la superficie del disco. Normalmente, las cabezas de lectura y escritura son parte del drive, sin embargo en los sistemas Winchester, las cabezas vienen sellados en el mismo paquete del disco para mejorar la velocidad de acceso. </li></ul><ul><li>            Los datos se almacenan en la superficie del disco en una o mas pistas, que son círculos concéntricos con una capacidad fija de almacenamiento medido en bytes con pista. Los disquetes pequeños tienen menos de 34 pistas por superficie, mientras que los grandes tienen varios cientos de pistas por superficie. Cada pista se identifica mediante un número (desde 0 en orden ascendente con movimientos de 1) y un número de superficie. </li></ul>
  28. 28. <ul><li>Las cabezas de lectura y escritura en un disco están instaladas juntos. </li></ul><ul><li>Las cabezas en cada superficie pueden accesar una sola pista en esa superficie. Por lo tanto, si existen 20 superficies en un paquete de disco, el sistema puede escribir o leer de cualquiera de las 20 pistas. Cuando el brazo de acceso se posiciona. Las pistas identificadas con el mismo número forman  lo que se conoce como un cilindro. </li></ul><ul><li>  Para accesar aun registro específico, el programa debe terminar y especificar el cilindro y superficie donde se encuentra el  registro. </li></ul><ul><li>Este concepto es un aspecto importante de los dos métodos de direccionamiento utilizadas en dispositivos de acceso directo: </li></ul><ul><li>Direccionamiento de pista y de sector. </li></ul>
  29. 29. <ul><li>La forma de direccionamiento de uso más común en la computadoras grandes utiliza el concepto de direccionamiento, pista /cilindro . </li></ul><ul><li>Punto Índice : La distribución general de una pista bajo el concepto de pista /cilindro , consiste de un punto índice, dirección inicial, registro descriptor de la pista y registro de datos. El punto índice señala el comienzo de una pista, todas las pistas del disco están sincronizadas con el punto índice. </li></ul><ul><li>Dirección Inicial : Durante la inicialización, el sistema escribe la dirección inicial y la pista. </li></ul><ul><li>            Si por alguna razón el sistema no se puede escribir una dirección inicial, el dispositivo no se puede utilizar. La dirección inicial consta de 4 datos. </li></ul><ul><li>·         El byte bandera indica si la pista es una pista primaria o alternativa. </li></ul><ul><li>·         El cilindro y más número de carga de lectura y escritura identifican juntos una pista específica en el disco, característica esencial para los métodos de direccionamiento directo y por hashing. </li></ul><ul><li>·         Los bytes de verificación son par la detección de errores. </li></ul>
  30. 30. <ul><li>Es el registro descriptor de la misma, el cual describe como se organizan los datos de la parte restante de la misma. Se incluyen nueve datos. Bytes bandera, número de cilindros, número de cabeza de lectura y escritura, se repiten en el registro descriptor. Ya  que en caso de que surja la necesidad, se puedan mover los datos de una pista primaria a una alternativa. </li></ul><ul><li>            El número de registro es el número secuencial del registro en la pista. </li></ul><ul><li>            Los números de cilindro, cabeza y registro conforman la identificación del registro, la cual distingue un registro en un disco de otro y, junto con los detalles de longitud de los datos, describe el área tomada en cuenta. </li></ul><ul><li>            El byte de longitud de la llave y los bytes de longitud de los datos describe la cantidad de espacio abarcado por cada registro. Los bytes de longitud de los datos son instrumentos para almacenar los registros de longitud variable, los bytes de verificación son para control de errores. </li></ul>
  31. 31. Regresar a Índice de Unidades

×