• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Slide della seconda lezione (24-2-2011)
 

Slide della seconda lezione (24-2-2011)

on

  • 646 views

Seconda lezione AA 2010-2011 Università degli Studi di Macerata - Facoltà di Giurisprudenza - Corso di "Sistemi di elaborazione delle informazioni"

Seconda lezione AA 2010-2011 Università degli Studi di Macerata - Facoltà di Giurisprudenza - Corso di "Sistemi di elaborazione delle informazioni"

Statistics

Views

Total Views
646
Views on SlideShare
646
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Slide della seconda lezione (24-2-2011) Slide della seconda lezione (24-2-2011) Presentation Transcript

    • SISTEMI DI ELABORAZIONE DELLE INFORMAZIONI Università degli Studi di Macerata Facoltà di Giurisprudenza “ LA RAPPRESENTAZIONE DIGITALE DELLE INFORMAZIONI” Lezione n. 2 Giovedì 24 febbraio 2011 Dott. PhD Luca Ricciotti A.A. 2010-2011 - secondo semestre
    • Sistemi di elaborazione delle informazioni Introduzione Il computer è in grado di elaborare e memorizzare solo informazioni di tipo binario, ovvero costituite da sequenze di bit (“ 0 ” ed “ 1 ”) Qualsiasi contenuto (documenti, immagini, audio, video etc.) deve quindi essere “convertito” in sequenze di bit per poter essere elaborato dal computer Esiste una relazione tra il numero di bit che si hanno a disopsizione e il numero di informazioni che si possono rappresentare con quei bit con 1 bit è possibile rappresentare 2 1 = 2 informazioni con 2 bit è possibile rappresentare 2 2 = 4 informazioni con 3 bit è possibile rappresentare 2 3 = 8 informazioni con 4 bit è possibile rappresentare 2 4 = 16 informazioni con 5 bit è possibile rappresentare 2 5 = 32 informazioni con 6 bit è possibile rappresentare 2 6 = 64 informazioni con 7 bit è possibile rappresentare 2 7 = 128 informazioni con 8 bit è possibile rappresentare 2 8 = 256 informazioni 2 bit informazione 1  “00” informazione 2  “01” informazione 3  “10” informazione 4  “11” 3 bit informazione 1  “000” informazione 2  “001” informazione 3  “010” informazione 4  “011” informazione 5  “100” informazione 6  “101” informazione 7  “110” informazione 8  “111” 1 bit informazione 1  “0” informazione 2  “1”
    • L’ordine di memorizzazione delle informazioni Le informazioni di dimensione superiore al byte (ad esempio, word , double word o quad word ) possono essere memorizzate all’interno della memoria centrale secondo due modalità che differiscono per l’ordine dei byte ( endianness ) Osservando il contenuto della memoria centrale con indirizzi crescenti da sinistra verso destra i byte vengono memorizzati nello stesso ordine Osservando il contenuto della memoria centrale con indirizzi crescenti da sinistra verso destra i byte vengono memorizzati nell’ordine inverso Sistemi di elaborazione delle informazioni Modalità “ big endian ” ( usata dai processori Motorola, IBM, SUN e sui protocolli internet ) La memorizzazione inizia dal byte più significativo (MSB, most significant byte ) per terminare con quello meno significativo (LSB, less significant byte ). Il più importante viene memorizzato nella cella di memoria con indirizzo più basso. Il meno importante viene memorizzanto nella cella di memoria con indirizzo più alto Modalità “ little endian ” ( usata dai processori Intel e sulle piattaforme Digital ) La memorizzazione inizia dal byte meno significativo (LSB, less significant byte ) per terminare con quello più significativo (MSB, most significant byte ). Il più importante viene memorizzato nella cella di memoria con indirizzo più alto. Il meno importante viene memorizzanto nella cella di memoria con indirizzo più basso
    • Segnale “ analogico ” e “ digitale ” Oggi viviamo in una società in cui tutti contenuti sono diventati digitali: dalle foto che scattiamo, alla musica che ascoltiamo, ai film che guardiamo, alle telefonate che facciamo, ai documenti che creiamo ormai sempre più solo in formato digitale ( born digital ) Sistemi di elaborazione delle informazioni Segnale analogico ( es. un’audiocassetta ) Un segnale è analogico quando varia con continuità nel tempo e quindi assume nel tempo tutti gli infiniti valori compresi tra il suo valore minimo ed il suo valore massimo Segnale digitale ( es. un CD audio ) Un segnale è digitale quando la variazione nel tempo avviene in modo discreto e quindi assume nel tempo solo due possibili valori: un valore “ basso ” che corrisponde a “0” ed un valore “ alto ” che corrisponde ad “1”, discriminati da un valore di soglia Copia di un segnale analogico Mai identica rispetto all’originale (nonostante l’impianto sia professionle) Degrado del contenuto audio (ogni volta che si fa una copia) Copia di un segnale digitale Quasi identica rispetto all’origina le ( nonostante il degrado ) ma sempre leggibile come “0” e “1” Replicabilità illimitata vantaggi
    • Rappresentazione “ digitale ” dei documenti di testo (1-4) I documenti di testo sono principalmente costituiti da caratteri; di conseguenza la loro rappresentazione all’interno del computer è strettamente legata a quella dei caratteri di cui sono composti Sistema di codifica dei caratteri ( charset ) (“ character encoding” codifica di carattere ) E’ un meccanismo che associa a ciascun carattere di un determinato repertorio ( character repertoire ) una determinata codifica (ad esempio, un numero naturale, una sequenza di bit , una combinazione di punti e linee, etc.) che ne costituisce la rappresentazione Ciascun carattere viene rappresentato come una sequenza di bit : l’associazione tra un carattere e la sequenza di bit che lo rappresenta viene stabilita da una dei diversi sistemi di codifica dei carattere in uso Sistemi di elaborazione delle informazioni Associazione tra carattere e codifica Fase 1 Gli elementi del repertorio di caratteri vengono associati a dei numeri interi non negativi detti punti di codice ( code point ) Associazione tra carattere e codifica Fase 2 attraverso la codifica di carattere ( character encoding ) a ciascun punto di codice è associata una determinata codifica
    • Rappresentazione “ digitale ” dei documenti di testo (2-4) I code point da 0 a 31 (venivano utilizzati in passato per le telescriventi e le stampanti ) e code point 127 (comando di eliminazione) - sono caratteri non stampabili e sono denominati codici di controllo I code point dal 32 al 126 sono caratteri stampabili In totale i caratteri ASCII stampabili sono 95 . Il sistema di posta elettronica e il sistema dei nomi di dominio ( Domain Name System , DNS), si basano ancor oggi sulla codifica ASCII standard. Per questo motivo non sono possibili indirizzi di posta elettronica né nomi di dominio contenenti lettere accentate (es. www.università.it) Sistemi di elaborazione delle informazioni i n f o r m a t i c a 1101001 1101110 1100110 1101111 1110010 1101101 1100001 1110100 1101001 1100011 1100001
    • Rappresentazione “ digitale ” dei documenti di testo (3-4) Sistemi di elaborazione delle informazioni Estensioni proprietarie e “ codepage ” (Introdotti nei mini-computer e mainframe delle università) IBM introdusse dei codici ASCII estesi (a 8 bit – 256 caratteri) chiamandoli set di caratteri code page (CP) e diversificandoli con numeri. Ricordiamo: il CP 437 utilizzato nei primi PC IBM e nel sistema op. MS-DOS il CP 850 utilizzato per le lingue europee occidentali il CP 1252 utilizzato di default dal sistema op. Windows Codifiche ISO/IEC 8859 L’ISO ha sviluppato anch’essa una famiglia di codifiche (a 8 bit – 256 caratteri) di carattere ASCII estese denominata ISO 8859. I primi 128 caratteri corrispondono a quelli dell’ASCII standard (ISO 646); gli altri 128 variano in base alla sottocodifica dell’8859 utilizzata. Lo standard non è quindi unico ma è suddiviso in più parti separate (ISO/IEC 8859-1, ISO/IEC 8859-2, etc.), ognuna delle quali può informalmente essere pensata come uno standard autonomo. I code point da 128 a 159 sono caratteri di controllo I code point da 160 a 255 sono caratteri addizionali - ISO 8859-1 Latin-1 Western European - ISO 8859-2 Latin-2 Central European - ISO 8859-3 Latin-3 South European - ISO 8859-4 Latin-4 North European - ISO 8859-5 Latin/Cyrillic - ISO 8859-6 Latin/Arabic - ISO 8859-7 Latin/Greek - ISO 8859-8 Latin/Hebrew - ISO 8859-9 Latin-5 Turkish - ISO 8859-10 Latin-6 Nordic (riarrangiamento dell’8859-4) - ISO 8859-11 Latin/Thai - ISO 8859-12 Latin/Devanagari (abbandonato) - ISO 8859-13 Latin-7 Baltic Rim - ISO 8859-14 Latin-8 Celtic - ISO 8859-15 Latin-9 (revisione dell’8859-1) - ISO 8859-16 Latin-10 South-Eastern European
    • Rappresentazione “ digitale ” dei documenti di testo (4-4) Sistemi di elaborazione delle informazioni I primi 256 code point di Unicode coincidono con quelli dell’ISO-8859-1 e, pertanto, è assicurata una piena compatibilità sia con tale sistema di codifica dei caratteri che con la codifica ASCII standard Unicode prevede un totale di 1.114.112 code point (17 “piani” composti ciascuno da 2 16 code point ) dei quali fino ad oggi ne sono stati assegnati circa 100.000
    • Rappresentazione “ digitale ” delle immagini (1-3) I formati per le immagini possono essere classificati sulla base della tecnologia utilizzata per rappresentare l’immagine stessa. Tre sono le principali categorie di formati: bitmap , vettoriali e ibridi Formati di tipo ibrido Combinano i dati vettoriali e raster in un’unica immagine, consentendo di combinare i vantaggi sia dell’una che dell’altra tipologia di formato Sistemi di elaborazione delle informazioni Formati di tipo vector Gli elementi che costituiscono le immagini vengono descritti mediante figure geometriche quali punti, linee e curve; tali figure geometriche sono definite attraverso formule matematiche che contengono tutte le istruzioni necessarie per tracciarle. ( es. per un segmento vengono memorizzate solo le coordinate del punto iniziale e di quello finale, per un cerchio solo le coordinate del centro e la lunghezza del raggio ). La grafica vettoriale è orientata agli oggetti (ogni oggetto è composto da singoli elementi ognuno con le sue proprietà). Le immagini vettoriali sono scalabili (indipendenti dalla risoluzione) Formati di tipo bitmap Le immagini di tipo bitmap (o raster ) organizzano le informazioni in una griglia rettangolare ( raster ) di pixel (contrazione dei termini picture ed element ), ciascuno dei quali è rappresentato con un certo numero di bit a seconda dello spazio dei colori che si intende utilizzare (bianco e nero, scala di grigi, colori a 16 bit , colori a 24 bit , etc.). I pixel sono dei veri e propri elementi delle immagini e vengono disposti e colorati in modo da creare un motivo
    • Rappresentazione “ digitale ” delle immagini (2-3) Sistemi di elaborazione delle informazioni Immagine bitmap in bianco e nero ( 1 bit ) 000000 011110 010010 011110 000000 Profondità del colore Si intende Il numero di bit che viene utilizzato per rappresentare il colore di ciascun pixel . S i misura in bit per pixel ( bpp ). Aumentando la profondità del colore aumenta la qualità dell’immagine. - 1 bpp, corrispondente a 2 1 = 2 colori (bianco e nero); - 3 bpp, corrispondente a 2 3 = 8 colori (scala di grigi a 8 livelli); - 4 bpp, corrispondente a 2 4 = 16 colori (scala di grigi a 16 livelli o 16 colori); - 8 bpp, corrispondente a 2 8 = 256 colori (scala di grigi a 256 livelli o 256 colori); - 16 bpp, corrispondente a 2 16 colori = 65.536 colori ( highcolor ); - 24 bpp, corrispondente a 2 24 = 16.777.216 colori ( truecolor , circa 16 milioni di colori); - 32 bpp, corrispondente a 2 32 = 4.294.967.296 (circa 4 miliardi di sfumature diverse); - 48 bpp, corrispondente a 2 48 = 281.474.976.710.656 colori.
    • Rappresentazione “ digitale ” delle immagini (3-3) Sistemi di elaborazione delle informazioni Esempio di fotografia digitale a 8 Mpixel con profondità di colore a 24 bit (16 milioni di colori) d file = 3264 × 2448 × 24 bit = 3264 × 2448 × 3 byte = 23.970.816 byte = 22,86 MiB Dimensione del file di immagine bitmap d file =dimensione in pixel × profondità di colore
    • Rappresentazione “ digitale ” dei contenuti video Un contenuto video può essere considerato come una sequenza di immagini statiche, chiamate fotogrammi o frame , visualizzate in rapida successione. Il numero di frame al secondo viene detto frame rate ed è misurato in fps ( frame per second ); tale numero è variabile, ma si è visto che per ottenere la sensazione di un movimento fluido non si può scendere al di sotto dei 25 fps. Il sistema PAL (utilizzato in Italia) prevede un frame rate di 25 fps. Il sistema NTSC (utilizzato in USA e Giappone) prevede un frame rate di 30 fps. Sistemi di elaborazione delle informazioni Esempio di video a 352 x 240 con profondità di colore a 24 bit (16 milioni di colori) della durata di 1 ora con sistema PAL d file = 352 × 240 × 24 bit = 352 × 240 × 3 byte = 247,5 KiB (1 frame) d = 247,5 KiB × 25 B = 6,04 MiB (1 secondo) d = 6,04 MiB × 3600 B = 21,24 GiB (1 ora) Dimensione minima di un file video d file =dimensione del singolo fotogramma × profondità di colore × frame rate × durata del video MPEG2, MPEG4, DIVX, XVID, MKV etc.
    • Rappresentazione “ digitale ” dei contenuti audio (1-3) All’interno del computer i contenuti audio vengono rappresentati in formato digitale, ovvero come sequenze di bit. la trasformazione di un segnale audio analogico in digitale ( digitalizzazione ) viene effettuata attraverso le due operazioni di campionamento e quantizzazione (o discretizzazione ). Queste due operazioni vengono realizzate da un dispositivo denominato convertitore analogico digitale ( Analogue to Digital Converter, ADC ) o campionatore . Sistemi di elaborazione delle informazioni Processo di conversione analogico digitale Il convertitore “ scompone ” il segnale audio in molti pezzettini (i campioni ) e ad ognuno viene attribuito un valore formato da una sequenza di bit . Tutti i bit sono immagazzinati su un supporto (es. CD) dal quale può essere fatto poi il processo inverso denominato playback (il segnale digitale viene riconvertito in analogico mediante un convertitore digitale-analogico (Digital to Analogue Converter, DAC)
    • Rappresentazione “ digitale ” dei contenuti audio (2-3) Sistemi di elaborazione delle informazioni Quantizzazione La quantizzazione è il procedimento di conversione di un valore analogico (infinitamente preciso) in un valore digitale (finitamente preciso), ovvero in una sequenza di bit . Il numero di bit che viene utilizzato per rappresentare ciascun campione viene definito risoluzione o profondità di suono e si misura in bit per campione ( bpc ); essa determina l’accuratezza con quale è effettuata ciascuna misurazione o campione. Campionamento Permette di trasformare un segnale audio analogico tempo-continuo nel corrispondente segnale tempo-discreto . Questa fase consiste nel misurare o “ campionare ” il segnale analogico (che è di tipo tempo-continuo ) ad istanti di tempo prefissati (generalmente equidistanziati) in modo da ottenere un segnale di tipo tempo-discreto che assume lo stesso valore di quello originale nei punti di campionamento. Se il convertitore (ADC) mette a disposizione una risoluzione di 3 bit avremo a disposizione 2 3 = 8 possibili configurazioni binarie (da 000 a 111) per rappresentare tutti i possibili livelli del segnale da digitalizzare. In questo modo si ottengono pochissimi valori per un segnale che, invece, potrebbe possedere moltissime possibilità di variazione dinamica. Più aumentano i bit a disposizione e maggiore è la qualità audio. Con 16 bit (molto in uso) si hanno 65.536 diversi livelli (2 16 ). Il numero di volte che il segnale analogico è misurato (o “campionato”) in un secondo è denominato frequenza di campionamento ( sample rate ): essa indica il numero di campioni per secondo ed è tipicamente misurata in Hertz (Hz, migliaia di cicli per secondo). È evidente che all’aumentare della frequenza di campionamento si ottiene una migliore approssimazione del segnale in ingresso.
    • Rappresentazione “ digitale ” dei contenuti audio (3-3) Esempio di registrazione audio digitale (mono) di 1 minuto, con frequenza di 8 kHz e risoluzione pari a 8 bit/campione d file = 8000 × 8 × 1 × 60 = 3.840.000 bit = 480.000 byte = 468,75 KiB Dimensione del file audio d file = frequenza di campionamento × risoluzione × numero dei canali × durata Bitrate (velocità del flusso di bit ) E’ il numero di bit utilizzati nella codifica di un secondo di audio. E’ un parametro che fornisce una stima della qualità audio digitale. È dato dal prodotto dei tre elementi frequenza di campionamento , risoluzione e numero di canali ed è espresso in bit per secondo ( bps ). WAVE E’ il formato dei file audio prodotti mediante i processi di campionamento e discretizzazione Sistemi di elaborazione delle informazioni Frequenza di campionamento Risoluzione Numero di canali Qualità CD 44.100 Hz 16 bit stereo Qualità radio 22.050 Hz 16 bit mono Qualità telefono 11.025 Hz 16 bit mono
    • “ LA RAPPRESENTAZIONE DIGITALE DELLE INFORMAZIONI” Lezione n. 2 Giovedì 24 febbraio 2011 [email_address] Dott. PhD Luca Ricciotti A.A. 2010-2011 - secondo semestre