SlideShare a Scribd company logo
1 of 122
Download to read offline
CARRERA PROFESIONAL DE INGENIERIA TELEINFORMATICA
Diseño e implementación de un
transmisor de datos para el sistema de
autentificación de trabajadores de la
estación televisiva Canal 51 - Chiclayo
INFORME DE INVESTIGACION
AUTORES:
CABRERA MONTALVO, KATHERINE
LIMONCHI CORONEL, CARLOS
MARTOS PAREDES, ROGGER ANDERSON
SANDOVAL VALLE, CRISTIAN JEAN PIERO
VERASTEGUI JIMENEZ, MANUEL ENOC
ASESOR:
PACHAMANGO BAUTISTA, THAUSO GAD
Ciclo Académico:
8vo – 2013 II
Diciembre de 2013
ÍNDICE
ASPECTO INFORMATIVO ................................................................................................6
1. Título de la Investigación .........................................................................................6
2. Autores ......................................................................................................................6
3. Asesor........................................................................................................................6
4. Área de investigación. ..............................................................................................6
5. Línea de investigación...............................................................................................6
6. Resolución De Aprobación........................................................................................6
7. Lugar de ejecución....................................................................................................6
8. Duración Total de la Investigación............................................................................7
9. Fecha de inicio...........................................................................................................7
10. Fecha de culminación. ............................................................................................7
CAPITULO I MARCO LÓGICO ........................................................................................7
1.1 Descripción de la Realidad Problemática ...............................................................7
1.2 Formulación del problema de Investigación...........................................................8
1.3 Objeto de la Investigación ......................................................................................8
1.4 Objetivos de la Investigación..................................................................................8
1.4.1. Objetivo General..............................................................................................8
1.4.2. Objetivos Específicos. .....................................................................................9
1.5 Justificación e Importancia de la Investigación......................................................9
1.6 Base teórica- conceptual. ........................................................................................9
1.6.1. Antecedentes de investigación. .......................................................................9
1.6.2. Aspectos teórico- conceptuales. ....................................................................10
1.6.2.1. AUTOMATIZACIÓN Y SISTEMAS DE ACCESO ............................10
1.6.2.2. LA AUTOMATIZACIÓN EN LA INDUSTRIA..................................10
1.6.2.3. SISTEMAS DE ACCESO PARA PUERTAS.......................................13
1.6.2.4. LCD (PANTALLA DE CRISTAL LÍQUIDO) .....................................15
1.6.2.5. TECLADO MATRICIAL 4X4 ..............................................................19
1.6.2.6. EL MICROCONTROLADOR PIC 16F877A .......................................20
1.6.2.7. COMUNICACIÓN SERIAL .................................................................33
1.6.2.8. MODULOS RF ......................................................................................34
1.6.2.9. CONSTRUCCIÓN DEL SISTEMA......................................................35
1.7 Planteamiento de la Hipótesis...............................................................................71
1.8 Definición operacional de las variables................................................................72
1.9 Operacionalización de las variables......................................................................72
CAPITULO II MARCO METODOLÓGICO.....................................................................72
2.1 Tipo de Investigación............................................................................................72
2.2 Diseño o trayectoria metodológica. ......................................................................72
2.3 Población y muestra.............................................................................................73
2.4 Técnicas e instrumentos de recolección de datos. ................................................73
2.5 Métodos de procesamiento de los datos. ..............................................................74
2.6 Aspectos éticos. ....................................................................................................74
2.7 Criterios de cientificidad.......................................................................................74
CAPITULO III RESULTADOS .........................................................................................74
CAPITULO IV DISCUSÍÓN..............................................................................................85
CAPITULO V CONCLUSIONES......................................................................................85
CAPITULO VI RECOMENDACIONES ...........................................................................86
REFERENCIAS BIBLIOGRÁFICAS ................................................................................88
ANEXO A ...........................................................................................................................89
HOJAS DEL PROGRAMA DETALLADO DEL MICROCONTROLADOR (MikroC
PRO)................................................................................................................................89
ANEXOS B .........................................................................................................................93
ANEXO D ...........................................................................................................................95
Esquemático Circuito PIC con Pantalla LCD..................................................................95
Esquemático Circuito PIC con Puerto Serial...................................................................95
Modulo Transmisor RF ...................................................................................................96
ANEXO E............................................................................................................................97
LISTADOS DE PROGRAMAS......................................................................................97
ANEXO F..........................................................................................................................122
PROGRAMACION DEL PIC 16F628A - TRANSMISOR .........................................122
RESUMEN
En el presente informe se detalla el funcionamiento, proceso de construcción y los
resultados obtenidos de un transmisor para el sistema de autentificación de
personal para la Estación televisiva Canal 51, dado que la empresa se ve en la
necesidad de encontrar una manera en los visitantes sean identificados y
accedan automáticamente solo el personal autorizado.
Consta de una interfaz de usuario compuesta por una pantalla LCD, un teclado
4x4 manejados por un micro controlador PIC y un micrófono y parlante
conectados a un DSP (Dispositivo procesador de señales) que en este caso
usamos la tarjeta de sonido de una pc. Para lograr la comunicación entre la
interfaz de usuario y el DSP se utiliza un puerto de comunicación serial y ambas
etapas funcionando a través de comandos del programa MATLAB.
Luego de las pruebas con el prototipo concluimos que el sistema procesa los
datos correctamente y cumple con los objetivos propuestos.
ABSTRACT
This report describes the operation, construction process and the results obtained
from the transmitter to the workers authentication system for the television station
“Canal 51”, as the company is in the need to find a way to automatically identify
visitors and only allow entry to authorized personnel.
It has a user interface consists of a LCD display, one 4x4 keypad operated by a
PIC microcontroller and a microphone and speaker connected to a SPD (signal
processor device) in this case we use the sound card of a PC. To achieve
communication between the user interface and the SPD we use a serial port
communication and both stages run through MATLAB commands.
After testing the prototype, we conclude the data processing is correct and satisfy
the objectives.
ASPECTO INFORMATIVO
1. Título de la Investigación
Diseño e implementación de un transmisor de datos para el sistema de
autentificación de trabajadores de la estación televisiva Canal 51 –
Chiclayo567
2. Autores
 Cabrera Montalvo, Katherine
vicm_2402@hotmail.com
 Limonchi Coronel, Carlos
calico.200594@hotmail.com
 Martos Paredes, Rogger Anderson
roanmar_15@hotmail.com
 Sandoval Valle, Piero
piero_mio_1@hotmail.com
 Verastegui Jimenez, Manuel Enoc
manuel_10_84@hotmail.com
3. Asesor
Ing. Thauso G. Pachamango Bautista
4. Área de investigación.
Procesamiento digital de Señales
5. Línea de investigación.
Algoritmos adaptativos
6. Resolución De Aprobación
Oficio N° 013-DICIA-UMB-2013
7. Lugar de ejecución.
Chiclayo
8. Duración Total de la Investigación
4 meses
9. Fecha de inicio.
Agosto 2013
10. Fecha de culminación.
Diciembre 2013
CAPITULO I MARCO LÓGICO
1.1 Descripción de la Realidad Problemática
El presente trabajo de investigación se encuentra en la intersección de
dos disciplinas de la ingeniería, la automatización y el procesamiento
de señales. La automatización se basa en sistemas de control,
instrumentación industrial e instrumentos computarizados que incluyen
sensores, transmisores, sistemas de control y supervisión, Circuitos
integrados Programables (PIC).
El procesamiento digital de señales es la manipulación matemática de
una señal de información para modificarla, procesarla o mejorarla en
algún sentido. Esto se puede conseguir mediante procesadores o
microprocesadores que poseen una secuencia de instrucciones, un
hardware como interfaz para la recolección de señales y un software
optimizado para aplicaciones que requieran operaciones numéricas a
muy alta velocidad, en este caso se usara MATLAB.
Los PIC’s fueron creados por Microchip en la década de 1980 y sus
aplicaciones fueron casi ilimitadas, usando un entorno de programación
se lograba controlar procesos a través de dispositivos de entrada y
salida.
En la actualidad, los PIC’s cumplen roles muy importantes dentro del
procesamiento digital de señales, conforman la etapa que controla
dispositivos como pantallas alfanuméricas LCD, control de teclados,
control de memorias seriales, control de temperatura, control de robots,
televisores, interfaz de PC, dispositivos de audio, sistemas de alarma,
relojes digitales, control de acceso y debido a su versatilidad se
vuelven indispensables en el desarrollo de proyectos a menor y gran
escala.
En nuestro país, como en muchos de Latinoamérica estos dispositivos
cumplen un rol didáctico en conjunto con PLC (Control Lógico
Programable), el cual es un dispositivo de control a nivel industrial y
cumplen funciones complementarias dentro de un sistema de
automatización de procesos. Los cuales no se ven aplicados en
proyectos ambiciosos, las empresas privadas usan este tipo de
tecnología transparente a los usuarios y esto conlleva a un gasto
elevado para obtener estos sistemas de control.
En el presente proyecto se desarrollara un sistema de control de
acceso usando PIC, dispositivos de comunicación digital y software de
procesamiento de señales para la autenticación de trabajadores de la
estación televisiva Canal 51.
1.2 Formulación del problema de Investigación
¿El diseño e implementación de un transmisor de datos gestionara la
autentificación de trabajadores de la estación televisiva canal 51 de
Chiclayo?
1.3 Objeto de la Investigación
La necesidad por parte de la empresa de un sistema de autentificación
eficiente que controle el ingreso de personal automáticamente.
1.4 Objetivos de la Investigación
1.4.1. Objetivo General.
Diseñar e implementar un transmisor de datos para el sistema de
autentificación de trabajadores de la estación televisiva Canal 51 de
Chiclayo.
1.4.2. Objetivos Específicos.
 Analizar los requerimientos del sistema de autentificación de
trabajadores de la estación televisiva canal 51
 Diseñar un transmisor para el sistema de autentificación.
 Implementar un transmisor para el sistema de autenticación.
 Realizar las pruebas de operatividad y eficiencia del transmisor.
1.5 Justificación e Importancia de la Investigación.
Debido al ritmo de trabajo que posee la empresa y la falta de personal
que supervise la llegada de visitantes y otros empleados el personal,
se propone como solución la implementación de un sistema de
autentificación de trabajadores y visitantes en general que permita dar
acceso al personal autorizado y lo niegue a toda persona externa a la
empresa, sin interrumpir las labores del personal de turno.
La importancia de este sistema radica en el control de entrada del
público, ahorro de costos de personal, mejoramiento de la
productividad del personal, gestionar la apertura de puertas y
proporcionar un valor agregado de modernización.
1.6 Base teórica- conceptual.
1.6.1. Antecedentes de investigación.
No se encontró información competente para proporcionar un registro
de documentación que ayude en la creación de un Transmisor de
datos para sistemas de identificación.
Sin embargo, existen empresas privadas de seguridad que brindan
dispositivos de validación de contraseñas para restringir el ingreso de
personal de las empresas clientes; a diferencia del presente sistema
propuesto que además de procesar contraseñas de trabajadores,
posee un segundo nivel de procesamiento de voz.
1.6.2. Aspectos teórico- conceptuales.
1.6.2.1. AUTOMATIZACIÓN Y SISTEMAS DE ACCESO
La automatización es un sistema de fabricación diseñado con el
fin de usar la capacidad de las máquinas para llevar a cabo
determinadas tareas anteriormente efectuadas por seres humanos, y
para controlar la secuencia de las operaciones sin intervención
humana. El término automatización también se ha utilizado para
describir sistemas no destinados a la fabricación en los que
dispositivos programados o automáticos pueden funcionar de
forma independiente o semiindependiente del control humano.
En comunicaciones, aviación y astronáutica, dispositivos como
los equipos automáticos de conmutación telefónica, los pilotos
automáticos y los sistemas automatizados de guía y control se
utilizan para efectuar diversas tareas con más rapidez o mejor de lo
que podría hacerlo un ser humano.
1.6.2.2. LA AUTOMATIZACIÓN EN LA INDUSTRIA.
Muchas industrias están muy automatizadas, o bien
utilizan tecnología de automatización en alguna etapa de
sus actividades. En las comunicaciones, y sobre todo en
el sector telefónico, la marcación, la transmisión y la
facturación se realizan automáticamente. También los
ferrocarriles están controlados por dispositivos de
señalización automáticos, que disponen de sensores para
detectar los convoyes que atraviesan determinado punto. De
esta manera siempre puede mantenerse un control sobre el
movimiento y ubicación de los trenes.
No todas las industrias requieren el mismo grado de
automatización. La agricultura, las ventas y algunos sectores
de servicios son difíciles de automatizar.
Es posible que la agricultura llegue a estar más
mecanizada, sobre todo en el procesamiento y envasado
de productos alimenticios. Sin embargo, en muchos
sectores de servicios, como los supermercados, las cajas
pueden llegar a automatizarse, pero sigue siendo
necesario reponer manualmente los productos en las
estanterías.
El concepto de automatización está evolucionando
rápidamente, en parte debido al desarrollo tecnológico y a
que las técnicas avanzan tanto dentro de una instalación
o sector como entre las industrias.
Por ejemplo, el sector petroquímico ha desarrollado el método
de flujo continuo de producción, posible debido a la
naturaleza de las materias primas utilizadas. En
una refinería, el petróleo crudo entra por un punto y
fluye por los conductos a través de dispositivos de
destilación y reacción, a medida que va siendo procesado
para obtener productos como la gasolina. Un conjunto de
dispositivos controlados automáticamente, dirigidos por
microprocesadores y controlados por una computadora
central, controla las válvulas, calderas y demás equipos,
regulando así el flujo y las velocidades de reacción.
Por otra parte, en las industrias metalúrgicas, de bebidas
y de alimentos envasados, algunos productos se elaboran
por lotes. Por ejemplo, se carga un horno de acero con los
ingredientes necesarios, se calienta y se produce un lote de
lingotes de acero. En esta fase, el contenido de
automatización es mínimo. Sin embargo, a continuación los
lingotes pueden procesarse automáticamente como
láminas o dándoles determinadas formas estructurales
mediante una serie de rodillos hasta alcanzar la
configuración deseada.
Los sectores de automoción y de otros productos de consumo
utilizan las técnicas de producción masivas de la fabricación
y montaje paso a paso. Esta técnica se aproxima al
concepto de flujo continuo, aunque incluye máquinas de
transferencia. Por consiguiente, desde el punto de vista
de la industria del automóvil, las máquinas de
transferencia son esenciales para la definición de la
automatización.
Cada una de estas industrias utiliza máquinas automatizadas
en la totalidad o en parte de sus procesos de fabricación,
como se puede apreciar en la figura 1.1.
Como resultado, cada sector tiene un concepto de
automatización adaptado a sus necesidades específicas.
En casi todas las fases del comercio pueden hallarse
más ejemplos. La propagación de la automatización y su
influencia sobre la vida cotidiana constituye la base de la
preocupación expresada por muchos acerca de las
consecuencias de la automatización sobre la sociedad y el
individuo.
Figura 2.1: Automatización
1.6.2.3. SISTEMAS DE ACCESO PARA PUERTAS
Un sistema de control de acceso físico para puertas
involucra hardware y software. Consiste en implementar
algún mecanismo electrónico mecánico que identifique si la
persona que quiere entrar está autorizada y en base a ello
otorgar acceso a alguna dependencia (permitir ingreso).
Características de los sistemas de control de acceso:
Control dependiendo de horarios y perfiles de
acceso. Por ejemplo puede crear un perfil de
"empleado de aseo" el cual puede hacer ingreso a
sus dependencias en cierto horario, mientras que el
perfil de usuario "ejecutivos administrativos" puede
hacerlo en otro. Esto permite que un empleado del
aseo no pueda tener acceso a una puerta de un área
restringida en otro horario que no sea el que se le
asignó en el sistema de control de acceso. En el
anexo C, se tiene un artículo que hace referencia acerca
de la seguridad.
Diversos tipos de puertas o portones. Se puede instalar
los equipos de control de acceso en puertas o portones
de todo tipo (puertas de vidrio, puertas de madera,
puertas de aluminio, rejas, etc.)
Variados tipos de mecanismos de cierre. Puede instalar
cerraduras eléctricas, cerraduras magnéticas, con pivotes,
etc.)
Variados tipos de identificación. Los sistemas de
control de acceso pueden funcionar con variados tipos
de tecnología (tarjetas HID, tarjetas con código de
barras, equipos biométricos, tarjetas de banda
magnética, teclados, botoneras).
Software de control y gestión. Los equipos pueden
contar con el software asociado que permite hacer
gestión sobre los accesos controlados, permitiendo
mediante software habilitar o deshabitar usuarios,
además de poder hacer una gestión posterior en base a
las marcas de acceso (fecha y hora).
Exportación de los datos. Las marcas de acceso
por las puertas se pueden exportar a MS Excel, dbf, MS
Access o txt.
 Control remoto. Es posible abrir puertas desde el software
(también abrir puertas desde el computador).
Todos estos equipos le darán mayor seguridad y
control en áreas restringidas.
Podemos tener equipos de identificación de personal
basados en:
 Identificación de huella digital (biometría),
 Tarjetas de código de barras,
 Tarjetas de banda magnética,
 Tarjetas de proximidad HID,
 Tarjetas de proximidad Mifare,
 Tarjetas de proximidad INDALA,
 Teclado para ingresar número de usuario y
contraseña,
Además podemos acompañar su control de acceso
con:
 Detectores de metales,
 Retenedores electromagnéticos,
 Cerraduras electromagnéticas, pivotes
 Teclados para acceso,
 Lectoras de huella dactilar,
 Botones para activación de puertas,
 Verificador de rutina para vigilantes,
Algunos de los sistemas de control desarrollados en la
actualidad se muestran en la figuras 2.2 a, 2.2 b:
a)
Figura 2.2 a: Control de acceso para puertas
b)
Figura 2.2 b: Control de acceso
1.6.2.4. LCD (PANTALLA DE CRISTAL LÍQUIDO)
La pantalla de cristal líquido es uno de los visualizadores
más utilizados en la actualidad debido a las importantes
ventajas que ofrece, por ejemplo permiten mostrar mensajes
que indican al operario el estado de la máquina, o para dar
instrucciones de manejo, mostrar valores, etc.
Es decir que permite la comunicación entre máquinas y
humanos, ya que los mensajes que se visualizan en la
pantalla del LCD pueden mostrar cualquier código ASCII,
introduciendo el código correspondiente de cada uno de los
caracteres a visualizar.
En el mercado existen varias presentaciones por ejemplo de
2 líneas por 8 caracteres, 2X16, 2X20, 4X20, etc. A pesar
de que la variedad de modelos del LCD es muy grande, las
líneas necesarias para su conexión y control son
prácticamente las mismas.
Para la visualización del proyecto se utiliza un LCD 2X16 como se
muestra en la figura 2.3 y a continuación se indica sus aspectos
más relevantes.
Figura 2.3: LCD 2X16
a) DESCRIPCIÓN DEL LCD:
La pantalla LCD (Liquid Crystal Display) es un
dispositivo microcontrolador de visualización grafico para
la presentación de caracteres, símbolos o incluso
dibujos, en este caso disponen de 2 filas de 16
caracteres cada una y cada carácter dispone de una
matriz de 5x7 puntos (pixels), aunque los hay de otro
número de filas y caracteres.
Este dispositivo está gobernado internamente por un
microcontrolador Hitachi 44780 y regula todos los
parámetros de presentación, este modelo es el más
comúnmente utilizado.
b) DESCRIPCIÓN DE PINES
En la Figura tabla 2.4: Se puede visualizar la distribución de
pines del LCD 2x16, y en la tabla 2.1 La función que cumple
cada pin.
Figura 2.4: Distribuciones de pines
T
a
b
l
a
Tabla 2.1: Función de cada pin del L
PIN SIMBOLO DESCRIPCIÓN
1 VSS Tierra de alimentación GND
2 Vdd Alimentación de +5V
3 Vo Ajuste del contraste del cristal líquido (0 a +5V)
4 RS Selección del Registro controlados RS=0 reg. Control
RS=1
5 R/W Lectura /Escritura en LCD R/W=0 escritura R/W=1
6 E Habilitación
7 D0 Bit menos significativo (bus de datos bidireccional)
8 D1
9 D2
10 D3
11 D4
12 D5
13 D6
14 D7 Bit más significativo (bus de datos bidireccional)
Características principales
 Pantalla de caracteres ASCII.
 Desplazamiento de los caracteres hacia la izquierda o la
derecha.
 Proporciona la dirección de la posición absoluta o
relativa del carácter.
 Memoria de 40 caracteres por línea de pantalla.
 Movimiento del cursor y cambio de su aspecto.
 Permite que el usuario pueda programar 8 caracteres.
 Conexión a un procesador usando un interfaz de 4 u 8
bits.
Funcionamiento
Para comunicarse con la pantalla LCD podemos hacerlo por
medio de sus pines de entrada de dos maneras posibles,
con bus de 4 bits o con bus de 8 bits, estos dos se
diferencian en el tiempo de retardo, pues la comunicación a
4 bits, primero envía los 4 bits más altos y luego los 4 bits
más bajos, mientras que la de 8 bits envía todo al mismo
tiempo, esto no es un inconveniente si consideramos que el
LCD trabaja en microsegundos (µs).
Para la aplicación del proyecto se utiliza la conexión de 4
bits más altos de LCD, con esto es suficiente para enviar los
mensajes.
c) COMPONENTES:
 Pantalla de cristal líquido Twisted Nematic (TN).
 Film de filtro vertical para polarizar la luz que entra.
 Substrato de vidrio con electrodos de Óxido de Indio
ITO. Las formas de los electrodos determinan las
formas negras que aparecen cuando la pantalla se
enciende y apaga. Los cantos verticales de la superficie son
suaves.
 Cristales líquidos "Twisted Nematic" (TN).
 Substrato de vidrio con film electrodo común (ITO) con
los cantos horizontales para alinearse con el filtro
horizontal.
 Film de filtro horizontal para bloquear/permitir el paso de luz.
 Superficie reflectante para enviar devolver la luz al
espectador. En un LCD retroiluminado, esta capa es
reemplazada por una fuente luminosa.
Figura 2.5: se aprecian las capas de cristales que tiene un LCD
1.6.2.5. TECLADO MATRICIAL 4X4
a) DESCRIPCIÓN:
Dispositivo de entrada de datos que consta de 16 teclas o
pulsadores, dispuestos e interconectados en filas y
columnas, como observamos en la figura 2.6. Dispone de
conector SIL (Single In Line) macho de 8 pines que se
corresponden con las 4 filas y las 4 columnas de las que
dispone.
Figura 2.6: Teclado matricial y esquema
b) FUNCIONAMIENTO:
En la figura 2.6 vemos el esquema de conexión interna del
teclado matricial y sus correspondientes pines de salida
numerados de izquierda a derecha mirando el teclado tal y
como se ve en la foto de la figura 2.6. Cuando se presiona
un pulsador se conecta una fila con una columna, teniendo
en cuenta este hecho es muy fácil averiguar que tecla fue
pulsada. También podemos ver la conexión típica con el
puerto B del PIC.
Las resistencias de 2K2 son necesarias para poder
compartir el puerto del PIC independientemente del
teclado y por ejemplo poder conectar un LCD o una barra de
leds al mismo tiempo. Durante la fase de lectura del
teclado la mitad del puerto B es configurada como
entrada y la otra mitad como lectura y durante la
escritura en el LCD u otro sistema, el puerto B es
configurada como salidas.
Entonces se podrían cortocircuitar accidentalmente las
salidas de los puertos provocando su destrucción, si
pulsásemos alguna tecla es ese momento con lo que al
poner estas resistencias evitamos este hecho y si se
produjera el cortocircuito tan solo circularía una pequeña
corriente y el puerto del PIC no correría ningún riesgo.
1.6.2.6. EL MICROCONTROLADOR PIC 16F877A
a) DESCRIPCION:
Se denomina microcontrolador a un dispositivo
programable capaz de realizar diferentes actividades que
requieran del procesamiento de datos digitales y del
control y comunicación digital de diferentes dispositivos.
Los microcontroladores poseen una memoria interna que
almacena dos tipos de datos; las instrucciones, que
corresponden al programa que se ejecuta, y los
registros, es decir, los datos que el usuario maneja, así como
registros especiales para el control de las diferentes
funciones del microcontrolador.
Los microcontroladores se programan en MPlaB,
Assembler, MicroC-PRO y cada microcontrolador varía su
conjunto de instrucciones de acuerdo a su fabricante y
modelo. De acuerdo al número de instrucciones que el
microcontrolador maneja se le denomina de arquitectura
RISC (reducido) o CISC (complejo).
Los microcontroladores poseen principalmente una ALU
(Unidad Lógico Aritmética), memoria del programa, memoria
de registros, y pines I/O (entrada y/0 salida). La ALU es la
encargada de procesar los datos dependiendo de las
instrucciones que se ejecuten como por ejemplo: ADD,
OR, AND, etc., mientras que los pines son los que se
encargan de comunicar al microcontrolador con el medio
externo; la función de los pines puede ser de
transmisión de datos, alimentación de corriente para el
funcionamiento de este o pines de control especifico.
En este proyecto se utilizo el PIC 16F877A. Este
microcontrolador es fabricado por Microchip familia a la
cual se le denomina PIC. Posee varias características
que hacen a este microcontrolador un dispositivo muy
versátil, eficiente y práctico para ser empleado en la
aplicación que posteriormente será detallada.
Algunas de estas características se muestran a continuación:
 Soporta modo de comunicación serial, posee dos
pines para ello.
 Amplia memoria para datos y programa.
 Memoria reprogramable: La memoria en este PIC es
la que se denomina FLASH; este tipo de memoria se
puede borrar electrónicamente (esto corresponde a la
“F” en el modelo).
 Set de instrucciones reducidas (tipo RISC), pero con
las instrucciones necesarias para facilitar su manejo.
b) CARACTERÍSTICAS:
En la tabla 2.2 se pueden observar las características
más relevantes del dispositivo.
NOMBRE DEL
PIN
PIN TIPO TIPO DE
BUFFER
DESCRIPCIÓN
OSC1/CLKIN
13 I
ST/MOS Entrada del oscilador de cristal /
Entrada de señal de reloj externa
OCS2/CLKOUT
14 O -
Salida del oscilador del cristal
MCLR/Vpp/THV 1 I/P ST Entrada del Master clear (Reset) o
entrada de voltaje de programación o
modo de control high voltaje test
RA0/AN0
RA1/AN1
RA2/AN2/Vref-
RA3/AN3/Vref+
RA4/TOCKI
RA5/SS/AN4
2.
3
4
5
6
7
I/O
I/O
I/O
I/O
I/O
I/O
TTL
TTL
TTL
TTL
ST
TTL
PORTA es un puerto I/O bidireccional
RAO: puede ser salida analógica 0
RA1: puede ser salida analógica 1
RA2: puede ser salida analógica 2 o
referencia negativa de voltaje
RA3: puede ser salida analógica 3 o
referencia positiva de voltaje
RA4: puede ser entrada de reloj
timer0.
RA5: puede ser salida analógica 4 o
el esclavo seleccionado por el puerto
serial síncrono.
RBO/INT
RB1
RB2
RB3/PGM
RB4
RB5
RB6
RB7/PGD
33
34
35
36
37
38
39
40
I/O
I/O
I/O
I/O
I/O
I/O
I/O
I/O
TTL/ST
TTL
TTL
TTL
TTL
TTL
TTL/ST
TTL/ST
PORTB es un puerto I/O bidireccional.
Puede ser programado todo como
entradas
RB0 puede ser pin de interrupción
externo.
RB3: puede ser la entrada de
programación de bajo voltaje.
Pin de interrupción
Pin de interrupción
Pin de interrupción. Reloj de
programación serial
RCO/T1OSO/TIC
KI
RC1/T1OS1/CC
15
16
I/O
I/O
ST
ST
PORTC es un puerto I/O bidireccional
RCO puede ser la salida del oscilador
timer1 o la entrada de reloj del timer1
RC1 puede ser la entrada del
oscilador timer1 o salida PMW 2
RC2 puede ser una entrada de
P2
RC2/CCP1
RC3/SCK/SCL
RC4/SD1/SDA
RC5/SD0
RC6/Tx/CK
RC7/Rx/DT
17
18
23
24
25
26
I/O
I/O
I/O
I/O
I/O
I/O
ST
ST
ST
ST
ST
ST
captura y comparación o salida PWN
RC3 puede ser la entrada o salida
serial de reloj síncrono para datos SPI
y modo I2C
RC4 puede ser la entrada de datos
SPI e I2C
RC5 puede ser la salida de datos SPI
RC6 puede ser el transmisor
asíncrono USART o el reloj síncrono
RC7 puede ser el receptor asíncrono
USART o datos síncronos
RD0/PSP0
RD1/PSP1
RD2/PSP2
RD3/PSP3
RD4/PSP4
RD5/PSP5
RD6/PSP6
RD7/PSP7
19
20
21
22
27
28
29
30
I/O
I/O
I/O
I/O
I/O
I/O
I/O
I/O
ST/TTL
ST/TTL
ST/TTL
ST/TTL
ST/TTL
ST/TTL
ST/TTL
ST/TTL
PORTD es un Puerto bidireccional
paralelo
RE1/WR/AN5
RE1/WR/AN
RE2/CS/AN7
8
9
10
I/O
I/O
I/O
ST/TTL
ST/TTL
ST/TTL
PORTE es un puerto I/O bidireccional
REO: puede ser control de lectura
para el puerto esclavo paralelo o
entrada analógica 5
RE1: puede ser escritura de control
para el puerto paralelo esclavo o
entrada analógica 6
RE2: puede ser el selector de control
para el puerto paralelo esclavo o la
entrada analógica 7
Vss 12
31
P - Referencia de tierra para los pines
lógicos y de I/O
Vdd 11
32
P - Fuente positiva para los pines lógicos
y de I/O
NC - - - No está conectado internamente
Tabla 2.2. Características del PIC
Descripción de los puertos:
Puerto A:
Puerto de E/S de 6 pines
RA0 è RA0 y AN0
RA1 è RA1 y AN1
RA2 è RA2, AN2 y Vref-
RA3 è RA3, AN3 y Vref+
RA4 è RA4 (Salida en colector abierto) y
T0CKI(Entrada de reloj del modulo Timer0)
RA5 è RA5, AN4 y SS (Selección esclavo para el
puerto serie síncrono)
Puerto B:
Puerto E/S 8 pines
Resistencias pull-up programables
RB0 è Interrupción externa
RB4-7 è Interrupción por cambio de flanco
RB5-RB7 y RB3 è programación y debugger in circuit
Puerto C:
Puerto E/S de 8 pines
RC0 è RC0, T1OSO (Timer1 salida oscilador) y
T1CKI (Entrada de reloj del modulo Timer1).
RC1-RC2 è PWM/COMP/CAPT
RC1 è T1OSI (entrada osc timer1)
RC3-4 è IIC
RC3-5 è SPI
RC6-7 è USART
Puerto D:
Puerto e/s de 8 pines
Bus de datos en PPS (Puerto paralelo esclavo)
Puerto E:
Puerto de E/S de 3 pines
RE0 è RE0 y AN5 y Read de PPS
RE1 è RE1 y AN6 y Write de PPS
RE2 è RE2 y AN7 y CS de P
Figura 2.7: se aprecia la distribución de pines del PIC 16F877A.
Figura 2.8: se muestra el diagrama de conexiones internas del PIC.
Dispositivos periféricos:
Timer0: Temporizador-contador de 8 bits con preescaler de
8 bits
Timer1: Temporizador-contador de 16 bits con preescaler
que puede incrementarse en modo sleep de forma externa
por un cristal/clock.
Timer2: Temporizador-contador de 8 bits con preescaler y
postescaler.
Dos módulos de Captura, Comparación, PWM
(Modulación de Anchura de Impulsos).
Conversor A/D de 1 0 bits.
Puerto Serie Síncrono Master (MSSP) con SPI e I2C
(Master/Slave).
USART/SCI (Universal Syncheronus Asynchronous
Receiver Transmitter) con 9 bit.
Puerta Paralela Esclava (PSP) solo en encapsulados con
40 pines.
c) PROGRAMACIÓN
El PIC usa un juego de instrucciones tipo RISC, cuyo número
puede variar desde 35 instrucciones para PICs de gama
baja a 70 para los de gama alta. Las instrucciones se
clasifican entre las que realizan operaciones entre el
acumulador y una constante, entre el acumulador y una
posición de memoria, instrucciones de condicionamiento y de
salto/retorno, implementación de interrupciones y una para
pasar a modo de bajo consumo llamada sleep.
Tenemos los siguientes términos importantes en la
programación de microcontroladores:
 Ensamblador.- La programación en lenguaje
ensamblador puede resultar un tanto ardua, pero
permite desarrollar programas muy eficientes, ya
que otorga el dominio absoluto del sistema. Los
fabricantes suelen proporcionar el programa
ensamblador de forma gratuita.
 Compilador.- La programación en un lenguaje de alto
nivel (como el C ó el Basic) permite disminuir el
tiempo de desarrollo de un producto.
 Depuración.- Debido a que los microcontroladores
van a controlar dispositivos físicos, se necesita
herramientas que permitan comprobar el buen
funcionamiento del microcontrolador cuando esté
conectado al resto de circuitos.
 Simulador.- Son capaces de ejecutar en un PC
programas realizados para el microcontrolador. Los
simuladores permiten tener un control absoluto
sobre la ejecución de un programa, siendo ideales
para la depuración de los mismos. Su gran
inconveniente es que es difícil simular la entrada
y salida de datos del microcontrolador. Tampoco
cuentan con los posibles ruidos en las entradas, pero,
al menos, permiten el paso físico de la
implementación de un modo más seguro y menos
costoso, puesto que ahorraremos en grabaciones
de chips para las pruebas físicas.
Para transferir el código de un ordenador al PIC
normalmente se usa un dispositivo llamado programador.
La mayoría de PICs que Microchip distribuye hoy en día
incorporan ICSP (In Circuit Serial Programming,
programación serie incorporada) o LVP (Low Voltage
Programming, programación a bajo voltaje), lo que
permite programar el PIC directamente en el circuito destino.
Para la ICSP se usan los pines RB6 y RB7 como reloj y
datos y el MCLR para activar el modo programación
aplicando un voltaje de unos 11 voltios.
Existen muchos programadores de PICs, desde los más
simples que dejan al software los detalles de
comunicaciones, a los más complejos, que pueden
verificar el dispositivo a diversas tensiones de
alimentación e implementan en hardware casi todas las
funcionalidades.
Se va a utilizar el lenguaje C. Las variables y constantes
deben ser definidas para determinar la asignación de
memoria requerida. El compilador que se utiliza es el
mikroC-PRO.
Variables
Algunos tipos de variables utilizados en mikroC-PRO son
los que podemos observar en la tabla 2.3:
Tabla 2.3: Variables de programación
Tipos de variables.
Los operadores nos sirven para hacer cómputos cuando
los utilizamos con variables.
Operadores Matemáticos
Principales operadores matemáticos están los
mostrados en la tabla 2.4:
Tabla 2.4: Operadores matemáticos
Tabla 2.5: Operadores Relacionales
T
a
b
l
Tabla 2.6: Operadores lógicos
Las instrucciones son acciones algorítmicas dentro de
un programa. Existen los siguientes tipos:
Instrucciones de asignación.- Son las que evalúan una
expresión y asignan este valor a una variable. Se las
reconoce porque utilizan el signo “=”.
Instrucciones condicionales.-Son instrucciones que
permiten seleccionar de un grupo de alternativas un valor o
acción específico. Dentro de estos están el if (si) y el
select case (selección de caso).
Instrucciones de interacción.- Estas permiten tener un
ciclo repetitivo de instrucciones. Tenemos a for (para),
while (mientras) y do (hacer)
Instrucciones de salto.- Sirven para transferir el control
hacia otras instrucciones. Tenemos a break (romper),
continue (continuar), exit (salir), goto (ir a), gosub (ir a
subrutina).
1.6.2.7. COMUNICACIÓN SERIAL
Se llama serial, porque los bits se reciben unos detrás de
otro o en serie. Una de las maneras para realizar la
comunicación entre dos PC’s y PC a circuito es utilizando un
cable serial, conectado a los puertos seriales de ambos.
La comunicación serial utiliza el protocolo RS-232, en un
extremo del cable de comunicaciones se encuentra un
conector llamado DB9 hembra y del otro extremo un
conector DB9 macho.
 MAX232
Es un circuito integrado que convierte los niveles de las
líneas de un puerto serie RS232 a niveles TTL y viceversa.
Sólo necesita una alimentación de 5V, ya que genera
internamente algunas tensiones que son necesarias para el
estándar RS232.
Soluciona la conexión necesaria para lograr comunicación
entre el puerto serie de una PC y cualquier otro circuito con
funcionamiento en base a señales de nivel TTL/CMOS.
TX es la señal de transmisión de datos, RX es la de
recepción, y RTS y CTS se utilizan para establecer el
protocolo para el envío y recepción de los datos.
Figura 2.7: Circuito MAX232
1.6.2.8. MODULOS RF
a) DESCRIPCIÓN
Módulos de RF son ampliamente utilizados en el diseño
electrónico debido a la dificultad de diseñar circuitos de
radio.
Un buen diseño de radio electrónico es notoriamente
complejo debido a la sensibilidad de los circuitos de radio y la
precisión de componentes y diseños necesarios para lograr
un funcionamiento en una frecuencia específica.
b) FUNCIONAMIENTO
Módulo de frecuencia de radio es un pequeño circuito
electrónico que se utiliza para transmitir y / o recibir señales
de radio en uno de un número de frecuencias portadoras.
1.6.2.9. CONSTRUCCIÓN DEL SISTEMA
La tecnología va evolucionando en nuestro diario vivir, con
ello se desarrollan nuevos sistemas que mejoran nuestra
condición de vida y nos ayudan en tareas cotidianas.
Con la utilización de elementos electrónicos como:
capacitores, resistencias, microcontrolador PIC. Se ha
desarrollado este sistema.
El equipo está construido con la finalidad de dar un acceso
automatizado a nuestra casa, oficina y en este caso en
particular para el ingreso a la estación televisiva del canal
51- Chiclayo.
La utilidad de la construcción de este sistema se centra en el
ingreso de un código, el cual mostrará en el LCD el usuario
relacionado a dicho código el cual a la vez seleccionara en
Matlab la muestra de voz correspondiente.
Ya que se cuenta con un nivel más de seguridad el cual
corresponde al reconocimiento de voz el cual se activara con
el código identificado del trabajador, se pedirá que diga en
voz alta y de manera entendible su clave la cual se procesa
en el matlab el cual hace el análisis de las muestras de la
matriz (mínimo son 28000 muestras guardadas) así se inicia
el análisis por biometría de la voz (análisis de los
coeficientes cepstrales en la escala de MEL).
La clave que puede ingresarse en este equipo puede ser
hasta 16 caracteres esto ya depende del usuario y su nivel
de seguridad, ya que un código mucho más grande brinda
una mayor seguridad, al no ser fácilmente descifrable.
En la construcción de este sistema involucran muchos
conocimientos de la utilización teclados matriciales, pantallas
LCD, utilización de los microcontroladores PIC y
programación en Matlab.
 DIAGRAMA DE BLOQUES Y FUNCIONAMIENTO
En la figura 2. Observamos el esquema principal del
proyecto, el cual cuenta con ingreso de datos a través del
teclado, para seleccionar opciones disponibles. La unidad
central del proceso es el microcontrolador, el cual ejecuta
instrucciones de acuerdo a nuestras necesidades. El
dispositivo de salida que facilita el manejo del equipo y con el
teclado, este es el LCD gráfico, el cual muestra la información
al usuario y con el teclado se puede interactuar con la
persona que maneje el equipo. El actuador principal es la
comunicación serial la cual este permitirá la comunicación de
la placa del PIC con la PC y llevará al software Matlab los
datos necesarios para el análisis del reconocimiento de voz;
posteriormente se generara un código ASCII solo si se logra
el reconocimiento de voz del trabajador, se envía hacia el
PIC16F877A el cual envia un pulso hacia el PIC 16F628A y
este se encargara de enviar el código ASCII abrir por medio
del módulo RF.
Figura 2.8: Diagrama de bloques del circuito
A continuación se describe detalladamente cada parte, que
compone este proyecto para comprenderlo de una mejor
manera.
TECLADO:
Se observa en la figura 2.9. el diagrama de la conexión del
teclado, en conexión multiplexada para optimizar el uso de
los pines del microcontrolador. Se utiliza 8 pines para
conectar el teclado, con las primeras 4 líneas del puerto D, el
microcontrolador envía en modo secuencial un barrido de
ceros lógicos y con las 4 líneas del puerto C se verifica la
tecla que está siendo presionada.
Las resistencias ayudan limitar la corriente de los pines,
caso contrario el microcontrolador se quemaría.
Figura 2.9: Esquema del teclado matricial (Eagle)
MICROCONTROLADOR
En la figura 2.10 se aprecia el diagrama del microcontrolador,
que es el cerebro electrónico que ejecuta las instrucciones que
están en su memoria grabadas. El programa que ejecuta este
microcontrolador se realiza de acuerdo a las necesidades de
cada sistema.
Figura 2.10: Diagrama del microcontrolador PIC
Este dispositivo nos ayuda a controlar el teclado, el LCD
gráfico y la comunicación serial. Su programa se describe de
manera detallada en el anexo B. Para su correcto
funcionamiento necesita tener una señal de reloj.
El circuito de reset está compuesto por una resistencia y un
pulsador, este circuito permite al igual que a un computador
resetearle por un mal funcionamiento. En el momento que
pulsamos el botón se genera un pulso negativo con el que
paramos el funcionamiento momentáneamente para que el
Microcontrolador se reinicie y funcione correctamente.
LCD
Se observa el diagrama y la conexión específica del LCD, se
tiene 4 líneas de datos de transmisión del microcontrolador
hacia el LCD, además se utiliza 2 líneas del PIC para
controlar el display.
Figura 2.11 Esquema del LCD
a)
b)
c)
d)
e)
 CONSTRUCCIÓN DE LA PLACA DEL EQUIPO
En la figura 2.12. se puede observar el diagrama de la
placa del equipo transmisor, donde se presenta la
interconexión del teclado, el LCd, el microcontrolador y
las conexiones en detalle de los distintos elementos que
componen el equipo.
Figura 2.12: Diagrama de los elementos principales del equipo (Proteus)
Figura 2.13: Esquemático del circuito del equipo (Eagle)
Figura 2.14: Board del circuito del equipo
 PROGRAMACIÓN DEL MICROCONTROLADOR
El programa del proyecto se muestra detallado en el
Anexo A, donde se encuentran todas las instrucciones
que se dan al PIC para que realice las diversas
tareas. Este programa fue desarrollado en el
compilador MicroCpro.
El programa se encarga de estar receptando las
señales del teclado frecuentemente. En el caso de
recibir una señal del teclado, el PIC muestra los
diferentes menús almacenados en su memoria.
RECONOCIMIENTO DE VOZ
TEORÍA DE FUNCIONAMIENTO
 Fundamentos de la voz
La señal de voz es una onda de presión acústica que se
genera voluntariamente a partir de movimientos de la
estructura anatómica del sistema fonador humano. La
producción de la voz comienza en el cerebro con la
conceptualización de la idea que se desea transmitir, la cual
se asocia a una estructura lingüística, seleccionando las
palabras adecuadas y ordenándolas de acuerdo con unas
reglas gramaticales. A continuación el cerebro produce los
comandos nerviosos que mueven los órganos vocales para
producir los sonidos. La unidad mínima de una cadena
hablada es el fonema, el cual posee un carácter distintivo en
la estructura de la lengua. La combinación de los fonemas da
origen a las silabas, las cuales conforman las palabras, y
estas a su vez, las oraciones.
El tracto vocal empieza a la salida de la laringe y termina a la
entrada de los labios. El tracto nasal empieza en el paladar y
termina en los orificios nasales. Los parámetros principales
del sistema articulatorio son: las cuerdas vocales, el paladar,
la lengua, los dientes, los labios y las mandíbulas.
Los distintos sonidos se producen al pasar el aire emitido por
los pulmones, a través de todo el sistema de producción, en
una determinada posición del aparato articulatorio. Desde el
punto de vista de la ingeniería es lógico pensar que este
sistema físico puede representarse como un filtro, cuya
función de transferencia depende del sonido articulado y, por
tanto, de la posición de los distintos órganos involucrados en
la generación de la voz. La entrada del filtro se puede modelar
mediante una señal de excitación, que corresponde al paso
del aire generado por los pulmones a través de la traquea y
las cuerdas vocales, y también será dependiente del sonido
generado.
Las cuerdas vocales son dos membranas dentro de la laringe
orientadas de adelante hacia atrás.
Por delante se unen en el cartílago tiroides, por detrás, cada
una esta sujeta a uno de los dos cartílagos aritenoides, los
cuales pueden separarse voluntariamente por medio de
músculos. La abertura entre ambas cuerdas se denomina
glotis. Cuando las cuerdas vocales se encuentran separadas
la glotis adopta una forma triangular. El aire pasa libremente y
casi no se produce sonido; este es el caso de la respiración.
Cuando la glotis comienza a cerrarse, el aire que la atraviesa
proveniente de los pulmones experimenta una turbulencia,
produciendo un ruido conocido como aspiración. Ahora, al
cerrarse más, las cuerdas vocales comienzan a vibrar de
modo audible, produciéndose un sonido tonal, es decir
periódico. La frecuencia de este sonido depende de varios
factores, entre otros del tamaño y la masa de las cuerdas
vocales, de la tensión de las cuerdas vocales, de la tensión
que se les aplique y de la velocidad del flujo del aire
proveniente de los pulmones. A mayor tamaño, menor
frecuencia de vibración, A mayor tensión la frecuencia
aumenta, siendo los sonidos más agudos. También aumenta
la frecuencia al crecer la velocidad del flujo de aire.
Finalmente, es posible obturar la glotis completamente, en
cual caso no se produce sonido. Sobre la glotis se encuentra
la epiglotis, un cartílago de la faringe que permite tapar la
glotis durante la deglución para evitar que el alimento ingerido
se introduzca en el tracto respiratorio. La porción que incluye
las cavidades faringea, oral y nasal junto con los elementos
articulatorios se denomina cavidad supraglótica en tanto que
los espacios por debajo de la laringe, es decir la traquea, los
bronquios y los pulmones, se denominan cavidades
infraglóticas.
Varios de los elementos de la cavidad supraglótica se
controlan a voluntad, permitiendo modificar dentro de
márgenes muy amplios los sonidos producidos por las
cuerdas vocales o agregar partes distintivas a estos, y hasta
producir sonidos propios. Esto se efectúa con dos
mecanismos principales: el filtrado y la articulación. El filtrado
actúa modificando el espectro del sonido. Tiene lugar en las
cuatro cavidades supraglóticas principales: la faringe, la
cavidad nasal, la cavidad oral y la cavidad labial. Las mismas
constituyen resonadores acústicos que enfatizan
determinadas bandas frecuenciales del espectro generado por
las cuerdas vocales, conduciendo al concepto de formantes,
es decir que se refuerza la amplitud de grupos de armónicos
situados alrededor de una determinada frecuencia. En
resumen, en el habla los formantes se determinan por el
proceso de filtrado que se produce en el tracto vocal por la
configuración de los articuladores.
RECONOCIMIENTO AUTOMÁTICO DEL HABLA:
Las principales características que diferencian a los sistemas
basados en reconocimiento del Habla frente a otras
alternativas son: la naturalidad que supone utilizar el habla en
las operaciones de comando y control, y la robustez y
precisión en la comunicación para diferentes usuarios y
diferentes entornos. Los resultados que esta tecnología
proporcione, deben contrastar con los derivados de otras
alternativas como: teclados, mouse, paneles y otros. Dado el
amplio campo de aplicación de la tecnología del habla, se ha
propuesto una clasificación, en tres grupos diferentes:
• Aplicaciones locales
En esta área se pretende realizar interfaces hombre-máquina,
que sustituyan la utilización de teclado y mouse, para dotar al
usuario de la movilidad, que estos le restan, también facilitar
el uso de máquinas a los usuarios discapacitados.
• Respuesta vocal interactiva
En estas aplicaciones se involucra la difusión o captura de
información, por parte de un gran número de usuarios, en
particular se utiliza la red telefónica como vehículo de acceso
a la información. Como por ejemplo para sustituir interfaces
de detección de tonos DTMF, como lo son las consultas de
cuentas bancarias, mensajería vocal, transmisión de
información general, movimientos de cuentas y otros.
• Automatización de sistemas telefónicos
En estas hallamos la marcación por voz, manejo de agendas,
directorio público, entre otras.
PRINCIPALES ÁREAS DE TRABAJO EN
RECONOCIMIENTO DEL HABLA
Un diagrama simplificado para un modelo de reconocimiento
automático del habla, mostrado en la figura, sugiere algunos
puntos importantes de considerar a la hora de llevar a cabo
una implementación. Entre las principales áreas de trabajo
que intervienen en el diseño y especificación de sistemas de
Reconocimiento del Habla actuales, se encuentran las
siguientes:
• Procesamiento de la señal de voz.
• Técnicas de reconocimiento de patrones.
• Diferentes estilos de habla.
• Dependencia del locutor.
• Tarea de reconocimiento.
• Bases de datos para entrenamiento y reconocimiento.
PROCESAMIENTO DE LA SEÑAL DE VOZ
La primera operación que debe realizar un reconocedor es
procesar la señal de voz de entrada al sistema, con objeto de
extraer la información acústica relevante para la tarea que
debemos realizar. Los rasgos o características que se deben
extraer de la señal de voz, son el resultado de un largo
proceso de investigación sobre diferentes procedimientos de
parametrización de la voz. Planteándose como solución actual
más extendida una parametrización de la envolvente espectral
que incluye consideraciones preceptúales a partir del
funcionamiento del oído.
Para reducir el número de parámetros posibles, la
parametrización se combina con la utilización de técnicas
discriminativas, seleccionándose el subconjunto con los
parámetros más eficientes o distintivos.
La señal de entrada puede venir acompañada por efectos
perturbadores, los cuales se desea sean eliminados, para ello
se ha generado tres líneas principales de trabajo:
• Detección robusta de voz: apareciendo innumerables
procedimientos de discriminación entre voz o ruido (silencio)
para diferentes tipos de ruido.
• Reducción de ruido: distinguiéndose procedimientos que
actúan directamente sobre la señal de voz y procedimientos
que buscan compensar el efecto del ruido sobre la
parametrización de la voz.
• Cancelación de ecos: incorporando técnicas de filtrado
adaptativo que permitan al usuario comenzar a hablar
mientras, desde el terminal remoto, se le está comunicando
un mensaje que puede provocar un eco en la voz que entra al
reconocedor.
OBTENCIÓN DE INFORMACIÓN MEDIANTE MICRÓFONO
Micrófono: El micrófono es un transductor electroacústico. Su
función es la de transformar (traducir) la presión acústica
ejercida sobre su capsula por las ondas sonoras en energía
eléctrica.
El audio es un fenómeno analógico. Para grabar una señal de
voz se hace la conversión de la señal analógica del micrófono
en una señal digital por medio del conversor A/D en la tarjeta
de sonido.
Cuando un micrófono esta operando las ondas de sonido
hacen que vibre el elemento magnético del micrófono
causando una corriente eléctrica hacia la tarjeta de sonido,
donde el conversor A/D básicamente graba los voltajes
eléctricos en intervalos específicos. Hay dos factores
importantes durante este proceso. Primero esta la taza de
muestreo o que tan seguido los valores de voltaje son
grabados. Segundo, son los bits por segundo, o que tan
exactamente los valores son grabados. Un tercero podría ser
el número de canales (mono o estéreo), pero para las
aplicaciones de reconocimiento de voz un canal mono es
suficiente. La mayoría de aplicaciones vienen con valores pre-
determinados, para desarrollo del código se debería de
cambiar los parámetros para ver lo que mejor funciona en el
algoritmo. Dado a que el habla es relativamente de bajas
frecuencias (entre 100Hz-8kHz), una frecuencia de muestreo
de 16000 muestras/seg provee una mayor exactitud en la
adquisición de la información, la frecuencia de nyquist.
La cuantificación mas comúnmente usada, es de 8 bits,
mínimo requerido para una calidad baja, puede mejorarse su
S/R con una técnica no lineal de cuantificación, se obtienen
excelentes resultados aumentando la cuantificación a 16 bits.
La siguiente etapa será aquella que se encargue de amplificar
las señales a niveles que sean manejables. A partir de la
señal analógica obtenida se hace necesario convertir la señal
a formato digital para poder procesarla en la computadora lo
que se realiza mediante dos procesos: muestreo y
cuantificación. La señal vocal tiene componentes de
frecuencia que pueden llegar a los 10 kHz., sin embargo la
mayor parte de los sonidos vocales tiene energía espectral
significativa hasta los 5 Khz. solamente los sonidos fricativos
poseen componentes que pueden llegar a los 10 kHz. En
nuestro caso se optó por una frecuenta de muestreo de
44100Hz y una resolución de 16 bits mono canal.
PRE-PROCESAMIENTO
Se hace necesario para el análisis realizar un pre-
procesamiento de la señal vocal. Esto se realiza a través de
técnicas que permitan extraer la información acústica
directamente a partir de la señal vocal emitida.
Filtro
En primera instancia se realiza un filtrado de la señal para
reducir los efectos del ruido que acompaña la señal de voz
ingresada. Al diseñar el mismo se deberá considerar el hecho
que la elección de las frecuencias de corte y paso de este,
condicionarán al sistema en la discriminación de voces
espectralmente parecidas.
Segmentación (determinación de los puntos de inicio y fin
de la señal para eliminar el ruido):
En el reconocimiento de señales de voz, se hace necesario
determinar con adecuada precisión los puntos de inicio y final
de cada palabra, es decir, se debe diferenciar las partes de
señal que llevan información de voz de aquellas que no llevan
voz. Este procedimiento evita gastar memoria y tiempo de
cálculo en las tramas que no contienen información evitando
así obtener resultados erróneos en el análisis de las señales
de voz.
Se han planteado diferentes maneras de clasificar eventos en
una señal de voz. Quizás la más simple y más empleada, esta
relacionada con la generación de la voz e incluye tres
estados: silencio cuando no hay voz; sonoro cuando se
presenta vibración de las cuerdas vocales; y sordo cuando las
cuerdas vocales no vibran.
En general, un sistema de clasificación de voz puede tener
inconvenientes en distinguir un fonema sordo de baja amplitud
y corta duración, del silencio; o un fonema sonoro de baja
amplitud de un fonema sordo o incluso del silencio. El error a
su vez aumenta a medida que la relación señal a ruido
disminuye.
El problema de encontrar los puntos de inicio y fin de palabra
es fundamental en procesamiento de voz. Por ejemplo, en
reconocimiento automático de palabras aisladas, es necesario
encontrar las regiones de la señal que corresponden a cada
palabra a ser analizada. De la correcta segmentación de la
señal depende en gran medida la exactitud del proceso de
reconocimiento. De hecho, las fallas en la segmentación de la
señal constituyen una de las principales fuentes de error en
los sistemas de reconocimiento de voz, ya que algunos
sonidos que pueden captarse, correspondientes a ruido de
fondo, podrían eventualmente confundirse con voz; por
ejemplo, el espectro de la respiración tiene semejanzas con el
de un fonema fricativo. La detección de los límites de palabra
también se realiza con el fin de evitar cálculos innecesarios, al
procesar únicamente las partes de la señal que corresponden
a voz.
Ventaneo
En la etapa siguiente, la señal filtrada y sin silencios se hace
necesario tomar la señal en tramas de
N muestras, donde N es un valor que se escoge tomando en
cuenta que la señal de voz es estacionaria a “trozos”,
condición necesaria para realizar el análisis de Fourier en
tiempo corto. El intervalo de tiempo en el que la señal se
considera estacionaria depende de la velocidad de cambios
del tracto vocal y las cuerdas vocales y comúnmente se
establece un valor entre 20 y 40 ms. Estas tramas se pasarán
por una ventana que en general es una ventana de Hamming.
Las ventanas rectangulares y las no rectangulares tienen sus
ventajas y desventajas en cuanto al ancho del lóbulo principal
y a la atenuación de los lóbulos secundarios. En el caso de la
ventana de Hamming se cumple con el principio de atenuar
bruscamente los lóbulos secundarios aunque el principal es
más ancho que para una ventana rectangular. Esta es la
ventana se define como:
wnT = 0.54-0.46cos2nN 0 ≤ n ≤ N
Como la ventana de Hamming atenúa mucho la señal que
queda en bordes de dicha ventana se hace un solapamiento
cada 10 o 20 ms para aplicarla así no se pierde información
útil.
En el reconocimiento del habla, la señal de voz pre-procesada
se ingresa a un nuevo procesamiento para producir una
representación de la voz en forma de secuencia de vectores o
agrupaciones de valores que se denominan parámetros, que
deben representar la información contenida en la envolvente
del espectro.
Hay que tener en cuenta que el número de parámetros debe
ser reducido, para no saturar la base de datos, ya que
mientras más parámetros tenga la representación menos
fiables son los resultados y mas costosa la implementación.
Existen distintos métodos de análisis para la extracción de
características, y se concentran en diferentes aspectos
representativos. En este caso analizaremos los dos de mayor
importancia para el análisis de la voz:
- Análisis de predicción lineal (LPC)
- Análisis cepstral
PARAMETRIZACIÓN
Coeficientes de predicción lineal (LPC):
Se trata de una de las técnicas más potentes de análisis de
voz, y uno de los métodos más útiles para codificar voz con
buena calidad. Su función es representar la envolvente
espectral de una señal digital de voz en una forma
comprimida, utilizando la información de un modelo lineal, con
lo cual se proporcionan unas aproximaciones a los
parámetros de la voz muy precisas.
Se fundamenta en establecer un modelo de filtro de tipo todo
polo, para la fuente de sonido. La principal motivación del
modelo todo polo viene dada porque permite describir la
función de transferencia de un tubo, que sin perdidas esta
formado por diferentes secciones. El modelo recibe este
nombre porque pretende extrapolar el valor de la siguiente
muestra de voz s(n) como la suma ponderada de muestras
pasadas s(n-1), s(n-2),…, s(n-K):
Cepstrum
Como se sabe los sonidos de la voz se pueden representar
mediante un espectrograma, que indica las componentes
frecuenciales de la señal de voz. Es así entonces como el
espectro nos proporciona información acerca de los
parámetros del modelo de producción de voz, tanto de la
excitación como del filtro que representa el tracto vocal.
Desde el principio de la década de los 70 los sistemas homo
mórficos han tenido una gran importancia en los sistemas de
reconocimiento de voz. Estos sistemas homo mórficos son
una clase de sistemas no lineales que obedecen a un
principio de superposición. De estos los sistemas lineales son
un caso especial.
Modelo de obtención de los coeficientes cesptrales
En el sistema de reconocimiento de voz en MATLAB existe
una función para obtener los coeficientes cepstrales utilizando
la FFT. La función utilizada es la rceps, que nos proporciona
el cepstrum real de la función ingresada, por medio del
algoritmo mostrado en la figura de arriba. La razón principal
para utilizar los coeficientes cepstrales es que tienen la
ventaja adicional que uno puede derivar de ellos una serie de
parámetros que son invariantes sin importar las distorsiones
que puedan ser introducidas por el micrófono o por cualquier
sistema de transmisión.
Coeficientes cepstrales de frecuencia Mel: MFCC.
Una familia de coeficientes directamente relacionada con los
LPC son los llamados mel-cepstrum o MFCC, los cuales son
de gran utilidad en la extracción de los parámetros de la señal
de voz, ya que están basados en la variación conocida de los
anchos de banda de las frecuencias críticas del oído.
Los filtros que se lo aplican a la señal en la técnica MFCC
están espaciados linealmente para frecuencias menores a
1000 Hz y logarítmicamente para frecuencias mayores de
1000 Hz, con el fin de capturar las características
fonéticamente importantes del habla. A esta escala se le
denomina “Escala de MEL” y su fórmula matemática es la
siguiente:
Los pasos necesarios para el cálculo de los MFCC se
muestran aquí:
El primer bloque calcula la transformada de Fourier de tiempo
corto a cada una de las tramas obtenidas de la etapa de pre-
procesamiento mediante la ecuación:
En el segundo bloque el cuadrado
ponderado por una serie de filtros distribuidos sobre la escala
de MEL para luego calcular la llamada “log-energía” del filtro l-
ésimo mediante la ecuación:
El banco de filtros linealmente espaciado en la escala de Mel
tiene la forma que se muestra abajo y los filtros que lo
conforman pueden ser triangulares o tener otras formas, tales
como Hamming, Hanning o Kaiser, pero el triangular es el
más utilizado.
RECONOCIMIENTO DEL HABLA. DECISIÓN.
Las técnicas e parametrización explicadas en el punto anterior
tienen como finalidad generar una serie de coeficientes que
representan las características de la señal de voz, que
pueden ser usadas en la fase de reconocimiento del habla y
que no se obtienen mediante un análisis temporal o
frecuencial. El tamaño de la matriz obtenida del proceso de
parametrización depende directamente de la longitud
(variable) de la señal de voz, la cual tiene con la palabra en sí
y el hablante.
Por esta razón, se hace necesaria la estandarización de la
matriz que contiene los coeficientes cepstrales calculados,
para que el tamaño de las matrices usadas para el
reconocimiento del habla sea el mismo.
La estandarización de la matriz de coeficientes cepstrales
constituye el primer paso a realizar en el proceso de
reconocimiento del habla y se denomina Cuantización
Vectorial. El paso siguiente corresponde al cálculo de la
diferencia entre la señal de voz del hablante y las señales que
se encuentran en la base de datos de entrenamiento del
sistema; dicha diferenciase obtiene mediante el cálculo de la
Distancia Euclidiana en varias dimensiones. Cada uno de los
procedimientos se explica en las secciones siguientes.
CUANTIFICACION VECTORIAL
Una parte importante en cualquier tipo de procesamiento de
voz es la optimización de los algoritmos en cuanto a velocidad
y almacenamiento, entonces, la cuantificación de vectores
trae consigo la idea de clasificar un conjunto de vectores,
luego de lo cual se buscarán los mejores representantes para
reducir el tamaño de la información a manejar. La forma de
medir la fidelidad de un cuantificador es determinar el error
que este produce al reemplazar los datos de entrada que
recibe por los vectores representantes o codewords, dicho
parámetro es llamado error por distorsión.
La finalidad de un cuantificador es obtener un conjunto de
vectores representativos llamado codebook, que presente el
menor error por distorsión, por ejemplo para cuantificar los
vectores de observación.
Ventajas:
 Reduce el almacenamiento de la información de
análisis.
 Se reduce el cálculo para determinar distancias entre
vectores espectrales.
 La representación del VQ se limita a una tabla que
contiene las distancias entre pares de vectores del
codebook.
 Representación discreta de las señales de voz.
Asociando una característica fonética con cada vector
del codebook, el proceso de elección del vector que
mejor lo representa es equivalente a asignar una
característica fonética a cada segmento de voz.
Desventajas:
 Distorsión en la representación del vector. Hay un
número finito de vectores en el codebook, el proceso
de “elección" del mejor representante es equivalente a
cuantificar el vector y conduce a un cierto nivel de error
de cuantificación. De cualquier modo con cualquier
codebook finito siempre habrá un nivel de ruido o error.
 El almacenamiento requerido para los vectores del
codebook no es pequeño. Cuanto más grande sea el
codebook menor es el error. Para un codebook de 1000
o más entradas, el almacenamiento no es irrelevante.
Hay que realizar un balance entre error de
cuantificación, procesamiento y almacenamiento del
codebook.
Componentes de un cuantificador vectorial
Para construir un cuantificador vectorial se necesita:
1. Un gran número de vectores de observación, V1, V2,.....,
Vn, que conforman el grupo de entrenamiento. El grupo de
entrenamiento se usa para crear el grupo de vectores del
codebook "óptimo" que representa la variabilidad espectral
observada en el grupo de entrenamiento.
2. Una medición de distancia entre cada par de vectores
espectrales de observación para agrupar el conjunto de
vectores de entrenamiento como axial también para
asociar o clasificar vectores arbitrarios a cada entrada del
codebook.
3. Un procedimiento de clasificación para ubicar y calcular los
centroides. Sobre la base del particionamiento que
clasifica el grupo de n vectores en M clústeres o sectores
primero elegimos el número M, codewords del codebook,
para luego proceder a la clasificación.
Vectores de observación
Al final de los distintos pasos para el tratamiento de la señal
de voz, se obtiene un vector que contiene la información vocal
que representa a la ventana temporal correspondiente, de
alguna manera una colección de características que describen
de la mejor manera posible la voz humana.
Estos vectores son conocidos en la literatura del
reconocimiento de voz como vectores de observación. Cabe
aclarar que existen varias formas de representación de estas
características como LPC (Linear Prediction Code) o Auditory
System, pero la que en la actualidad da los mejores
resultados es el análisis Cepstral, en particular los
coeficientes MFCC (Mel Frecuency Cepstral Coeficients).
También suele incorporarse al vector de observación la
información de la primera y segunda derivadas del Cepstrum
con respecto al tiempo para agregar información de las
características dinámicas del sistema y el logaritmo de la
energía total de la ventana.
Clasificación de Vectores
El objetivo de un módulo clasificador es agrupar una cantidad
de vectores característicos, N, en una cantidad M (MDN),
discreta, de sectores o celdas de clasificación logrando que
las características en cada sector sean similares. Existen
muchos criterios para lograr dicho objetivo y a continuación
veremos algunos de los más comunes.
Imaginemos que la media multidimensional de un
determinado sector i, es μi (con 1<i<M), y a continuación
ingresa al clasificador un vector de observación o, se puede
clasificar dicho vector calculando la "distancia" a la que se
halla de cada una de las M medias y asignándolo al sector
mas "cercano". Este método de clasificación se denomina k-
Means debido a que se agrupan los vectores en torno a k
valores medios, quedando formados k sectores (en nuestro
caso k=M). Existe el problema de inicialización de los valores
de μi, y su reestimación a medida que progresa el algoritmo.
Algoritmos de Clasificación:
Podemos decir, en general, que los N vectores originales de
tamaño D quedarán representados por M vectores, cada uno
de los cuales es llamado "palabra de código" o codeword
(Cw), el grupo entero de dichos vectores, forma un "libro de
códigos" o codebook, quedan entonces delimitadas M
regiones o sectores, llamados regiones de Voronoi. Los
principales algoritmos de clasificación de vectores son
descritos a continuación:
Algoritmo K-Means:
1. Inicialización: Arbitrariamente elegimos M vectores o
palabras de código, codewords, como el grupo inicial
del codebook.
2. Búsqueda del más cercano: Por cada vector de
observación, se busca el codeword en el codebook que
es el más cercano (en términos de distancia), y asigna a
ese vector a la celda correspondiente.
3. Actualización del centroide: actualiza el codeword en
cada celda o sector usando el centroide de los vectores
de entrenamiento asignados a un sector.
4. Iteración: Repite los pasos 2 y 3 hasta que la distancia
media caiga debajo de un umbral prefijado.
La forma de cada sector o celda o partición es muy
dependiente de la medida de distorsión espectral y las
estadísticas de los vectores en el grupo de entrenamiento.
Este método es el más simple y por tanto existen numerosas
modificaciones y mejoras, algunos de sus puntos débiles son:
1. Los resultados dependen en forma muy acentuada de
los valores iniciales elegidos como palabras de código.
2. También hay gran dependencia del número de sectores
M axial como de la implementación de la "distancia"
usada.
3. Puede suceder que algunos de los sectores resulten
vacíos.
Algoritmo LBG:
Se analizará con algún detalle debido a su buen desempeño,
para eso comenzaremos por el algoritmo fundamental LBG. El
algoritmo LBG, lleva su nombre debido a sus autores Y.
Linde, A. Buzo y R. M. Garrí, en él se elige 1 codeword inicial
de entre los vectores de datos a clasificar, luego se utiliza el
algoritmo de división binaria para duplicar el número de
codewords, los vectores de observación se agrupan en torno
a los codewords que les presentan menor distancia, se
recalculan los codewords como la media multidimensional de
cada sector y se agrupan nuevamente los datos, el proceso
se detiene cuando el codebook no presenta variación
significativa y al llegar al número de codewords deseados.
Este algoritmo de gran popularidad (que utiliza el algoritmo k-
Means) produce codebooks que logran un mínimo local en la
función de error por distorsión. Para generar un codebook de
M sectores o palabras de código:
En primer lugar designando un codeword inicial para luego
utilizando una técnica de división llegar a obtener un
codebook inicial, luego iterando la misma técnica de división
en los codewords hasta que llegamos a obtener el numero de
codewords igual a M que va a ser el tamaño del codebook
deseado.
El procesamiento se denomina división binaria:
1. Designar 1 vector del codebook o codeword inicial, este
resulta ser el centroide del grupo de los vectores de
entrenamiento.
2. Calcular la media del grupo de entrenamiento: Calcular
el error o distancia media entre el codeword inicial y los
vectores de entrenamiento.
3. Duplicar el tamaño del codebook mediante la división
de cada codeword.
4. Usar el algoritmo K-Means para tomar el mejor grupo
de centroides para la separación del codebook.
5. Iterar pasos 3 y 4 hasta llegar a un codebook de
tamaño M.
Una de las causas que motivo el uso de un VQ fue la
suposición que, en el límite, el codebook debería idealmente
tener 36 vectores, uno por cada fonema, suposición que es
incorrecta.
Utilización del cuantificador y del codebook
Una vez construido el codebook, el procedimiento para
cuantificar vectores es básicamente realizar una búsqueda
completa a través del codebook para encontrar el mejor
representante. Si anotamos los vectores del codebook, de
tamaño M, como Cw, 1≤ w ≤ M, y tomamos al vector de
observación a ser cuantificado como V, luego el vector
representante o codeword, Vd.*, es:
Un procedimiento de cuantificación para señal de voz elige el
vector más cercano del codebook al vector de observación y
utiliza ese vector denominado codeword, como la
representación resultante para etapas posteriores. Se refiere
como al vector "vecino" más cercano, toma como entrada,
vectores de señal de voz y da como respuesta, a su salida, el
vector que mejor representa esa entrada.
Distancia Euclidiana
La distancia Euclidiana se emplea, para el reconocimiento del
habla, como método para calcular la diferencia existente entre
el codebook obtenido de la palabra dicha por el hablante y el
resto de codebooks almacenados en la base de datos de
entrenamiento del sistema. El resultado final de dicha
comparación es un valor numérico que representa la distancia
entre dos matrices de iguales dimensiones. El codebook
perteneciente a la base de datos de entrenamiento del
sistema cuya distancia al codebook generado para
representar la palabra dicha por el hablante sea menor que el
nivel de comparación establecido por el programador de la
aplicación, identifica la palabra con la que ya existe mayor
semejanza. La fórmula matemática empleada para el cálculo
de la distancia euclidiana en dos o más dimensiones se
muestra en la siguiente ecuación:
Se acostumbra usar dicha métrica para el cálculo de la
distancia entre dos puntos, pero su aplicación va más allá,
permitiendo calcular la distancia entre dos matrices.
TRANSMISOR
La Parte transmisora se realiza luego de que el
reconocimiento de voz utilizando el MATLAB ha sido
corroborado de esa manera se envía un código ASCII a través
del puerto serial el cual llega al PIC 16F877A el cual activa
(envía un pulso eléctrico) al PIC 16F628A el cual transmite un
código ASCII “abrir” de manera inalámbrica utilizando los
módulos RF (conectado al PIN 8) en este caso la parte
transmisora, el código ASCII es recibido y procesado (“abre o
no abre la puerta”), pero esta operación le compete a la parte
receptora del sistema.
La Programación del PIC 16F628A se encuentra en los
ANEXOS.
 CONSTRUCCIÓN DEL SISTEMA
Primero se ha realizado un prototipo inicial en protoboard para
hacer todas las pruebas y cambios hasta tener
perfeccionando el equipo. Se ha probado los elementos
interconectados por posibles fallas y verificado todo lo que
necesitamos.
Figura 2.15: Funcionamiento del equipo
Con los esquemas listos y las pruebas en el protoboard
realizadas, se procede a realizar la placa del circuito y soldar
los elementos como se observa en las figuras 2.16, 2.17.
Figura 2.16.
Figura 2.17.
INTERFAZ GRÁFICA
Para realizar la interfaz gráfica se recurrió al uso de la GUIDE
de MATLab. Dicho entorno nos permite diseñar primero
gráficamente la interfaz de usuario para luego volcar dicha
interfaz a código. En ella se pueden ir colocando sobre un
marco diferentes tipos de botones, textos fijos, textos
dinámicos modificables por el usuario, checkbox, menús
desplegables, imágenes, gráficos, entre otros.
A continuación se mostrará el marco inicial de sobre el que
comenzamos a trabajar y en el que vamos colocando
diferentes botones según nuestras necesidades.
Los Static Text se utilizarán para indicar títulos y
funcionalidades. Los Popup Menu serán menús desplegables
que contendrán las órdenes que guardaremos y luego
trataremos de identificar. El Slider o barra deslizante nos
servirá para que el usuario elija el nivel de precisión del
algoritmo de decisión. Axes1 contendrá la gráfica del audio
ingresado. El Push Button de la izquierda se utilizará para
ingresar nuevos patrones mientras que el Push Button del
centro se utilizará como salida. Por último el Toggle Button de
la derecha se utilizará para iniciar o salir del modo audio
donde se ingresar los comandos a identificar.
Paso siguiente se cambiará el texto, color, tamaño, forma,
posición, tipo y color de letra etc. de cada uno de los objetos
que introdujimos en el entorno según necesidades y gustos
personales. Para esto debemos mencionar que haciendo
doble clic sobre cualquiera de los objetos accedemos a una
tabla con todas las propiedades del mismo para su
modificación. La tabla que se despliega es la que se muestra
abajo.
El entorno finalmente después de todas las modificaciones a
los objetos queda como se muestra abajo:
Cuando presionamos el botón salir se despliega el cartel que
se muestra abajo. Si optamos por la opción Si se cierran
todas las ventanas del programa mientras que si presionamos
No podemos continuar con la ejecución del mismo.
Este es el menú pop up que se desplegará al presionar sobre
uno de ellos. Como se ve aparecen las 6 códigos a identificar
por usuario (por motivos de pruebas), más las ordenes de
confirmación u omisión para cuando se desea Encender o
Apagar y la contraseña para abandonar el modo Reconocer.
En el caso de presionar el botón de Patrón nuevo y después
de haber ingresado el mismo, o sea, transcurridos los dos
segundos a partir de que se lo pulso, se observará el
siguiente cartel.
Si después de haber ingresado un patrón nuevo elegimos el
usuario y la frase donde queremos que se guarde en los
menús pop up se mostrará lo siguiente:
En caso de que se presione sobre los menús pop up y no se
haya ingresado con anterioridad un patrón de audio nuevo se
mostrará el siguiente mensaje de error:
Si recordamos las explicaciones dadas en la parte de
Parametrización, se obtenían dos matrices de observación
que contenían los coeficientes característicos de la frase.
Como la primera se obtenía a partir de la señal de audio sin
silencio e iba desde la muestra 1 a la última menos 26000,
para que no haya un error en el manejo de las matrices y los
vectores, la señal de audio sin silencio debería tener más de
26000 muestras. Esto es porque si no se podría indicar que el
análisis se hiciera hasta la muestra (end-2600) cuyo resultado
sería negativo si el número de muestras fuera menor a 26000
y produciría error. De esta manera se tomo como condición de
compromiso que el archivo de audio que se genera cuando se
ingresa un nuevo patrón o cuando se ingresa una frase a
reconocer tenga como mínimo 28000 muestras. Si esta
condición no se cumple de despliega el siguiente cartel que
obliga a ingresar una nueva orden o patrón.
La siguiente imagen nos muestra la gráfica del audio de una
orden a medida que dicha orden es reproducida por el locutor.
Para cuando el locutor termino la orden dentro de los dos
segundos que le da el sistema a partir que inició a
reproducirla, el sistema muestra la gráfica de la orden
completa en el tiempo.
Es necesario aclarar que cuando comienza la adquisición y
hasta finalizada la gráfica total de la señal (un par de
segundos) el botón que en un principio se denominaba
Reconocer cambia su leyenda a Escape. Esto se debe a que
además de poder abandonar el modo audio de
reconocimiento mediante la reproducción de la contraseña es
posible abandonarlo presionando sobre el Toggle Button
cuando en este figura la leyenda Escape. Esto sucede por un
corto período cada vez que se detecta actividad en el
micrófono, para luego figurar nuevamente la leyenda
Reconocer. Para poder abandonar el modo audio por este
método no es necesario decir la contraseña o alguna de las
frases estipuladas, basta con que el sistema reconozca
presencia de voz en el micrófono y el botón cambia su
funcionalidad, y al presionarlo se abandona dicho modo.
1.7 Planteamiento de la Hipótesis
El sistema de control gestionara el acceso al público y trabajadores de
la estación televisiva Canal 51.
1.8 Definición operacional de las variables
Datos procesados por el sistema de autentificación.
1.9 Operacionalización de las variables.
VARIABLE DIMENSIONES INDICADORES TÉCNICA
INSTRUMEN
TOS
Datos
procesados
por el
sistema de
autenticación
 Digitalizació
n de señales
 Transferenc
ia de datos
digitales.
 Frecuencia de
muestreo
 Numero de bits
 Relación señal
a ruido
 Error de
cuantización.
 Ancho de
banda
 Tasa de bits.
 Tasa de
baudios
 Evaluación
de
parámetros.
 Cálculo
matemático.
 Evaluación
de
parámetros.
 Cálculo
matemático.
 Ficha de
observaci
ón
 Ficha de
evaluació
n de
resultado
s
 Ficha de
observaci
ón
CAPITULO II MARCO METODOLÓGICO.
2.1 Tipo de Investigación.
Descriptiva propositiva
2.2 Diseño o trayectoria metodológica.
X O
Dónde:
X: Sistema de control de autentificación.
O: Trabajadores de Estación Televisiva Canal 51
2.3 Población y muestra.
Dada la naturaleza de la investigación, este proyecto no presenta
población y muestra.
2.4 Técnicas e instrumentos de recolección de datos.
- Observación
Es el registro visual de lo que ocurre en una situación real,
clasificando, consignando los acontecimientos pertinentes de
acuerdo con algún esquema previsto y según el problema que se
estudia. Es preciso estar alerta para discriminar adecuadamente
todo este conjunto posible de informaciones.
- Entrevistas
Este método se utiliza para recabar información en forma verbal, a
través de preguntas que propone el analista. Sirve para analizar la
realidad y estado de la situación problemática, y solamente se
trabajara con el gerente, administrador y jefes de las áreas, quienes
tomaran las decisiones del negocio para la elaboración del Plan
estratégico y el Plan de acción en Tecnologías y Sistemas de
Información.
- Análisis documental
Recolección de información a través de documentos existentes, ya
sean en libros, revistas, tesis e internet, entre otras.
- Consulta a expertos
Se consultara vía correo electrónico, a través de foros y entrevistas
a expertos en Plan Estratégico y Plan de Acción en Tecnologías y
Sistemas de Información.
- Consulta bibliográfica
Se consultara material bibliográfico (tesis, tesinas, libros, revistas,
etc.), así como también información obtenida desde internet, etc.
2.5 Métodos de procesamiento de los datos.
Los datos obtenidos por el sistema serán almacenados, tratados,
comparados y procesados usando el software MATLAB y un Circuito
Integrado Programable (PIC) con algoritmos en lenguaje C.
2.6 Aspectos éticos.
El presente trabajo de investigación respeta los principios éticos de la
dignidad de las personas, justicia y beneficencia.
2.7 Criterios de cientificidad.
Credibilidad, puesto que la información bibliográfica es de primera
fuente y la información de campo recogida es directa de los elemento
que son investigados.
Confirmabilidad, puesto que lo resultados serán llevados a la
comparación de los diferentes estamentos tomados en cuenta y para
ello se utilizara la confirmación por triangulación de los resultados.
Auditabilidad, puesto que se corroborara el presupuesto a proyectar
en base a costos y gastos actuales y verídicos.
CAPITULO III RESULTADOS
Al analizar los requerimientos del sistema de autentificación de
trabajadores de la estación televisiva canal 51 nos encontramos que la
cantidad de trabajadores son en promedio de 20 facilitando y agilizando
el proceso de guardado de los patrones de las claves en el sistema.
Para diseñar un transmisor para el sistema de autentificación
escogimos la comunicación serial combinada con la transmisión
inalámbrica utilizando los módulos RF detallados en el informe.
Al realizar las pruebas del transmisor para el sistema de autenticación
nos dimos cuenta de que la velocidad de transmisión dependía de los
obstáculos y distancia por eso al haber en el canal señales analógicas
en el espectro electromagnético por las transmisiones normales del
canal decidimos utilizarlos en línea de vista vimos que su eficiencia
mejoro notablemente.
La interfaz de usuario (PIC) se comunicó exitosamente con la pc
usando el puerto de comunicaciones serial, se envió un carácter ASCII
indicando el número que identifica a un trabajador.
El sistema reconoció las contraseñas pre grabadas en el sistema y al
ser correctas se pudo comunicar de vuelta al PIC para que transmita la
señal de apertura de la puerta.
RESULTADOS DE LAS PRUEBAS REALIZADAS DEL SISTEMA DE
RECONOCIMIENTO DE VOZ
En lo que concierne a esta parte del informe se describirá como se
fueron realizando y llevando a la práctica los diferentes ítems
mencionados durante el marco teórico.
A continuación comenzamos con el desarrollo de cada parte:
MICRÓFONO
Se utilizó un micrófono integrado a un par de auriculares de la marca
Genius: modelo HS-04S. El mismo cuenta con las siguientes
características.
Conector del micrófono: plug estéreo 3.5mm
Frecuencia de respuesta del micrófono: 50Hz – 20KHz
Impedancia del micrófono: 2.2KOhm
Sensibilidad del micrófono: Requiere -60dB * 4dBB
Este auricular con micrófono de Genius, el HS-04S, le dará la
flexibilidad para hacer de todo... con más comodidad y calidad.
Este auricular con micrófono con cancelación de ruido proporciona
claridad mejorada de audio. Si pasa muchas horas chateando con su
ordenador, jugando o en videoconferencia, tendrá una comodidad
superior con la banda de la cabeza de goma blanda y las almohadillas
de las orejas contienen espuma suave.
También tiene un práctico control de volumen en el cable y su
micrófono se puede colocar tanto a la derecha como a la izquierda, o
sea que elija el HS-04S para sentir más comodidad.
Al margen del modelo y marca del micrófono, es recomendable que
sea unidireccional para minimizar los efectos de ruidos externos.
ADQUISICIÓN. MATLAB
Como se mencionó más arriba se eligió una frecuencia de muestreo de
44100Hz con una resolución de 16 bits y monocanal.
La forma más fácil en MATLab de adquirir audio por palca de sonido es
a través de la función:
wavrecord(n,Fs)
Esta función graba n muestras de la señal de audio, muestreadas a
una frecuencia de Fs. En una primera instancia esta fue la forma
elegida para adquirir la señal pero más adelante se requirió que se
vaya mostrando en pantalla el audio a medida que se iba adquiriendo.
De esta manera hubo que buscar un modo alternativo de adquirir ya
que la función wavrecord no dejaba disponible la señal para el ploteo
en pantalla hasta que no se haya terminado con la adquisición.
Entonces se recurrió al código que se muestra más abajo y que se
explicará brevemente. Este código permite hacer una adquisición de
datos ya sea por la placa de sonido o por algún DSP conectado a la
computadora de acuerdo a la configuración de instrucciones que se
haga.
handles.AI = analoginput('winsound'); Esta línea indica que se creará
un objeto de entrada analógica denominado handles.AI que manejará
la placa de sonido.
chan = addchannel(handles.AI,1); Se selecciona un solo canal.
set(handles.AI,'SampleRate',44100) Esta instrucción indica las
muestras a tomar por segundo.
set(handles.AI,'SamplesPerTrigger',duration*ActualRate) con esta
instrucción se indica la cantidad total de muestras a tomar.
En nuestra aplicación se colocaron dos botones que realizan una
adquisición de audio. Con uno se ingresan los patrones y se realiza
utilizando las instrucciones anteriores. El otro se utiliza para iniciar el
reconocimiento de órdenes y la adquisición es activada por un umbral
de audio en el micrófono. En este caso se deberán especificar las
siguientes instrucciones para que la adquisición se inicie por la
presencia de audio en el micrófono.
set(AI,'TriggerType','software'); Disparo por presencia de audio.
set(AI,'TriggerCondition','rising'); La condición de disparo es
superado un umbral
set(AI,'TriggerConditionValue',0.13); El umbral es 0.13 voltios
set(AI,'TriggerChannel',AI.Channel(1)); Se indica el canal de disparo
En cualquiera de los dos botones se comienza con la adquisición con la
instrucción start(handles.AI)
En el caso que se especificó el trigger por software los datos para
matlab solo interesarán a partir de que se supere el umbral y no desde
que se ejecute start.
A continuación se indicará cual es el trozo de código que permite
adquirir una determinada cantidad de muestras, plotearlas, continuar
con la adquisición, plotear nuevamente y así hasta terminar con la
adquisición. El ejecutarse tan rápidamente pareciera que se gráfica en
tiempo real la señal. La función fundamental para esto es drawnow.
while handles.AI.SamplesAcquired < preview
end
while handles.AI.SamplesAcquired < duration*ActualRate
data = peekdata(handles.AI,preview);
for i=1:882
if abs(data(i))<8e-3
data(i) =0;
end
end
set(handles.h,'ydata',data)
drawnow
end
data = getdata(handles.AI);
handles.grafica=1:1:88200;
handles.h = plot(handles.grafica,data);
title('Orden')
xlabel('Muestras')
ylabel('Nivel de voz')
Después de terminar con la adquisición y gráfica de la señal de audio
se elimina el objeto de entrada analógica que inicialmente se había
creado con las siguientes funciones de MATLab.
delete(handles.AI)
clear handles.AI
PROCESAMIENTO DE LA SEÑAL
Filtrado:
El diseño del filtro se realizó a través de la herramienta Digital Filter
Design2 de MATLab. En la misma se puede hacer una selección de los
parámetros característicos de un filtro, observar su respuesta en
frecuencia, obtener los coeficientes característicos del mismo y conocer
su estabilidad.
Como se puede observar en el bloque se especificó que se quería
diseñar un filtro FIR pasa-banda, tipo ventana, donde esa ventana era
la de Hamming, con frecuencias de corte en 100Hz y 8000Hz a una
frecuencia de muestreo a 44100Hz. Se obtuvo un filtro de orden 800,
estable con una respuesta en frecuencia como la que se muestra en la
imagen. Hay que aclarar que muchas de las características finales del
filtro se obtuvieron a partir de múltiples pruebas donde se evaluó la
respuesta del mismo, su selectividad, estabilidad, atenuación en
bandas de paso, atenuación en bandas de corte y rizado en la banda
de paso; lo que nos llevó a la decisión final.
Sobre el editor de MATLab el filtro diseñado se implementó a través de
los siguientes comandos:
B = FIR1(800,[100 8000]/22050);
patron=filter(B,1,ua4);
Donde FIR1 es la función que devuelve los coeficientes del filtro, donde
se le ingresaron como parámetros el orden del mismo y las frecuencias
de corte. El tipo de ventana no se especificó ya que esta función trae
por defecto la de Hamming que era la elegida. La función filter hace
pasar la señal de voz (ua4 en este caso) a través de los coeficientes
que contiene B (que se obtuvieron con FIR1).
Detección y eliminación de los períodos de silencio de la señal:
Se comienza por hacer un cálculo de la energía de la señal de audio.
Para esto se calcula el valor absoluto de la señal y se obtiene el pico
máximo. Se divide la señal de audio por el valor antes obtenido para
independizar la forma de onda respecto de la intensidad de la señal.
len = length(s); % longitud del vector
d=max(abs(s));
s=s/d;
La señal normalizada se eleva al cuadrado y se divide por el número de
muestras de la señal con lo que se obtiene la energía promedio de la
señal.
avg_e = sum(s.*s)/len
Luego lo que se hará es dividir la señal normalizada en ventanas de un
número determinado de muestras, calcular la energía de ese trozo de
señal y si esa energía es mayor a un porcentaje (tomado como umbral
de decisión) de la energía promedio de la señal completa entonces
dicha ventana se conserva. En caso contrario la ventana se desecha ya
que se interpreta que al no llegar su energía al umbral establecido
entonces esa ventana corresponde con un intervalo de silencio de la
señal de audio.
THRES = 0.02;
y = [0];
for i = 1:400:len-400
seg = s(i:i+399)
e = sum(seg.*seg)/400;
if( e> THRES*avg_e)
y=[y;seg(1:end)];
end;
end;
THRES es el umbral de decisión y corresponde al 2% de la energía
promedio de la señal entera.
Este valor se definió después de varias pruebas observando cuales
eran los resultados de eliminación de silencios. Las ventanas se
eligieron de 400 muestras que a la frecuencia de muestreo (44100Hz)
corresponde a aproximadamente 10ms por lo que no existe la
posibilidad de que en el intento de eliminar silencio se elimine algún
fonema de audio (cuya duración ronda entre los 10 y 20ms).En la
siguiente imagen se mostrará la evolución temporal de la palabra
“hola”. El archivo generado es de 2 segundos, o sea 88200 muestras.
En el se pueden observar los períodos de silencio acompañados con
ruido de fondo. Estos períodos no aportan información al sistema por lo
que se busca eliminarlos.
Esta imagen corresponde al mismo archivo después de haber sido
pasado por el algoritmo de eliminación de silencio.
PARAMETRIZACIÓN
Para la obtención de coeficientes que caractericen a los patrones
guardados y/o a las órdenes de reconocimiento se utilizó la función
melcepst.m. Esta función permite obtener los coeficientes cepstrales en
escala de MEL cuya teoría se mencionó más arriba. La elección de los
coficientes cepstrales en escala de MEL se definió debido a que fue la
que mejores resultados prácticos nos dió.
La función melcepst.m pertenece a la librería Voicebox que se puede
descargar de
http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html.
Esta tiene como argumentos los siguientes parámetros:
melcepst(s,fs,w,nc,p,n,inc,fl,fh)
s= es la señal de audio con los intervalos de silencio eliminados.
fs= es la frecuencia de muestreo que en nuestro caso es de 44100Hz.
Si se omite este parámetro, el algoritmo toma por defecto 11025Hz.
w= es el tipo de filtro que conforma el banco e filtros. Puede ser de
Hamming, Hanning, rectangular, triangular, entre otros. Para el caso
utilizamos una ventana de Hamming aunque se recomienda utilizar un
ventaneo triangular para mejores resultados.
nc= el número de coeficientes cepstrales que caracterizarán a la
parametrización. Por defecto son 12 pero en nuestro caso se utilizaron
14 coeficientes ya que fueron los que mejores resultados arrojaron en
la práctica.
p= indica el número de filtros que tendrá el banco de filtros
característico de este tipo de parametrización. Para nuestra aplicación
se definió un total de 30 filtros para el banco.
n= longitud de las ventanas de muestras. La función melcepst además
de la parametrización hace el ventaneo por lo que es un parámetro a
especificar. En los otros métodos de parametrización como Cepstrum o
LPC tendríamos que haber hecho el ventaneo de la señal antes de la
parametrización.
Vale aclarar que la función impone que sea una potencia de 2 entonces
se eligió n=1024 que corresponde a una ventana de aproximadamente
23ms de duración, valor que se encuentra dentro del rango (20 a 40ms)
donde la señal se considera estacionaria.
inc= indica el solapamiento entre ventanas. El valor por defecto es n/2
que según nuestra elección de n sería 512 muestras pero se eligió
inc=410 por mejores resultados.
Al ejecutar la función melcepst con los argumentos elegidos, esta nos
devuelve una matriz con coeficientes que caracterizan a la señal de
audio ingresada.
La división de la señal de audio favorece a la identificación pero como
la duración de las diferentes palabras no es la misma (ej: televisión
dura más que luces) se realizó un solapamiento en la división de la
señal que eliminaría el inconveniente. Este solapamiento es tomar
como primera parte de la orden desde la muestra 1 a la última menos
22000, y como segunda parte de la orden, se toma de la última menos
26000 a la última. Es decir hay un solapamiento de 400 muestras que
soluciona lo antes mencionado.
Traducido a código queda como sigue:
c01=melcepst(q(1:end-22000),fs,'M',14,30,1024,410,0,0.1815);
c02=melcepst(q(end-26000:end),fs,'M',14,30,1024,410,0,0.1815);
Entonces por cada orden del usuario se obtienen 2 matrices con
coeficientes característicos de la misma.
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final
Informe final

More Related Content

What's hot

paneton-de-quinua-trabajo-modelo
 paneton-de-quinua-trabajo-modelo paneton-de-quinua-trabajo-modelo
paneton-de-quinua-trabajo-modeloSady00012
 
Heuristic Evaluations
Heuristic EvaluationsHeuristic Evaluations
Heuristic Evaluationslorena_moreno
 
Modelo de Organización Inteligente
Modelo de Organización InteligenteModelo de Organización Inteligente
Modelo de Organización Inteligenteidelcarpio
 
Microbiologia industrial
Microbiologia industrialMicrobiologia industrial
Microbiologia industrialVictor Morales
 
Mermelada+de+quinua.docx+trabajo+final
Mermelada+de+quinua.docx+trabajo+finalMermelada+de+quinua.docx+trabajo+final
Mermelada+de+quinua.docx+trabajo+finalnafable
 
EstimacióN Del Costo De Los Objetivos Del Milenio
EstimacióN Del Costo De Los Objetivos Del MilenioEstimacióN Del Costo De Los Objetivos Del Milenio
EstimacióN Del Costo De Los Objetivos Del Milenioguestc74c5d0
 
Introducción a la Gestión del Conocimiento
Introducción a la Gestión del ConocimientoIntroducción a la Gestión del Conocimiento
Introducción a la Gestión del Conocimientolily2009
 
ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...
ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...
ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...LUIS ALBERTO CUNALATA BOMBON
 
Capacitación mipymes desarrollo y gestión de productos (C2)
Capacitación mipymes desarrollo y gestión de productos (C2)Capacitación mipymes desarrollo y gestión de productos (C2)
Capacitación mipymes desarrollo y gestión de productos (C2)Misiones Jesuíticas Chiquitania
 
Estudio y diseño definitivo para ingenio azucarero. msc. francisco martin armas
Estudio y diseño definitivo para ingenio azucarero. msc. francisco martin armasEstudio y diseño definitivo para ingenio azucarero. msc. francisco martin armas
Estudio y diseño definitivo para ingenio azucarero. msc. francisco martin armasFrancisco Martin Armas
 
Bases para la crditacion ceba
Bases para la crditacion cebaBases para la crditacion ceba
Bases para la crditacion cebaCETPRO HYO
 

What's hot (18)

paneton-de-quinua-trabajo-modelo
 paneton-de-quinua-trabajo-modelo paneton-de-quinua-trabajo-modelo
paneton-de-quinua-trabajo-modelo
 
Heuristic Evaluations
Heuristic EvaluationsHeuristic Evaluations
Heuristic Evaluations
 
Modelo de Organización Inteligente
Modelo de Organización InteligenteModelo de Organización Inteligente
Modelo de Organización Inteligente
 
21222
2122221222
21222
 
Manual cv lac
Manual cv lacManual cv lac
Manual cv lac
 
Microbiologia industrial
Microbiologia industrialMicrobiologia industrial
Microbiologia industrial
 
Plan de Ciencia y tecnologia -nicaragua
Plan de Ciencia y tecnologia -nicaragua Plan de Ciencia y tecnologia -nicaragua
Plan de Ciencia y tecnologia -nicaragua
 
Mermelada+de+quinua.docx+trabajo+final
Mermelada+de+quinua.docx+trabajo+finalMermelada+de+quinua.docx+trabajo+final
Mermelada+de+quinua.docx+trabajo+final
 
EstimacióN Del Costo De Los Objetivos Del Milenio
EstimacióN Del Costo De Los Objetivos Del MilenioEstimacióN Del Costo De Los Objetivos Del Milenio
EstimacióN Del Costo De Los Objetivos Del Milenio
 
Introducción a la Gestión del Conocimiento
Introducción a la Gestión del ConocimientoIntroducción a la Gestión del Conocimiento
Introducción a la Gestión del Conocimiento
 
ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...
ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...
ANÁLISIS DE LA CADENA DE SUMINISTRO EN MICRO Y PEQUEÑAS EMPRESAS DE CALZADO E...
 
Capacitación mipymes desarrollo y gestión de productos (C2)
Capacitación mipymes desarrollo y gestión de productos (C2)Capacitación mipymes desarrollo y gestión de productos (C2)
Capacitación mipymes desarrollo y gestión de productos (C2)
 
Estudios vigilancia
Estudios vigilancia Estudios vigilancia
Estudios vigilancia
 
Guia pml
Guia pmlGuia pml
Guia pml
 
Estudio y diseño definitivo para ingenio azucarero. msc. francisco martin armas
Estudio y diseño definitivo para ingenio azucarero. msc. francisco martin armasEstudio y diseño definitivo para ingenio azucarero. msc. francisco martin armas
Estudio y diseño definitivo para ingenio azucarero. msc. francisco martin armas
 
Bases para la crditacion ceba
Bases para la crditacion cebaBases para la crditacion ceba
Bases para la crditacion ceba
 
129917
129917129917
129917
 
Tesis.propuesta de un modelo de inventario
Tesis.propuesta de un modelo de inventarioTesis.propuesta de un modelo de inventario
Tesis.propuesta de un modelo de inventario
 

Similar to Informe final

Rey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambricaRey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambricaGallegos Vazquez Omar
 
Manual de Tecnicas Para Auditoria Informatica
Manual de Tecnicas Para Auditoria InformaticaManual de Tecnicas Para Auditoria Informatica
Manual de Tecnicas Para Auditoria InformaticaDiego Pacheco
 
Rey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambricaRey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambricaErik Patterson
 
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdfComunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdfShakinCrescenzi2
 
Presentación1.pptx
Presentación1.pptxPresentación1.pptx
Presentación1.pptxvimacoll
 
Follower memoria final Universidad Tecnologica de Hermosillo
Follower memoria final Universidad Tecnologica de HermosilloFollower memoria final Universidad Tecnologica de Hermosillo
Follower memoria final Universidad Tecnologica de HermosilloJoaquin Peralta Carvajal
 
DataMining_lastfm
DataMining_lastfmDataMining_lastfm
DataMining_lastfmRub Afonso
 
Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...
Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...
Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...Pedro Arcos Méndez
 
Serie aprender a_investigar,_módulo_3_recolección_de_la_información
Serie aprender a_investigar,_módulo_3_recolección_de_la_informaciónSerie aprender a_investigar,_módulo_3_recolección_de_la_información
Serie aprender a_investigar,_módulo_3_recolección_de_la_informaciónSistemadeEstudiosMed
 

Similar to Informe final (20)

Tesis de grado
Tesis de gradoTesis de grado
Tesis de grado
 
Rey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambricaRey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambrica
 
Diagnostico de Fallas Red Area Local
Diagnostico de Fallas Red Area LocalDiagnostico de Fallas Red Area Local
Diagnostico de Fallas Red Area Local
 
Trabajo de investigacion ing de sistemas
Trabajo de investigacion  ing de sistemasTrabajo de investigacion  ing de sistemas
Trabajo de investigacion ing de sistemas
 
Sp023 anexo 8 plan estrategico institucional
Sp023 anexo 8 plan estrategico institucionalSp023 anexo 8 plan estrategico institucional
Sp023 anexo 8 plan estrategico institucional
 
Manual de Tecnicas Para Auditoria Informatica
Manual de Tecnicas Para Auditoria InformaticaManual de Tecnicas Para Auditoria Informatica
Manual de Tecnicas Para Auditoria Informatica
 
Tesis pre - grado
Tesis pre - gradoTesis pre - grado
Tesis pre - grado
 
Rey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambricaRey manrique fernando_cctv_ip_inalambrica
Rey manrique fernando_cctv_ip_inalambrica
 
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdfComunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
Comunicarlaciencia_15_FranciscoGilyFranciscoGarcaGarca.pdf
 
Msc_Thesis
Msc_ThesisMsc_Thesis
Msc_Thesis
 
Presentación1.pptx
Presentación1.pptxPresentación1.pptx
Presentación1.pptx
 
Tfm ignacio-arriola
Tfm ignacio-arriolaTfm ignacio-arriola
Tfm ignacio-arriola
 
Tesis jaime
Tesis jaimeTesis jaime
Tesis jaime
 
0281 williams
0281 williams0281 williams
0281 williams
 
Follower memoria final Universidad Tecnologica de Hermosillo
Follower memoria final Universidad Tecnologica de HermosilloFollower memoria final Universidad Tecnologica de Hermosillo
Follower memoria final Universidad Tecnologica de Hermosillo
 
DataMining_lastfm
DataMining_lastfmDataMining_lastfm
DataMining_lastfm
 
C2.302
C2.302C2.302
C2.302
 
Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...
Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...
Análisis del uso de algoritmos de Minería de Datos y Machine Learning para Ma...
 
Ciberseguridad
CiberseguridadCiberseguridad
Ciberseguridad
 
Serie aprender a_investigar,_módulo_3_recolección_de_la_información
Serie aprender a_investigar,_módulo_3_recolección_de_la_informaciónSerie aprender a_investigar,_módulo_3_recolección_de_la_información
Serie aprender a_investigar,_módulo_3_recolección_de_la_información
 

More from DiciaUMB

Identidad cultural umb
Identidad cultural umbIdentidad cultural umb
Identidad cultural umbDiciaUMB
 
Comportamiento del consumidor
Comportamiento del consumidorComportamiento del consumidor
Comportamiento del consumidorDiciaUMB
 
Guia de turismo cultural en lambayeque museos y complejos UMB
Guia de turismo cultural en lambayeque museos y complejos UMB Guia de turismo cultural en lambayeque museos y complejos UMB
Guia de turismo cultural en lambayeque museos y complejos UMB DiciaUMB
 
Investigación AHE UMB Morrope Patapo Puerto Eten
Investigación AHE UMB Morrope Patapo Puerto Eten Investigación AHE UMB Morrope Patapo Puerto Eten
Investigación AHE UMB Morrope Patapo Puerto Eten DiciaUMB
 
MORROPE TIERRA DE LA IGUANA
MORROPE TIERRA DE LA IGUANA MORROPE TIERRA DE LA IGUANA
MORROPE TIERRA DE LA IGUANA DiciaUMB
 
PUERTO ETEN MILAGRO DE VIDA EN EL TIEMPO
PUERTO ETEN MILAGRO DE VIDA EN EL TIEMPOPUERTO ETEN MILAGRO DE VIDA EN EL TIEMPO
PUERTO ETEN MILAGRO DE VIDA EN EL TIEMPODiciaUMB
 
Informe de investigacion formativa perfil emprendedor umb
Informe de investigacion formativa perfil emprendedor umbInforme de investigacion formativa perfil emprendedor umb
Informe de investigacion formativa perfil emprendedor umbDiciaUMB
 
Ahte monografia umb
Ahte monografia umbAhte monografia umb
Ahte monografia umbDiciaUMB
 
Monografia 2013 ii final
Monografia 2013   ii finalMonografia 2013   ii final
Monografia 2013 ii finalDiciaUMB
 
Informe final 2011 umb
Informe final 2011 umbInforme final 2011 umb
Informe final 2011 umbDiciaUMB
 
Informe clima social familiar umb
Informe  clima social familiar umbInforme  clima social familiar umb
Informe clima social familiar umbDiciaUMB
 

More from DiciaUMB (12)

Identidad cultural umb
Identidad cultural umbIdentidad cultural umb
Identidad cultural umb
 
Comportamiento del consumidor
Comportamiento del consumidorComportamiento del consumidor
Comportamiento del consumidor
 
Charla
CharlaCharla
Charla
 
Guia de turismo cultural en lambayeque museos y complejos UMB
Guia de turismo cultural en lambayeque museos y complejos UMB Guia de turismo cultural en lambayeque museos y complejos UMB
Guia de turismo cultural en lambayeque museos y complejos UMB
 
Investigación AHE UMB Morrope Patapo Puerto Eten
Investigación AHE UMB Morrope Patapo Puerto Eten Investigación AHE UMB Morrope Patapo Puerto Eten
Investigación AHE UMB Morrope Patapo Puerto Eten
 
MORROPE TIERRA DE LA IGUANA
MORROPE TIERRA DE LA IGUANA MORROPE TIERRA DE LA IGUANA
MORROPE TIERRA DE LA IGUANA
 
PUERTO ETEN MILAGRO DE VIDA EN EL TIEMPO
PUERTO ETEN MILAGRO DE VIDA EN EL TIEMPOPUERTO ETEN MILAGRO DE VIDA EN EL TIEMPO
PUERTO ETEN MILAGRO DE VIDA EN EL TIEMPO
 
Informe de investigacion formativa perfil emprendedor umb
Informe de investigacion formativa perfil emprendedor umbInforme de investigacion formativa perfil emprendedor umb
Informe de investigacion formativa perfil emprendedor umb
 
Ahte monografia umb
Ahte monografia umbAhte monografia umb
Ahte monografia umb
 
Monografia 2013 ii final
Monografia 2013   ii finalMonografia 2013   ii final
Monografia 2013 ii final
 
Informe final 2011 umb
Informe final 2011 umbInforme final 2011 umb
Informe final 2011 umb
 
Informe clima social familiar umb
Informe  clima social familiar umbInforme  clima social familiar umb
Informe clima social familiar umb
 

Recently uploaded

SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxYadi Campos
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfapunteshistoriamarmo
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Katherine Concepcion Gonzalez
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfGruberACaraballo
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxroberthirigoinvasque
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024IES Vicent Andres Estelles
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxFernando Solis
 
EL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptx
EL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptxEL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptx
EL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptxsisimosolorzano
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024IES Vicent Andres Estelles
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primariaWilian24
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdfValeriaCorrea29
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...jlorentemartos
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOluismii249
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.docRodneyFrankCUADROSMI
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxNadiaMartnez11
 

Recently uploaded (20)

SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptxSEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
SEXTO SEGUNDO PERIODO EMPRENDIMIENTO.pptx
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Biografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdfBiografía de Charles Coulomb física .pdf
Biografía de Charles Coulomb física .pdf
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
EL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptx
EL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptxEL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptx
EL HABITO DEL AHORRO en tu idea emprendedora22-04-24.pptx
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdf
 
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
TEMA 14.DERIVACIONES ECONÓMICAS, SOCIALES Y POLÍTICAS DEL PROCESO DE INTEGRAC...
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
SESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.docSESION DE PERSONAL SOCIAL.  La convivencia en familia 22-04-24  -.doc
SESION DE PERSONAL SOCIAL. La convivencia en familia 22-04-24 -.doc
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
 

Informe final

  • 1. CARRERA PROFESIONAL DE INGENIERIA TELEINFORMATICA Diseño e implementación de un transmisor de datos para el sistema de autentificación de trabajadores de la estación televisiva Canal 51 - Chiclayo INFORME DE INVESTIGACION AUTORES: CABRERA MONTALVO, KATHERINE LIMONCHI CORONEL, CARLOS MARTOS PAREDES, ROGGER ANDERSON SANDOVAL VALLE, CRISTIAN JEAN PIERO VERASTEGUI JIMENEZ, MANUEL ENOC ASESOR: PACHAMANGO BAUTISTA, THAUSO GAD Ciclo Académico: 8vo – 2013 II Diciembre de 2013
  • 2. ÍNDICE ASPECTO INFORMATIVO ................................................................................................6 1. Título de la Investigación .........................................................................................6 2. Autores ......................................................................................................................6 3. Asesor........................................................................................................................6 4. Área de investigación. ..............................................................................................6 5. Línea de investigación...............................................................................................6 6. Resolución De Aprobación........................................................................................6 7. Lugar de ejecución....................................................................................................6 8. Duración Total de la Investigación............................................................................7 9. Fecha de inicio...........................................................................................................7 10. Fecha de culminación. ............................................................................................7 CAPITULO I MARCO LÓGICO ........................................................................................7 1.1 Descripción de la Realidad Problemática ...............................................................7 1.2 Formulación del problema de Investigación...........................................................8 1.3 Objeto de la Investigación ......................................................................................8 1.4 Objetivos de la Investigación..................................................................................8 1.4.1. Objetivo General..............................................................................................8 1.4.2. Objetivos Específicos. .....................................................................................9 1.5 Justificación e Importancia de la Investigación......................................................9 1.6 Base teórica- conceptual. ........................................................................................9 1.6.1. Antecedentes de investigación. .......................................................................9 1.6.2. Aspectos teórico- conceptuales. ....................................................................10 1.6.2.1. AUTOMATIZACIÓN Y SISTEMAS DE ACCESO ............................10 1.6.2.2. LA AUTOMATIZACIÓN EN LA INDUSTRIA..................................10 1.6.2.3. SISTEMAS DE ACCESO PARA PUERTAS.......................................13 1.6.2.4. LCD (PANTALLA DE CRISTAL LÍQUIDO) .....................................15 1.6.2.5. TECLADO MATRICIAL 4X4 ..............................................................19 1.6.2.6. EL MICROCONTROLADOR PIC 16F877A .......................................20 1.6.2.7. COMUNICACIÓN SERIAL .................................................................33 1.6.2.8. MODULOS RF ......................................................................................34 1.6.2.9. CONSTRUCCIÓN DEL SISTEMA......................................................35 1.7 Planteamiento de la Hipótesis...............................................................................71 1.8 Definición operacional de las variables................................................................72 1.9 Operacionalización de las variables......................................................................72
  • 3. CAPITULO II MARCO METODOLÓGICO.....................................................................72 2.1 Tipo de Investigación............................................................................................72 2.2 Diseño o trayectoria metodológica. ......................................................................72 2.3 Población y muestra.............................................................................................73 2.4 Técnicas e instrumentos de recolección de datos. ................................................73 2.5 Métodos de procesamiento de los datos. ..............................................................74 2.6 Aspectos éticos. ....................................................................................................74 2.7 Criterios de cientificidad.......................................................................................74 CAPITULO III RESULTADOS .........................................................................................74 CAPITULO IV DISCUSÍÓN..............................................................................................85 CAPITULO V CONCLUSIONES......................................................................................85 CAPITULO VI RECOMENDACIONES ...........................................................................86 REFERENCIAS BIBLIOGRÁFICAS ................................................................................88 ANEXO A ...........................................................................................................................89 HOJAS DEL PROGRAMA DETALLADO DEL MICROCONTROLADOR (MikroC PRO)................................................................................................................................89 ANEXOS B .........................................................................................................................93 ANEXO D ...........................................................................................................................95 Esquemático Circuito PIC con Pantalla LCD..................................................................95 Esquemático Circuito PIC con Puerto Serial...................................................................95 Modulo Transmisor RF ...................................................................................................96 ANEXO E............................................................................................................................97 LISTADOS DE PROGRAMAS......................................................................................97 ANEXO F..........................................................................................................................122 PROGRAMACION DEL PIC 16F628A - TRANSMISOR .........................................122
  • 4. RESUMEN En el presente informe se detalla el funcionamiento, proceso de construcción y los resultados obtenidos de un transmisor para el sistema de autentificación de personal para la Estación televisiva Canal 51, dado que la empresa se ve en la necesidad de encontrar una manera en los visitantes sean identificados y accedan automáticamente solo el personal autorizado. Consta de una interfaz de usuario compuesta por una pantalla LCD, un teclado 4x4 manejados por un micro controlador PIC y un micrófono y parlante conectados a un DSP (Dispositivo procesador de señales) que en este caso usamos la tarjeta de sonido de una pc. Para lograr la comunicación entre la interfaz de usuario y el DSP se utiliza un puerto de comunicación serial y ambas etapas funcionando a través de comandos del programa MATLAB. Luego de las pruebas con el prototipo concluimos que el sistema procesa los datos correctamente y cumple con los objetivos propuestos.
  • 5. ABSTRACT This report describes the operation, construction process and the results obtained from the transmitter to the workers authentication system for the television station “Canal 51”, as the company is in the need to find a way to automatically identify visitors and only allow entry to authorized personnel. It has a user interface consists of a LCD display, one 4x4 keypad operated by a PIC microcontroller and a microphone and speaker connected to a SPD (signal processor device) in this case we use the sound card of a PC. To achieve communication between the user interface and the SPD we use a serial port communication and both stages run through MATLAB commands. After testing the prototype, we conclude the data processing is correct and satisfy the objectives.
  • 6. ASPECTO INFORMATIVO 1. Título de la Investigación Diseño e implementación de un transmisor de datos para el sistema de autentificación de trabajadores de la estación televisiva Canal 51 – Chiclayo567 2. Autores  Cabrera Montalvo, Katherine vicm_2402@hotmail.com  Limonchi Coronel, Carlos calico.200594@hotmail.com  Martos Paredes, Rogger Anderson roanmar_15@hotmail.com  Sandoval Valle, Piero piero_mio_1@hotmail.com  Verastegui Jimenez, Manuel Enoc manuel_10_84@hotmail.com 3. Asesor Ing. Thauso G. Pachamango Bautista 4. Área de investigación. Procesamiento digital de Señales 5. Línea de investigación. Algoritmos adaptativos 6. Resolución De Aprobación Oficio N° 013-DICIA-UMB-2013 7. Lugar de ejecución. Chiclayo
  • 7. 8. Duración Total de la Investigación 4 meses 9. Fecha de inicio. Agosto 2013 10. Fecha de culminación. Diciembre 2013 CAPITULO I MARCO LÓGICO 1.1 Descripción de la Realidad Problemática El presente trabajo de investigación se encuentra en la intersección de dos disciplinas de la ingeniería, la automatización y el procesamiento de señales. La automatización se basa en sistemas de control, instrumentación industrial e instrumentos computarizados que incluyen sensores, transmisores, sistemas de control y supervisión, Circuitos integrados Programables (PIC). El procesamiento digital de señales es la manipulación matemática de una señal de información para modificarla, procesarla o mejorarla en algún sentido. Esto se puede conseguir mediante procesadores o microprocesadores que poseen una secuencia de instrucciones, un hardware como interfaz para la recolección de señales y un software optimizado para aplicaciones que requieran operaciones numéricas a muy alta velocidad, en este caso se usara MATLAB. Los PIC’s fueron creados por Microchip en la década de 1980 y sus aplicaciones fueron casi ilimitadas, usando un entorno de programación se lograba controlar procesos a través de dispositivos de entrada y salida. En la actualidad, los PIC’s cumplen roles muy importantes dentro del procesamiento digital de señales, conforman la etapa que controla dispositivos como pantallas alfanuméricas LCD, control de teclados, control de memorias seriales, control de temperatura, control de robots,
  • 8. televisores, interfaz de PC, dispositivos de audio, sistemas de alarma, relojes digitales, control de acceso y debido a su versatilidad se vuelven indispensables en el desarrollo de proyectos a menor y gran escala. En nuestro país, como en muchos de Latinoamérica estos dispositivos cumplen un rol didáctico en conjunto con PLC (Control Lógico Programable), el cual es un dispositivo de control a nivel industrial y cumplen funciones complementarias dentro de un sistema de automatización de procesos. Los cuales no se ven aplicados en proyectos ambiciosos, las empresas privadas usan este tipo de tecnología transparente a los usuarios y esto conlleva a un gasto elevado para obtener estos sistemas de control. En el presente proyecto se desarrollara un sistema de control de acceso usando PIC, dispositivos de comunicación digital y software de procesamiento de señales para la autenticación de trabajadores de la estación televisiva Canal 51. 1.2 Formulación del problema de Investigación ¿El diseño e implementación de un transmisor de datos gestionara la autentificación de trabajadores de la estación televisiva canal 51 de Chiclayo? 1.3 Objeto de la Investigación La necesidad por parte de la empresa de un sistema de autentificación eficiente que controle el ingreso de personal automáticamente. 1.4 Objetivos de la Investigación 1.4.1. Objetivo General. Diseñar e implementar un transmisor de datos para el sistema de autentificación de trabajadores de la estación televisiva Canal 51 de Chiclayo.
  • 9. 1.4.2. Objetivos Específicos.  Analizar los requerimientos del sistema de autentificación de trabajadores de la estación televisiva canal 51  Diseñar un transmisor para el sistema de autentificación.  Implementar un transmisor para el sistema de autenticación.  Realizar las pruebas de operatividad y eficiencia del transmisor. 1.5 Justificación e Importancia de la Investigación. Debido al ritmo de trabajo que posee la empresa y la falta de personal que supervise la llegada de visitantes y otros empleados el personal, se propone como solución la implementación de un sistema de autentificación de trabajadores y visitantes en general que permita dar acceso al personal autorizado y lo niegue a toda persona externa a la empresa, sin interrumpir las labores del personal de turno. La importancia de este sistema radica en el control de entrada del público, ahorro de costos de personal, mejoramiento de la productividad del personal, gestionar la apertura de puertas y proporcionar un valor agregado de modernización. 1.6 Base teórica- conceptual. 1.6.1. Antecedentes de investigación. No se encontró información competente para proporcionar un registro de documentación que ayude en la creación de un Transmisor de datos para sistemas de identificación. Sin embargo, existen empresas privadas de seguridad que brindan dispositivos de validación de contraseñas para restringir el ingreso de personal de las empresas clientes; a diferencia del presente sistema propuesto que además de procesar contraseñas de trabajadores, posee un segundo nivel de procesamiento de voz.
  • 10. 1.6.2. Aspectos teórico- conceptuales. 1.6.2.1. AUTOMATIZACIÓN Y SISTEMAS DE ACCESO La automatización es un sistema de fabricación diseñado con el fin de usar la capacidad de las máquinas para llevar a cabo determinadas tareas anteriormente efectuadas por seres humanos, y para controlar la secuencia de las operaciones sin intervención humana. El término automatización también se ha utilizado para describir sistemas no destinados a la fabricación en los que dispositivos programados o automáticos pueden funcionar de forma independiente o semiindependiente del control humano. En comunicaciones, aviación y astronáutica, dispositivos como los equipos automáticos de conmutación telefónica, los pilotos automáticos y los sistemas automatizados de guía y control se utilizan para efectuar diversas tareas con más rapidez o mejor de lo que podría hacerlo un ser humano. 1.6.2.2. LA AUTOMATIZACIÓN EN LA INDUSTRIA. Muchas industrias están muy automatizadas, o bien utilizan tecnología de automatización en alguna etapa de sus actividades. En las comunicaciones, y sobre todo en el sector telefónico, la marcación, la transmisión y la facturación se realizan automáticamente. También los ferrocarriles están controlados por dispositivos de señalización automáticos, que disponen de sensores para detectar los convoyes que atraviesan determinado punto. De esta manera siempre puede mantenerse un control sobre el movimiento y ubicación de los trenes. No todas las industrias requieren el mismo grado de automatización. La agricultura, las ventas y algunos sectores de servicios son difíciles de automatizar. Es posible que la agricultura llegue a estar más
  • 11. mecanizada, sobre todo en el procesamiento y envasado de productos alimenticios. Sin embargo, en muchos sectores de servicios, como los supermercados, las cajas pueden llegar a automatizarse, pero sigue siendo necesario reponer manualmente los productos en las estanterías. El concepto de automatización está evolucionando rápidamente, en parte debido al desarrollo tecnológico y a que las técnicas avanzan tanto dentro de una instalación o sector como entre las industrias. Por ejemplo, el sector petroquímico ha desarrollado el método de flujo continuo de producción, posible debido a la naturaleza de las materias primas utilizadas. En una refinería, el petróleo crudo entra por un punto y fluye por los conductos a través de dispositivos de destilación y reacción, a medida que va siendo procesado para obtener productos como la gasolina. Un conjunto de dispositivos controlados automáticamente, dirigidos por microprocesadores y controlados por una computadora central, controla las válvulas, calderas y demás equipos, regulando así el flujo y las velocidades de reacción. Por otra parte, en las industrias metalúrgicas, de bebidas y de alimentos envasados, algunos productos se elaboran por lotes. Por ejemplo, se carga un horno de acero con los ingredientes necesarios, se calienta y se produce un lote de lingotes de acero. En esta fase, el contenido de automatización es mínimo. Sin embargo, a continuación los lingotes pueden procesarse automáticamente como láminas o dándoles determinadas formas estructurales mediante una serie de rodillos hasta alcanzar la configuración deseada.
  • 12. Los sectores de automoción y de otros productos de consumo utilizan las técnicas de producción masivas de la fabricación y montaje paso a paso. Esta técnica se aproxima al concepto de flujo continuo, aunque incluye máquinas de transferencia. Por consiguiente, desde el punto de vista de la industria del automóvil, las máquinas de transferencia son esenciales para la definición de la automatización. Cada una de estas industrias utiliza máquinas automatizadas en la totalidad o en parte de sus procesos de fabricación, como se puede apreciar en la figura 1.1. Como resultado, cada sector tiene un concepto de automatización adaptado a sus necesidades específicas. En casi todas las fases del comercio pueden hallarse más ejemplos. La propagación de la automatización y su influencia sobre la vida cotidiana constituye la base de la preocupación expresada por muchos acerca de las consecuencias de la automatización sobre la sociedad y el individuo. Figura 2.1: Automatización
  • 13. 1.6.2.3. SISTEMAS DE ACCESO PARA PUERTAS Un sistema de control de acceso físico para puertas involucra hardware y software. Consiste en implementar algún mecanismo electrónico mecánico que identifique si la persona que quiere entrar está autorizada y en base a ello otorgar acceso a alguna dependencia (permitir ingreso). Características de los sistemas de control de acceso: Control dependiendo de horarios y perfiles de acceso. Por ejemplo puede crear un perfil de "empleado de aseo" el cual puede hacer ingreso a sus dependencias en cierto horario, mientras que el perfil de usuario "ejecutivos administrativos" puede hacerlo en otro. Esto permite que un empleado del aseo no pueda tener acceso a una puerta de un área restringida en otro horario que no sea el que se le asignó en el sistema de control de acceso. En el anexo C, se tiene un artículo que hace referencia acerca de la seguridad. Diversos tipos de puertas o portones. Se puede instalar los equipos de control de acceso en puertas o portones de todo tipo (puertas de vidrio, puertas de madera, puertas de aluminio, rejas, etc.) Variados tipos de mecanismos de cierre. Puede instalar cerraduras eléctricas, cerraduras magnéticas, con pivotes, etc.) Variados tipos de identificación. Los sistemas de control de acceso pueden funcionar con variados tipos de tecnología (tarjetas HID, tarjetas con código de barras, equipos biométricos, tarjetas de banda magnética, teclados, botoneras).
  • 14. Software de control y gestión. Los equipos pueden contar con el software asociado que permite hacer gestión sobre los accesos controlados, permitiendo mediante software habilitar o deshabitar usuarios, además de poder hacer una gestión posterior en base a las marcas de acceso (fecha y hora). Exportación de los datos. Las marcas de acceso por las puertas se pueden exportar a MS Excel, dbf, MS Access o txt.  Control remoto. Es posible abrir puertas desde el software (también abrir puertas desde el computador). Todos estos equipos le darán mayor seguridad y control en áreas restringidas. Podemos tener equipos de identificación de personal basados en:  Identificación de huella digital (biometría),  Tarjetas de código de barras,  Tarjetas de banda magnética,  Tarjetas de proximidad HID,  Tarjetas de proximidad Mifare,  Tarjetas de proximidad INDALA,  Teclado para ingresar número de usuario y contraseña, Además podemos acompañar su control de acceso con:  Detectores de metales,  Retenedores electromagnéticos,  Cerraduras electromagnéticas, pivotes  Teclados para acceso,
  • 15.  Lectoras de huella dactilar,  Botones para activación de puertas,  Verificador de rutina para vigilantes, Algunos de los sistemas de control desarrollados en la actualidad se muestran en la figuras 2.2 a, 2.2 b: a) Figura 2.2 a: Control de acceso para puertas b) Figura 2.2 b: Control de acceso 1.6.2.4. LCD (PANTALLA DE CRISTAL LÍQUIDO) La pantalla de cristal líquido es uno de los visualizadores más utilizados en la actualidad debido a las importantes ventajas que ofrece, por ejemplo permiten mostrar mensajes que indican al operario el estado de la máquina, o para dar instrucciones de manejo, mostrar valores, etc.
  • 16. Es decir que permite la comunicación entre máquinas y humanos, ya que los mensajes que se visualizan en la pantalla del LCD pueden mostrar cualquier código ASCII, introduciendo el código correspondiente de cada uno de los caracteres a visualizar. En el mercado existen varias presentaciones por ejemplo de 2 líneas por 8 caracteres, 2X16, 2X20, 4X20, etc. A pesar de que la variedad de modelos del LCD es muy grande, las líneas necesarias para su conexión y control son prácticamente las mismas. Para la visualización del proyecto se utiliza un LCD 2X16 como se muestra en la figura 2.3 y a continuación se indica sus aspectos más relevantes. Figura 2.3: LCD 2X16 a) DESCRIPCIÓN DEL LCD: La pantalla LCD (Liquid Crystal Display) es un dispositivo microcontrolador de visualización grafico para la presentación de caracteres, símbolos o incluso dibujos, en este caso disponen de 2 filas de 16 caracteres cada una y cada carácter dispone de una matriz de 5x7 puntos (pixels), aunque los hay de otro número de filas y caracteres.
  • 17. Este dispositivo está gobernado internamente por un microcontrolador Hitachi 44780 y regula todos los parámetros de presentación, este modelo es el más comúnmente utilizado. b) DESCRIPCIÓN DE PINES En la Figura tabla 2.4: Se puede visualizar la distribución de pines del LCD 2x16, y en la tabla 2.1 La función que cumple cada pin. Figura 2.4: Distribuciones de pines T a b l a Tabla 2.1: Función de cada pin del L PIN SIMBOLO DESCRIPCIÓN 1 VSS Tierra de alimentación GND 2 Vdd Alimentación de +5V 3 Vo Ajuste del contraste del cristal líquido (0 a +5V) 4 RS Selección del Registro controlados RS=0 reg. Control RS=1 5 R/W Lectura /Escritura en LCD R/W=0 escritura R/W=1 6 E Habilitación 7 D0 Bit menos significativo (bus de datos bidireccional) 8 D1 9 D2 10 D3 11 D4 12 D5 13 D6 14 D7 Bit más significativo (bus de datos bidireccional)
  • 18. Características principales  Pantalla de caracteres ASCII.  Desplazamiento de los caracteres hacia la izquierda o la derecha.  Proporciona la dirección de la posición absoluta o relativa del carácter.  Memoria de 40 caracteres por línea de pantalla.  Movimiento del cursor y cambio de su aspecto.  Permite que el usuario pueda programar 8 caracteres.  Conexión a un procesador usando un interfaz de 4 u 8 bits. Funcionamiento Para comunicarse con la pantalla LCD podemos hacerlo por medio de sus pines de entrada de dos maneras posibles, con bus de 4 bits o con bus de 8 bits, estos dos se diferencian en el tiempo de retardo, pues la comunicación a 4 bits, primero envía los 4 bits más altos y luego los 4 bits más bajos, mientras que la de 8 bits envía todo al mismo tiempo, esto no es un inconveniente si consideramos que el LCD trabaja en microsegundos (µs). Para la aplicación del proyecto se utiliza la conexión de 4 bits más altos de LCD, con esto es suficiente para enviar los mensajes. c) COMPONENTES:  Pantalla de cristal líquido Twisted Nematic (TN).  Film de filtro vertical para polarizar la luz que entra.  Substrato de vidrio con electrodos de Óxido de Indio ITO. Las formas de los electrodos determinan las formas negras que aparecen cuando la pantalla se enciende y apaga. Los cantos verticales de la superficie son suaves.
  • 19.  Cristales líquidos "Twisted Nematic" (TN).  Substrato de vidrio con film electrodo común (ITO) con los cantos horizontales para alinearse con el filtro horizontal.  Film de filtro horizontal para bloquear/permitir el paso de luz.  Superficie reflectante para enviar devolver la luz al espectador. En un LCD retroiluminado, esta capa es reemplazada por una fuente luminosa. Figura 2.5: se aprecian las capas de cristales que tiene un LCD 1.6.2.5. TECLADO MATRICIAL 4X4 a) DESCRIPCIÓN: Dispositivo de entrada de datos que consta de 16 teclas o pulsadores, dispuestos e interconectados en filas y columnas, como observamos en la figura 2.6. Dispone de conector SIL (Single In Line) macho de 8 pines que se corresponden con las 4 filas y las 4 columnas de las que dispone. Figura 2.6: Teclado matricial y esquema
  • 20. b) FUNCIONAMIENTO: En la figura 2.6 vemos el esquema de conexión interna del teclado matricial y sus correspondientes pines de salida numerados de izquierda a derecha mirando el teclado tal y como se ve en la foto de la figura 2.6. Cuando se presiona un pulsador se conecta una fila con una columna, teniendo en cuenta este hecho es muy fácil averiguar que tecla fue pulsada. También podemos ver la conexión típica con el puerto B del PIC. Las resistencias de 2K2 son necesarias para poder compartir el puerto del PIC independientemente del teclado y por ejemplo poder conectar un LCD o una barra de leds al mismo tiempo. Durante la fase de lectura del teclado la mitad del puerto B es configurada como entrada y la otra mitad como lectura y durante la escritura en el LCD u otro sistema, el puerto B es configurada como salidas. Entonces se podrían cortocircuitar accidentalmente las salidas de los puertos provocando su destrucción, si pulsásemos alguna tecla es ese momento con lo que al poner estas resistencias evitamos este hecho y si se produjera el cortocircuito tan solo circularía una pequeña corriente y el puerto del PIC no correría ningún riesgo. 1.6.2.6. EL MICROCONTROLADOR PIC 16F877A a) DESCRIPCION: Se denomina microcontrolador a un dispositivo programable capaz de realizar diferentes actividades que requieran del procesamiento de datos digitales y del control y comunicación digital de diferentes dispositivos.
  • 21. Los microcontroladores poseen una memoria interna que almacena dos tipos de datos; las instrucciones, que corresponden al programa que se ejecuta, y los registros, es decir, los datos que el usuario maneja, así como registros especiales para el control de las diferentes funciones del microcontrolador. Los microcontroladores se programan en MPlaB, Assembler, MicroC-PRO y cada microcontrolador varía su conjunto de instrucciones de acuerdo a su fabricante y modelo. De acuerdo al número de instrucciones que el microcontrolador maneja se le denomina de arquitectura RISC (reducido) o CISC (complejo). Los microcontroladores poseen principalmente una ALU (Unidad Lógico Aritmética), memoria del programa, memoria de registros, y pines I/O (entrada y/0 salida). La ALU es la encargada de procesar los datos dependiendo de las instrucciones que se ejecuten como por ejemplo: ADD, OR, AND, etc., mientras que los pines son los que se encargan de comunicar al microcontrolador con el medio externo; la función de los pines puede ser de transmisión de datos, alimentación de corriente para el funcionamiento de este o pines de control especifico. En este proyecto se utilizo el PIC 16F877A. Este microcontrolador es fabricado por Microchip familia a la cual se le denomina PIC. Posee varias características que hacen a este microcontrolador un dispositivo muy versátil, eficiente y práctico para ser empleado en la aplicación que posteriormente será detallada. Algunas de estas características se muestran a continuación:  Soporta modo de comunicación serial, posee dos
  • 22. pines para ello.  Amplia memoria para datos y programa.  Memoria reprogramable: La memoria en este PIC es la que se denomina FLASH; este tipo de memoria se puede borrar electrónicamente (esto corresponde a la “F” en el modelo).  Set de instrucciones reducidas (tipo RISC), pero con las instrucciones necesarias para facilitar su manejo. b) CARACTERÍSTICAS: En la tabla 2.2 se pueden observar las características más relevantes del dispositivo. NOMBRE DEL PIN PIN TIPO TIPO DE BUFFER DESCRIPCIÓN OSC1/CLKIN 13 I ST/MOS Entrada del oscilador de cristal / Entrada de señal de reloj externa OCS2/CLKOUT 14 O - Salida del oscilador del cristal MCLR/Vpp/THV 1 I/P ST Entrada del Master clear (Reset) o entrada de voltaje de programación o modo de control high voltaje test
  • 23. RA0/AN0 RA1/AN1 RA2/AN2/Vref- RA3/AN3/Vref+ RA4/TOCKI RA5/SS/AN4 2. 3 4 5 6 7 I/O I/O I/O I/O I/O I/O TTL TTL TTL TTL ST TTL PORTA es un puerto I/O bidireccional RAO: puede ser salida analógica 0 RA1: puede ser salida analógica 1 RA2: puede ser salida analógica 2 o referencia negativa de voltaje RA3: puede ser salida analógica 3 o referencia positiva de voltaje RA4: puede ser entrada de reloj timer0. RA5: puede ser salida analógica 4 o el esclavo seleccionado por el puerto serial síncrono. RBO/INT RB1 RB2 RB3/PGM RB4 RB5 RB6 RB7/PGD 33 34 35 36 37 38 39 40 I/O I/O I/O I/O I/O I/O I/O I/O TTL/ST TTL TTL TTL TTL TTL TTL/ST TTL/ST PORTB es un puerto I/O bidireccional. Puede ser programado todo como entradas RB0 puede ser pin de interrupción externo. RB3: puede ser la entrada de programación de bajo voltaje. Pin de interrupción Pin de interrupción Pin de interrupción. Reloj de programación serial RCO/T1OSO/TIC KI RC1/T1OS1/CC 15 16 I/O I/O ST ST PORTC es un puerto I/O bidireccional RCO puede ser la salida del oscilador timer1 o la entrada de reloj del timer1 RC1 puede ser la entrada del oscilador timer1 o salida PMW 2 RC2 puede ser una entrada de
  • 24. P2 RC2/CCP1 RC3/SCK/SCL RC4/SD1/SDA RC5/SD0 RC6/Tx/CK RC7/Rx/DT 17 18 23 24 25 26 I/O I/O I/O I/O I/O I/O ST ST ST ST ST ST captura y comparación o salida PWN RC3 puede ser la entrada o salida serial de reloj síncrono para datos SPI y modo I2C RC4 puede ser la entrada de datos SPI e I2C RC5 puede ser la salida de datos SPI RC6 puede ser el transmisor asíncrono USART o el reloj síncrono RC7 puede ser el receptor asíncrono USART o datos síncronos RD0/PSP0 RD1/PSP1 RD2/PSP2 RD3/PSP3 RD4/PSP4 RD5/PSP5 RD6/PSP6 RD7/PSP7 19 20 21 22 27 28 29 30 I/O I/O I/O I/O I/O I/O I/O I/O ST/TTL ST/TTL ST/TTL ST/TTL ST/TTL ST/TTL ST/TTL ST/TTL PORTD es un Puerto bidireccional paralelo
  • 25. RE1/WR/AN5 RE1/WR/AN RE2/CS/AN7 8 9 10 I/O I/O I/O ST/TTL ST/TTL ST/TTL PORTE es un puerto I/O bidireccional REO: puede ser control de lectura para el puerto esclavo paralelo o entrada analógica 5 RE1: puede ser escritura de control para el puerto paralelo esclavo o entrada analógica 6 RE2: puede ser el selector de control para el puerto paralelo esclavo o la entrada analógica 7 Vss 12 31 P - Referencia de tierra para los pines lógicos y de I/O Vdd 11 32 P - Fuente positiva para los pines lógicos y de I/O NC - - - No está conectado internamente Tabla 2.2. Características del PIC Descripción de los puertos: Puerto A: Puerto de E/S de 6 pines RA0 è RA0 y AN0 RA1 è RA1 y AN1 RA2 è RA2, AN2 y Vref- RA3 è RA3, AN3 y Vref+ RA4 è RA4 (Salida en colector abierto) y T0CKI(Entrada de reloj del modulo Timer0) RA5 è RA5, AN4 y SS (Selección esclavo para el puerto serie síncrono) Puerto B: Puerto E/S 8 pines Resistencias pull-up programables
  • 26. RB0 è Interrupción externa RB4-7 è Interrupción por cambio de flanco RB5-RB7 y RB3 è programación y debugger in circuit Puerto C: Puerto E/S de 8 pines RC0 è RC0, T1OSO (Timer1 salida oscilador) y T1CKI (Entrada de reloj del modulo Timer1). RC1-RC2 è PWM/COMP/CAPT RC1 è T1OSI (entrada osc timer1) RC3-4 è IIC RC3-5 è SPI RC6-7 è USART Puerto D: Puerto e/s de 8 pines Bus de datos en PPS (Puerto paralelo esclavo) Puerto E: Puerto de E/S de 3 pines RE0 è RE0 y AN5 y Read de PPS RE1 è RE1 y AN6 y Write de PPS RE2 è RE2 y AN7 y CS de P
  • 27. Figura 2.7: se aprecia la distribución de pines del PIC 16F877A.
  • 28. Figura 2.8: se muestra el diagrama de conexiones internas del PIC.
  • 29. Dispositivos periféricos: Timer0: Temporizador-contador de 8 bits con preescaler de 8 bits Timer1: Temporizador-contador de 16 bits con preescaler que puede incrementarse en modo sleep de forma externa por un cristal/clock. Timer2: Temporizador-contador de 8 bits con preescaler y postescaler. Dos módulos de Captura, Comparación, PWM (Modulación de Anchura de Impulsos). Conversor A/D de 1 0 bits. Puerto Serie Síncrono Master (MSSP) con SPI e I2C (Master/Slave). USART/SCI (Universal Syncheronus Asynchronous Receiver Transmitter) con 9 bit. Puerta Paralela Esclava (PSP) solo en encapsulados con 40 pines. c) PROGRAMACIÓN El PIC usa un juego de instrucciones tipo RISC, cuyo número puede variar desde 35 instrucciones para PICs de gama baja a 70 para los de gama alta. Las instrucciones se clasifican entre las que realizan operaciones entre el acumulador y una constante, entre el acumulador y una posición de memoria, instrucciones de condicionamiento y de salto/retorno, implementación de interrupciones y una para pasar a modo de bajo consumo llamada sleep.
  • 30. Tenemos los siguientes términos importantes en la programación de microcontroladores:  Ensamblador.- La programación en lenguaje ensamblador puede resultar un tanto ardua, pero permite desarrollar programas muy eficientes, ya que otorga el dominio absoluto del sistema. Los fabricantes suelen proporcionar el programa ensamblador de forma gratuita.  Compilador.- La programación en un lenguaje de alto nivel (como el C ó el Basic) permite disminuir el tiempo de desarrollo de un producto.  Depuración.- Debido a que los microcontroladores van a controlar dispositivos físicos, se necesita herramientas que permitan comprobar el buen funcionamiento del microcontrolador cuando esté conectado al resto de circuitos.  Simulador.- Son capaces de ejecutar en un PC programas realizados para el microcontrolador. Los simuladores permiten tener un control absoluto sobre la ejecución de un programa, siendo ideales para la depuración de los mismos. Su gran inconveniente es que es difícil simular la entrada y salida de datos del microcontrolador. Tampoco cuentan con los posibles ruidos en las entradas, pero, al menos, permiten el paso físico de la implementación de un modo más seguro y menos costoso, puesto que ahorraremos en grabaciones de chips para las pruebas físicas. Para transferir el código de un ordenador al PIC normalmente se usa un dispositivo llamado programador. La mayoría de PICs que Microchip distribuye hoy en día incorporan ICSP (In Circuit Serial Programming, programación serie incorporada) o LVP (Low Voltage Programming, programación a bajo voltaje), lo que
  • 31. permite programar el PIC directamente en el circuito destino. Para la ICSP se usan los pines RB6 y RB7 como reloj y datos y el MCLR para activar el modo programación aplicando un voltaje de unos 11 voltios. Existen muchos programadores de PICs, desde los más simples que dejan al software los detalles de comunicaciones, a los más complejos, que pueden verificar el dispositivo a diversas tensiones de alimentación e implementan en hardware casi todas las funcionalidades. Se va a utilizar el lenguaje C. Las variables y constantes deben ser definidas para determinar la asignación de memoria requerida. El compilador que se utiliza es el mikroC-PRO. Variables Algunos tipos de variables utilizados en mikroC-PRO son los que podemos observar en la tabla 2.3: Tabla 2.3: Variables de programación Tipos de variables.
  • 32. Los operadores nos sirven para hacer cómputos cuando los utilizamos con variables. Operadores Matemáticos Principales operadores matemáticos están los mostrados en la tabla 2.4: Tabla 2.4: Operadores matemáticos Tabla 2.5: Operadores Relacionales T a b l Tabla 2.6: Operadores lógicos
  • 33. Las instrucciones son acciones algorítmicas dentro de un programa. Existen los siguientes tipos: Instrucciones de asignación.- Son las que evalúan una expresión y asignan este valor a una variable. Se las reconoce porque utilizan el signo “=”. Instrucciones condicionales.-Son instrucciones que permiten seleccionar de un grupo de alternativas un valor o acción específico. Dentro de estos están el if (si) y el select case (selección de caso). Instrucciones de interacción.- Estas permiten tener un ciclo repetitivo de instrucciones. Tenemos a for (para), while (mientras) y do (hacer) Instrucciones de salto.- Sirven para transferir el control hacia otras instrucciones. Tenemos a break (romper), continue (continuar), exit (salir), goto (ir a), gosub (ir a subrutina). 1.6.2.7. COMUNICACIÓN SERIAL Se llama serial, porque los bits se reciben unos detrás de otro o en serie. Una de las maneras para realizar la comunicación entre dos PC’s y PC a circuito es utilizando un cable serial, conectado a los puertos seriales de ambos.
  • 34. La comunicación serial utiliza el protocolo RS-232, en un extremo del cable de comunicaciones se encuentra un conector llamado DB9 hembra y del otro extremo un conector DB9 macho.  MAX232 Es un circuito integrado que convierte los niveles de las líneas de un puerto serie RS232 a niveles TTL y viceversa. Sólo necesita una alimentación de 5V, ya que genera internamente algunas tensiones que son necesarias para el estándar RS232. Soluciona la conexión necesaria para lograr comunicación entre el puerto serie de una PC y cualquier otro circuito con funcionamiento en base a señales de nivel TTL/CMOS. TX es la señal de transmisión de datos, RX es la de recepción, y RTS y CTS se utilizan para establecer el protocolo para el envío y recepción de los datos. Figura 2.7: Circuito MAX232 1.6.2.8. MODULOS RF a) DESCRIPCIÓN Módulos de RF son ampliamente utilizados en el diseño electrónico debido a la dificultad de diseñar circuitos de
  • 35. radio. Un buen diseño de radio electrónico es notoriamente complejo debido a la sensibilidad de los circuitos de radio y la precisión de componentes y diseños necesarios para lograr un funcionamiento en una frecuencia específica. b) FUNCIONAMIENTO Módulo de frecuencia de radio es un pequeño circuito electrónico que se utiliza para transmitir y / o recibir señales de radio en uno de un número de frecuencias portadoras. 1.6.2.9. CONSTRUCCIÓN DEL SISTEMA La tecnología va evolucionando en nuestro diario vivir, con ello se desarrollan nuevos sistemas que mejoran nuestra condición de vida y nos ayudan en tareas cotidianas. Con la utilización de elementos electrónicos como: capacitores, resistencias, microcontrolador PIC. Se ha desarrollado este sistema. El equipo está construido con la finalidad de dar un acceso automatizado a nuestra casa, oficina y en este caso en particular para el ingreso a la estación televisiva del canal 51- Chiclayo. La utilidad de la construcción de este sistema se centra en el ingreso de un código, el cual mostrará en el LCD el usuario relacionado a dicho código el cual a la vez seleccionara en Matlab la muestra de voz correspondiente. Ya que se cuenta con un nivel más de seguridad el cual corresponde al reconocimiento de voz el cual se activara con el código identificado del trabajador, se pedirá que diga en voz alta y de manera entendible su clave la cual se procesa en el matlab el cual hace el análisis de las muestras de la
  • 36. matriz (mínimo son 28000 muestras guardadas) así se inicia el análisis por biometría de la voz (análisis de los coeficientes cepstrales en la escala de MEL). La clave que puede ingresarse en este equipo puede ser hasta 16 caracteres esto ya depende del usuario y su nivel de seguridad, ya que un código mucho más grande brinda una mayor seguridad, al no ser fácilmente descifrable. En la construcción de este sistema involucran muchos conocimientos de la utilización teclados matriciales, pantallas LCD, utilización de los microcontroladores PIC y programación en Matlab.  DIAGRAMA DE BLOQUES Y FUNCIONAMIENTO En la figura 2. Observamos el esquema principal del proyecto, el cual cuenta con ingreso de datos a través del teclado, para seleccionar opciones disponibles. La unidad central del proceso es el microcontrolador, el cual ejecuta instrucciones de acuerdo a nuestras necesidades. El dispositivo de salida que facilita el manejo del equipo y con el teclado, este es el LCD gráfico, el cual muestra la información al usuario y con el teclado se puede interactuar con la persona que maneje el equipo. El actuador principal es la comunicación serial la cual este permitirá la comunicación de la placa del PIC con la PC y llevará al software Matlab los datos necesarios para el análisis del reconocimiento de voz; posteriormente se generara un código ASCII solo si se logra el reconocimiento de voz del trabajador, se envía hacia el PIC16F877A el cual envia un pulso hacia el PIC 16F628A y este se encargara de enviar el código ASCII abrir por medio del módulo RF.
  • 37. Figura 2.8: Diagrama de bloques del circuito A continuación se describe detalladamente cada parte, que compone este proyecto para comprenderlo de una mejor manera. TECLADO: Se observa en la figura 2.9. el diagrama de la conexión del teclado, en conexión multiplexada para optimizar el uso de los pines del microcontrolador. Se utiliza 8 pines para conectar el teclado, con las primeras 4 líneas del puerto D, el microcontrolador envía en modo secuencial un barrido de ceros lógicos y con las 4 líneas del puerto C se verifica la tecla que está siendo presionada. Las resistencias ayudan limitar la corriente de los pines, caso contrario el microcontrolador se quemaría.
  • 38. Figura 2.9: Esquema del teclado matricial (Eagle) MICROCONTROLADOR En la figura 2.10 se aprecia el diagrama del microcontrolador, que es el cerebro electrónico que ejecuta las instrucciones que están en su memoria grabadas. El programa que ejecuta este microcontrolador se realiza de acuerdo a las necesidades de cada sistema. Figura 2.10: Diagrama del microcontrolador PIC
  • 39. Este dispositivo nos ayuda a controlar el teclado, el LCD gráfico y la comunicación serial. Su programa se describe de manera detallada en el anexo B. Para su correcto funcionamiento necesita tener una señal de reloj. El circuito de reset está compuesto por una resistencia y un pulsador, este circuito permite al igual que a un computador resetearle por un mal funcionamiento. En el momento que pulsamos el botón se genera un pulso negativo con el que paramos el funcionamiento momentáneamente para que el Microcontrolador se reinicie y funcione correctamente. LCD Se observa el diagrama y la conexión específica del LCD, se tiene 4 líneas de datos de transmisión del microcontrolador hacia el LCD, además se utiliza 2 líneas del PIC para controlar el display. Figura 2.11 Esquema del LCD a) b) c) d) e)
  • 40.  CONSTRUCCIÓN DE LA PLACA DEL EQUIPO En la figura 2.12. se puede observar el diagrama de la placa del equipo transmisor, donde se presenta la interconexión del teclado, el LCd, el microcontrolador y las conexiones en detalle de los distintos elementos que componen el equipo. Figura 2.12: Diagrama de los elementos principales del equipo (Proteus)
  • 41. Figura 2.13: Esquemático del circuito del equipo (Eagle)
  • 42. Figura 2.14: Board del circuito del equipo  PROGRAMACIÓN DEL MICROCONTROLADOR El programa del proyecto se muestra detallado en el Anexo A, donde se encuentran todas las instrucciones que se dan al PIC para que realice las diversas tareas. Este programa fue desarrollado en el compilador MicroCpro. El programa se encarga de estar receptando las señales del teclado frecuentemente. En el caso de recibir una señal del teclado, el PIC muestra los diferentes menús almacenados en su memoria.
  • 43. RECONOCIMIENTO DE VOZ TEORÍA DE FUNCIONAMIENTO  Fundamentos de la voz La señal de voz es una onda de presión acústica que se genera voluntariamente a partir de movimientos de la estructura anatómica del sistema fonador humano. La producción de la voz comienza en el cerebro con la conceptualización de la idea que se desea transmitir, la cual se asocia a una estructura lingüística, seleccionando las palabras adecuadas y ordenándolas de acuerdo con unas reglas gramaticales. A continuación el cerebro produce los comandos nerviosos que mueven los órganos vocales para producir los sonidos. La unidad mínima de una cadena hablada es el fonema, el cual posee un carácter distintivo en la estructura de la lengua. La combinación de los fonemas da origen a las silabas, las cuales conforman las palabras, y estas a su vez, las oraciones. El tracto vocal empieza a la salida de la laringe y termina a la entrada de los labios. El tracto nasal empieza en el paladar y termina en los orificios nasales. Los parámetros principales del sistema articulatorio son: las cuerdas vocales, el paladar, la lengua, los dientes, los labios y las mandíbulas. Los distintos sonidos se producen al pasar el aire emitido por los pulmones, a través de todo el sistema de producción, en una determinada posición del aparato articulatorio. Desde el punto de vista de la ingeniería es lógico pensar que este sistema físico puede representarse como un filtro, cuya función de transferencia depende del sonido articulado y, por tanto, de la posición de los distintos órganos involucrados en la generación de la voz. La entrada del filtro se puede modelar mediante una señal de excitación, que corresponde al paso del aire generado por los pulmones a través de la traquea y las cuerdas vocales, y también será dependiente del sonido
  • 44. generado. Las cuerdas vocales son dos membranas dentro de la laringe orientadas de adelante hacia atrás. Por delante se unen en el cartílago tiroides, por detrás, cada una esta sujeta a uno de los dos cartílagos aritenoides, los cuales pueden separarse voluntariamente por medio de músculos. La abertura entre ambas cuerdas se denomina glotis. Cuando las cuerdas vocales se encuentran separadas la glotis adopta una forma triangular. El aire pasa libremente y casi no se produce sonido; este es el caso de la respiración. Cuando la glotis comienza a cerrarse, el aire que la atraviesa proveniente de los pulmones experimenta una turbulencia, produciendo un ruido conocido como aspiración. Ahora, al cerrarse más, las cuerdas vocales comienzan a vibrar de modo audible, produciéndose un sonido tonal, es decir periódico. La frecuencia de este sonido depende de varios factores, entre otros del tamaño y la masa de las cuerdas vocales, de la tensión de las cuerdas vocales, de la tensión que se les aplique y de la velocidad del flujo del aire proveniente de los pulmones. A mayor tamaño, menor frecuencia de vibración, A mayor tensión la frecuencia aumenta, siendo los sonidos más agudos. También aumenta la frecuencia al crecer la velocidad del flujo de aire. Finalmente, es posible obturar la glotis completamente, en cual caso no se produce sonido. Sobre la glotis se encuentra la epiglotis, un cartílago de la faringe que permite tapar la glotis durante la deglución para evitar que el alimento ingerido se introduzca en el tracto respiratorio. La porción que incluye las cavidades faringea, oral y nasal junto con los elementos articulatorios se denomina cavidad supraglótica en tanto que los espacios por debajo de la laringe, es decir la traquea, los bronquios y los pulmones, se denominan cavidades infraglóticas. Varios de los elementos de la cavidad supraglótica se controlan a voluntad, permitiendo modificar dentro de
  • 45. márgenes muy amplios los sonidos producidos por las cuerdas vocales o agregar partes distintivas a estos, y hasta producir sonidos propios. Esto se efectúa con dos mecanismos principales: el filtrado y la articulación. El filtrado actúa modificando el espectro del sonido. Tiene lugar en las cuatro cavidades supraglóticas principales: la faringe, la cavidad nasal, la cavidad oral y la cavidad labial. Las mismas constituyen resonadores acústicos que enfatizan determinadas bandas frecuenciales del espectro generado por las cuerdas vocales, conduciendo al concepto de formantes, es decir que se refuerza la amplitud de grupos de armónicos situados alrededor de una determinada frecuencia. En resumen, en el habla los formantes se determinan por el proceso de filtrado que se produce en el tracto vocal por la configuración de los articuladores. RECONOCIMIENTO AUTOMÁTICO DEL HABLA: Las principales características que diferencian a los sistemas basados en reconocimiento del Habla frente a otras alternativas son: la naturalidad que supone utilizar el habla en las operaciones de comando y control, y la robustez y precisión en la comunicación para diferentes usuarios y diferentes entornos. Los resultados que esta tecnología proporcione, deben contrastar con los derivados de otras alternativas como: teclados, mouse, paneles y otros. Dado el amplio campo de aplicación de la tecnología del habla, se ha propuesto una clasificación, en tres grupos diferentes: • Aplicaciones locales En esta área se pretende realizar interfaces hombre-máquina, que sustituyan la utilización de teclado y mouse, para dotar al usuario de la movilidad, que estos le restan, también facilitar el uso de máquinas a los usuarios discapacitados. • Respuesta vocal interactiva En estas aplicaciones se involucra la difusión o captura de información, por parte de un gran número de usuarios, en
  • 46. particular se utiliza la red telefónica como vehículo de acceso a la información. Como por ejemplo para sustituir interfaces de detección de tonos DTMF, como lo son las consultas de cuentas bancarias, mensajería vocal, transmisión de información general, movimientos de cuentas y otros. • Automatización de sistemas telefónicos En estas hallamos la marcación por voz, manejo de agendas, directorio público, entre otras. PRINCIPALES ÁREAS DE TRABAJO EN RECONOCIMIENTO DEL HABLA Un diagrama simplificado para un modelo de reconocimiento automático del habla, mostrado en la figura, sugiere algunos puntos importantes de considerar a la hora de llevar a cabo una implementación. Entre las principales áreas de trabajo que intervienen en el diseño y especificación de sistemas de Reconocimiento del Habla actuales, se encuentran las siguientes: • Procesamiento de la señal de voz. • Técnicas de reconocimiento de patrones. • Diferentes estilos de habla. • Dependencia del locutor. • Tarea de reconocimiento. • Bases de datos para entrenamiento y reconocimiento.
  • 47. PROCESAMIENTO DE LA SEÑAL DE VOZ La primera operación que debe realizar un reconocedor es procesar la señal de voz de entrada al sistema, con objeto de extraer la información acústica relevante para la tarea que debemos realizar. Los rasgos o características que se deben extraer de la señal de voz, son el resultado de un largo proceso de investigación sobre diferentes procedimientos de parametrización de la voz. Planteándose como solución actual más extendida una parametrización de la envolvente espectral que incluye consideraciones preceptúales a partir del funcionamiento del oído. Para reducir el número de parámetros posibles, la parametrización se combina con la utilización de técnicas discriminativas, seleccionándose el subconjunto con los parámetros más eficientes o distintivos. La señal de entrada puede venir acompañada por efectos perturbadores, los cuales se desea sean eliminados, para ello se ha generado tres líneas principales de trabajo: • Detección robusta de voz: apareciendo innumerables procedimientos de discriminación entre voz o ruido (silencio) para diferentes tipos de ruido. • Reducción de ruido: distinguiéndose procedimientos que actúan directamente sobre la señal de voz y procedimientos que buscan compensar el efecto del ruido sobre la parametrización de la voz. • Cancelación de ecos: incorporando técnicas de filtrado adaptativo que permitan al usuario comenzar a hablar mientras, desde el terminal remoto, se le está comunicando un mensaje que puede provocar un eco en la voz que entra al reconocedor. OBTENCIÓN DE INFORMACIÓN MEDIANTE MICRÓFONO Micrófono: El micrófono es un transductor electroacústico. Su función es la de transformar (traducir) la presión acústica
  • 48. ejercida sobre su capsula por las ondas sonoras en energía eléctrica. El audio es un fenómeno analógico. Para grabar una señal de voz se hace la conversión de la señal analógica del micrófono en una señal digital por medio del conversor A/D en la tarjeta de sonido. Cuando un micrófono esta operando las ondas de sonido hacen que vibre el elemento magnético del micrófono causando una corriente eléctrica hacia la tarjeta de sonido, donde el conversor A/D básicamente graba los voltajes eléctricos en intervalos específicos. Hay dos factores importantes durante este proceso. Primero esta la taza de muestreo o que tan seguido los valores de voltaje son grabados. Segundo, son los bits por segundo, o que tan exactamente los valores son grabados. Un tercero podría ser el número de canales (mono o estéreo), pero para las aplicaciones de reconocimiento de voz un canal mono es suficiente. La mayoría de aplicaciones vienen con valores pre- determinados, para desarrollo del código se debería de cambiar los parámetros para ver lo que mejor funciona en el algoritmo. Dado a que el habla es relativamente de bajas frecuencias (entre 100Hz-8kHz), una frecuencia de muestreo de 16000 muestras/seg provee una mayor exactitud en la adquisición de la información, la frecuencia de nyquist. La cuantificación mas comúnmente usada, es de 8 bits, mínimo requerido para una calidad baja, puede mejorarse su S/R con una técnica no lineal de cuantificación, se obtienen excelentes resultados aumentando la cuantificación a 16 bits. La siguiente etapa será aquella que se encargue de amplificar las señales a niveles que sean manejables. A partir de la señal analógica obtenida se hace necesario convertir la señal a formato digital para poder procesarla en la computadora lo que se realiza mediante dos procesos: muestreo y cuantificación. La señal vocal tiene componentes de frecuencia que pueden llegar a los 10 kHz., sin embargo la
  • 49. mayor parte de los sonidos vocales tiene energía espectral significativa hasta los 5 Khz. solamente los sonidos fricativos poseen componentes que pueden llegar a los 10 kHz. En nuestro caso se optó por una frecuenta de muestreo de 44100Hz y una resolución de 16 bits mono canal. PRE-PROCESAMIENTO Se hace necesario para el análisis realizar un pre- procesamiento de la señal vocal. Esto se realiza a través de técnicas que permitan extraer la información acústica directamente a partir de la señal vocal emitida. Filtro En primera instancia se realiza un filtrado de la señal para reducir los efectos del ruido que acompaña la señal de voz ingresada. Al diseñar el mismo se deberá considerar el hecho que la elección de las frecuencias de corte y paso de este, condicionarán al sistema en la discriminación de voces espectralmente parecidas. Segmentación (determinación de los puntos de inicio y fin de la señal para eliminar el ruido): En el reconocimiento de señales de voz, se hace necesario determinar con adecuada precisión los puntos de inicio y final de cada palabra, es decir, se debe diferenciar las partes de señal que llevan información de voz de aquellas que no llevan voz. Este procedimiento evita gastar memoria y tiempo de cálculo en las tramas que no contienen información evitando así obtener resultados erróneos en el análisis de las señales de voz. Se han planteado diferentes maneras de clasificar eventos en una señal de voz. Quizás la más simple y más empleada, esta relacionada con la generación de la voz e incluye tres estados: silencio cuando no hay voz; sonoro cuando se presenta vibración de las cuerdas vocales; y sordo cuando las cuerdas vocales no vibran. En general, un sistema de clasificación de voz puede tener inconvenientes en distinguir un fonema sordo de baja amplitud
  • 50. y corta duración, del silencio; o un fonema sonoro de baja amplitud de un fonema sordo o incluso del silencio. El error a su vez aumenta a medida que la relación señal a ruido disminuye. El problema de encontrar los puntos de inicio y fin de palabra es fundamental en procesamiento de voz. Por ejemplo, en reconocimiento automático de palabras aisladas, es necesario encontrar las regiones de la señal que corresponden a cada palabra a ser analizada. De la correcta segmentación de la señal depende en gran medida la exactitud del proceso de reconocimiento. De hecho, las fallas en la segmentación de la señal constituyen una de las principales fuentes de error en los sistemas de reconocimiento de voz, ya que algunos sonidos que pueden captarse, correspondientes a ruido de fondo, podrían eventualmente confundirse con voz; por ejemplo, el espectro de la respiración tiene semejanzas con el de un fonema fricativo. La detección de los límites de palabra también se realiza con el fin de evitar cálculos innecesarios, al procesar únicamente las partes de la señal que corresponden a voz. Ventaneo En la etapa siguiente, la señal filtrada y sin silencios se hace necesario tomar la señal en tramas de N muestras, donde N es un valor que se escoge tomando en cuenta que la señal de voz es estacionaria a “trozos”, condición necesaria para realizar el análisis de Fourier en tiempo corto. El intervalo de tiempo en el que la señal se considera estacionaria depende de la velocidad de cambios del tracto vocal y las cuerdas vocales y comúnmente se establece un valor entre 20 y 40 ms. Estas tramas se pasarán por una ventana que en general es una ventana de Hamming. Las ventanas rectangulares y las no rectangulares tienen sus ventajas y desventajas en cuanto al ancho del lóbulo principal y a la atenuación de los lóbulos secundarios. En el caso de la ventana de Hamming se cumple con el principio de atenuar
  • 51. bruscamente los lóbulos secundarios aunque el principal es más ancho que para una ventana rectangular. Esta es la ventana se define como: wnT = 0.54-0.46cos2nN 0 ≤ n ≤ N Como la ventana de Hamming atenúa mucho la señal que queda en bordes de dicha ventana se hace un solapamiento cada 10 o 20 ms para aplicarla así no se pierde información útil. En el reconocimiento del habla, la señal de voz pre-procesada se ingresa a un nuevo procesamiento para producir una representación de la voz en forma de secuencia de vectores o agrupaciones de valores que se denominan parámetros, que deben representar la información contenida en la envolvente del espectro. Hay que tener en cuenta que el número de parámetros debe ser reducido, para no saturar la base de datos, ya que mientras más parámetros tenga la representación menos fiables son los resultados y mas costosa la implementación. Existen distintos métodos de análisis para la extracción de características, y se concentran en diferentes aspectos representativos. En este caso analizaremos los dos de mayor importancia para el análisis de la voz: - Análisis de predicción lineal (LPC) - Análisis cepstral PARAMETRIZACIÓN Coeficientes de predicción lineal (LPC): Se trata de una de las técnicas más potentes de análisis de voz, y uno de los métodos más útiles para codificar voz con buena calidad. Su función es representar la envolvente espectral de una señal digital de voz en una forma comprimida, utilizando la información de un modelo lineal, con lo cual se proporcionan unas aproximaciones a los parámetros de la voz muy precisas. Se fundamenta en establecer un modelo de filtro de tipo todo
  • 52. polo, para la fuente de sonido. La principal motivación del modelo todo polo viene dada porque permite describir la función de transferencia de un tubo, que sin perdidas esta formado por diferentes secciones. El modelo recibe este nombre porque pretende extrapolar el valor de la siguiente muestra de voz s(n) como la suma ponderada de muestras pasadas s(n-1), s(n-2),…, s(n-K): Cepstrum Como se sabe los sonidos de la voz se pueden representar mediante un espectrograma, que indica las componentes frecuenciales de la señal de voz. Es así entonces como el espectro nos proporciona información acerca de los parámetros del modelo de producción de voz, tanto de la excitación como del filtro que representa el tracto vocal. Desde el principio de la década de los 70 los sistemas homo mórficos han tenido una gran importancia en los sistemas de reconocimiento de voz. Estos sistemas homo mórficos son una clase de sistemas no lineales que obedecen a un principio de superposición. De estos los sistemas lineales son un caso especial. Modelo de obtención de los coeficientes cesptrales En el sistema de reconocimiento de voz en MATLAB existe una función para obtener los coeficientes cepstrales utilizando la FFT. La función utilizada es la rceps, que nos proporciona el cepstrum real de la función ingresada, por medio del algoritmo mostrado en la figura de arriba. La razón principal para utilizar los coeficientes cepstrales es que tienen la ventaja adicional que uno puede derivar de ellos una serie de
  • 53. parámetros que son invariantes sin importar las distorsiones que puedan ser introducidas por el micrófono o por cualquier sistema de transmisión. Coeficientes cepstrales de frecuencia Mel: MFCC. Una familia de coeficientes directamente relacionada con los LPC son los llamados mel-cepstrum o MFCC, los cuales son de gran utilidad en la extracción de los parámetros de la señal de voz, ya que están basados en la variación conocida de los anchos de banda de las frecuencias críticas del oído. Los filtros que se lo aplican a la señal en la técnica MFCC están espaciados linealmente para frecuencias menores a 1000 Hz y logarítmicamente para frecuencias mayores de 1000 Hz, con el fin de capturar las características fonéticamente importantes del habla. A esta escala se le denomina “Escala de MEL” y su fórmula matemática es la siguiente: Los pasos necesarios para el cálculo de los MFCC se muestran aquí: El primer bloque calcula la transformada de Fourier de tiempo corto a cada una de las tramas obtenidas de la etapa de pre- procesamiento mediante la ecuación: En el segundo bloque el cuadrado
  • 54. ponderado por una serie de filtros distribuidos sobre la escala de MEL para luego calcular la llamada “log-energía” del filtro l- ésimo mediante la ecuación: El banco de filtros linealmente espaciado en la escala de Mel tiene la forma que se muestra abajo y los filtros que lo conforman pueden ser triangulares o tener otras formas, tales como Hamming, Hanning o Kaiser, pero el triangular es el más utilizado. RECONOCIMIENTO DEL HABLA. DECISIÓN. Las técnicas e parametrización explicadas en el punto anterior tienen como finalidad generar una serie de coeficientes que representan las características de la señal de voz, que pueden ser usadas en la fase de reconocimiento del habla y que no se obtienen mediante un análisis temporal o frecuencial. El tamaño de la matriz obtenida del proceso de parametrización depende directamente de la longitud (variable) de la señal de voz, la cual tiene con la palabra en sí y el hablante. Por esta razón, se hace necesaria la estandarización de la matriz que contiene los coeficientes cepstrales calculados, para que el tamaño de las matrices usadas para el reconocimiento del habla sea el mismo.
  • 55. La estandarización de la matriz de coeficientes cepstrales constituye el primer paso a realizar en el proceso de reconocimiento del habla y se denomina Cuantización Vectorial. El paso siguiente corresponde al cálculo de la diferencia entre la señal de voz del hablante y las señales que se encuentran en la base de datos de entrenamiento del sistema; dicha diferenciase obtiene mediante el cálculo de la Distancia Euclidiana en varias dimensiones. Cada uno de los procedimientos se explica en las secciones siguientes. CUANTIFICACION VECTORIAL Una parte importante en cualquier tipo de procesamiento de voz es la optimización de los algoritmos en cuanto a velocidad y almacenamiento, entonces, la cuantificación de vectores trae consigo la idea de clasificar un conjunto de vectores, luego de lo cual se buscarán los mejores representantes para reducir el tamaño de la información a manejar. La forma de medir la fidelidad de un cuantificador es determinar el error que este produce al reemplazar los datos de entrada que recibe por los vectores representantes o codewords, dicho parámetro es llamado error por distorsión. La finalidad de un cuantificador es obtener un conjunto de vectores representativos llamado codebook, que presente el menor error por distorsión, por ejemplo para cuantificar los vectores de observación. Ventajas:  Reduce el almacenamiento de la información de análisis.  Se reduce el cálculo para determinar distancias entre vectores espectrales.  La representación del VQ se limita a una tabla que contiene las distancias entre pares de vectores del codebook.  Representación discreta de las señales de voz. Asociando una característica fonética con cada vector del codebook, el proceso de elección del vector que
  • 56. mejor lo representa es equivalente a asignar una característica fonética a cada segmento de voz. Desventajas:  Distorsión en la representación del vector. Hay un número finito de vectores en el codebook, el proceso de “elección" del mejor representante es equivalente a cuantificar el vector y conduce a un cierto nivel de error de cuantificación. De cualquier modo con cualquier codebook finito siempre habrá un nivel de ruido o error.  El almacenamiento requerido para los vectores del codebook no es pequeño. Cuanto más grande sea el codebook menor es el error. Para un codebook de 1000 o más entradas, el almacenamiento no es irrelevante. Hay que realizar un balance entre error de cuantificación, procesamiento y almacenamiento del codebook. Componentes de un cuantificador vectorial Para construir un cuantificador vectorial se necesita: 1. Un gran número de vectores de observación, V1, V2,....., Vn, que conforman el grupo de entrenamiento. El grupo de entrenamiento se usa para crear el grupo de vectores del codebook "óptimo" que representa la variabilidad espectral observada en el grupo de entrenamiento. 2. Una medición de distancia entre cada par de vectores espectrales de observación para agrupar el conjunto de vectores de entrenamiento como axial también para asociar o clasificar vectores arbitrarios a cada entrada del codebook. 3. Un procedimiento de clasificación para ubicar y calcular los centroides. Sobre la base del particionamiento que clasifica el grupo de n vectores en M clústeres o sectores primero elegimos el número M, codewords del codebook, para luego proceder a la clasificación. Vectores de observación Al final de los distintos pasos para el tratamiento de la señal
  • 57. de voz, se obtiene un vector que contiene la información vocal que representa a la ventana temporal correspondiente, de alguna manera una colección de características que describen de la mejor manera posible la voz humana. Estos vectores son conocidos en la literatura del reconocimiento de voz como vectores de observación. Cabe aclarar que existen varias formas de representación de estas características como LPC (Linear Prediction Code) o Auditory System, pero la que en la actualidad da los mejores resultados es el análisis Cepstral, en particular los coeficientes MFCC (Mel Frecuency Cepstral Coeficients). También suele incorporarse al vector de observación la información de la primera y segunda derivadas del Cepstrum con respecto al tiempo para agregar información de las características dinámicas del sistema y el logaritmo de la energía total de la ventana. Clasificación de Vectores El objetivo de un módulo clasificador es agrupar una cantidad de vectores característicos, N, en una cantidad M (MDN), discreta, de sectores o celdas de clasificación logrando que las características en cada sector sean similares. Existen muchos criterios para lograr dicho objetivo y a continuación veremos algunos de los más comunes. Imaginemos que la media multidimensional de un determinado sector i, es μi (con 1<i<M), y a continuación ingresa al clasificador un vector de observación o, se puede clasificar dicho vector calculando la "distancia" a la que se halla de cada una de las M medias y asignándolo al sector mas "cercano". Este método de clasificación se denomina k- Means debido a que se agrupan los vectores en torno a k valores medios, quedando formados k sectores (en nuestro caso k=M). Existe el problema de inicialización de los valores de μi, y su reestimación a medida que progresa el algoritmo. Algoritmos de Clasificación: Podemos decir, en general, que los N vectores originales de
  • 58. tamaño D quedarán representados por M vectores, cada uno de los cuales es llamado "palabra de código" o codeword (Cw), el grupo entero de dichos vectores, forma un "libro de códigos" o codebook, quedan entonces delimitadas M regiones o sectores, llamados regiones de Voronoi. Los principales algoritmos de clasificación de vectores son descritos a continuación: Algoritmo K-Means: 1. Inicialización: Arbitrariamente elegimos M vectores o palabras de código, codewords, como el grupo inicial del codebook. 2. Búsqueda del más cercano: Por cada vector de observación, se busca el codeword en el codebook que es el más cercano (en términos de distancia), y asigna a ese vector a la celda correspondiente. 3. Actualización del centroide: actualiza el codeword en cada celda o sector usando el centroide de los vectores de entrenamiento asignados a un sector. 4. Iteración: Repite los pasos 2 y 3 hasta que la distancia media caiga debajo de un umbral prefijado. La forma de cada sector o celda o partición es muy dependiente de la medida de distorsión espectral y las estadísticas de los vectores en el grupo de entrenamiento. Este método es el más simple y por tanto existen numerosas modificaciones y mejoras, algunos de sus puntos débiles son: 1. Los resultados dependen en forma muy acentuada de los valores iniciales elegidos como palabras de código. 2. También hay gran dependencia del número de sectores M axial como de la implementación de la "distancia" usada. 3. Puede suceder que algunos de los sectores resulten vacíos. Algoritmo LBG: Se analizará con algún detalle debido a su buen desempeño, para eso comenzaremos por el algoritmo fundamental LBG. El
  • 59. algoritmo LBG, lleva su nombre debido a sus autores Y. Linde, A. Buzo y R. M. Garrí, en él se elige 1 codeword inicial de entre los vectores de datos a clasificar, luego se utiliza el algoritmo de división binaria para duplicar el número de codewords, los vectores de observación se agrupan en torno a los codewords que les presentan menor distancia, se recalculan los codewords como la media multidimensional de cada sector y se agrupan nuevamente los datos, el proceso se detiene cuando el codebook no presenta variación significativa y al llegar al número de codewords deseados. Este algoritmo de gran popularidad (que utiliza el algoritmo k- Means) produce codebooks que logran un mínimo local en la función de error por distorsión. Para generar un codebook de M sectores o palabras de código: En primer lugar designando un codeword inicial para luego utilizando una técnica de división llegar a obtener un codebook inicial, luego iterando la misma técnica de división en los codewords hasta que llegamos a obtener el numero de codewords igual a M que va a ser el tamaño del codebook deseado. El procesamiento se denomina división binaria: 1. Designar 1 vector del codebook o codeword inicial, este resulta ser el centroide del grupo de los vectores de entrenamiento. 2. Calcular la media del grupo de entrenamiento: Calcular el error o distancia media entre el codeword inicial y los vectores de entrenamiento. 3. Duplicar el tamaño del codebook mediante la división de cada codeword. 4. Usar el algoritmo K-Means para tomar el mejor grupo de centroides para la separación del codebook. 5. Iterar pasos 3 y 4 hasta llegar a un codebook de tamaño M. Una de las causas que motivo el uso de un VQ fue la suposición que, en el límite, el codebook debería idealmente
  • 60. tener 36 vectores, uno por cada fonema, suposición que es incorrecta. Utilización del cuantificador y del codebook Una vez construido el codebook, el procedimiento para cuantificar vectores es básicamente realizar una búsqueda completa a través del codebook para encontrar el mejor representante. Si anotamos los vectores del codebook, de tamaño M, como Cw, 1≤ w ≤ M, y tomamos al vector de observación a ser cuantificado como V, luego el vector representante o codeword, Vd.*, es: Un procedimiento de cuantificación para señal de voz elige el vector más cercano del codebook al vector de observación y utiliza ese vector denominado codeword, como la representación resultante para etapas posteriores. Se refiere como al vector "vecino" más cercano, toma como entrada, vectores de señal de voz y da como respuesta, a su salida, el vector que mejor representa esa entrada. Distancia Euclidiana La distancia Euclidiana se emplea, para el reconocimiento del habla, como método para calcular la diferencia existente entre el codebook obtenido de la palabra dicha por el hablante y el resto de codebooks almacenados en la base de datos de entrenamiento del sistema. El resultado final de dicha comparación es un valor numérico que representa la distancia entre dos matrices de iguales dimensiones. El codebook perteneciente a la base de datos de entrenamiento del sistema cuya distancia al codebook generado para representar la palabra dicha por el hablante sea menor que el nivel de comparación establecido por el programador de la aplicación, identifica la palabra con la que ya existe mayor semejanza. La fórmula matemática empleada para el cálculo de la distancia euclidiana en dos o más dimensiones se muestra en la siguiente ecuación:
  • 61. Se acostumbra usar dicha métrica para el cálculo de la distancia entre dos puntos, pero su aplicación va más allá, permitiendo calcular la distancia entre dos matrices. TRANSMISOR La Parte transmisora se realiza luego de que el reconocimiento de voz utilizando el MATLAB ha sido corroborado de esa manera se envía un código ASCII a través del puerto serial el cual llega al PIC 16F877A el cual activa (envía un pulso eléctrico) al PIC 16F628A el cual transmite un código ASCII “abrir” de manera inalámbrica utilizando los módulos RF (conectado al PIN 8) en este caso la parte transmisora, el código ASCII es recibido y procesado (“abre o no abre la puerta”), pero esta operación le compete a la parte receptora del sistema. La Programación del PIC 16F628A se encuentra en los ANEXOS.
  • 62.
  • 63.  CONSTRUCCIÓN DEL SISTEMA Primero se ha realizado un prototipo inicial en protoboard para hacer todas las pruebas y cambios hasta tener perfeccionando el equipo. Se ha probado los elementos interconectados por posibles fallas y verificado todo lo que necesitamos. Figura 2.15: Funcionamiento del equipo Con los esquemas listos y las pruebas en el protoboard realizadas, se procede a realizar la placa del circuito y soldar los elementos como se observa en las figuras 2.16, 2.17. Figura 2.16.
  • 64.
  • 65. Figura 2.17. INTERFAZ GRÁFICA Para realizar la interfaz gráfica se recurrió al uso de la GUIDE de MATLab. Dicho entorno nos permite diseñar primero gráficamente la interfaz de usuario para luego volcar dicha interfaz a código. En ella se pueden ir colocando sobre un marco diferentes tipos de botones, textos fijos, textos dinámicos modificables por el usuario, checkbox, menús desplegables, imágenes, gráficos, entre otros. A continuación se mostrará el marco inicial de sobre el que comenzamos a trabajar y en el que vamos colocando diferentes botones según nuestras necesidades.
  • 66. Los Static Text se utilizarán para indicar títulos y funcionalidades. Los Popup Menu serán menús desplegables que contendrán las órdenes que guardaremos y luego trataremos de identificar. El Slider o barra deslizante nos servirá para que el usuario elija el nivel de precisión del algoritmo de decisión. Axes1 contendrá la gráfica del audio ingresado. El Push Button de la izquierda se utilizará para ingresar nuevos patrones mientras que el Push Button del centro se utilizará como salida. Por último el Toggle Button de la derecha se utilizará para iniciar o salir del modo audio donde se ingresar los comandos a identificar. Paso siguiente se cambiará el texto, color, tamaño, forma, posición, tipo y color de letra etc. de cada uno de los objetos que introdujimos en el entorno según necesidades y gustos personales. Para esto debemos mencionar que haciendo doble clic sobre cualquiera de los objetos accedemos a una tabla con todas las propiedades del mismo para su modificación. La tabla que se despliega es la que se muestra abajo.
  • 67. El entorno finalmente después de todas las modificaciones a los objetos queda como se muestra abajo:
  • 68. Cuando presionamos el botón salir se despliega el cartel que se muestra abajo. Si optamos por la opción Si se cierran todas las ventanas del programa mientras que si presionamos No podemos continuar con la ejecución del mismo. Este es el menú pop up que se desplegará al presionar sobre uno de ellos. Como se ve aparecen las 6 códigos a identificar por usuario (por motivos de pruebas), más las ordenes de confirmación u omisión para cuando se desea Encender o Apagar y la contraseña para abandonar el modo Reconocer.
  • 69. En el caso de presionar el botón de Patrón nuevo y después de haber ingresado el mismo, o sea, transcurridos los dos segundos a partir de que se lo pulso, se observará el siguiente cartel. Si después de haber ingresado un patrón nuevo elegimos el usuario y la frase donde queremos que se guarde en los menús pop up se mostrará lo siguiente: En caso de que se presione sobre los menús pop up y no se haya ingresado con anterioridad un patrón de audio nuevo se mostrará el siguiente mensaje de error: Si recordamos las explicaciones dadas en la parte de Parametrización, se obtenían dos matrices de observación que contenían los coeficientes característicos de la frase. Como la primera se obtenía a partir de la señal de audio sin
  • 70. silencio e iba desde la muestra 1 a la última menos 26000, para que no haya un error en el manejo de las matrices y los vectores, la señal de audio sin silencio debería tener más de 26000 muestras. Esto es porque si no se podría indicar que el análisis se hiciera hasta la muestra (end-2600) cuyo resultado sería negativo si el número de muestras fuera menor a 26000 y produciría error. De esta manera se tomo como condición de compromiso que el archivo de audio que se genera cuando se ingresa un nuevo patrón o cuando se ingresa una frase a reconocer tenga como mínimo 28000 muestras. Si esta condición no se cumple de despliega el siguiente cartel que obliga a ingresar una nueva orden o patrón. La siguiente imagen nos muestra la gráfica del audio de una orden a medida que dicha orden es reproducida por el locutor. Para cuando el locutor termino la orden dentro de los dos segundos que le da el sistema a partir que inició a
  • 71. reproducirla, el sistema muestra la gráfica de la orden completa en el tiempo. Es necesario aclarar que cuando comienza la adquisición y hasta finalizada la gráfica total de la señal (un par de segundos) el botón que en un principio se denominaba Reconocer cambia su leyenda a Escape. Esto se debe a que además de poder abandonar el modo audio de reconocimiento mediante la reproducción de la contraseña es posible abandonarlo presionando sobre el Toggle Button cuando en este figura la leyenda Escape. Esto sucede por un corto período cada vez que se detecta actividad en el micrófono, para luego figurar nuevamente la leyenda Reconocer. Para poder abandonar el modo audio por este método no es necesario decir la contraseña o alguna de las frases estipuladas, basta con que el sistema reconozca presencia de voz en el micrófono y el botón cambia su funcionalidad, y al presionarlo se abandona dicho modo. 1.7 Planteamiento de la Hipótesis El sistema de control gestionara el acceso al público y trabajadores de la estación televisiva Canal 51.
  • 72. 1.8 Definición operacional de las variables Datos procesados por el sistema de autentificación. 1.9 Operacionalización de las variables. VARIABLE DIMENSIONES INDICADORES TÉCNICA INSTRUMEN TOS Datos procesados por el sistema de autenticación  Digitalizació n de señales  Transferenc ia de datos digitales.  Frecuencia de muestreo  Numero de bits  Relación señal a ruido  Error de cuantización.  Ancho de banda  Tasa de bits.  Tasa de baudios  Evaluación de parámetros.  Cálculo matemático.  Evaluación de parámetros.  Cálculo matemático.  Ficha de observaci ón  Ficha de evaluació n de resultado s  Ficha de observaci ón CAPITULO II MARCO METODOLÓGICO. 2.1 Tipo de Investigación. Descriptiva propositiva 2.2 Diseño o trayectoria metodológica. X O Dónde: X: Sistema de control de autentificación. O: Trabajadores de Estación Televisiva Canal 51
  • 73. 2.3 Población y muestra. Dada la naturaleza de la investigación, este proyecto no presenta población y muestra. 2.4 Técnicas e instrumentos de recolección de datos. - Observación Es el registro visual de lo que ocurre en una situación real, clasificando, consignando los acontecimientos pertinentes de acuerdo con algún esquema previsto y según el problema que se estudia. Es preciso estar alerta para discriminar adecuadamente todo este conjunto posible de informaciones. - Entrevistas Este método se utiliza para recabar información en forma verbal, a través de preguntas que propone el analista. Sirve para analizar la realidad y estado de la situación problemática, y solamente se trabajara con el gerente, administrador y jefes de las áreas, quienes tomaran las decisiones del negocio para la elaboración del Plan estratégico y el Plan de acción en Tecnologías y Sistemas de Información. - Análisis documental Recolección de información a través de documentos existentes, ya sean en libros, revistas, tesis e internet, entre otras. - Consulta a expertos Se consultara vía correo electrónico, a través de foros y entrevistas a expertos en Plan Estratégico y Plan de Acción en Tecnologías y Sistemas de Información. - Consulta bibliográfica Se consultara material bibliográfico (tesis, tesinas, libros, revistas, etc.), así como también información obtenida desde internet, etc.
  • 74. 2.5 Métodos de procesamiento de los datos. Los datos obtenidos por el sistema serán almacenados, tratados, comparados y procesados usando el software MATLAB y un Circuito Integrado Programable (PIC) con algoritmos en lenguaje C. 2.6 Aspectos éticos. El presente trabajo de investigación respeta los principios éticos de la dignidad de las personas, justicia y beneficencia. 2.7 Criterios de cientificidad. Credibilidad, puesto que la información bibliográfica es de primera fuente y la información de campo recogida es directa de los elemento que son investigados. Confirmabilidad, puesto que lo resultados serán llevados a la comparación de los diferentes estamentos tomados en cuenta y para ello se utilizara la confirmación por triangulación de los resultados. Auditabilidad, puesto que se corroborara el presupuesto a proyectar en base a costos y gastos actuales y verídicos. CAPITULO III RESULTADOS Al analizar los requerimientos del sistema de autentificación de trabajadores de la estación televisiva canal 51 nos encontramos que la cantidad de trabajadores son en promedio de 20 facilitando y agilizando el proceso de guardado de los patrones de las claves en el sistema. Para diseñar un transmisor para el sistema de autentificación escogimos la comunicación serial combinada con la transmisión inalámbrica utilizando los módulos RF detallados en el informe. Al realizar las pruebas del transmisor para el sistema de autenticación nos dimos cuenta de que la velocidad de transmisión dependía de los obstáculos y distancia por eso al haber en el canal señales analógicas en el espectro electromagnético por las transmisiones normales del canal decidimos utilizarlos en línea de vista vimos que su eficiencia mejoro notablemente.
  • 75. La interfaz de usuario (PIC) se comunicó exitosamente con la pc usando el puerto de comunicaciones serial, se envió un carácter ASCII indicando el número que identifica a un trabajador. El sistema reconoció las contraseñas pre grabadas en el sistema y al ser correctas se pudo comunicar de vuelta al PIC para que transmita la señal de apertura de la puerta. RESULTADOS DE LAS PRUEBAS REALIZADAS DEL SISTEMA DE RECONOCIMIENTO DE VOZ En lo que concierne a esta parte del informe se describirá como se fueron realizando y llevando a la práctica los diferentes ítems mencionados durante el marco teórico. A continuación comenzamos con el desarrollo de cada parte: MICRÓFONO Se utilizó un micrófono integrado a un par de auriculares de la marca Genius: modelo HS-04S. El mismo cuenta con las siguientes características. Conector del micrófono: plug estéreo 3.5mm Frecuencia de respuesta del micrófono: 50Hz – 20KHz Impedancia del micrófono: 2.2KOhm Sensibilidad del micrófono: Requiere -60dB * 4dBB Este auricular con micrófono de Genius, el HS-04S, le dará la flexibilidad para hacer de todo... con más comodidad y calidad. Este auricular con micrófono con cancelación de ruido proporciona claridad mejorada de audio. Si pasa muchas horas chateando con su ordenador, jugando o en videoconferencia, tendrá una comodidad superior con la banda de la cabeza de goma blanda y las almohadillas de las orejas contienen espuma suave. También tiene un práctico control de volumen en el cable y su micrófono se puede colocar tanto a la derecha como a la izquierda, o sea que elija el HS-04S para sentir más comodidad. Al margen del modelo y marca del micrófono, es recomendable que sea unidireccional para minimizar los efectos de ruidos externos.
  • 76. ADQUISICIÓN. MATLAB Como se mencionó más arriba se eligió una frecuencia de muestreo de 44100Hz con una resolución de 16 bits y monocanal. La forma más fácil en MATLab de adquirir audio por palca de sonido es a través de la función: wavrecord(n,Fs) Esta función graba n muestras de la señal de audio, muestreadas a una frecuencia de Fs. En una primera instancia esta fue la forma elegida para adquirir la señal pero más adelante se requirió que se vaya mostrando en pantalla el audio a medida que se iba adquiriendo. De esta manera hubo que buscar un modo alternativo de adquirir ya que la función wavrecord no dejaba disponible la señal para el ploteo en pantalla hasta que no se haya terminado con la adquisición. Entonces se recurrió al código que se muestra más abajo y que se explicará brevemente. Este código permite hacer una adquisición de datos ya sea por la placa de sonido o por algún DSP conectado a la computadora de acuerdo a la configuración de instrucciones que se haga. handles.AI = analoginput('winsound'); Esta línea indica que se creará un objeto de entrada analógica denominado handles.AI que manejará la placa de sonido. chan = addchannel(handles.AI,1); Se selecciona un solo canal. set(handles.AI,'SampleRate',44100) Esta instrucción indica las muestras a tomar por segundo. set(handles.AI,'SamplesPerTrigger',duration*ActualRate) con esta instrucción se indica la cantidad total de muestras a tomar. En nuestra aplicación se colocaron dos botones que realizan una adquisición de audio. Con uno se ingresan los patrones y se realiza utilizando las instrucciones anteriores. El otro se utiliza para iniciar el reconocimiento de órdenes y la adquisición es activada por un umbral de audio en el micrófono. En este caso se deberán especificar las siguientes instrucciones para que la adquisición se inicie por la presencia de audio en el micrófono. set(AI,'TriggerType','software'); Disparo por presencia de audio. set(AI,'TriggerCondition','rising'); La condición de disparo es
  • 77. superado un umbral set(AI,'TriggerConditionValue',0.13); El umbral es 0.13 voltios set(AI,'TriggerChannel',AI.Channel(1)); Se indica el canal de disparo En cualquiera de los dos botones se comienza con la adquisición con la instrucción start(handles.AI) En el caso que se especificó el trigger por software los datos para matlab solo interesarán a partir de que se supere el umbral y no desde que se ejecute start. A continuación se indicará cual es el trozo de código que permite adquirir una determinada cantidad de muestras, plotearlas, continuar con la adquisición, plotear nuevamente y así hasta terminar con la adquisición. El ejecutarse tan rápidamente pareciera que se gráfica en tiempo real la señal. La función fundamental para esto es drawnow. while handles.AI.SamplesAcquired < preview end while handles.AI.SamplesAcquired < duration*ActualRate data = peekdata(handles.AI,preview); for i=1:882 if abs(data(i))<8e-3 data(i) =0; end end set(handles.h,'ydata',data) drawnow end data = getdata(handles.AI); handles.grafica=1:1:88200; handles.h = plot(handles.grafica,data); title('Orden') xlabel('Muestras') ylabel('Nivel de voz') Después de terminar con la adquisición y gráfica de la señal de audio se elimina el objeto de entrada analógica que inicialmente se había
  • 78. creado con las siguientes funciones de MATLab. delete(handles.AI) clear handles.AI PROCESAMIENTO DE LA SEÑAL Filtrado: El diseño del filtro se realizó a través de la herramienta Digital Filter Design2 de MATLab. En la misma se puede hacer una selección de los parámetros característicos de un filtro, observar su respuesta en frecuencia, obtener los coeficientes característicos del mismo y conocer su estabilidad. Como se puede observar en el bloque se especificó que se quería diseñar un filtro FIR pasa-banda, tipo ventana, donde esa ventana era la de Hamming, con frecuencias de corte en 100Hz y 8000Hz a una frecuencia de muestreo a 44100Hz. Se obtuvo un filtro de orden 800, estable con una respuesta en frecuencia como la que se muestra en la imagen. Hay que aclarar que muchas de las características finales del
  • 79. filtro se obtuvieron a partir de múltiples pruebas donde se evaluó la respuesta del mismo, su selectividad, estabilidad, atenuación en bandas de paso, atenuación en bandas de corte y rizado en la banda de paso; lo que nos llevó a la decisión final. Sobre el editor de MATLab el filtro diseñado se implementó a través de los siguientes comandos: B = FIR1(800,[100 8000]/22050); patron=filter(B,1,ua4); Donde FIR1 es la función que devuelve los coeficientes del filtro, donde se le ingresaron como parámetros el orden del mismo y las frecuencias de corte. El tipo de ventana no se especificó ya que esta función trae por defecto la de Hamming que era la elegida. La función filter hace pasar la señal de voz (ua4 en este caso) a través de los coeficientes que contiene B (que se obtuvieron con FIR1). Detección y eliminación de los períodos de silencio de la señal: Se comienza por hacer un cálculo de la energía de la señal de audio. Para esto se calcula el valor absoluto de la señal y se obtiene el pico máximo. Se divide la señal de audio por el valor antes obtenido para independizar la forma de onda respecto de la intensidad de la señal. len = length(s); % longitud del vector d=max(abs(s)); s=s/d; La señal normalizada se eleva al cuadrado y se divide por el número de muestras de la señal con lo que se obtiene la energía promedio de la señal. avg_e = sum(s.*s)/len Luego lo que se hará es dividir la señal normalizada en ventanas de un número determinado de muestras, calcular la energía de ese trozo de señal y si esa energía es mayor a un porcentaje (tomado como umbral
  • 80. de decisión) de la energía promedio de la señal completa entonces dicha ventana se conserva. En caso contrario la ventana se desecha ya que se interpreta que al no llegar su energía al umbral establecido entonces esa ventana corresponde con un intervalo de silencio de la señal de audio. THRES = 0.02; y = [0]; for i = 1:400:len-400 seg = s(i:i+399) e = sum(seg.*seg)/400; if( e> THRES*avg_e) y=[y;seg(1:end)]; end; end; THRES es el umbral de decisión y corresponde al 2% de la energía promedio de la señal entera. Este valor se definió después de varias pruebas observando cuales eran los resultados de eliminación de silencios. Las ventanas se eligieron de 400 muestras que a la frecuencia de muestreo (44100Hz) corresponde a aproximadamente 10ms por lo que no existe la posibilidad de que en el intento de eliminar silencio se elimine algún fonema de audio (cuya duración ronda entre los 10 y 20ms).En la siguiente imagen se mostrará la evolución temporal de la palabra “hola”. El archivo generado es de 2 segundos, o sea 88200 muestras. En el se pueden observar los períodos de silencio acompañados con ruido de fondo. Estos períodos no aportan información al sistema por lo que se busca eliminarlos.
  • 81. Esta imagen corresponde al mismo archivo después de haber sido pasado por el algoritmo de eliminación de silencio. PARAMETRIZACIÓN Para la obtención de coeficientes que caractericen a los patrones guardados y/o a las órdenes de reconocimiento se utilizó la función melcepst.m. Esta función permite obtener los coeficientes cepstrales en escala de MEL cuya teoría se mencionó más arriba. La elección de los coficientes cepstrales en escala de MEL se definió debido a que fue la
  • 82. que mejores resultados prácticos nos dió. La función melcepst.m pertenece a la librería Voicebox que se puede descargar de http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html. Esta tiene como argumentos los siguientes parámetros: melcepst(s,fs,w,nc,p,n,inc,fl,fh) s= es la señal de audio con los intervalos de silencio eliminados. fs= es la frecuencia de muestreo que en nuestro caso es de 44100Hz. Si se omite este parámetro, el algoritmo toma por defecto 11025Hz. w= es el tipo de filtro que conforma el banco e filtros. Puede ser de Hamming, Hanning, rectangular, triangular, entre otros. Para el caso utilizamos una ventana de Hamming aunque se recomienda utilizar un ventaneo triangular para mejores resultados. nc= el número de coeficientes cepstrales que caracterizarán a la parametrización. Por defecto son 12 pero en nuestro caso se utilizaron 14 coeficientes ya que fueron los que mejores resultados arrojaron en la práctica. p= indica el número de filtros que tendrá el banco de filtros característico de este tipo de parametrización. Para nuestra aplicación se definió un total de 30 filtros para el banco. n= longitud de las ventanas de muestras. La función melcepst además de la parametrización hace el ventaneo por lo que es un parámetro a especificar. En los otros métodos de parametrización como Cepstrum o LPC tendríamos que haber hecho el ventaneo de la señal antes de la parametrización. Vale aclarar que la función impone que sea una potencia de 2 entonces se eligió n=1024 que corresponde a una ventana de aproximadamente 23ms de duración, valor que se encuentra dentro del rango (20 a 40ms) donde la señal se considera estacionaria. inc= indica el solapamiento entre ventanas. El valor por defecto es n/2 que según nuestra elección de n sería 512 muestras pero se eligió inc=410 por mejores resultados. Al ejecutar la función melcepst con los argumentos elegidos, esta nos devuelve una matriz con coeficientes que caracterizan a la señal de audio ingresada.
  • 83. La división de la señal de audio favorece a la identificación pero como la duración de las diferentes palabras no es la misma (ej: televisión dura más que luces) se realizó un solapamiento en la división de la señal que eliminaría el inconveniente. Este solapamiento es tomar como primera parte de la orden desde la muestra 1 a la última menos 22000, y como segunda parte de la orden, se toma de la última menos 26000 a la última. Es decir hay un solapamiento de 400 muestras que soluciona lo antes mencionado. Traducido a código queda como sigue: c01=melcepst(q(1:end-22000),fs,'M',14,30,1024,410,0,0.1815); c02=melcepst(q(end-26000:end),fs,'M',14,30,1024,410,0,0.1815); Entonces por cada orden del usuario se obtienen 2 matrices con coeficientes característicos de la misma.