Sistema ocr

  • 614 views
Uploaded on

Sistema OCR com mapeamento de caracteres (imagem) para deficientes desenvolvido usando rede neural.

Sistema OCR com mapeamento de caracteres (imagem) para deficientes desenvolvido usando rede neural.

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
614
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
14
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. MINISTÉRIO DA EDUCAÇÃO SECRETARIA DE EDUCAÇÃO PROFISSIONAL E TECNOLÓGICA INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA TRIÂNGULO MINEIRO – Campus Uberlândia Sistema para Deficientes Visuais eInstrutores com redes neurais e OCR Adilmar Coelho Dantas Suprior em Sistema para Internet
  • 2. SumárioIntrodução ......................................................................................................................... 3História ............................................................................................................................. 3Tecnologia Assistiva ........................................................................................................ 3Objetivo da tecnologia assistiva ....................................................................................... 4Categorias da tecnologia assistiva .................................................................................... 4Redes neurais .................................................................................................................... 8 O Neurônio Artificial e a Rede Neural ......................................................................... 9 O Neurônio Artificial.................................................................................................... 9 A Rede Neural Artificial (Multilayer Perceptron) ...................................................... 10Funcionamento ............................................................................................................... 12Objetivo .......................................................................................................................... 12Desenvolvimento ............................................................................................................ 12Manual ............................................................................................................................ 12Anexos ............................................................................................................................ 13
  • 3. Introdução O sistema consiste em apoiar pessoas com deficiências visuais em seus estudos epara executarem tarefas do seu dia a dia como, por exemplo, ler o que está escrito emalgum anúncio. Além disso, ele possui material de apoio para que eles possam atravésde aulas em voz estudarem para processo seletivos como vestibulares e concursos. OCR é um acrónimo para o inglêsOpticalCharacterRecognition, é umatecnologia para reconhecer caracteres a partir de um arquivo de imagem ou mapa de bitssejam eles escritos à mão, datilografados ou impressos. Dessa forma, através do OCR épossível obter um arquivo de texto editável por um computador.História Em 1950David Shepard e Louis Tordella começaram a pesquisa doprocedimento para automação de dados da então Agência de Segurança das ForçasArmadas (AFSA) dos Estados Unidos, que dois anos depois se tornaria a Agência deSegurança Nacional (NSA). Com a ajuda de Harvey Cook eles construíram o "Gismo",o primeiro software de OCR. Shepard então fundou a IntelligentMachinesResearchCorporation (IMR) que fez os primeiros softwares OCR comerciais. Em 1953 a IBM obteve uma licença da IMR e desenvolveu um software próprioclassificando-o como OpticalCharacterRecognition, tornando o termo OCR um padrãona indústria para essa tecnologia.Tecnologia Assistiva Tecnologia Assistiva é um termo ainda novo, utilizado para identificar todo oarsenal de Recursos e Serviços que contribuem para proporcionar ou ampliarhabilidades funcionais de pessoas com deficiência e consequentemente promover VidaIndependente e Inclusão. É também definida como "uma ampla gama de equipamentos, serviços,estratégias e práticas concebidas e aplicadas para minimizar os problemas encontradospelos indivíduos com deficiências" (COOK E HUSSEY • Assistive Technologies:PrinciplesandPractices • Mosby – Year Book, Inc., 1995). No Brasil, o Comitê de Ajudas Técnicas - CAT, instituído pela PORTARIA N°142, DE 16 DE NOVEMBRO DE 2006 propõe o seguinte conceito para a tecnologiaassistiva: "Tecnologia Assistiva é uma área do conhecimento, de característicainterdisciplinar, que engloba produtos, recursos, metodologias, estratégias, práticas eserviços que objetivam promover a funcionalidade, relacionada à atividade eparticipação de pessoas com deficiência, incapacidades ou mobilidade reduzida, visandosua autonomia, independência, qualidade de vida e inclusão social" (ATA VII - Comitêde Ajudas Técnicas (CAT) - Coordenadoria Nacional para Integração da PessoaPortadora de Deficiência (CORDE) - Secretaria Especial dos Direitos Humanos -Presidência da República).
  • 4. O termo Assistive Technology, traduzido no Brasil como Tecnologia Assistiva,foi criado em 1988 como importante elemento jurídico dentro da legislação norte-americana conhecida como Public Law 100-407 e foi renovado em 1998 como AssistiveTechnology Act de 1998 (P.L. 105-394, S.2432). Compõe, com outras leis, o ADA -American withDisabilitiesAct, que regula os direitos dos cidadãos com deficiência nosEUA, além de prover a base legal dos fundos públicos para compra dos recursos queestes necessitam.Objetivo da tecnologia assistiva Proporcionar à pessoa com deficiência maior independência, qualidade de vida einclusão social, através da ampliação de sua comunicação, mobilidade, controle de seuambiente, habilidades de seu aprendizado, trabalho e integração com a família, amigos esociedade.Categorias da tecnologia assistiva A classificação abaixo foi construída com base nas diretrizes gerais da ADA,porémnão é definitiva e pode variar segundo alguns autores. A importância das classificações no âmbito da tecnologia assistiva se dá pelapromoção da organização desta área de conhecimento e servirá ao estudo, pesquisa,desenvolvimento, promoção de políticas públicas, organização de serviços, catalogaçãoe formação de banco de dados para identificação dos recursos mais apropriados aoatendimento de uma necessidade funcional do usuário final. 1 Auxílios para a vida diária Materiais e produtos para auxílio em tarefas rotineiras tais como comer, cozinhar, vestir-se, tomar banho e executar necessidades pessoais, manutenção da casa etc.
  • 5. 2 CAA (CSA) Comunicação Recursos, eletrônicos ou não, que permitem a aumentativa comunicação expressiva e receptiva das pessoas(suplementar) e sem a fala ou com limitações da mesma. São alternativa muito utilizadas as pranchas de comunicação com os símbolos PCS ou Bliss além de vocalizadores e softwares dedicados para este fim. 3 Recursos de Equipamentos de entrada e saída (síntese de voz,acessibilidade ao Braille), auxílios alternativos de acesso computador (ponteiras de cabeça, de luz), teclados modificados ou alternativos, acionadores, softwares especiais (de reconhecimento de voz, etc.), que permitem as pessoas com deficiência a usarem o computador. 4 Sistemas de controle Sistemas eletrônicos que permitem as pessoas de ambiente com limitações moto-locomotoras, controlar remotamente aparelhos eletroeletrônicos, sistemas de segurança, entre outros, localizados em seu quarto, sala, escritório, casa e arredores.
  • 6. 5 Projetosarquitetônicos para Adaptações estruturais e reformas na casa e/ouacessibilidade ambiente de trabalho, através de rampas, elevadores, adaptações em banheiros entre outras, que retiram ou reduzem as barreiras físicas, facilitando a locomoção da pessoa com deficiência. 6 Órteses e Troca ou ajuste de partes do corpo, faltantes ou próteses de funcionamento comprometido, por membros artificiais ou outros recurso ortopédicos (talas, apoios etc.). Inclui-se os protéticos para auxiliar nos déficits ou limitações cognitivas, como os gravadores de fita magnética ou digital que funcionam como lembretes instantâneos. 7 Adequação Adaptações para cadeira de rodas ou outro Postural sistema de sentar visando o conforto e distribuição adequada da pressão na superfície da pele (almofadas especiais, assentos e encostos anatômicos), bem como posicionadores e contentores que propiciam maior estabilidade e postura adequada do corpo através do suporte e posicionamento de tronco/cabeça/membros.
  • 7. 8 Auxílios de mobilidade Cadeiras de rodas manuais e motorizadas, bases móveis, andadores, scooters de 3 rodas e qualquer outro veículo utilizado na melhoria da mobilidade pessoal. 9 Auxílios para cegos ou comvisão subnormal Auxílios para grupos específicos que inclui lupas e lentes, Braille para equipamentos com síntese de voz, grandes telas de impressão, sistema de TV com aumento para leitura de documentos, publicações etc. 10 Auxílios parasurdos ou comdéficit auditivo Auxílios que incluem vários equipamentos (infravermelho, FM), aparelhos para surdez, telefones com teclado — teletipo (TTY), sistemas com alerta táctil-visual, entre outros. 11Adaptações em Acessórios e adaptações que possibilitam a veículos condução do veículo, elevadores para cadeiras de rodas, camionetas modificadas e outros veículos automotores usados no transporte pessoal.
  • 8. Redes neurais As redes neurais artificiais consistem em um método de solucionar problemas deinteligência artificial, construindo um sistema que tenha circuitos que simulem océrebro humano, inclusive seu comportamento, ou seja, aprendendo, errando e fazendodescobertas. São mais que isso, são técnicas computacionais que apresentam um modeloinspirado na estrutura neural de organismos inteligentes e que adquirem conhecimentoatravés da experiência. Uma grande rede neural artificial pode ter centenas ou milharesde unidades de processamento, enquanto o cérebro de um mamífero pode ter bilhões deneurônios. Apesar da complexidade da redes neurais não permitir uma única definição,as linhas seguintes seguem como uma tentativa das inúmeras definições ouinterpretações do que seja realmente uma rede neural. Um grafo direcionado é um objeto geométrico que consiste de um conjunto depontos, chamados nós, ao longo de um conjunto de segmentos de linhas direcionadasentre eles. Uma rede neural é uma estrutura de processamento de informação distribuídaparalelamente na forma de um grafo direcionado, com algumas restrições e definiçõespróprias. Os nós deste grafo são chamados elementos de processamento. Suas arestas sãoconexões, que funcionam como caminhos de condução instantânea de sinais em umaúnica direção, de forma que seus elementos de processamento podem receber qualquernúmero de conexões de entrada. Estas estruturas podem possuir memória local, etambém possuir qualquer número de conexões de saída desde que os sinais nestasconexões sejam os mesmos. Portanto, estes elementos tem na verdade uma únicaconexão de saída, que pode dividir-se em cópias para formar múltiplas conexões, sendoque todos carregam o mesmo sinal. Então, a única entrada permitida para a função de transferência (que cada elementode processamento possui) são os valores armazenados na memória local do elemento deprocessamento e os valores atuais dos sinais de entrada nas conexões recebidas peloelemento de processamento. Os únicos valores de saída permitidos a partir da função detransferência são valores armazenados na memória local do elemento de processamento,e o sinal de saída do mesmo. A função de transferência pode operar continuamente ou episodicamente. Sendoque no segundo caso, deve existir uma entrada chamada "activate" que causa oativamento da função de transferência com o sinal de entrada corrente e com valores damemória local, e produzir um sinal de saída atualizado (ocasionalmente alterandovalores da memória). E no primeiro caso, os elementos estão sempre ativados, e aentrada "activate" chega através de uma conexão de um elemento de processamentoagendado que também é parte da rede. Sinais de entrada para uma rede neural a partir de fora da rede chegam através deconexões que se originam do mundo externo, saídas da rede para o mundo externo sãoconexões que deixam a rede.
  • 9. De forma geral, a operação de uma célula da rede se resume em: Sinais são apresentados à entrada; Cada sinal é multiplicado por um peso que indica sua influência na saída da unidade; É feita a soma ponderada dos sinais que produz um nível de atividade; Se este nível excede um limite (threshold) a unidade produz uma saída;O Neurônio Artificial e a Rede Neural Assim como o sistema nervoso é composto por bilhões de células nervosas, a redeneural artificial também seria formada por unidades que nada mais são que pequenosmódulos que simulam o funcionamento de um neurônio. Estes módulos devemfuncionar de acordo com os elementos em que foram inspirados, recebendo eretransmitindo informações.O Neurônio Artificial O fisiologista WarremMacCulloch interpretou o funcionamento do neurôniobiológico como sendo um circuito de entradas binárias combinadas por uma somaponderada (com pesos) produzindo uma entrada efetiva: fig06-Modelo de McCulloch e Pitts No modelo geral de neurônio (fig06) as entradas WiUi são combinadas usandouma função F, para produzir um estado de ativação do neurônio (correspondente àfrequência de descarga do neurônio biológico).As entradas chegam através dosdendritos e tem um peso atribuído pela sinapse.
  • 10. fig07-Esquema de um neurônio artificial A função básica de um neurônio é somar as entradas e retornar uma saída, casoesse valor seja maior que o valor de soma (threshold).A Rede Neural Artificial (MultilayerPerceptron) A rede neural artificial é um sistema de neurônios ligados por conexões sinápticasdivididos em neurônios de entrada, que recebem estímulos do meio externo, neurôniosinternos ou hidden (ocultos) e neurônios de saída, que se comunicam com o exterior. Aforma de arranjar perceptrons em camadas é denominado MultilayerPerceptron. Omultilayerperceptron foi concebido para resolver problemas mais complexos, os quaisnão poderiam ser resolvidos pelo modelo de neurônio básico. Um único perceptron ouuma combinação das saídas de alguns perceptrons poderia realizar uma operação XOR,porém, seria incapaz de aprendê-la. Para isto são necessárias mais conexões, as quais sóexistem em uma rede de perceptrons dispostos em camadas. Os neurônios internos sãode suma importância na rede neural pois provou-se que sem estes torna-se impossível aresolução de problemas linearmente não separáveis. Em outras palavras pode-se dizerque uma rede é composta por várias unidades de processamento, cujo funcionamento ébastante simples. Essas unidades, geralmente são conectadas por canais de comunicaçãoque estão associados a determinado peso. As unidades fazem operações apenas sobreseus dados locais, que são entradas recebidas pelas suas conexões. O comportamentointeligente de uma Rede Neural Artificial vem das interações entre as unidades deprocessamento da rede. A maioria dos modelos de redes neurais possui alguma regra de treinamento, ondeos pesos de suas conexões são ajustados de acordo com os padrões apresentados. Emoutras palavras, elas aprendem através de exemplos. Arquiteturas neurais sãotipicamente organizadas em camadas, com unidades que podem estar conectadas àsunidades da camada posterior. A rede neural passa por um processo de treinamento a partir dos casos reaisconhecidos, adquirindo, a partir daí, a sistemática necessária para executaradequadamente o processo desejado dos dados fornecidos. Sendo assim, a rede neural é
  • 11. capaz de extrair regras básicas a partir de dados reais, diferindo da computaçãoprogramada, onde é necessário um conjunto de regras rígidas pré-fixadas e algoritmos. fig08-Organização em camadas. Usualmente as camadas são classificadas em três grupos:  Camada de Entrada: onde os padrões são apresentados à rede;  Camadas Intermediárias ou Ocultas: onde é feita a maior parte do processamento, através das conexões ponderadas; podem ser consideradas como extratoras de características;  Camada de Saída: onde o resultado final é concluído e apresentado. Redes neurais são também classificadas de acordo com a arquitetura em que foram implementadas, topologia, características de seus nós, regras de treinamento, e tipos de modelos.
  • 12. Funcionamento O sistema funciona totalmente operado somente por voz e por comandos doteclado, ou seja, para cada movimento o deficiente ouve e interpreta sua ação executadano sistema, um sistema implantado de biblioteca da MICROSOFT faz a parte de OCRem que através de uma interface o usuário consegue digitalizar documentos ouvi-los ouate mesmo salva-los em uma biblioteca eliminando assim a necessidade bastantequestionada pelos próprios deficientes de que muitas das vezes seus instrutores nãotinham tempo de lerem livros dos quais eles sentiam vontade e que ainda não foramlançados embraile.O Software e composto de módulos divididos por faixa etária se posicionam da seguintemaneira. Infantil: Histórias e Material educacional Adulto: Material escolar (Português, matemática, historia, física, etc.). Instrutor: Sistema OCR, Biblioteca Virtual.Objetivo O principal objetivo do Software e proporcionar a inclusão digital dessas pessoascom deficiência permitindo que este material seja compartilhado via web (livros.txt –para serem lidos pelo sistema) através de um site.DesenvolvimentoPlataforma DELPHI 7 + Plugin MICROSOFT OFFICE OCR + NEURAL DELPHI A instalação e os requisitos para que o sistema rode com desempenho total sãomínimos já que o sistema não exige interfaces sobrecarregadas.ManualDesenvolver um manual após o desenvolvimentoTeclas de navegação TAB / ENTERCalibração de Voz do sistema (manual em anexo)
  • 13. Anexos