SlideShare a Scribd company logo
1 of 2
Download to read offline
Curioso Ojo del lenguaje
[Grey-Walter] curioso ojo al lenguaje
Fri Sep 19 07:44:13 CEST 2003


       Sgeun un etsduio de una uivenrsdiad ignlsea, no ipmotra el odren en el que las ltears etsan
       ersciats, la uicna csoa ipormtnate es que la pmrirea y la utlima ltera esten ecsritas en la
       psiocion cocrrtea. El
       rsteo peuden estar ttaolmntee mal y aun pordas lerelo sin pobrleams. Etso es pquore no
       lemeos cada ltera por si msima preo la paalbra es un tdoo .


Es un efecto muy curioso pero creo que la interpretación del estudio ("no importa el orden de la
letras sinó unicamente la primera y la ultima") es totalmente erroneo, por no decir falso.
Dos preguntas que dicha interpretación no sabe responder:

1. Muchas palabras comparten las mismas letras y coinciden en la primera y la última, ¿como
podemos interpretar la palabra correcta al leer las lineas anteriores?

2. Es curioso que cuando hace unos dias leí la misma noticia en inglés me fué mucho más fácil de
reconocer las palabras, ¿como es posible si mi nivel de inglés es muy inferior al del español?
Mi interpretación del efecto es mucho menos misteriosa pero más coherente con lo que sabemos
sobre el funcionamiento del cerebro / redes neuronales: Nuestros sistemas de preproceso sensorial
nos hacen muy robustos frente al ruido original, ya que lo que percibe nuestro cerebro consciente ha
sido editado y corregido previamente. Solo hay que pensar en la dificultad de corregir la ortografia
de un texto escrito, por muchas veces que lo revisemos siempre hay errores orto/tipográficos que se
nos escapan porque simplemente no los vemos, nuestro sistema de lectura los corrige y no nos
permite ver los carácteres realmente escritos. Pero este sistema de corrección de errores, como
todos, tienen limitaciones: digamos que puede corregir facilmente pequeños errores locales como
transposiciones (ejemlpo), borrados (ejempo), sustituciones (ejempro) e inserciones (ejempelo) de
carácteres, pero tiene muchas más dificultades para corregir errores a más distancia (epljemo).
[Nota: "Distancia de Levenshtein" o distancia de edición entre dos palabras se define como el
número entero de operaciones elementales (inserción, borrado y sustitución) que permite
transformar una cadena de carácteres en la otra.]

1. Muchas palabras comparten las mismas letras y coinciden en la primera y la última, ¿como
podemos interpretar la palabra correcta al leer las lineas anteriores? Porque es falso que el orden de
las letras no influya, cuando tenemos que elegir un candidato para la palabra misteriosa escogemos
la que está mejor alineada con la original, es decir la que tiene una menor distancia de edición, o
dicho de otra manera la que las posiciones de los carácteres individuales están más cerca de las
posiciones originales.

2. Es curioso que cuando hace unos dias leí la misma noticia en inglés me fué mucho más fácil de
reconocer las palabras, ¿como es posible si mi nivel de inglés es muy inferior al del español? El
principal motivo es que los cambios que ha hecho el autor son mínimos, en lugar de mezclar
aleatoriamente las letras como ha hecho Pablo, basicamente ha ido recorriendo la palabra e
intercambiado (swap) las letras consecutivas cada 2 o 3 carácteres, por lo que la distancia entre la
cadena original y la cambiada és pequeña. También influye que la longitud media de las palabras en
inglés debe ser alrededor de 4 y la del español de 6 (datos orientativos), por lo que si restamos la
letra inicial y final nos quedan 2 y 4 letras a recombinar, curiosmente para la mayoria de las
palabras inglesas solo nos permiten una operación de transposición, y para la mayoria de las
españolas (no digamos ya del alemán) el árbol de combinaciones es muy superior.
PD tcaompo etasn tan mal etasicrs. quizas el español e ingles se den bien al truco, habria que ver si
a los alemanes les hace gracia Ejemplo: he tardado varios dias en reconocer la palabra "etasicrs"
("escritas"?), porque una de las sílabas "ta" se elejo totalmente de su posición, pasando del final al
principio de la palabra, lo que aumentaba enormemente la distancia de edición o Levenstein. Si solo
se hubiera girado: "esicrats", hubiera sido mucho más sencilla de leer a pesar de conteneer las
mismas letras y coincidir en la primera y la última. Finalmente, todo lo anterior es válido para
palabras sueltas, si a esta capacidad le añadimos la información contextual (las palabras anteriores o
posteriores) y el sentido general de la frase la tarea de escoger la palabra correcta se hace mucho
más sencilla todavia. (Por ejemplo, esta frase tiene una ###### tachada y a pesar de todo se
entiende perfectamente).

Resumen: La capacidad del cerebro para filtrar ruido, sobretodo en señales
tan redundantes como el lenguaje humano, es impresionante. No hace falta
buscar explicaciones misteriosas, de hecho el cerebro és una máquina de
detectar patrones incluso donde no existen.
saludos,

     Francesc

Articulo tomado de:

https://listas.sindominio.net/pipermail/grey-walter/2003-September/000604.html

More Related Content

Similar to Mas de la distancia de levenshtein

Tecnicas de redacción
Tecnicas de redacciónTecnicas de redacción
Tecnicas de redacciónJuan Martinez
 
16.tecnicas d redaccion ..[1]
16.tecnicas d redaccion ..[1]16.tecnicas d redaccion ..[1]
16.tecnicas d redaccion ..[1]Ramón Ibarra
 
La Lectura tecnicas para mejorarla
La Lectura tecnicas para mejorarla La Lectura tecnicas para mejorarla
La Lectura tecnicas para mejorarla Ivan Farinango
 
Span 4396 rasgos diferenciales entre el inglés y el castellano i
Span 4396 rasgos diferenciales entre el inglés y el castellano iSpan 4396 rasgos diferenciales entre el inglés y el castellano i
Span 4396 rasgos diferenciales entre el inglés y el castellano iSierra Francisco Justo
 
Redaccion creativa doc
Redaccion creativa docRedaccion creativa doc
Redaccion creativa docJJRG4
 
Propuesta de intervencion de los problemas de lectoescritura.
Propuesta de intervencion de los problemas de lectoescritura.Propuesta de intervencion de los problemas de lectoescritura.
Propuesta de intervencion de los problemas de lectoescritura.esthpece
 
1. Propuesta de intervencion de los problemas de lectoescritura.
1. Propuesta de intervencion de los problemas de lectoescritura.1. Propuesta de intervencion de los problemas de lectoescritura.
1. Propuesta de intervencion de los problemas de lectoescritura.esthpece
 
Técnicas de redacción
Técnicas de redacciónTécnicas de redacción
Técnicas de redacciónandrea025
 
Propuesta de intervencion de los problemas de lectoescritura
Propuesta de intervencion de los problemas de lectoescrituraPropuesta de intervencion de los problemas de lectoescritura
Propuesta de intervencion de los problemas de lectoescrituraesthpece
 
Resumen de tiempos verbales
Resumen de tiempos verbalesResumen de tiempos verbales
Resumen de tiempos verbalesJade_Neves
 
SIGNOS DE PUNTUACIÓN de lectura y comprension.pdf
SIGNOS DE PUNTUACIÓN de lectura  y comprension.pdfSIGNOS DE PUNTUACIÓN de lectura  y comprension.pdf
SIGNOS DE PUNTUACIÓN de lectura y comprension.pdfbrochetaamajiki46
 
Cuestiones de léxico
Cuestiones de léxicoCuestiones de léxico
Cuestiones de léxicoAmparomm10
 

Similar to Mas de la distancia de levenshtein (20)

Empezar a caminar-4º de ESO
Empezar a caminar-4º de ESOEmpezar a caminar-4º de ESO
Empezar a caminar-4º de ESO
 
Tema 1 hc
Tema 1 hcTema 1 hc
Tema 1 hc
 
Tecnicas de redacción
Tecnicas de redacciónTecnicas de redacción
Tecnicas de redacción
 
16.tecnicas d redaccion ..[1]
16.tecnicas d redaccion ..[1]16.tecnicas d redaccion ..[1]
16.tecnicas d redaccion ..[1]
 
Tecnicas d redaccion.
Tecnicas d redaccion.Tecnicas d redaccion.
Tecnicas d redaccion.
 
La Lectura tecnicas para mejorarla
La Lectura tecnicas para mejorarla La Lectura tecnicas para mejorarla
La Lectura tecnicas para mejorarla
 
Span 4396 rasgos diferenciales entre el inglés y el castellano i
Span 4396 rasgos diferenciales entre el inglés y el castellano iSpan 4396 rasgos diferenciales entre el inglés y el castellano i
Span 4396 rasgos diferenciales entre el inglés y el castellano i
 
Present simple
Present simplePresent simple
Present simple
 
Redaccion creativa doc
Redaccion creativa docRedaccion creativa doc
Redaccion creativa doc
 
Hand out 5 to 13 14
Hand out 5 to 13 14Hand out 5 to 13 14
Hand out 5 to 13 14
 
Propuesta de intervencion de los problemas de lectoescritura.
Propuesta de intervencion de los problemas de lectoescritura.Propuesta de intervencion de los problemas de lectoescritura.
Propuesta de intervencion de los problemas de lectoescritura.
 
1. Propuesta de intervencion de los problemas de lectoescritura.
1. Propuesta de intervencion de los problemas de lectoescritura.1. Propuesta de intervencion de los problemas de lectoescritura.
1. Propuesta de intervencion de los problemas de lectoescritura.
 
Técnicas de redacción
Técnicas de redacciónTécnicas de redacción
Técnicas de redacción
 
Propuesta de intervencion de los problemas de lectoescritura
Propuesta de intervencion de los problemas de lectoescrituraPropuesta de intervencion de los problemas de lectoescritura
Propuesta de intervencion de los problemas de lectoescritura
 
Resumen de tiempos verbales
Resumen de tiempos verbalesResumen de tiempos verbales
Resumen de tiempos verbales
 
Afijos - presentación.pptx
Afijos - presentación.pptxAfijos - presentación.pptx
Afijos - presentación.pptx
 
SIGNOS DE PUNTUACIÓN de lectura y comprension.pdf
SIGNOS DE PUNTUACIÓN de lectura  y comprension.pdfSIGNOS DE PUNTUACIÓN de lectura  y comprension.pdf
SIGNOS DE PUNTUACIÓN de lectura y comprension.pdf
 
Acentuacion y tildacion
Acentuacion y tildacionAcentuacion y tildacion
Acentuacion y tildacion
 
Cuestion de lexico
Cuestion de lexicoCuestion de lexico
Cuestion de lexico
 
Cuestiones de léxico
Cuestiones de léxicoCuestiones de léxico
Cuestiones de léxico
 

Mas de la distancia de levenshtein

  • 1. Curioso Ojo del lenguaje [Grey-Walter] curioso ojo al lenguaje Fri Sep 19 07:44:13 CEST 2003 Sgeun un etsduio de una uivenrsdiad ignlsea, no ipmotra el odren en el que las ltears etsan ersciats, la uicna csoa ipormtnate es que la pmrirea y la utlima ltera esten ecsritas en la psiocion cocrrtea. El rsteo peuden estar ttaolmntee mal y aun pordas lerelo sin pobrleams. Etso es pquore no lemeos cada ltera por si msima preo la paalbra es un tdoo . Es un efecto muy curioso pero creo que la interpretación del estudio ("no importa el orden de la letras sinó unicamente la primera y la ultima") es totalmente erroneo, por no decir falso. Dos preguntas que dicha interpretación no sabe responder: 1. Muchas palabras comparten las mismas letras y coinciden en la primera y la última, ¿como podemos interpretar la palabra correcta al leer las lineas anteriores? 2. Es curioso que cuando hace unos dias leí la misma noticia en inglés me fué mucho más fácil de reconocer las palabras, ¿como es posible si mi nivel de inglés es muy inferior al del español? Mi interpretación del efecto es mucho menos misteriosa pero más coherente con lo que sabemos sobre el funcionamiento del cerebro / redes neuronales: Nuestros sistemas de preproceso sensorial nos hacen muy robustos frente al ruido original, ya que lo que percibe nuestro cerebro consciente ha sido editado y corregido previamente. Solo hay que pensar en la dificultad de corregir la ortografia de un texto escrito, por muchas veces que lo revisemos siempre hay errores orto/tipográficos que se nos escapan porque simplemente no los vemos, nuestro sistema de lectura los corrige y no nos permite ver los carácteres realmente escritos. Pero este sistema de corrección de errores, como todos, tienen limitaciones: digamos que puede corregir facilmente pequeños errores locales como transposiciones (ejemlpo), borrados (ejempo), sustituciones (ejempro) e inserciones (ejempelo) de carácteres, pero tiene muchas más dificultades para corregir errores a más distancia (epljemo). [Nota: "Distancia de Levenshtein" o distancia de edición entre dos palabras se define como el número entero de operaciones elementales (inserción, borrado y sustitución) que permite transformar una cadena de carácteres en la otra.] 1. Muchas palabras comparten las mismas letras y coinciden en la primera y la última, ¿como podemos interpretar la palabra correcta al leer las lineas anteriores? Porque es falso que el orden de las letras no influya, cuando tenemos que elegir un candidato para la palabra misteriosa escogemos la que está mejor alineada con la original, es decir la que tiene una menor distancia de edición, o dicho de otra manera la que las posiciones de los carácteres individuales están más cerca de las posiciones originales. 2. Es curioso que cuando hace unos dias leí la misma noticia en inglés me fué mucho más fácil de reconocer las palabras, ¿como es posible si mi nivel de inglés es muy inferior al del español? El principal motivo es que los cambios que ha hecho el autor son mínimos, en lugar de mezclar aleatoriamente las letras como ha hecho Pablo, basicamente ha ido recorriendo la palabra e intercambiado (swap) las letras consecutivas cada 2 o 3 carácteres, por lo que la distancia entre la cadena original y la cambiada és pequeña. También influye que la longitud media de las palabras en inglés debe ser alrededor de 4 y la del español de 6 (datos orientativos), por lo que si restamos la letra inicial y final nos quedan 2 y 4 letras a recombinar, curiosmente para la mayoria de las palabras inglesas solo nos permiten una operación de transposición, y para la mayoria de las españolas (no digamos ya del alemán) el árbol de combinaciones es muy superior.
  • 2. PD tcaompo etasn tan mal etasicrs. quizas el español e ingles se den bien al truco, habria que ver si a los alemanes les hace gracia Ejemplo: he tardado varios dias en reconocer la palabra "etasicrs" ("escritas"?), porque una de las sílabas "ta" se elejo totalmente de su posición, pasando del final al principio de la palabra, lo que aumentaba enormemente la distancia de edición o Levenstein. Si solo se hubiera girado: "esicrats", hubiera sido mucho más sencilla de leer a pesar de conteneer las mismas letras y coincidir en la primera y la última. Finalmente, todo lo anterior es válido para palabras sueltas, si a esta capacidad le añadimos la información contextual (las palabras anteriores o posteriores) y el sentido general de la frase la tarea de escoger la palabra correcta se hace mucho más sencilla todavia. (Por ejemplo, esta frase tiene una ###### tachada y a pesar de todo se entiende perfectamente). Resumen: La capacidad del cerebro para filtrar ruido, sobretodo en señales tan redundantes como el lenguaje humano, es impresionante. No hace falta buscar explicaciones misteriosas, de hecho el cerebro és una máquina de detectar patrones incluso donde no existen. saludos, Francesc Articulo tomado de: https://listas.sindominio.net/pipermail/grey-walter/2003-September/000604.html