Your SlideShare is downloading. ×

Qué es estadística

1,450

Published on

estadistica y su evolucion

estadistica y su evolucion

Published in: Economy & Finance
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,450
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
15
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Lectura 2<br />¿QUÉ ES LA ESTADÍSTICA?<br />POR EL PREMIO NOBEL DR. RAGNAR FRISCH<br />DE “CEMENTERIO DE NÚMEROS” A INSTRUMENTO DE DECISIÓN<br />“Hay tres tipos de mentiras: las mentiras, las mentiras condenables y las estadísticas”. Esta es una de las máximas mas citada desde hace un siglo al abordar el tema de las estadísticas. O dicho de otro modo: existen las mentiras, las mentiras oficiosas; o bien: las estadísticas son una forma maliciosa de decir las mentiras.<br />Curiosamente, los eruditos no se han puesto de acuerdo sobre a quien deben atribuir esta sentencia. Benjamín Disraeli fue probablemente su iniciador, habiéndose propuesto también como autor de la misma a su contrincante Lord Palmerston. En cualquier caso, parece ser que fue debida a la malicia de un diputado del siglo pasado, al cual se le presentaron unas estadísticas que no supo interpretar y al verse públicamente comprometido se defendió con esta sentencia.<br />Es sorprendente que una observación hecho con sorna hace un siglo en el Parlamento inglés, haya sido, desde entonces, repetida en todo el mundo.<br />Todavía es más sorprendente que, igual ahora que antes, la mayoría de la gente la cita sin crítica, aun sin tener ningún o casi ningún conocimiento de lo que es realmente la estadística.<br />Las estadísticas mienten; esto se oye una vez, dos veces, muchas veces y creerlo es mucho más fácil que tener uno mismo la ocasión de comprobar que esta o aquella estadística “miente” realmente pero esta postura tan difundida abarca, singularmente, su contraria: las estadísticas están consideradas como el non-plus-ultra de lo irrefutable, ya que de ellas emana el mágico sortilegio de la precisión matemática, porque ¿qué puede ser mas incorruptible que una operación con números?. El que necesita argumentos decisivos e invulnerables, se provee a tiempo de datos y cálculos y echando una mirad definitiva sobre la mesa puede exclamar: ahí esta. La estadística demuestra. Muchas veces, además, a partir de dos estadísticas se obtienen tesis completamente contradictorias, lo cual convence al no iniciado de que las estadísticas, en efecto, mienten. Pero cuando después de pensarlo, este seguro de ello, quizá se pregunte como es posible que la precisión matemática y aquellas mentiras tan claras vayan tan estrechamente unidas. Por ello, la estadística se convierte en una ciencia oculta practicada por unos extraños seres. <br />Esto no sería grave, si se tratara de un método o ciencia, con que el hombre de la calle apenas estuviera en contacto. Pero esto no ocurre con las estadísticas. No solo aparecen en todo tipo de comunicaciones, informaciones y noticias sino que además forman las bases para la planificación, urbanización y organización de los problemas públicos.<br />El primer gran teórico de la estadística en lengua alemana, Gottfried Achenwall, a mediados del siglo XVIII, se apoyó explícitamente en el origen etimológico de la palabra estadística, “status”, es decir, “situación” y “estado”. La estadística debía mostrar las “características reales” de una sociedad burguesa, en otras palabras: las particularidades propias de un estado.<br />Podemos encontrar los últimos restos de estas formas más antiguas de la ciencia estadística, en las primeras páginas de los actuales libros oficiales de estadística de la República Federal Alemana. En ellas se hace una reseña de la superficie de las islas del mar del Norte, de la altura de las montañas pizarrosas del Rin, del número de presas en el canal Elba-Lubek, de la altura del agua en los embalses, altura a que se hallan situados los balnearios...<br />Entre tanto, en Inglaterra se elaboraba un tipo de estadística completamente distinto –“la aritmética política”- que partiendo del número de nacimientos y muertes, intentaba comparar y observar las variaciones del número de habitantes durante periodos largos de tiempo. Graunt y Petty realizaron, a mediados del siglo XVII el trabajo fundamental. En Alemania, esta orientación – en dura lucha con la escuela de Achenwall y Schlözer obtuvo el primer éxito definitivo gracias al grandioso esfuerzo de Johann Peter Süssmilch, clérigo castrense y posteriormente alto consejero consistorial.<br />Süsmilch –“un meteorito luminoso y solitario, como lo llamo Oettingen- tituló su obra más importante Betrachtrungen ubre die göttliche Ordnung in den Veränderung des menschilichen Geschlechts, aus der Geburt, den Tode und der Fortpflanzung deselben erwiesen” (1741) (consideraciones sobre las disposiciones divinas en las variaciones del género humano, comprobadas por el número de nacimientos, muertes y la reproducción en si misma). Este es un libro de estadística de la población, pero el autor solo esperaba llegar a conocer la voluntad de Dios en las regularidades que se manifiestan en la vida (véase Fig. 1). En los diez años siguientes se operó un cambio en dicha estadística político-aritmética que se convirtió en estadística mundana. El matemático y el teórico de la probabilidad buscaron y encontraron cada vez mas regularidades en la vida social. Lo que había empezado como una adoración de Dios, se convirtió en problemas de aritmética para los perspicaces matemáticos (o astrónomos).<br />La ya mencionada influencia de la teoría de la probabilidad sobre la estadística, ha dado desde aquel momento resultados cada vez más fructíferos. El belga Adolphe Quételet Hizo el cómputo de todos los tipos humanos existentes, desde el “homme moyen” (hombre medio) hasta los tipos ideales deseados y los anormales en algún grado. <br />A partir de aquí creo no solo una fábula místico-matemática, sino también la base fundamental del futuro trabajo estadístico: el concepto de distribución normal, curva normal, valor medio y desviación.<br /> Entre los numerosos matemáticos y sabios que durante los siglos XVIII y XIX llevaron a cabo valiosos trabajos sobre los que se ha pasado la estadística posterior, citemos solamente a los tres Bernouilli (Jacob, Daniel y Nicolás), Halley, Lagrange, Euler y especialmente a Laplace, De Moivre y Gauss: entre los ingleses destaquemos al clérigo Tomas Bayes.<br />Todo el trabajo estadístico del siglo XIX y principios del XX tuvo como característica el estudio de las grandes masas. La idea clave era la colección completa de datos. Toda la población era abarcada en censos cuidadosamente preparados y listas completas de todos los acontecimientos demográficos y económicos. La consigna era: siempre más números y abarcando cada vez más.<br />Esto era la estadística y sigue siéndolo actualmente para el hombre de la calle.<br />Pero a principios de nuestro siglo y plenamente en los años treinta, se produjo un nuevo giro en el desarrollo de la estadística. Nació la estadística moderna, la estadística inductiva, la estadística analítica. Más tarde hablaremos de las características de esta última, pero aquí solo vamos a presentar una diferencia esencial respecto a la antigua estadística: antes, se quería obtener información de cada detalle en particular, consiguiéndola solo tras penosos e infructuosos trabajos; actualmente se buscan métodos que hagan posible obtener conclusiones generales a partir de muestras y conclusiones parciales La palabra clave de la estadística moderna es “muestra”.<br />Este cambio provocó un giro completo en la teoría y praxis de la estadística. Más que nunca fue dominada por las matemáticas –y no precisamente por las cuatro reglas de aritmética que habían bastado a la ciencia del Estado y a la estadística de las largas colecciones de datos-. La matemática estadística se desarrolló como una rama de la alta matemática con procedimientos propios como son el análisis de la varianza, el cálculo de la correlación y los ensayos de hipótesis con sus numerosos métodos de trabajo.<br />Los principios de esta transformación, a comienzos del siglo XX, son debidos primero a Lexis y Bortkiewicz en Alemania y Tschebyschew, Tschuprow, Ljapunow y Markow en Rusia. Pero pronto esta disciplina se convirtió en Dominio de los anglo-americanos y-en menor proporción- también de los escandinavos. Después de la Segunda Guerra Mundial, la estadística tuvo que empezar de nuevo en Europa Central, y fue Oscar Anderson y algunos otros quienes introdujeron allí los nuevos métodos. Ya en 1965, Erwin Kreyszig manifestó: “como es sabido, en los países de lengua alemana no se ha prestado suficiente atención a la estadística y además ha sido poco utilizada”. La posición sobresaliente de los angloamericanos se debe sobre todo a la gran personalidad de Sir Ronald A. Fisher, el cual ha desarrollado solo o en equipo, una gran parte de los métodos de trabajo usados hoy en el análisis estadístico.<br />Puede que él y la “escuela biométrica” sean hoy superados en algunos aspectos, pero la importancia histórica de Fischer para la estadística moderna continúa siendo inmensa. Entre los estadísticos anglo-americanos más importantes citaremos además a G.U. Yale, Karl Pearson y el polonés residente en América Jerzy Neyman, el cual, junto con el hijo de Pearson fue el creador de la teoría de muestreo.<br />Hoy el buen estadístico es un mejor matemático y esto no constituye una razón para que el hombre de la calle vea ratificado su respeto -o su repugnancia- por la estadística. En todos los campos de la ciencia ocurre que el trabajo altamente cualificado solo puede ser realizado por especialistas. <br />Pero el hombre inteligente de hoy trata de hacer un esfuerzo por conocer todos los adelantos significativos de la ciencia, aunque no tenga relación alguna con su trabajo. La visión del mundo que dan las ciencias naturales o la sociología interesan al no-naturalista y al no-sociólogo respectivamente. Otro tanto ocurre con la estadística. Los métodos y afirmaciones estadísticos son cada vez más significativos. Los principios básicos de esta rama del saber son requeridos por todo el mundo: sea en el trabajo o en la vida privada.<br />PROBABILIDAD Y PRECISIÓN<br />La base de toda la estadística moderna esta en el cálculo de probabilidad, que no es fácil ni claro. El interés por los datos del pasado surge del interés por el futuro; los resultados parciales obtenidos de una muestra deben ayudar a la decisión de actitudes futuras. De este modo se obtienen inferencias a partir de conocimientos parciales. Estas inferencias no deben mal interpretarse como una predicción precisa, sino que siempre están sujetas a ideas como “probabilidad”, “margen de confianza”, “valor esperado”, “máxima probabilidad”, “probabilidad segura”, “hipótesis”, y “valor estimado”. Porque a lo sumo podemos conocer el pasado, pero nunca el futuro. Y el conocimiento de una muestra justifica –solo dentro de ciertos límites- las afirmaciones extendidas a toda la población.<br />Pero ante todo, para poder sacar conclusiones de las muestras y de los resultados parciales es necesario que la muestra de la población haya sido tomada al azar y no por otro procedimiento de selección. El azar, incluido en el cálculo de probabilidades, es fácilmente alterado y falseado por toda elección subjetiva.<br />Vemos que en los libros elementales de estadística hay una introducción al cálculo de probabilidad –y viceversa-. Es difícil establecer una frontera entre ambos. Oímos a menudo que la estadística moderna es el cálculo de probabilidades aplicado. Dicho de esta forma no es quizá del todo correcto, pero nadie puede negar su estrecha relación.<br />¿QUÉ ES LA ESTADÍSTICA?<br />Leonard Savage, uno de los más importantes pero también uno de los más discutidos estadísticos de nuestro tiempo escribió en la introducción de su libro “Foundations of Statistics” (Fundamentos de Estadística): “Todo el mundo coincide en que la estadística se basa en el cálculo de probabilidades. Pero existen opiniones diversas sobre qué se entiende por probabilidad; y cómo ésta se relaciona con la estadística. Y en estas cuestiones, la posibilidad de llegar a un acuerdo es tan difícil como en la Torre de Babel”.<br />No podemos presentar aquí las polémicas que sobre este punto mantienen las eminencias de la estadística. Por ello, nos hemos limitado a dar las explicaciones mínimas sobre cálculo de probabilidades que permitan la comprensión de un manual de estadística. Pero es necesario indicar aquí esta mezcla entre el cálculo de probabilidades y la estadística moderna. Cálculo de probabilidades, ensayo de hipótesis, estimaciones y suposiciones son los temas principales sobre los que trabaja la estadística de hoy.<br />Los métodos son matemáticamente exactos y precios, pero los resultados son estimaciones y probabilidades. La pretendida precisión de la estadística desorienta solo al no especializado – el hombre entendido en la materia sabe que la estadística es el arte de evaluar y suponer más que una técnica de cálculo-.<br />Ernst Wagemann, que durante veinte años fue presidente del Instituto de Estadística dijo una vez: “la aritmética es la criada de la evaluación estadística”.<br />El estadístico británico, M.J. Moroney termino su libro Facts from figures (“De cifras a hechos”) con estas palabras: “en la escuela se ha inculcado siempre, que la aritmética es una ciencia exacta y que siempre hay unos resultados ciertos para los ejercicios que figuran en los libros de texto. Si alguna vez nos dicen de hacer una estimación y damos un resultado justo, no podemos dejar de indicar también que lo que hemos hecho no ha sido más que una burda aproximación... pero esto es una lamentable preparación para enfrentarse con la vida. Dejando aparte los cajeros de los bancos, al resto de las personas, la precisión aritmética no les sirve absolutamente para nada... <br />Los profesores, que realizan una extraordinaria labor, querrían enseñar a sus alumnos que la aritmética se resiste a toda crítica, cuando lo que deberían enseñarles es la forma de tachar el 114,72 y escribir el 100”.<br />La estadística política de los siglos XVIII y XIV recogía cuidadosamente una gran cantidad de datos de los que pretendía obtener, mediante engorrosas operaciones, conclusiones exactas. La estadística matemática de hoy, por el contrario, es el arte de apreciar cuan inexacto se supone que es un número, cuan probable es un resultado, una hipótesis o una afirmación.<br />El principio de estas nuevas formas de cálculo se remontan a más de cien años; fue Quetelet quien manifestó esta falta de precisión en las conclusiones estadísticas.<br />Pero constantemente, los aficionados a la estadística –y estos últimos años desgraciadamente también los estadísticos de profesión- caen en la tentación de fingir una precisión en los resultados, que por otra parte, no es nada fácil de alcanzar. Hace apenas cuarenta años, Oscar Anderson, uno de los primeros que fomentó la estadística en los países de lengua alemana, escribió en este sentido –por cierto, defendiéndose-: hay dos axiomas que yo considero válidos: 1. No tiene ningún fin práctico el querer pesar un saco de heno en una balanza de precisión de las que se usan en un laboratorio químico. 2. No representa ninguna ayuda, saber que la distancia entre dos ciudades difiere en unos pasos si en realidad es del orden de miles. <br />Asimismo no nos dice nada una diferencia de milímetros en el grosor de la puerta de la ciudad. <br />Este segundo “axioma” no es aceptado en todas partes. El profundo respeto otorgado a la precisión aritmética, que tanto había abominado Moroney, continúa todavía. Y si alguna vez se hace una aproximación, el valor obtenido se considera como algo intocable. Así podemos leer que tal fenómeno ha tenido lugar a 1609 km de la costa. La evaluación “mil millas (marinas)” se ha usado desgraciadamente en diversos sentidos. Así cuando ocurre una catástrofe a 32 km de Saigon o San Francisco, se dice que ha ocurrido aproximadamente a unas veinte millas de la ciudad en cuestión.<br />La estadística aborrece este tipo de aritmética –y con razón-. Seguramente, una afirmación estadística podría darse exacta hasta los decimales, pero una buena estadística no puede dejar nunca de indicar cual es la probabilidad de que este valor sea exacto. Si el estadístico no quiere decir “alrededor de 1600” entonces dirá “con el 95% de probabilidad de que el número no sea menor de 1583 ni mayor de 1631”. Sería una equivocación, recriminar a la estadística por hacer hincapié sobre la probabilidad y esta expresión de la inexactitud. De hecho, no se hace más que poner de manifiesto lo que cada día en el lenguaje corriente-y a menudo también en ciencia- no queremos aceptar como una verdad: que también nuestro “si” y “no”, incluso nuestros “completamente seguro” y “seguro que no”, están sometidos a cierto grado de inseguridad y duda. Para simplificar y no entrar en un caos, no hacemos caso de las causalidades, sorpresas e improbabilidades que pudieran presentarse. Sin embargo, la estadística matemática define los límites de la probabilidad – y paga un precio por ello-: la precisión queda dudosa <br />Pero debemos preguntarnos como lo ha hecho Moroney: ¿De dónde proviene este afán de precisión? Para la compañía de ferrocarriles debe ser importante conocer el número de viajeros que tomaran el tren de Hamburgo hacia Italia en el mes de julio. Pero le basta con saber, con una aproximación del orden de mil, los que fueron el año pasado. Un par de centenares más o menos no tiene, en este caso, ninguna importancia.<br />Una colección completa de datos de toda la población no está nunca exenta de errores, y a menudo posee tantos como la colección de datos de una pequeña muestra. Un problema tan sencillo a primera vista como es saber el número de turistas alemanes que fueron a Italia el año pasado, se hace mucho más complejo si lo estudiamos atentamente. El verano -¿a que llamamos verano?- definámoslo pues: de principios de junio a finales de septiembre. ¿Qué hacemos ahora? ¿Debemos ir a todas las agencias de viajes y sumar todas las personas que han utilizado sus servicios para ir a Italia? ¿Y hacer que los empleados de la aduana sur pregunten a todos los conductores donde van a pasar sus vacaciones? Aquí hemos dejado de contar los que viajan en tren y los que han salido por la frontera francesa; y además hemos contado dos veces los que van en viajes organizados. ¿Y que hacemos con la gente que ha cogido un billete de avión para Roma, pero que desde allí se dirige a El Cairo o a Madrid? ¿Podemos considerar que pasan las vacaciones en Italia aquellos que lo hacen en un lago suizo y se desplazan a Venecia solo para tres días?<br />Si obtenemos la información en los registros de los hoteles italianos, hallaremos otros números, pero que no serán necesariamente los mejores. Ocurre que algunas pensiones no inscriben a sus huéspedes. Y no habrá forma de registrar a aquellos que viajen en “roulette”. Una encuesta realizada sobre una muestra de unos cuantos miles de ciudadanos alemanes daría seguramente –con mucho menos gasto- un resultado más exacto que el de aquella investigación sobre el total. <br />Podemos llegar a cometer todavía mayores errores si queremos saber cuántos marcos o dólares deja el turista medio en España, Austria o Grecia. Es algo difícil de precisar ya que no todas las divisas van al Banco Nacional, ni todos los dólares provienen de americanos, ni los marcos alemanes. Si leemos que un ciudadano alemán gasta en Italia un promedio de 3567 liras al día, debemos tener en cuenta: primero, que este número es sólo una estimación y que la mejor forma de expresarlo es: “gasta entre 3500 y 3630 liras con un 95% de seguridad”, segundo, que se han dividido mecánicamente los marcos dejados en Italia por el número de turistas alemanes para hallar este promedio. Los promedios desempeñan un importante papel en estadística –aunque a menudo son mal interpretados-. Por esta razón vamos a dirigir nuestra atención hacia este punto. Estos logros culminan con la obra de Pierre Simon Laplace, que establece las primeras hipótesis estadísticas de orden intuitivo, lleva a cabo estudios de cómo se desvía un conjunto de valores a partir del promedio y esto da origen a la teoría analítica de las probabilidades.<br />Ése fue el inicio para el estudio de Carl Friedrich Gauss, que refiere a la ley normal del error y el método de mínimos cuadrados, contando también con la colaboración de Simon Denis Poisson quién redacta la distribución que lleva su nombre.<br />Los esfuerzos de éstos y otros grandes hombres en el campo de las matemáticas aplicadas han servido de cimientos y estímulos al estudio y la investigación en todos los países del mundo.<br />Como una conclusión relacionada con los acontecimientos aquí tratados es posible hablar de dos términos y metodología diferente.<br />Si se trata de la recolección, presentación y caracterización de un conjunto de datos que arrojan como resultado la descripción de las diversas características de una población o muestra, tiene lugar una metodología llamada: Estadística Descriptiva.<br />

×