Qué es variable nominal

97,219 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
97,219
On SlideShare
0
From Embeds
0
Number of Embeds
7
Actions
Shares
0
Downloads
153
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Qué es variable nominal

  1. 1. ¿QUÉ ES VARIABLE NOMINAL?Son variables numéricas cuyos valores representan una categoría o identifican ungrupo de pertenencia. Este tipo de variables sólo nos permite establecer relaciones deigualdad/desigualdad entre los elementos de la variable. La asignación de los valoresse realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo deeste tipo de variables es el Género ya que nosotros podemos asignarles un valor a loshombres y otro diferente a las mujeres y por más machistas o feministas que seamosno podríamos establecer que uno es mayor que el otro.¿QUÉ ES VARIABLE ORDINAL?Son variables numéricas cuyos valores representan una categoría o identifican ungrupo de pertenencia contando con un orden lógico. Este tipo de variables nos permiteestablecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si unacategoría es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel deeducación, ya que se puede establecer que una persona con título de Postgrado tieneun nivel de educación superior al de una persona con título de bachiller. En lasvariables ordinales no se puede determinar la distancia entre sus categorías, ya queno es cuantificable o medible.¿QUÉ ES VARIABLE CARDINAL?Estas escalas son más refinadas que las ordinales; el nivel científico de utilidad esmás alto que el de la escala ordinal, ya que permite la cuantificación y, a este nivel,medir escalas asociadas. Existen dos tipos de escalas cardinales: escala de intervalosy escala de razón. Una característica común para estos dos tipos de escalas es quedistancias iguales entre dos puntos corresponden siempre a diferencias iguales.Las escalas de intervalos se emplean generalmente para establecer intervalos entretemperaturas y fechas, entre otros. En estas escalas es importante resaltar que noexiste un punto de referencia o cero real.Las escalas de razón o de proporción, permiten incluir un valor cero real, lo que haceposible operaciones matemáticas para establecer proporciones o cocientes, lasescalas. Son escalas de cocientes las que miden la longitud, la masa, la intensidad decorriente eléctrica y otras variables del mundo físico.¿QUÉ SON LAS OPERACIONES DE DESIGUALDAD?Son operaciones con desigualdad a dos miembros de una desigualdad a las cuales lessumamos o restamos un mismo número la desigualdad se mantiene. ejm3<53+2<5+25<7Si a los dos miembros de una desigualdad les multiplicamos o dividimos por un mismonúmero, la desigualdad: si el nº es positivo se mantiene.3<53·2<5·26 < 10si el número es negativo, se invierte.3<5
  2. 2. 3 (-2) > 5 (-2)-6 > -10¿QUÉ SON LOGARITMOS?En matemáticas, el logaritmo de un número —en una base determinada— es elexponente al cual hay que elevar la base para obtener dicho número. Por ejemplo, ellogaritmo de 1000 en base 10 es 3, porque 1000 es igual a 10 a la potencia 3: 1000 =103 = 10×10×10.De la misma manera que la operación opuesta de la suma es la resta y la de lamultiplicación la división, el cálculo de logaritmos es la operación inversa a lapotenciación de la base del logaritmo.Para representar la operación de logaritmo en una determinada base se escribe laabreviatura log y como subíndice la base y después el número resultante del quedeseamos hallar el logaritmo. Por ejemplo, 35=243 luego log3243=5. Cuando sesobreentiende la base, se puede omitir.Los logaritmos fueron introducidos por John Napier a principios del siglo XVII como unmedio de simplificación de los cálculos. Estos fueron rápidamente adoptados porcientíficos, ingenieros, y otros para realizar operaciones más fácilmente, usando reglasde cálculo y tablas de logaritmos. Estos dispositivos se basan en el hecho másimportante — por derecho propio — que el logaritmo de un producto es la suma de loslogaritmos de los factores:La noción actual de los logaritmos viene de Leonhard Euler, quien conectó estos conla función exponencial en el siglo XVIII.¿QUÉ SON ANTILOGARITMOS? A cada número p o s i t i vo le corresponde un logaritmo, p o s i t i vo o n e g at i vo . A t o d o n ú m er o po s i t i vo o n e g a t i vo l e c o r r e s p o n d e el l o g a r i t m o d e ot r o n úm e r o , q u e s e l l a m a s u a n t i l og a r i t m o . E l a n t i l o g a r i t m o d e u n n ú m e r o, e n u n a b a s e d a d a c o n s i s t e e n e l e va r l a b a s e a l n ú m er o r e s u l t a d o . S i t e n e m o s u n l og ar i t m o d ec i m a l p o d e m o s u t i l i za r l a c a l c u l a d o r a p a r a h al l a r s u a n t i l o g ar i t m o , p a r a e l l o t e n em o s q ue p u l s a r l a t e c l a 1 0 x . G e n e r a lm e n t e es t a t e c l a s u e l e ve n i r c o m o s e g u n d a f u nc i ó n d e l a t e c l a " l o g " . log x = 2.4572 x = 1 0 2 . 4 5 7 2 = 2 8 6 . 55Cologaritmo
  3. 3. E l c o l o g a r i t m o d e un n ú m e r o e s e l l o g ar i t m o d e s u i n ve r s o , p o r t a n t o e l c o l o g a r i t m o d e u n n ú m er o e s e l o p u e s t o d e s u logaritmo. c o l o g 2 0 0 = - l og 2 00 = - 2. 3 0 1 0Ejercicios C a l c u l a m e d i a n t e l og ar i t m o s e l va l o r d e x. 1 2 3¿QUÉ SON VARIABLES ALEATORIAS?En probabilidad y estadística, una variable aleatoria o variable estocástica es unavariable estadística cuyos valores se obtienen de mediciones en algún tipo deexperimento aleatorio. Formalmente, una variable aleatoria es una función, que asignaeventos (p.e., los posibles resultados de tirar un dado dos veces: (1, 1), (1, 2), etc.) anúmeros reales (p.e., su suma).Los valores posibles de una variable aleatoria pueden representar los posiblesresultados de un experimento aún no realizado, o los posibles valores de una cantidadcuyo valor actualmente existente es incierto (p.e., como resultado de mediciónincompleta o imprecisa). Intuitivamente, una variable aleatoria puede tomarse comouna cantidad cuyo valor no es fijo pero puede tomar diferentes valores; unadistribución de probabilidad se usa para describir la probabilidad de que se den losdiferentes valores.
  4. 4. Las variables aleatorias suelen tomar valores reales, pero se pueden considerarvalores aleatorios como valores lógicos, funciones... El término elemento aleatorio seutiliza para englobar todo ese tipo de conceptos relacionados. Un conceptorelacionado es el de proceso estocástico, un conjunto de variables aleatoriasordenadas (habitualmente por orden o tiempo).¿TABLAS ESTADÍSTICAS? Tablas estadísticas Dentro del estudio de la Estadística, una parte importante son las funciones estadística, tanto continuas Distribuciones continuas como discretas, que nos permiten determinar las Distribución normal probabilidades de un suceso, Tabla para imprimir: Distribución normal partiendo del modelo estadístico al que ese suceso se ajusta. Tabla para imprimir: Distribución normal inversa En la práctica, cuando queremos saber el valor Distribución t de Student numérico de esa probabilidad, no solamente la expresión que Tabla para imprimir: Distribución t de Student la determina, necesitamos cuantificar la distribución de Tabla para imprimir: Distribución t de Student probabilidad, que no suelen inversa ser expresiones sencillas, en los últimos tiempos el desarrollo de Distribución chi-cuadrado la informática, facilita grandemente estos cálculos, Distribución exponencial pero la utilización de tablas estadísticas es lo más corriente. Distribución gamma Veamos algunas de estas tablas Distribuciones discretas y su modo de empleo. Distribución binomial Distribución de Poisson Distribución geométrica Distribución hipergeométrica
  5. 5. ¿ORGANIZACIÓN Y DESCRIPCIÓN DE DATOS?Organización y descripción grafica de un conjunto de datos.Una forma de presentación para organizar los datos es la tabla de frecuencias,conocida también por el nombre de distribución de frecuencias. En este tipo de tablasse divide la amplitud de los valores numéricos de los datos en un cierto número deintervalos o clases, denominado frecuencia.Primeramente, se deciden cuántas clases deberán establecerse y si éstas tendrán ono la misma anchura. Es común utilizar entre 5 y 20 clases, lo cual resulta convenienteconstruirlas de modo que todas las clases tengan la misma anchura, cual recibe elnombre de intervalo de clase.Ahora se determina el intervalo de clase, calculando la diferencia entre el mayor y elmenor valor numérico de los datos. Nótese que una vez escogidos los intervalos declase y el límite inferior de la primera clase, los límites de las clases restantes quedanperfectamente definidos. Los puntos que limitan a una de las clases reciben el nombrede límites de clase.Para prevenir ambigüedades en cuanto a la clase a la que pertenece cierto número,diremos que un dato pertenece a una determinada clase si su valor numérico esestrictamente mayor que el límite inferior y menor o igual que el límite superior.Es conveniente elegir un número que represente a cada una de las clases. Se elige elpunto central, que se denomina Valor Medio de Clase, el cual se obtiene dividiendo lasuma de los límites de clase entre dos.El siguiente paso para la construcción de la tabla es llevar a cabo del conteo delnúmero de observaciones que pertenecen a cada clase. Este número es llamadofrecuencia absoluta de clase (fi). Es conveniente calcular las frecuencias relativas declase (pi), las cuales indican qué proporción del total de las observaciones pertenece acada clase; dividiendo la frecuencia absoluta entre el total de observaciones (total defrecuencias absolutas).¿REGLAS PARA LA REPRESENTACIÓN GRAFICA?¿TIPOS DE GRÁFICOS? Tabla de entrada de datos: Es una tabla en la cual solo aparecen los datos que se obtuvieron de la investigación científica o del experimento. Es la tabla más sencilla y se utiliza cuando no se necesita mayor información acerca de los datos, estas tablas se construyen por medio de la tabulación de los datos, este
  6. 6. procedimiento es relativamente sencillo, para realizarlo nos ocupamos de un conjunto de datos estadísticos obtenidos al registrar los resultados de una serie de n repeticiones de algún experimento u observación aleatoria, suponiendo que las repeticiones son mutuamente independientes y se realizan en condiciones uniformes, es importante decir que el resultado de cada observación puede expresarse de forma numérica, para este tipo de tablas de entrada de datos se puede trabajar con una ó más variables, de manera que nuestro material estadístico consiste en n valores observados de la variable Xj.Los valores observados se suelen registrar, en primer lugar en una lista, si él numerode observaciones no excede de 20 ó 30, estos datos se registran en orden crecientede magnitud.Con los datos de esta tabla pueden hacerse diversas representaciones gráficas ycalcularse determinadas características numéricas como la media, la mediana, etc.EJ: Agrupar en una tabla de datos10, 1, 6, 9, 2, 5, 7, 4, 3, 8X 1 2 3 4 5 6 7 8 9 10 Tablas de frecuencias: Una tabla de frecuencia está formada por las categorías o valores de una variable y sus frecuencias correspondientes. Esta tabla es lo mismo que una distribución de frecuencias. Esta tabla se crea por medio de la tabulación y agrupación, la cual es un método sencillo como lo habíamos empezado a ver en la tabla de datos, Se realiza el mismo procedimiento de tabulación anteriormente descrito si el numero de valores observados para la variable, se trabaja con una sola variable, descontando los repetidos son pequeños, si existen repetidos la frecuencia f es el número de repeticiones de un valor de X dado, Sin embargo, cuando el conjunto de datos es mayor, resulta laborioso trabajar directamente con los valores individuales observados y entonces se lleva a cabo, por lo general, algún tipo de agrupación como paso preliminar, antes de iniciar cualquier otro tratamiento de los datos. Las reglas para proceder a la agrupación son diferentes según sea la variable, discreta o continua, para una variable discreta suele resultar conveniente hacer una tabla en cuya primera columna figuren todos los valores de la variable X representados en el material, y en la segunda, la frecuencia f con que ha aparecido cada valor de X en las observaciones.Para una variable continua, el procedimiento de agrupación es algo más complicado.Se toma un intervalo adecuado sobre el eje de la variable que contenga los n valoresobservados, y divídase el intervalo en cierto número de intervalos de clase. Todas lasobservaciones que pertenecen al mismo intervalo de clase se agrupan y cuentan, y élnumero que resulte representa la frecuencia de clase correspondiente a dichointervalo, luego se forma una tabla, en cuya primera columna figuran los limites decada intervalo de clase, y en la segunda aparecen las correspondientes frecuencias.Estas clases de tablas son las más usadas y brindan mayor información de los datosque las tablas de entradas de datos, efectivamente, una tabla de este tipo dará enforma abreviada, una información completa acerca de la distribución de los valoresobservados. Con estas se pueden utilizar más a fondo los métodos gráficos al igualque los métodos aritméticos.Ej: Agrupar en una tabla 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 5X F1 22 43 34 1
  7. 7. 5 1 S 11Agrupar en una tabla las siguientes estaturas: 160, 168, 175, 183, 170, 164, 170, 184,171, 168, 187, 161, 183, 175, 185, 186, 187, 164, 165, 175, 162, 188, 169, 163, 166,172, 173, 167, 174, 176, 178, 179, 177X F160-165 6265-270 6170-175 6175-180 7180-185 3185-190 5 S 33 Tablas de doble entrada: También llamadas tablas de contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categorías o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o numero de elementos que reúnen a la vez las dos categorías o valores de las dos variables que se cruzan en cada casilla. Para la tabulación de un material agrupado de observaciones simultáneas de dos variables aleatorias necesitaremos una tabla descrita como anteriormente lo describimos, las reglas para agrupar son las mismas que en el caso de una sola variable.Este tipo de tablas brindan información estadística de dos eventos relacionados entresí, es útil en casos en los cuales los experimentos son dependientes de otroexperimento, mas adelante aparecen mas aplicaciones del análisis estadísticobivariable.Ej:T1/T2 SÍ NOSÍ 12 2NO 10 4 1. Métodos gráficos:Primero definiré lo que es un gráfico o diagrama en estadísticaUn diagrama es una especie de esquemático, formado por líneas, figuras, mapas,utilizado para representar, bien datos estadísticos a escala o según una ciertaproporción, o bien los elementos de un sistema, las etapas de un proceso y lasdivisiones o subdivisiones de una clasificación. Entre las funciones que cumplen losdiagramas se pueden señalar las siguientes: Hacen más visibles los datos, sistemas y procesos Ponen de manifiesto sus variaciones y su evolución histórica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la correlación entre dos o más variables. Sistematizan y sintetizan los datos, sistemas y procesos. Aclaran y complementan las tablas y las exposiciones teóricas o cuantitativas. El estudio de su disposición y de las relaciones que muestran pueden sugerir hipótesis nuevas.
  8. 8. Algunos de los diagramas más importantes son el diagrama en árbol, diagrama deáreas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques,diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo yhoja diagrama, histogramas y gráficos de caja y bigote o boxplots.2.1 Gráficos univariados: Para trabajar los gráficos univariables debemos primerosaber lo que es el análisis estadístico invariable y después de esto trabajaremos losmétodos pedidosEl análisis estadístico que opera con datos referentes a una sola variable o distribuciónde frecuencias y pretende determinar sus propiedades estadísticas. El a.e.u.proporciona al analista medidas representativas de la distribución o promedios, índicesde dispersión de los datos de la distribución, procedimientos para normalizar los datos,medidas de desigualdad de unos datos en relación con otros y por ultimo medidas dela asimetría de la distribución. Gráficos de puntos: Es una variación del diagrama lineal simple el cual esta formado por líneas rectas o curvas, que resultan de la representación, en un eje de coordenadas, de distribuciones de frecuencias, este construye colocando en el eje x los valores correspondientes a la variable y en el eje de las ordenadas el valor correspondiente a la frecuencia para este valor. Proporciona principalmente información con respecto a las frecuencias. Este se usa cuando solo se necesita información sobre la frecuencia.Cuando la muestra se agrupa por intervalos se trabaja con la marca de clase delintervalo de clase, la marca de clase es el punto medio del intervaloEJ: Duración de tubos de neónX(horas) Xm F300-400 350 2400-500 450 6500-600 550 10600-700 650 8700-800 750 4 S 30 Gráficos de tallo y hoja: es una forma rápida de obtener una representación visual ilustrativa del conjunto de datos, para construir un diagrama de tallo y hoja primero se debe seleccionar uno ó más dígitos iniciales para los valores de tallo, el dígito o dígitos finales se convierten en hojas, luego se hace una lista de valores de tallo en una columna vertical. Prosiguiendo a registrar la hoja por cada observación junto al valor correspondiente de tallo, finalmente se indica las unidades de tallos y
  9. 9. hojas en algún lugar del diagrama, este se usa para listas grandes y es un método resumido de mostrar los datos, posee la desventaja que no proporciona sino los datos, y no aparece por ningún lado información sobre frecuencias y demás datos importantes.Ej: realice un diagrama de tallo y hoja para los siguientes datos de distancias enyardas de una cancha de golf6435 6464 6433 6470 6526 6527 6506 6583 6605 6694 6614 6790 6770 6700 67986770 6745 6713 6890 6870 6873 6850 6900 6927 6936 6904 7051 7005 7011 70407050 7022 7131 7169 7168 7105 7113 7165 7280 7209 Diagramas de barras: nombre que recibe el diagrama utilizado para representar gráficamente distribuciones discretas de frecuencias no agrupadas. Se llama así porque las frecuencias de cada categoría de la distribución se hacen figurar por trazos o columnas de longitud proporcional, separados unos de otros. Existen tres principales clases de gráficos de barras: Barra simple: se emplean para graficar hechos únicos Barras múltiples: es muy recomendable para comprar una serie estadística con otra, para ello emplea barras simples se distinto color o tramado en un mismo plano cartesiano, una al lado de la otra Barras compuestas: en este método de graficacion las barras de la segunda serie se colocan encima de las barras de la primera serie en forma respectiva.El diagrama de barras proporciona información comparativa principalmente y este essu uso principal, este diagrama también muestra la información referente a lasfrecuenciasEj:CIUDAD TEMPERATURAA 12B 18C 24TIENDA Enero Febrero Marzo abril mayo JunioA 800 600 700 900 1100 1000B 700 500 600 1000 900 1200
  10. 10. Histogramas: Se emplea para ilustrar muestras agrupadas en intervalos. Estáformado por rectángulos unidos a otros, cuyos vértices de la base coinciden con loslímites de los intervalos y el centro de cada intervalo es la marca de clase, querepresentamos en el eje de las abscisas. La altura de cada rectángulo es proporcionala la frecuencia del intervalo respectivo. Esta proporcionalidad se aplica por medio de lasiguiente formulaAltura del rectángulo = frecuencia relativa/longitud de baseEl histograma se usa para representar variables cuantitativas continuas que han sidoagrupadas en intervalos de clase, la desventaja que presenta que no funcionaPara variables discretas, de lo contrario es una forma útil y practica de mostrar losdatos estadísticos.EJ:X Xm F118-126 122 2126-134 130 3134-142 138 8142-150 146 12150-158 154 7158-166 162 5166-174 170 2174-182 178 1 S 40 Diagramas de caja o boxplots: los pasos para construirlo son los siguientes: dibujar y marcar un eje de medida horizontal
  11. 11. construir un rectángulo cuyo borde izquierdo está arriba del cuarto inferior y cuyo borde derecho está arriba del cuarto superior dibujar un segmento de recta vertical dentro de la caja arriba de la mediana prolongar rectas desde cada extremo de la caja hasta las observaciones más lejanas que estén todavía a menos de 1.5fs de los bordes correspondientes dibujar un circulo abierto para identificar cada observación que caiga entre 1.5fs y 3fs del borde al cual está más cercano estas se llaman puntos inusuales suaves dibujar un circulo de línea llena para identificar cada observación que caiga a mas de 3fs del borde más cercano, estas se llaman puntos inusuales extremosDonde fs= cuarto superior – cuarto inferiorEste diagrama se usa cuando se necesita la mayor información acerca de ladistribución de los datos, la ventaja que posee con respecto a los demás diagramas esque este gráfico posee características como centro y dispersión de los datos, y laprincipal desventaja que posee es que no presenta ninguna información acerca de lasfrecuencias que presentan los datosEJ: Para los siguientes datos realice un diagrama de caja: 2.68 3.06 4.31 4.71 5.715.99 6.06 7.04 7.17 7.46 7.50 8.27 8.42 8.73 8.84 9.14 9.19 9.21 9.39 11.28 15.1921.06 Gráficos de sectores: es un gráfico que se basa en una proporcionalidad entre la frecuencia y el ángulo central de una circunferencia, de tal manera que a la frecuencia total le corresponde el ángulo central de 360°. Para construir se aplica la siguiente fórmula:X = frecuencia relativa * 360°/S frecuencia relativaEste se usa cuando se trabaja con datos que tienen grandes frecuencias, y los valoresde la variable son pocos, la ventaja que tiene este diagrama es que es fácil de hacer yes entendible fácilmente, la desventaja que posee es que cuando los valores de lavariable son muchos es casi imposible o mejor dicho no informa mucho este diagramay no es productivo, proporciona principalmente información acerca de las frecuenciasde los datos de una manera entendible y sencilla.EJ: Representar mediante un gráfico de sectores la frecuencia con que aparece cadauna de las cinco vocales en el presente párrafo:Vocal a e i o uFrecuencia 13 20 4 6 3 S 462.2 gráficos bivariados: Para trabajar los diagramas de dispersión, primero debemossaber que es el análisis estadístico bivariable y las ventajas que este tieneEl análisis estadístico bivariable es aquel análisis que opera con datos referentes ados variables y pretende descubrir y estudiar sus propiedades estadísticas. El análisisestadístico bivariable se orienta fundamentalmente a la normalización de los valores o
  12. 12. frecuencias ce los datos brutos, determina la existencia, dirección y grado de lavariación conjunta entre las dos variables, lo que se realiza mediante él calculo de loscoeficientes de correlación pertinentes, calcula la covarianza o producto de lasdesviaciones de las dos variables en relación a sus medias respectivas y por ultimoestablece la naturaleza y forma de la asociación entre las dos variables en el caso delas variables de intervalo. Diagrama de dispersión: es un diagrama que representa gráficamente, en un espacio de ordenadas, los puntos de dicho espacio que corresponden a los valores correlativos de una distribución bivariante conjunta, estos diagramas deben usarse cuando tenemos un análisis estadístico bivariable, ósea una tabla de datos de doble entrada, la ventaja que tienen es que se puede graficar de una forma sencilla una distribución bivariante conjunta y la desventaja principal es que no funciona si sucede que una dupla se repitaEJ: X YA 2 3B 4 1C 5 4D 3 6E 2 8
  13. 13. ÍndiceRealice la investigación en la Web

×