• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Psicometría
 

Psicometría

on

  • 45,854 views

 

Statistics

Views

Total Views
45,854
Views on SlideShare
45,601
Embed Views
253

Actions

Likes
12
Downloads
914
Comments
7

11 Embeds 253

http://psicometria.alianzasuperior.com 85
http://posgradovirtual.upeu.edu.pe 52
http://pedagogayvirtualidadpsicometra.blogspot.mx 44
http://www.slideshare.net 32
http://pedagogayvirtualidadpsicometra.blogspot.com 22
http://www.scoop.it 9
https://www.facebook.com 4
http://pedagogayvirtualidadpsicometra.blogspot.com.br 2
http://webcache.googleusercontent.com 1
https://twitter.com 1
http://psicometria.aula.la 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

17 of 7 previous next Post a comment

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Psicometría Psicometría Presentation Transcript

    • PSICOMETRÍA Diseñado por: Germán Andrés Torres Escobar
    • Hitos en la historia de la psicometría AÑO HITO O ACONTECIMIENTO 1115 a.C. En China se utilizan tests para acceder a puestos en el gobierno. 1869 d C. Francis Galton publica el libro Genio Hereditario (1869) donde plantea a través de estudios estadísticos que la inteligencia se hereda. 1904 – 1910 d. C. Charles Spearman funda la Teoría Clásica de los tests o del modelo lineal y publica su teoría de los factores de la inteligencia y las formulas de atenuación. 1905 d.C. Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para niños, con el fin de establecer su edad mental y predecir su rendimiento académico. 1918 d.C. Se crean los tests de inteligencia Army Alpha y Beta para clasificar a los soldados durante la Primera Guerra Mundial y Robert Woodworth elaboró el primer Personal Data Sheet para detectar los soldados que pudieran tener crisis nerviosas. 1931 d.C. Thurstone publica su libro The reliability and validity of tests . 1939 d.C. Wechsler propone su escala de medida para la inteligencia. 1940 d.C. Aparece el cuestionario de personalidad de Minnesota Multiphasic Personality Inventory (MMPI). 1960 d.C. Cronbach propone su Teoría de la Generalización en la cual utiliza el análisis de varianza para interpretar las fuentes de error en los puntajes. 1980 d.C. Rasch plantea la Teoría de la Respuesta al Ítem o del rasgo latente que permite conocer la información de cada ítem para diseñar pruebas individualizadas.
    • La psicometría
      • Es la rama de la psicología que desarrolla y estudia las propiedades de las pruebas psicológicas o tests para medir las variables psicológicas con la mayor precisión posible.
    • Diferencia entre psicometría y evaluación psicológica Psicometría Evaluación psicológica Énfasis en la medición Énfasis en el diagnóstico Instrumentos y tests La persona
    • Historia de la psicometría
      • Antecedentes históricos.
      • Modelos de medición.
    • Antecedentes históricos
      • Hacia el a ñ o 1115 a.C. se utilizan comienzan a utilizar en China los primeros tests que buscan medir las capacidades de aspirantes para acceder a puestos del gobierno ( primera medición de capacidades ).
      • En 1869 Francis Galton publica el libro Genio Hereditario donde plantea a través de estudios estadísticos que la inteligencia se hereda y que es posible medirla ( estudios estadísticos en psicología ).
      • Entre 1904 y 1910 Charles Spearman funda la Teor í a Clásica de los tests o del modelo lineal y publica su teoría de los factores de la inteligencia y las formulas de atenuaci ó n ( Estrategias de medición y TCT ).
      • En 1905 Alfredo Binet y Theodore Simon publican la primera escala de inteligencia para ni ñ os, con el fin de establecer su edad mental y predecir su rendimiento académico ( uno de los primeros tests psicológicos ).
      • En 1960 Lee Cronbach propone su Teoría de la Generalización en la cual utiliza el análisis de varianza para interpretar las fuentes de error en los puntajes. Igualmente él desarrolló estrategias para la medición de la confiabilidad de un test.
      • En 1980 Rasch plantea la Teoría de la Respuesta al Ítem o del rasgo latente que permite conocer la información de cada ítem para diseñar pruebas individualizadas.
    • Modelos de medición Teoría Clásica de los Tests (TCT) Teoría de la Respuesta al Ítem (TRI) Análisis de la prueba completa Análisis de ítems individuales En una muestra pequeña de sujetos (N < 500) En grandes muestras de sujetos (N ≥ 500)
    • Teoría clásica de los Tests
      • El modelo de puntuación verdadera se concreta en un primer supuesto:
      • X = V + E
      • que indica que la puntuación empírica directa de una persona en un test (X) está compuesta por la puntuación verdadera de la persona (V) y un error de medida (E) que se comete al medir el rasgo con el test.
      • El error de medida se establece como la diferencia entre la puntuación empírica y la verdadera:
      • E = X - V
      • La puntuación verdadera se obtiene con el promedio de las puntuaciones empíricas que obtiene la persona en un número elevado de aplicaciones del test:
      • V = E[X]
      • Si en una población se conocen las puntuaciones V y E de los individuos, la correlación entre ambas variables sería nula, porque se asume que puntuaciones verdaderas elevadas no tienen porqué tener asociados errores elevados:
      • r VE = 0
      • Si en una población conociéramos los errores de medida de cada individuo quien ha realizado dos tests diferentes (j y k), la correlación entre ambas variables también sería nula:
      • ρ E jEk = 0
      • Si en una población conociéramos las puntuaciones E en un test j y las puntuaciones V en un test k, ambas variables correlacionarían cero :
      • ρ E jVk = 0
    • Limitaciones de la Teoría Clásica
      • Las características de los ítems (dificultad y discriminación) dependen del grupo de personas en el que se han aplicado.
      • La puntuación que una persona obtenga será diferente si se le aplican dos tests que midan la misma característica pero cuyo nivel de dificultad sea diferente.
      • La TCT supone que el error de medida es una propiedad del test y, por lo tanto, igual para todos los sujetos, independientemente de cual sea su puntuación.
    • Teoría de la Respuesta al Ítem
      • Unidimensionalidad : todos los ítems que forman el test han de medir un mismo y único rasgo . El supuesto de unidimensionalidad exige que todos y cada uno de los ítems del test midan una única dimensión.
      • No hay como tal puntuaciones verdaderas sino una probabilidad de acierto determinada por unos parámetros.
      • Independencia local : entre los ítems de un test si la respuesta que una persona da a uno de ellos no depende de las respuestas que da a los otros, ni por el orden de presentación de los ítems, las respuestas que ya se hayan dado, etc.
    • Un prueba psicológica o test
      • Es un instrumento en formato impreso o digital que consta de una serie de preguntas o reactivos que miden unas variables psicológicas especificas a través de un sistema de puntuación .
      • Puede aplicarse en diferentes campos de la psicología, para fines diversos como diagnóstico clínico (psicología clínica) , selección de personal (psicología organizacional) o análisis de aptitudes vocacionales (psicología educativa).
    • Estructura general de un test impreso
      • Cuadernillo de instrucciones.
      • Cuadernillo de preguntas.
      • Hoja(s) de respuestas.
      • Plantilla de corrección.
      • Tabla de puntuaciones y baremos.
    • El cuadernillo de instrucciones
      • Es un documento donde se menciona:
      • El nombre de la prueba, sus autores y el año de publicación.
      • La(s) variable(s) que mide y sus objetivos.
      • Los antecedentes (marco conceptual y teórico) de la prueba.
      • Las instrucciones generales de aplicación (para los psicólogos).
    • El cuadernillo de preguntas
      • Es un documento que consta de:
      • Las instrucciones de respuesta (para quien la va a responder).
      • Los ítems o preguntas.
      • No puede rayarse ni se puede escribir sobre este ya que se usa en diferentes aplicaciones.
    • La hoja de respuestas y plantilla de corrección
      • Es la hoja donde la persona anota las respuestas a de los ítems planteados en el cuadernillo de preguntas.
      • Una vez que la persona entrega la hoja de respuestas al psicólogo, él o ella la califican poniendo encima de la hoja de respuestas, la plantilla de corrección para ver en cuales acertó el sujeto y en cuales no.
    • El sistema de puntuación Puntuación cruda o bruta ∑ Puntuación de los ítems – Errores Puntuación estándar o típica Centiles Puntuaciones T, S o Z Perfil del sujeto
    • La tabla de puntuaciones y baremos
      • Una vez que se han obtenido los aciertos y errores de la persona con ayuda de la plantilla, se obtiene una puntuación cruda o bruta , que es especifica para ese sujeto.
      • Esa puntuación bruta se analiza en la tabla de puntuaciones estándar, para obtener una puntuación estándar o típica del sujeto dentro de la población o muestra de sujetos que presentó la prueba (baremo).
    • Los baremos
      • Son tablas de puntuaciones estándar que se clasifican por grupos poblacionales o muestrales según la edad, profesión o género.
      • Por ejemplo, para una misma prueba existen baremos para hombres, mujeres, hombres profesionales, mujeres profesionales, estudiantes de secundaria, etc.
    • Tipos de pruebas o tests Clasificación de las pruebas Según la aplicación Según la forma de medir la(s) variable(s) Según la(s) variable(s) que miden
      • Autoaplicación
      • Individual
      • Grupal
      • De desempeño
      • De poder
      • De velocidad
      • De capacidad mental
      • De conocimientos
      • De personalidad
    • Clasificación de las pruebas por aplicación
      • Pruebas de autoaplicación : son tests que no requieren la aplicación por parte de un psicólogo sino que puede hacerlas la persona con ayuda de un computador.
      • Pruebas de aplicación individual : son aquellas que el psicólogo administra a una sola persona. Por ejemplo, en un caso clínico.
      • Pruebas de aplicación grupal : son aquellas que el psicólogo pueden aplicar a varias personas al mismo tiempo, pero controlando que no conversen entre ellas. Por ejemplo, una prueba de aptitudes e intereses vocacionales.
    • Clasificación de las pruebas según la forma de medir la(s) variable(s)
      • Pruebas de desempeño : miden el rendimiento máximo (individual) o el rendimiento normal o típico (de un grupo).
      • Pruebas de poder : miden el nivel de destreza mental de un sujeto o su nivel de conocimiento.
      • Pruebas de velocidad : miden cuantos ítems responde el sujeto en un tiempo especifico.
      • Pruebas con referencia a la norma o al criterio : mide la variables psicológica según objetivos específicos.
    • Clasificación de las pruebas según las variables que miden
      • Pruebas de capacidad mental (inteligencia).
      • Pruebas de aprovechamiento o conocimiento.
      • Pruebas de personalidad.
      • Pruebas de actitudes, aptitudes, intereses, motivación, opinión y valores.
      • Pruebas neuropsicológicas.
    • Estructura general de un ítem
      • Enunciado : menciona las instrucciones para contestar el ítem y plantea un contexto o situación a partir del cual se hace la pregunta.
      • Pregunta(s): son cuestionamientos que evalúan directamente la variable psicológica de forma implícita. Pueden ser abiertas (libre respuesta) o cerradas (opciones especificas).
      • Opciones de respuesta : incluyen una(s) respuestas(s) correcta(s) y un(os) distractor(es) o respuesta(s) falsa(s).
    • Clasificación del formato de respuestas Clasificación de los ítems En tests de rendimiento óptimo En tests de rendimiento típico
      • De elección
      • De emparejamiento
      • De opción binaria
      • De categorías ordenadas
      - De adjetivos
    • Clasificación de las respuestas en tests de rendimiento óptimo
      • Elección binaria : de dos alternativas, se elige la que se considera correcta (Sí o No) o (verdadero-falso).
      • Elección múltiple : entre más de dos alternativas se elige la que se considera correcta.
      • Emparejamiento : c onsiste en encontrar las parejas entre dos conjuntos de conceptos.
    • Clasificación de las respuestas en tests de rendimiento típico
      • Opción binaria : la persona debe manifestar si está de acuerdo o en desacuerdo con una afirmación.
      • Categorías ordenadas : el formato establece un continuo ordinal de más de dos categorías, que permite a la persona matizar mejor su respuesta.
      • Adjetivos bipolares : este formato es típico de lo que se denomina &quot;diferencial semántico&quot;.
    • Confiabilidad
      • Es el grado en el cual las mediciones repetidas de un fenómeno relativamente estable son aproximadas entre sí o consistentes.
      • Permite predecir el desempeño de un grupo o de un sujeto e igualmente sirve para describirlo en ambos casos.
    • Formas de medir la confiabilidad
      • Test-retest: consiste en aplicar un test dos veces a un mismo grupo en un intervalo de días o meses (no superior).
      • Formas paralelas: consiste en aplicar un test homologo o equivalente a un mismo grupo pero en tiempos diferentes.
      • División por mitades: consiste en comparar los resultados de los ítems pares e impares en la aplicación grupal de un test.
    • Coeficientes de confiabilidad
      • Test-retest: coeficiente de estabilidad (r).
      • Formas paralelas: coeficiente de equivalencia (r).
      • División por mitades: coeficiente de consistencia interna (r).
    • Coeficientes más usados en división por mitades
    • Formas de mejorar la confiabilidad de un test
      • Para calcular el número de ítems K para lograr una confiabilidad RXY deseada (superior a 0.7) se usa la formula:
      • K = RXY * (1 – rXY) / rXY) * (1 – RXY)
      • donde rX es la confiabilidad inicial.
      • Una vez obtenido el número K se multiplica por el número de items inicial y luego se le resta a ese resultado el número de ítems inicial.
      • Para calcular la confiabilidad al quitar un número de ítems X con un total de ítems Y y con una confiabilidad conocida C se usa la siguiente formula:
      • Y – X / Y
      • El resultado obtenido con esta formula debe operarse con la formula 2:
      • [resultado 1 * C]
      • [1 + (resultado 1 – 1) * C]
    • VALIDEZ
      • Es el grado en el cual una prueba mide lo que pretende medir.
      • Conjunto de pruebas y datos que han de recogerse para garantizar la pertinencia predictiva de las inferencias que hacen a partir de un test.
    • Tipos de validez
      • Validez del contenido.
      • Validez con relación a criterio.
      • Validez del constructo.
    • VALIDEZ DEL CONTENIDO
      • Es la muestra adecuada y representativa de los contenidos que se pretende evaluar con un test.
      • Los ítems o preguntas se seleccionan según su:
      • Coherencia: con las características y variables.
      • Relevancia: de acuerdo con el indicador.
      • Buena redacción: la gramática del ítem.
      • Validez aparente: para el evaluado.
    • VALIDEZ CON RELACIÓN AL CRITERIO
      • Es la comparación del desempeño de un grupo de sujetos en un test respecto patrones de medida ya establecidos.
      • Se clasifica en:
      • Validez concurrente.
      • Validez predictiva.
    • Validez concurrente
      • Es el análisis de variabilidad que efectúa al comparar el desempeño de dos grupos de distintos de sujetos en un mismo test.
      • También se le denomina validez cruzada o entre distintas muestras.
    • Validez predictiva
      • Es el grado de precisión con que las calificaciones de la prueba predicen las calificaciones del criterio.
      • Se obtiene mediante la correlación entre una variable de indicador y una variable criterio a partir de r (Pearson), cuyo valor es igual o menor a 0,60.
    • Factores que afectan la validez con relación a los criterios
      • Las diferencias de grupo :
      • sexo, edad y rasgos de personalidad.
      • La contaminación de los criterios :
      • evidencias falsas que les restan validez.
      • El índice de base (debe ser mayor de 50) :
      • número de personas que poseen la variable medida.
      • El incremento de la validez:
      • costo razonable del instrumento.
    • VALIDEZ DEL CONSTRUCTO
      • Es el grado de exactitud con el que se mide un constructo o concepto psicológico particular.
      • Depende de unas condiciones que son externas al evaluador y la persona que diseña la prueba.
    • Condiciones de la validez del constructo
      • Valoración por parte de jueces expertos de la correspondencia contenido-concepto.
      • Análisis de la consistencia interna de la prueba.
      • Estudio de las variables intervinientes en la calificación.
      • Análisis factorial y correlación con otras pruebas.
      • Análisis de las respuestas.
      • Correlaciones altas con otras medidas o métodos para medir el mismo constructo ( Validez convergente ).
      • Correlaciones bajas con las medidas de constructos diferentes ( Validez discriminante ).
    • CONSTRUCCIÓN DE LOS ÍTEMS
    • La Taxonomía de Bloom
      • El dominio cognoscitivo comprende 6 categorías:
      • Recuerdo
      • Comprensión
      • Aplicación
      • Análisis
      • Síntesis
      • Evaluación
    • La Taxonomía de Bloom
      • Recuerdo:
      • Incluye situaciones de examen que acentúan la importancia del recuerdo de datos, ideas, materiales o fenómenos, ya sea como reconocimiento o evocación. Supone, el recuerdo o reconocimiento de: Datos específicos como terminologías o hechos; modos y medios para el tratamiento de datos específicos como convenciones, clasificaciones, metodologías, técnicas o procedimientos y, universales y abstracciones en un campo determinado como principios, generalizaciones, teorías y estructuras (Herrera, 2003).
    • La Taxonomía de Bloom
      • Ejemplo 1: Pregunta que evalúa Recuerdo
      • A continuación encontrará preguntas que constan de un enun­ciado y cuatro (4) o cinco (5) opciones de respuesta. Usted debe marcar en su hoja de respuesta, aquella opción que considere correc­ta.
      • El modelo de control social propuesto por Max Weber para las organizaciones, se denomina modelo:
      • A.- de los sistemas
      • B.- burocrático
      • C.- estructuralista
      • D.- de las organizaciones
    • La Taxonomía de Bloom
      • Comprensión:
      • Implica la intelección y fraccionamiento de un mensaje. Operacionalmente se define como cualquier conducta que vaya desde la presentación de una proposición con palabras distintas de las del enunciado original, hasta la aplicación de un principio en una situación nueva para el examinado, pasando por la ejemplificación. Se define en términos de tres operaciones: a) Traducción o capacidad para expresar un concepto o mensaje conocido en palabras diferentes o pasarlo de un sistema simbólico a otro , b) Interpretación o reordenamiento de ideas de una comunicación en una nueva configuración. Incluye la habilidad para captar el contenido de una comunicación como un todo y distinguir entre conclusiones legítimas y contradictorias y c) Extrapolación o hacer explícitas algunas conclusiones, colorarios, consecuencias o efectos de una comunicación dada (Herrera, 2003) .
    • La Taxonomía de Bloom
      • Ejemplo 2: Pregunta que evalúa Comprensión
      • Si un psicólogo afirma que una prueba que ha preparado para selección de personal tiene un coeficiente de validez predictiva mas alto que el de fiabilidad, concluiría que
      • A. está bien, por cuanto lo mas importante para la selección es la validez de predicción
      • B. debería tener mas alta fiabilidad que validez ya que lo principal es la confianza en el instrumento
      • C. debe tener un error ya que la validez predictiva NO puede ser mayor al coeficiente de fiabilidad
      • D. debe tener un error ya que los dos coeficientes, el de validez y el de fiabilidad deben tener igual valor
      • E. no debería utilizar la prueba ya que debe tener mas alta fiabilidad que validez para el objeto propuesto
    • La Taxonomía de Bloom
      • Aplicación:
      • Se refiere a la capacidad para aplicar teorías, principios, métodos o ideas en la solución de un problema práctico. Es la habilidad para aplicar principios y generalizaciones a nuevos problemas y situaciones. Comprende entonces tareas como a) identificar los principios o generalizaciones apropiados para resolver un problema o reformularlo para lograr tal identificación, b) especificar los límites dentro de los cuales un principio o generalización es verdadero o relevante y reconocer las excepciones a los mismos y las razones para ello, c) explicar nuevos fenómenos a partir de principios o genera­li­zaciones conocidas, predecir lo que sucederá en una situación nueva mediante el uso de principios y generalizaciones apropiadas, y d) determinar o justificar una decisión o acción en una situación usando principios o generalizaciones e indicar el razonamiento que apoya la utilización de los mismos ante un determinado problema (Herrera 2003).
    • La Taxonomía de Bloom
      • Ejemplo 3: Pregunta que evalúa Aplicación
      • Escoja la característica del pensamiento infantil que mejor se ajusta a la conducta descrita por Piaget:
      • - Cómo se hace para tener madera? Se cortan los troncos de los árboles. - Qué se hace para tener árboles? Se siembran los granos. - Y los granos? Se compran. - Dónde? En los almacenes. - Y el dueño del almacén? Piénsalo un poco. Los hace. - Con qué? Con otros granos. - Cuando vinieron los primeros hombres, había ya árboles? No. - Cómo han comenzado? Por los granos. - De dónde venían estos granos? Del almacén.
      • A. Realismo
      • B. Animismo
      • C. Artificialismo
      • D. Sincretismo
      • E. Funcionalismo
    • La Taxonomía de Bloom
      • Análisis:
      • Hace referencia a la habilidad para fraccionar una comunicación en sus elementos, de manera que aparezcan explícitas la jerarquía de las ideas y las relaciones existentes entre ellas. Esta es un proceso complejo que implica las tres categorías anteriores; recuerdo, com­prensión y aplicación, pero va mas allá de ellas. Aquí se incluyen tres subcategorías: a) análisis de elementos o habilidad para fraccionar una información en sus elementos, como supues­tos no explícitos, hechos e hipótesis; b) análisis de relaciones o identificar la relaciones que existen entre los elementos de una comunicación; inferir los criterios, relaciones, cualidades, suposiciones o condiciones implícitas en una comunicación; o bien, determinar las relaciones entre las hipóte­sis y las pruebas que la apoyan, entre las conclusiones y las hipótesis, o entre las conclusiones y las evidencias; y c) análisis de principios de organización que es la habilidad para explicitar los principios organizadores que ha seguido un autor, reducir su propósito, su punto de vista, su actitud o su interpretación (Herrera 2003).
    • La Taxonomía de Bloom
      • Ejemplo 4: Pregunta que evalúa Análisis
      • Considere los resultados del siguiente estudio:
      • En una investigación sobre heredabilidad de rasgos psicosociales, en este caso la criminalidad, se conformaron tres grupos de sujetos así: el grupo A por parejas de gemelos univitelinos, el grupo B por parejas de gemelos bivitelinos y el grupo C por parejas de hermanos naturales. En ningún caso los hermanos fueron separados. Una vez aplicados los instrumentos de medida (cuestionarios, encuestas, etc.,), se encontraron los siguientes porcentajes de acuerdo en relación con la presencia de conductas criminales:
      • GRUPOS A B C
      • % DE ACUERDO 77 35 8
      • Escoja la interpretación que mejor se ajuste a los datos de la investigación
      • A. A mayor concordancia genética corresponde un mayor porcentaje de acuerdo
      • B. La criminalidad depende del medio ambiente en un 23%.
      • C. El bajo porcentaje registrado por el grupo C se debe a que es el grupo con el menor nivel de homogeneidad genética
      • D. No se puede concluir en favor de la heredabilidad de las conductas criminales.
    • La Taxonomía de Bloom
      • Síntesis:
      • Es la capacidad para reunir diferentes elementos o partes para formar un todo. Esto es, la habilidad para combinar elementos con el fin de constituir una estructura o esquema que no estaba presente con claridad. La capacidad de síntesis incluye: a) producción de una comunicación única, b) producción de un plan o conjunto de operaciones con un fin determinado y c) derivación de un conjunto de relaciones abstractas, explicaciones o hipótesis para dar cuenta de un fenómeno dado. Es difícil construir preguntas estructuradas que evalúen esta categoría, son mucho más frecuentes las preguntas abiertas de tipo ensayo (Herrera 2003).
    • La Taxonomía de Bloom
      • Evaluación:
      • Es la capacidad para emitir juicios sobre ideas, obras, métodos, materiales o soluciones, con algún propósito determinado. Esta catego­ría incluye formulación de juicios: a) con base en pautas internas como exactitud, precisión y cuidado con que ha sido elabora­da una comunicación dada; consistencia de los razona­mientos, relaciones entre supues­tos, evidencias y conclusiones y reco­noci­miento de los valores y puntos de vista utiliza­dos en un juicio particular sobre una obra b) en términos de criterios externos como comparación de un trabajo u obra con otros, utilizando criterios o normas explícitas. Al igual que en la categoría anterior, es difícil construir preguntas estructuradas que evalúen esta categoría, son más apropiadas las preguntas abiertas de tipo ensayo (Herrera 2003).
    • Tipos de Preguntas NOMBRE ELEMENTOS CARACTERISTICAS Elección múltiple con única respuesta Un enunciado y cuatro o cinco opciones de respuesta Sólo una de las opciones completa correctamente el enunciado. Puede utilizarse para evaluar cualquier objetivo educativo especialmente recuerdo, comprensión y aplicación. Elección múltiple con múltiple respuesta Un enunciado y cuatro (4) opciones de respuesta Una, dos, tres o todas las opciones de respuesta pueden completar correctamente el enunciado, el examinado debe elegir una combinación de ellas. Adecuado para evaluar cualquier objetivo educativo. Información suficiente Un problema y dos informaciones relacionadas con el mismo Una o las dos informaciones pueden ser necesarias y suficientes para resolver el problema o pueden ser necesarias pero no suficientes. El evaluado no debe resolver el problema, sólo evaluar la información disponible. Excelente para evaluar aplicación. Análisis de postulados Una afirmación y dos postulados Tanto la afirmación como los postulados son VERDADEROS. El examinado evalúa la relación lógica entre ellos. Excelente para evaluar análisis. Análisis de relaciones Dos afirmaciones separadas por la palabra PORQUE Tanto la afirmación como la razón pueden ser VERDADERAS o FALSAS. El examinado evalúa tanto su valor de verdad como la relación lógica entre ellas. Excelente para evaluar análisis.
    • Elección Múltiple con Única Respuesta
      • Es el tipo de pregunta más conocido y usado en las pruebas objetivas. Están conformadas por un enunciado y cuatro (4) o cinco (5) opciones de respuesta. El enunciado puede contener una frase incompleta, una interrogación, un texto o una gráfica; las opciones de respuesta aparecen identificadas con las letras A, B, C, D y E. Una sola de las opciones completa o responde correctamente el enunciado. Este tipo de pregunta es útil para evaluar cualquiera de las cuatro primeras categorías de la taxonomía de Bloom. Los ejemplos 1 a 4 son preguntas de elección múltiple con única respuesta.
    • Elección Múltiple con Única Respuesta
      • Además de las consideraciones generales sobre construcción de preguntas, en este tipo de ítems es altamente recomendable evitar expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES. Si más de una opción es correcta probablemente la pregunta quede mejor formulada con el formato de elección múltiple con múltiple respuesta.
    • Elección Múltiple con Múltiple Respuesta
      • Este tipo de pregunta consta de un enunciado y cuatro (4) opciones de respuesta identificadas con los números 1, 2, 3 y 4. Una o varias opciones de estas pueden completar correctamente el enunciado. Este tipo de pregunta es útil para evaluar cualquiera de las categorías de objetivos educativos. Sin embargo, se usa frecuentemente para evaluar comprensión y aplicación utilizando: a) una situación en la que es necesario considerar varias consecuencias posibles, b) una situación en la que es necesario especificar una o más condiciones para definirla adecuadamente, c) dos situaciones semejantes o disímiles con respecto a uno o más puntos de comparación, d) un principio que puede aplicarse a más de una situación o e) varias consideraciones que pueden conducir al mismo resultado.
    • Elección Múltiple con Múltiple Respuesta
      • Las instrucciones que se dan al examinado son, generalmente de la siguiente forma:
      • &quot;A continuación encontrará preguntas que constan de un enunciado y cuatro (4) opciones de respuesta. Una o varias opciones pueden completar correctamente el enunciado. Usted debe marcar su hoja de respuestas según el cuadro siguiente:
      • Marque A si las opciones 1, 2 y 3 son correctas
      • Marque B si las opciones 1 y 3 son correctas
      • Marque C si las opciones 2 y 4 son correctas
      • Marque D si sólo la opción 4 es correcta
      • Marque E si todas las opciones son correctas
    • Elección Múltiple con Múltiple Respuesta
      • Este tipo de pregunta no debe incluir distractores mutuamente excluyentes por cuanto estarían anulando una o varias opciones de respuesta; tampoco debe incluir en las opciones de respuesta expresiones como TODAS LAS ANTERIORES o NINGUNA DE LAS ANTERIORES.
    • Elección Múltiple con Múltiple Respuesta
      • Ejemplo:
      • La investigación empírica ha encontrado que:
      • 1. Las personas toman menos tiempo en el aprendizaje de un concepto cuando hay muchos atributos irrelevantes
      • 2. En el aprendizaje de un concepto son mejores los ejemplos negativos que los positivos
      • 3. En el aprendizaje de un concepto la velocidad de aprendizaje es una función directa del número de atributos
      • 4. Las personas toman más tiempo en el aprendizaje de un concepto cuando hay muchos atributos relevantes
    • Información Suficiente
      • Estas preguntas constan de un problema y dos informaciones identificadas con los números I y II. No se requiere que el examinado resuelva el problema, sino que decida si las informaciones proporcionadas son necesarias y suficientes para resolverlo. Este tipo de pregunta es muy útil para evaluar aplicación.
    • Información Suficiente
      • Las instrucciones son, generalmente, las siguientes:
      • &quot;Las preguntas que encontrará a continuación constan de un problema y dos informaciones identificadas con los números I y II. Usted debe decidir si las informaciones son necesarias y suficientes para solucionar el problema y marcar su hoja de respuestas según el cuadro siguiente: ...
      • Marque A sí necesita y basta con las informaciones I y II
      • Marque B si necesita y basta con la información I
      • Marque C si necesita y basta con la información II
      • Marque D si cualquiera de las dos informaciones sirve
      • Marque E si no es suficiente con las dos informaciones
    • Información Suficiente
      • Además de las normas generales, para la construcción de este tipo de preguntas es necesario tener en cuenta: a) las informaciones NO deben ser contradictorias entre sí o mutuamente excluyentes, b) en las preguntas de clave A, el problema debe poder solucionarse con las dos informaciones sin requerir de otra, c) en las preguntas de clave B, C o D, el problema planteado debe poder solucionarse con una sola información y d) en las preguntas de clave E las informaciones deben ser necesarias pero NO suficientes para resolver el problema.
    • Información Suficiente
      • Ejemplo 6: Pregunta de Información Suficiente
      • Se quiere comparar el tiempo de reacción ante un estímulo en dos poblaciones. Se toman muestran aleatorias de las poblaciones, se recogen los datos y se elige un estadístico de prueba. Para decidir si se acepta o rechaza una hipótesis de igualdad de medias con un nivel de significancia , se requiere conocer:
      • I. la distribución del estadístico de prueba
      • II. la probabilidad de obtener un valor mayor que el observado en el estadístico de prueba
    • Análisis de Postulados
      • Este tipo de pregunta consta de una afirmación y dos postulados identificados con los números I y II. Entre la afirmación y los postulados se encuentra la palabra POR CONSIGUIENTE. Para responder este tipo de pregunta el examinado no necesita evaluar el valor de verdad de las afirmaciones, todo se supone verdadero; solo debe analizar la relación lógica existente entre afirmación y postulados. Es un tipo de pregunta de difícil elaboración y requiere de cuidadoso análisis previo para que la respuesta sea inequívoca. Es muy adecuado para evaluar análisis.
    • Análisis de Postulados
      • Las instrucciones para responder este tipo de pregunta son, generalmente, como se muestra a continuación
      • &quot;Las preguntas que encontrará a conti­nuación constan de una afirmación VERDADERA y dos postulados también VERDADEROS identifica­dos con los números I y II. Usted debe deci­dir si los postula­dos se deducen lógicamente de la afir­mación y contestar según el cuadro siguiente: ...
      • Marque A sí de la tesis se deducen los postulados I y II
      • Marque B si de la tesis solo se deduce el postulado I
      • Marque C si de la tesis solo se deduce el postulado II
      • Marque D si ninguno de los postulados se deduce de la tesis
    • Análisis de Postulados
      • Ejemplo 7: Pregunta de Análisis de Postulados
      • Es inimputable quien comete el delito bajo influencia determinante de un trastorno mental
      • POR CONSIGUIENTE
      • I. Un psicótico puede ser inimputable
      • II. Un inimputable comete un hecho típico y antijurídico pero no culpable ni punible
    • Análisis de Postulados
      • Además de las normas generales, para la construcción de este tipo de preguntas es necesa­rio tener en cuenta: a) aun cuando la instrucción le indica al examinado que debe suponer todo verdadero, es recomendable que las afirmaciones lo sean en efecto o, por lo menos que no sean absurdos u obviamente falsos, b) todas las afirmaciones deben ser gramaticalmen­te completas e independientes unas de otras, c) la construcción de la pregunta debe ser tal que la deduc­ción lógica sea indiscutible, de manera que la respues­ta co­rrecta sea inequívoca y d) este tipo de pregunta es útil para poblaciones de alto nivel educativo.
    • Análisis de Relaciones
      • Las preguntas de este tipo presentan dos afirmaciones unidas por la palabra PORQUE y la segunda afirmación se considera una RAZON verdadera o supuesta de la primera. El examinado debe evaluar tanto el valor de verdad de las afirmaciones como la relación entre ellas. A diferencia de las preguntas de análisis de postulados, en éstas las afirmaciones pueden ser verdaderas o falsas. Este tipo de preguntas es particularmente útil para evaluar análisis y presenta menos dificultades prácticas que la pregunta de análisis de postulados.
    • Análisis de Relaciones
      • Las preguntas que encontrará a conti­nua­ción constan de una afirmación y una razón unidas por la pala­bra PORQUE. Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relación existente entre las mismas, y contestar en su hoja de respuestas según el cuadro siguiente:
      • Marque A si ambas afirmaciones son verdadera y la segunda es una razón o explicación correcta de la primera
      • Marque B si ambas afirmaciones son verdaderas pero la segunda NO es una razón o explicación correcta de la primera
      • Marque C si la primera afirmación es verdadera pero la segunda es falsa
      • Marque D si la primera afirmación es falsa pero la segunda es verdadera
      • Marque E si ambas afirmaciones son falsas
    • Análisis de Relaciones
      • Las preguntas que encontrará a conti­nua­ción constan de una afirmación y una razón unidas por la pala­bra PORQUE. Usted debe juzgar tanto el grado de verdad o falsedad de cada una de ellas como la relación existente entre las mismas, y contestar en su hoja de respuestas según el cuadro siguiente:
      • Marque A si ambas afirmaciones son verdadera y la segunda es una razón o explicación correcta de la primera
      • Marque B si ambas afirmaciones son verdaderas pero la segunda NO es una razón o explicación correcta de la primera
      • Marque C si la primera afirmación es verdadera pero la segunda es falsa
      • Marque D si la primera afirmación es falsa pero la segunda es verdadera
      • Marque E si ambas afirmaciones son falsas
    • Análisis de Relaciones
      • Para la construcción de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas, b) las afirmaciones no deben ser contradictorias entre sí o mutuamente excluyen­tes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente, es decir, deben ser frases gramaticalmente completas.
    • Análisis de Relaciones
      • Para la construcción de este tipo de preguntas es necesario tener en cuenta: a) las afirmaciones no deben ser obviamente falsas u obviamente verdaderas, b) las afirmaciones no deben ser contradictorias entre sí o mutuamente excluyen­tes y c) las afirmaciones deben estar construidas de manera que pueda juzgarse su verdad o falsedad independientemente, es decir, deben ser frases gramaticalmente completas.
    • Análisis de Relaciones
      • Ejemplo 8: Pregunta de Análisis de Relaciones
      • El hemisferio cerebral izquierdo regula las contracciones musculares del lado derecho del cuerpo
      • PORQUE
      • las fibras motoras y sensitivas se cruzan en el bulbo
    • ANÁLISIS DE LOS ÍTEMS
    • Éxito en la estimación en contextos variados Propiedades del sujeto Propiedades de los ítems Estimación de la Dificultad del ítems Frecuencia de cada opción Dificultad Correlación con la prueba Discriminación Azar Covarianza con la prueba (Homogeneidad) Halo Juicios Subjetivos Calificación Administración Rapport
    • INDICE DE DIFICULTAD
      • Indica la proporción de aciertos en la muestra de alumnos que estamos utilizando. Es la media de éste 50% de sujetos analizados.
      • El término de dificultad se presta a equívocos: in índice mayor indica un pregunta mas fácil.
      • Este índice de dificultad sirve para evaluar cuatro variables:
      • La complejidad de la habilidad medida.
      • Las características del logro del grupo.
      • La comparación de distintos reactivos que miden la misma habilidad.
      • La comparación de reactivos que miden la misma habilidad pero con una relación jerárquica.
    • INDICE DE DIFICULTAD
      • Se fija un mínimo valor aceptable de p = 0.5 para considerar el reactivo bueno, cualquier medida inferior a 0.5, aunque no quiere decir que el reactivo no sirve, es mejor no usarlo porque podría ser que lo que está mal son las instrucciones.
      • Criterios para calificar la dificultad de los reactivos de acuerdo al valor del índice de dificultad de los reactivos p.
      • Muy difícil Optima Ligeramente fácil Muy fácil
      • 0% - 49% 50% - 69% 70% - 89% 90% - 100%
    • INDICES DE DISCRIMINACION
      • Los índices de discriminación expresan en que medida cada pregunta o ítem diferencia a los que mas saben de los que menos saben.
      • Es el índice probablemente más utilizado. Expresa hasta que punto la pregunta discrimina, establece diferencias, contribuye a situar a un sujeto en el grupo superior e inferior.
      • A mayor diferencia, en numero de acertantes entre los grupos superior e inferior, el ítem es mas discriminante, contribuye mas a situar a un sujeto entre los primeros o entre los últimos.
      • Las preguntas muy fáciles y muy difíciles no discriminan , no establecen diferencias; nos dicen que todos saben o no saben una pregunta, pero no quien sabe mas y quien menos. Estas preguntas no contribuyen a la fiabilidad del test, pero eso no quiere decir necesariamente que sean malas preguntas.
      • Si todos y solos los del grupo superior responden correctamente, tendremos que: ID =1 .
      • Si todos y solos los del grupo inferior responden correctamente, tendremos que: ID = -1 .
      • Si el ID es menor de 0.30 el ítem debe eliminarse porque no discrimina, aún cuando su nivel de dificultad sea óptimo.
      • Si el ítem tiene un ID igual o superior a 0.30 y su nivel de dificultad no es óptimo debe entonces corregirse y mejorarse ya que discrimina y puede considerarse como un ítem adecuado para la prueba. A mayor valor, mayor poder discriminativo.
    • Forma de calcular D y P
      • Procedimiento:
      • Hallar los puntajes totales por sujeto.
      • Ordenarlos de mayor a menor o al revés. Nos interesan los puntajes extremos (27% de bajos) y (27% de altos) y los puntajes promedio no sirven para el análisis, se ocultan. Por ejemplo, si hay 100 datos el 27% serian 27 datos y si fueran 70 datos el 27% seria equivalente a 18 datos.
      • Calcular el número de sujetos del grupo de los altos que responde correctamente bien cada ítem y calcular el número de sujetos del grupo de los bajos que responde bien cada ítem.
      • Identificar el índice de dificultad por la formula:
      • P = nG(altos)A + nG(bajos)B
      • G(total)A + G(total)B
      • y el índice de dificultad con la formula:
      • D = GA + GB
      • G(total).