Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de  inteso desarro...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarroll...
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Evaluación 3
Upcoming SlideShare
Loading in...5
×

Evaluación 3

5,414

Published on

Published in: Education, Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
5,414
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
69
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

Evaluación 3

  1. 1. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de inteso desarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43. http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Revista ELectrónica de Investigación y EValuación Educativa DESDE LOS TESTS HASTA LA INVESTIGACIÓN EVA- LUATIVA ACTUAL. UN SIGLO, EL XX, DE INTENSO DE- SARROLLO DE LA EVALUACIÓN EN EDUCACIÓN (From tests to current evaluative research. One century, the XXth, of in- tense development of evaluation in education) por Articles record Ficha artículo Tomás Escudero Escorza About authors Sobre los autores (tescuder@posta.unizar.es) HTML format Formato HTML Abstract Resumen This article presents a review and state of art about devel- Este artículo presenta una revisión crítica del desarrollo opment in educational evaluation in the XXth century. The histórico que ha tenido el ámbito de la evaluación educa- main theoretical proposals are commented tiva durante todo el siglo XX. Se analizan los principales propuestas teóricas planteadas. Keywords Descriptores Evaluation, Evaluation Research, Evaluation Methods; Evaluación, Investigación evaluativa, Métodos de Evalua- Formative Evaluation Summative Evaluation, Testing, ción, Evaluación Formativa, Evaluación Sumativa, Test, Program Evaluation Evaluación de ProgramasIntroducción El análisis la vamos a llevar a cabo basándo- nos en tres planteamientos que podríamos ta- En cualquier disciplina, la aproximación histó- char de clásicos en la reciente literatura sobrerica suele ser una vía fundamental para compren- el tema y que usamos indistintamente, aunqueder su concepción, estatus, funciones, ámbito, no tenemos la pretensión de ofrecer un plan-etc. Este hecho es especialmente evidente en el teamiento de síntesis, sino de utilización cabalcaso de la evaluación, pues se trata de una disci- de todos ellos, puesto que los tres plantea-plina que ha sufrido profundas transformaciones mientos inciden sobre los mismos momentos yconceptuales y funcionales a lo largo de la histo- movimientos claves.ria y, sobre todo, a lo largo del siglo XX, en elque principalmente ubicamos nuestro análisis. En Un planteamiento, quizás el más utilizado eneste sentido, la aproximación diacrónica al con- nuestro contexto (Mateo y otros, 1993; Her-cepto resulta imprescindible. nández, 1993), es el que ofrecen Madaus, Scri- Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 11
  2. 2. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmven, Stufflebeam y otros autores, que en sus tra- los procedimientos que se empleaban en labajos suelen establecer seis épocas, empezando China imperial, hace más de tres mil años, parasu análisis desde el siglo XIX (Stufflebeam y seleccionar a los altos funcionarios. Otros auto-Shinkfield, 1987; Madaus y otros, 1991). Nos res como Sundbery (1977) hablan de pasajeshablan de: a) época de la reforma (1800-1900), evaluadores en la Biblia, mientras Blancob) época de la eficiencia y del «testing» (1900- (1994) se refiere a los exámenes de los profe-1930), c) época de Tyler (1930-1945), d) época sores griegos y romanos. Pero según McRey-de la inocencia (1946-1956), e) época de la ex- nold (1975), el tratado más importante de eva-pansión (1957-1972) y f) época de la profesiona- luación de la antigüedad es el Tetrabiblos, quelización (desde 1973), que enlaza con la situa- se atribuye a Ptolomeo. También Cicerón yción actual. San Agustín introducen en sus escritos concep- tos y planteamientos evaluadores. Otros autores como Cabrera (1986) y Salvador(1992) citan tres grandes épocas, tomando como En la Edad Media se introducen los exáme-punto de referencia central la figura de Tyler en nes en los medios universitarios con carácterel segundo cuarto del Siglo XX. A la época de más formal. Hay que recordar los famososTyler se le denomina de nacimiento, a las ante- exámenes orales públicos en presencia de tri-riores de precedentes o antecedentes y a la poste- bunal, aunque sólo llegaban a los mismos losrior de desarrollo. que contaban con el visto bueno de sus profe- sores, con lo que la posibilidad de fracaso era Guba y sus colaboradores, sobre todo Yvonna prácticamente inexistente. En el RenacimientoLyncoln, destacan distintas generaciones. Ahora se siguen utilizando procedimientos selectivosestaríamos en la cuarta (Guba y Lincoln, 1989), y Huarte de San Juan, en su Examen de inge-que según ellos se apoya en el enfoque paradig- nios para las ciencias, defiende la observaciónmático constructivista y en las necesidades de los como procedimiento básico de la evaluación«stakeholders» (demandantes e implicados en la (Rodríguez y otros, 1995).evaluación), como base para determinar la in-formación que se necesita. La primera genera- En el siglo XVIII, a medida que aumenta lación es la de la medición, que llega hasta el pri- demanda y el acceso a la educación, se acentúamer tercio de este siglo, la segunda es la de la la necesidad de comprobación de los méritosdescripción y la tercera la del juicio o valoración. individuales y las instituciones educativas van elaborando e introduciendo normas sobre la Tras el análisis histórico, como complemento y utilización de exámenes escritos (Gil, 1992).como revisión de síntesis del mismo, ofrecemosun sucinto resumen de los enfoques evaluativos Entrado el siglo XIX se establecen los siste-más relevantes, de los distintos modelos y plan- mas nacionales de educación y aparecen losteamientos que, con mayor o menor fuerza, vie- diplomas de graduación, tras la superación denen a nuestra mente cuando intentamos acotar lo exámenes (exámenes del Estado). Según Maxque es hoy en día la investigación evaluativa en Weber (Barbier, 1993), surge un sistema deeducación exámenes de comprobación de una preparación específica, para satisfacer las necesidades de1. Precedentes: Antes de los «tests» y de la una nueva sociedad jerárquica y burocratizada.medición En los Estados Unidos, en 1845, Horace Mann comienza a utilizar las primeras técnicas eva- Desde la antigüedad se han venido creando y luativas del tipo «tests» escritos, que se extien-usando procedimientos instructivos en los que den a las escuelas de Boston, y que inician ellos profesores utilizaban referentes implícitos, camino hacia referentes más objetivos y explí-sin una teoría explícita de evaluación, para valo- citos con relación a determinadas destrezasrar y, sobre todo, diferenciar y seleccionar a es- lecto-escritoras. Sin embargo, no se trata toda-tudiantes. Dubois (1970) y Coffman (1971) citanRevista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 12
  3. 3. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmvía de una evaluación sustentada en un enfoque c) El desarrollo de los métodos estadísticosteórico, sino más bien, algo que responde a prác- que favorecía decisivamente la orientaciónticas en buena medida rutinarias y con frecuencia métrica de la época (Nunnally, 1978).basadas en instrumentos poco fiables. d) El desarrollo de la sociedad industrial Al final del siglo XIX, en 1897, aparece un tra- que potenciaba la necesidad de encontrarbajo de J. M. Rice, que se suele señalar como la unos mecanismos de acreditación y selec-primera investigación evaluativa en educación ción de alumnos, según sus conocimientos.(Mateo y otros, 1993). Se trataba de un análisiscomparativo en escuelas americanas sobre el Consecuentemente con este estado de cosas,valor de la instrucción en el estudio de la ortogra- en este periodo entre finales del siglo XIX yfía, utilizando como criterio las puntuaciones principios del XX, se desarrolla una actividadobtenidas en los tests. evaluativa intensa conocida como «testing», que se define por características como las si-2. Los tests psicométricos guientes: En el contexto anterior, a finales del siglo XIX, • Medición y evaluación resultaban términosse despierta un gran interés por la medición cien- intercambiables. En la práctica sólo setífica de las conductas humanas. Esto es algo que hablaba de medición.se enmarca en el movimiento renovador de lametodología de las ciencias humanas, al asumir • El objetivo era detectar y establecer dife-el positivismo de las ciencias físico-naturales. En rencias individuales, dentro del modelo deleste sentido, la evaluación recibe las mismas rasgo y atributo que caracterizaba las elabo-influencias que otras disciplinas pedagógicas raciones psicológicas de la época (Fernándezrelacionadas con procesos de medición, como la Ballesteros, 1981), es decir, el hallazgo depedagogía experimental y la diferencial (Cabrera, puntuaciones diferenciales, para determinar1986). la posición relativa del sujeto dentro de la norma grupal. La actividad evaluativa se verá condicionadade forma decisiva por diversos factores que con- • Los tests de rendimiento, sinónimo de eva-fluyen en dicho momento, tales como: luación educativa, se elaboraban para esta- blecer discriminaciones individuales, olvi- a) El florecimiento de las corrientes filosófi- dándose en gran medida la representatividad cas positivistas y empíricas, que apoyaban a la y congruencia con los objetivos educativos. observación, la experimentación, los datos y En palabras de Guba y Lincoln (1982), la los hechos como fuentes del conocimiento evaluación y la medida tenían poca relación verdadero. Aparece la exigencia del rigor cien- con los programas escolares. Los tests in- tífico y de la objetividad en la medida de la formaban algo sobre los alumnos, pero no de conducta humana (Planchard, 1960) y se po- los programas con los que se les había for- tencian las pruebas escritas como medio para mado. combatir la subjetividad de los exámenes ora- les (Ahman y Cook, 1967). En el campo educativo destacan algunos ins- trumentos de aquella época, como las escalas b) La influencia de las teorías evolucionistas de escritura de Ayres y Freeman, de redacción y los trabajos de Darwin, Galton y Cattel, apo- de Hillegas, de ortografía de Buckingan, de yando la medición de las características de los cálculo de Wood, de lectura de Thorndike y individuos y las diferencias entre ellos. McCall y de aritmética de Wood y McCall (Planchard, 1960; Ahman y Cook, 1967; Ebel, 1977).Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 13
  4. 4. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Sin embargo, fue en los tests psicológicos don- ten textos y publicaciones que utilizan de ma-de los esfuerzos tuvieron mayor impacto, siendo nera indisoluble evaluación y medida (Gron-probablemente la obra de Thorndike (1904) la de lund, 1985).mayor influencia en los comienzos del siglo XX.En Francia destacan los trabajos de Alfred Binet, 3. El nacimiento de la verdadera evalua-después revisados por Terman en la Universidad ción educativa: La gran reformade Stanford, sobre tests de capacidades cogniti- «tyleriana»vas. Ahora hablamos del Stanford-Binet, uno delos tests más conocidos en la historia de la psi- Antes de que llegara la revolución promovidacometría. por Ralph W. Tyler, en Francia se inicia en los años veinte una corriente independiente cono- Años más tarde, con las necesidades de reclu- cida como docimología (Pieron, 1968 y 1969;tamiento en la Primera Guerra Mundial, Arthur Bonboir, 1972), que supone un primer acerca-Otis dirige un equipo que construye tests colecti- miento a la verdadera evaluación educativa. Sevos de inteligencia general (Alfa para lectoescri- criticaba, sobre todo, el divorcio entre lo ense-tores y Beta para analfabetos) e inventarios de ñado y las metas de la instrucción. La evalua-personalidad (Phillips, 1974). ción se dejaba, en último término, en manos de una interpretación totalmente personal del pro- Tras la contienda, los tests psicológicos se po- fesor. Como solución se proponía: a) elabora-nen al servicio de fines sociales. La década entre ción de taxonomías para formular objetivos, b)1920 y 1930 marca el punto más alto del «tes- diversificación de fuentes de información,ting», pues se idean multitud de tests estandari- exámenes, expedientes académicos, técnicas dezados para medir toda clase de destrezas escola- repesca y tests, c) unificación de criterios deres con referentes objetivos externos y explícitos, corrección a partir del acuerdo entre los correc-basados en procedimientos de medida de la inte- tores de las pruebas y d) revisión de los juiciosligencia, para utilizar con grandes colectivos de de valoración mediante procedimientos talesestudiantes. como la doble corrección, o la media de distin- Estas aplicaciones estandarizadas se acogen tos correctores. Como puede verse, se trata demuy bien en los ámbitos educativos y McCall criterios en buena medida vigentes actualmente(1920) propone que los profesores construyan y, en algún caso, incluso avanzados.sus propias pruebas objetivas, para no tener que Pero quien es tradicionalmente consideradoconfiar exclusivamente en las propuestas por como el padre de la evaluación educativa esespecialistas externos. Tyler (Joint Committee, 1981), por ser el pri- Este movimiento estuvo vigente en paralelo al mero en dar una visión metódica de la misma,proceso de perfeccionamiento de los tests psico- superando desde el conductismo, muy en bogalógicos con el desarrollo de la estadística y del en el momento, la mera evaluación psicológica.análisis factorial. El fervor por el «testing» de- Entre 1932 y 1940, en su famoso Eight-Yearcreció a partir de los años cuarenta e, incluso, Study of Secondary Education para la Progres-empezaron a surgir algunos movimientos hiper- sive Education Association, publicado dos añoscríticos con estas prácticas. después (Smith y Tyler, 1942), plantea la nece- sidad de una evaluación científica que sirva Guba y Lincoln (1989) se refieren a esta eva- para perfeccionar la calidad de la educación.luación como a la primera generación, que puede La obra de síntesis la publica unos años des-legítimamente ser denominada como la genera- pués (Tyler, 1950), exponiendo de manera cla-ción de la medida. El papel del evaluador era ra su idea de «curriculum», e integrando en éltécnico, como proveedor de instrumentos de me- su método sistemático de evaluación educativa,dición. Según estos autores, esta primera genera- como el proceso surgido para determinar ención permanece todavía viva, pues todavía exis- qué medida han sido alcanzados los objetivosRevista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 14
  5. 5. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmpreviamente establecidos (véase también Tyler, ción es más amplia que el hacer explícito este1967 y 1969). cambio a los propios alumnos, padres y profe- sores; es también un medio para informar sobre El «currículum» viene delimitado por las cua- la eficacia del programa educacional y tambiéntro cuestiones siguientes: de educación continua del profesor. Se trata, según Guba y Lincoln (1989), de la segunda a) ¿Qué objetivos se desean conseguir? generación de la evaluación. Desgraciadamen- b) ¿Con qué actividades se pueden alcanzar? te, esta visión evaluativa global no fue suficientemente apreciada, ni explotada, por c) ¿Cómo pueden organizarse eficazmente aquellos que utilizaron sus trabajos (Bloom y estas experiencias? otros, 1975; Guba y Lincoln, 1982). d) ¿Cómo se puede comprobar si se alcanzan A pesar de lo anterior y de que las reformas los objetivos? tylerianas no siempre se aplicaron de inmedia- to, las ideas de Tyler fueron muy bien acogidas Y la buena evaluación precisa de las siguientes por los especialistas en desarrollo curricular ycondiciones: por los profesores. Su esquema era racional y a) Propuesta clara de objetivos. se apoyaba en una tecnología clara, fácil de entender y aplicar (Guba y Lincoln, 1982; b) Determinación de las situaciones en las House, 1989) y encajaba perfectamente en la que se deben manifestar las conductas espera- racionalidad del análisis de la tarea que comen- das. zaba a usarse con éxito en ámbitos educativos militares (Gagné, 1971). En España, los plan- c) Elección de instrumentos apropiados de teamientos de Tyler se extendieron con la Ley evaluación. General de Educación de 1970. d) Interpretación de los resultados de las Tras la Segunda Guerra Mundial se produce pruebas. un periodo de expansión y optimismo que Stuf- flebeam y Shinkfield (1987) no han dudado en e) Determinación de la fiabilidad y objetivi- calificar de «irresponsabilidad social», por el dad de las medidas. gran despilfarro consumista tras una época de Esta evaluación ya no es una simple medición, recesión. Se trata de la etapa conocida como laporque supone un juicio de valor sobre la infor- de la inocencia (Madaus y otros, 1991). Semación recogida. Se alude, aunque sin desarro- extienden mucho las instituciones y serviciosllar, a la toma de decisiones sobre los aciertos o educativos de todo tipo, se producen cantidadfracasos de la programación, en función de los de tests estandarizados, se avanza en la tecno-resultados de los alumnos, algo que retomarán logía de la medición y en los principios estadís-otros importantes evaluadores como Cronbach y ticos del diseño experimental (Gulliksen, 1950;Sufflebeam unos años después. Lindquist, 1953; Walberg y Haertel, 1990) y aparecen las famosas taxonomías de los objeti- Para Tyler, la referencia central en la evalua- vos educativos (Bloom y otros, 1956; Krath-ción son los objetivos preestablecidos, que deben wohl y otros, 1964). Sin embargo, en esta épo-ser cuidadosamente definidos en términos de ca, la aportación de la evaluación a la mejoraconducta (Mager, 1962), teniendo en cuenta que de la enseñanza es escasa debido a la carenciadeben marcar el desarrollo individual del alum- de planes coherentes de acción. Se escribe mu-no, pero dentro de un proceso socializador. cho de evaluación, pero con escasa influencia en el perfeccionamiento de la labor instruccio- El objeto del proceso evaluativo es determinar nal. El verdadero desarrollo de las propuestasel cambio ocurrido en los alumnos, pero su fun-Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 15
  6. 6. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmtylerianas vino después (Taba, 1962; Popham y nos. Para ello, es necesario interaccionar conBaker, 1970; Fernández de Castro, 1973). ellos de manera más frecuente y más infor- mal. Ralph W. Tyler murió el 18 de febrero de1994, superados los noventa años de vida, tras Medio siglo después de que Tylersiete décadas de fructíferas aportaciones y servi- revolucionara el mundo de la evaluacióncios a la evaluación, a la investigación y a la edu- educativa, se observa la fortaleza, coherencia ycación en general. Unos meses antes, en abril de vigencia de su pensamiento. Como acabamos1993, Pamela Perfumo, una estudiante graduada de ver, sus ideas básicas, convenientementede la Universidad de Stanford, entrevistó a Tyler actualizadas, se entroncan fácilmente en lascon el propósito de conocer su pensamiento acer- corrientes más actuales de la evaluaciónca del actual desarrollo de la evaluación y de los educativa.temas controvertidos alrededor de la misma. Esta 4. El desarrollo de los sesentaentrevista, convenientemente preparada, fuepresentada el 16 de abril de 1993 en la Conferen- Los años sesenta traerán nuevos aires a lacia de la AERA que tuvo lugar en Atlanta. evaluación educativa, entre otras cosas porqueHorowitz (1995) analiza el contenido y el signi- se empezó a prestar interés por algunas de lasficado de la citada entrevista, destacando, entre llamadas de atención de Tyler, relacionadasotros, los siguientes aspectos en el pensamiento con la eficacia de los programas y el valor in-de Tyler al final de sus días: trínseco de la evaluación para la mejora de la educación. a) Necesidad de analizar cuidadosamente los propósitos de la evaluación, antes de ponerse a En esa época surge un cierto conflicto entre evaluar. Los actuales planteamientos de eva- la sociedad americana y su sistema educativo, luaciones múltiples y alternativas deben ajus- sobre todo porque los rusos iban por delante en tarse a este principio la carrera especial, tras el lanzamiento del Sputnik por la URSS en 1957. Aparece un cier- b) El propósito más importante en la evalua- to desencanto con la escuela pública y crece la ción de los alumnos es guiar su aprendizaje, presión por la rendición de cuentas (MacDo- esto es, ayudarles a que aprendan. Para ello es nald, 1976; Stenhouse, 1984). En 1958 se pro- necesaria una evaluación comprensiva de to- mulga una nueva ley de defensa educativa que dos los aspectos significativos de su rendi- proporciona muchos programas y medios para miento; no basta con asegurarse que hacen re- evaluarlos. En 1964 se establece el Acta de gularmente el trabajo diario. educación primaria y secundaria (ESEA) y se crea el National Study Comitte on Evaluation, c) El «portfolio» es un instrumento valioso de creándose una nueva evaluación no sólo de evaluación, pero depende de su contenido. En alumnos, sino orientada a incidir en los pro- todo caso, hay que ser cauteloso ante la pre- gramas y en la práctica educativa global (Ma- ponderancia de un solo procedimiento de eva- teo y otros, 1993; Rodríguez y otros, 1995). luación, incluyendo el «portfolio», por su in- capacidad de abarcar todo el espectro de as- Para mejorar la situación y retomar la hege- pectos evaluables. monía científica y educativa, fueron muchos los millones de dólares que desde los fondos d) La verdadera evaluación debe ser idiosin- públicos se destinaron a subvencionar nuevos crásica, adecuada a las peculiaridades del programas educativos e iniciativas del personal alumno y el centro. En rigor, la comparación de las escuelas públicas americanas encamina- de centros no es posible. das a mejorar la calidad de la enseñanza. (Po- pham, 1983; Rutman y Mowbray, 1983; Weiss, e) Los profesores deben rendir cuentas de su 1983). Este movimiento se vio también poten- acción educativa ante los padres de los alum- ciado por el desarrollo de nuevos medios tecnológicos (audiovisuales, ordenadores...) yRevista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 16
  7. 7. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmnológicos (audiovisuales, ordenadores...) y el de este movimiento de rendición de cuentas, dela enseñanza programada, cuyas posibilidades responsabilidad escolar, diera lugar a una olea-educativas despertaron el interés entre los profe- da de protestas por parte del personal docente.sionales de la educación (Rosenthal, 1976). Otra dimensión de la responsabilidad escolar De la misma forma que la proliferación de nos la ofrece Popham (1980), cuando se refiereprogramas sociales en la década anterior había al movimiento de descentralización escolarimpulsado la evaluación de programas en el área durante los últimos años sesenta y principios desocial, los años sesenta serán fructíferos en de- los setenta. Los grandes distritos escolares semanda de evaluación en el ámbito de la educa- dividieron en áreas geográficas más pequeñas,ción. Esta nueva dinámica en la que entra la eva- y, por consiguiente, con un control ciudadanoluación, hace que, aunque ésta se centraba en los más directo sobre lo que ocurría en las escue-alumnos como sujeto que aprende, y el objeto de las.valoración era el rendimiento de los mismos, susfunciones, su enfoque y su última interpretación Como consecuencia de estos focos de in-variará según el tipo de decisión buscada. fluencia, se amplió considerablemente el fe- nómeno de la evaluación educativa. El sujeto Buena parte de culpa de este fuerte ímpetu eva- directo de la evaluación siguió siendo el alum-luador americano se debió a la ya citada aproba- no, pero también todos aquellos factores queción de la «Elementary and Secondary Act» confluyen en el proceso educativo (el programa(ESEA) en 1965 (Berk, 1981; Rutman, 1984). educativo en un sentido amplio, profesor, me-Con esta ley se puso en marcha el primer pro- dios, contenidos, experiencias de aprendizaje,grama significativo para la organización de la organización, etc.), así como el propio produc-educación en el ámbito federal de los Estados to educativo.Unidos, y se estipuló que cada uno de los pro-yectos realizados con el apoyo económico fede- Como resultado de estas nuevas necesidadesral debía ser anualmente evaluado, a fin de justi- de la evaluación, se inicia durante esta épocaficar subvenciones futuras. un periodo de reflexión y de ensayos teóricos con ánimo de clarificar la multidimensionali- Junto al desencanto de la escuela pública, cabe dad del proceso evaluativo. Estas reflexionesseñalar la recesión económica que caracteriza los teóricas enriquecerán decisivamente el ámbitofinales años sesenta, y, sobre todo, la década de conceptual y metodológico de la evaluación, lolos setenta. Ello hizo que la población civil, co- que unido a la tremenda expansión de la eva-mo contribuyentes, y los propios legisladores se luación de programas ocurrida durante estospreocupasen por la eficacia y el rendimiento del años, dará lugar al nacimiento de esa nuevadinero que se empleaba en la mejora del sistema modalidad de investigación aplicada que hoyescolar. A finales de los años sesenta, y como denominamos como investigación evaluativa.consecuencia de lo anterior, entra en escena unnuevo movimiento, la era de la «Accountability», Como hitos de la época hay que destacar dosde la rendición de cuentas (Popham, 1980 y ensayos por su decisiva influencia: el artículo1983; Rutman y Mowbray, 1983), que se asocia de Cronbach (1963), Course improvementfundamentalmente a la responsabilidad del per- through evaluation, y el de Scriven (1967), Thesonal docente en el logro de objetivos educativos methodology of evaluation. La riqueza de ideasestablecidos. De hecho, en el año 1973, la legis- evaluativas expuestas en estos trabajos noslación de muchos estados americanos instituyó la obligan a que, aunque brevemente, nos refira-obligación de controlar el logro de los objetivos mos a ellas.educativos y la adopción de medidas correctivas Del análisis que Cronbach del concepto, fun-en caso negativo (MacDonald, 1976; Wilson y ciones y metodología de la evaluación, entresa-otros, 1978). Es comprensible que, planteado así, camos las sugerencias siguientes:Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 17
  8. 8. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm a) Asociar el concepto de evaluación a la tudios de seguimientos, esto es, el camino toma de decisiones. Distingue el autor tres ti- posterior seguido por los estudiantes que han pos de decisiones educativas a las cuales la participado en el programa. evaluación sirve: a) sobre el perfeccionamien- to del programa y de la instrucción, b) sobre f) Desde esta óptica, las técnicas de eva- los alumnos (necesidades y méritos finales) y luación no pueden limitarse a los tests de c) acerca de la regulación administrativa sobre rendimiento. Los cuestionarios, las entrevis- la calidad del sistema, profesores, organiza- tas, la observación sistemática y no sistemá- ción, etc. De esta forma, Cronbach abre el tica, las pruebas de ensayo, según el autor, campo conceptual y funcional de la evaluación ocupan un lugar importante en la evaluación, educativa mucho más allá del marco concep- en contraste al casi exclusivo uso que se tual dado por Tyler, aunque en su línea de su- hacía de los tests como técnicas de recogida gerencias. de información. b) La evaluación que se usa para mejorar un Si estas reflexiones de Cronbach fueron im- programa mientras éste se está aplicando, pactantes, no lo fueron menos las del ensayo de contribuye más al desarrollo de la educación Scriven (1967). Sus fecundas distinciones ter- que la evaluación usada para estimar el valor minológicas ampliaron enormemente el campo del producto de un programa ya concluido. semántico de la evaluación, a la vez que clari- ficaron el quehacer evaluativo. Destacamos a c) Poner en cuestión la necesidad de que los continuación las aportaciones más significati- estudios evaluativos sean de tipo comparativo. vas: Entre las objeciones a este tipo de estudios, el autor destaca el hecho de que, con frecuencia, a) Se establece de forma tajante la diferen- las diferencias entre las puntuaciones prome- cia entre la evaluación como actividad me- dio entre-grupos son menores que las intra- todológica, lo que el autor llama meta de la grupos, así como otras referentes a las dificul- evaluación, y las funciones de la evaluación tades técnicas que en el marco educativo pre- en un contexto particular. Así, la evaluación sentan los diseños comparativos. Cronbach como actividad metodológica es esencial- aboga por unos criterios de comparación de ti- mente igual, sea lo que fuera lo que estemos po absoluto, reclamando la necesidad de una evaluando. El objetivo de la evaluación es evaluación con referencia al criterio, al defen- invariante, supone en definitiva el proceso der la valoración con relación a unos objetivos por el cual estimamos el valor de algo que se bien definidos y no la comparación con otros evalúa, mientras que las funciones de la eva- grupos. luación pueden ser enormemente variadas. Estas funciones se relacionan con el uso que d) Se ponen en cuestión los estudios a gran se hace de la información recogida. escala, puesto que las diferencias entre los tra- tamientos pueden ser muy grandes e impedir b) Scriven señala dos funciones distintas discernir con claridad las causas de los resul- que puede adoptar la evaluación: la for- tados. Se defienden los estudios más analíti- mativa y la sumativa. Propone el término de cos, bien controlados, que pueden usarse para evaluación formativa para calificar aquel comparar versiones alternativas de un progra- proceso de evaluación al servicio de un pro- ma. grama en desarrollo, con objeto de mejorar- lo, y el término de evaluación sumativa para e) Metodológicamente Cronbach propone aquel proceso orientado a comprobar la efi- que la evaluación debe incluir: 1) estudios de cacia del programa y tomar decisiones sobre proceso –hechos que tienen lugar en el aula–; su continuidad. 2) medidas de rendimiento y actitudes – cambios observados en los alumnos– y 3) es-Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 18
  9. 9. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm c) Otra importante contribución de Scriven no sólo analiza y describe la realidad, además, es la crítica al énfasis que la evaluación da a la la valora, la juzga con relación a distintos crite- consecución de objetivos previamente estable- rios. cidos, porque si los objetivos carecen de valor, no tiene ningún interés saber hasta qué punto Durante estos años sesenta aparecen muchas se han conseguido. Resalta la necesidad de que otras aportaciones que va perfilando una nueva la evaluación debe incluir tanto la evaluación concepción evaluativa, que terminará de des- de los propios objetivos como el determinar el arrollarse y, sobre todo, de extenderse en las grado en que éstos han sido alcanzados (Scri- décadas posteriores. Se percibe que el núcleo ven, 1973 y 1974). conceptual de la evaluación lo constituye la valoración del cambio ocurrido en el alumno d) Clarificadora es también la distinción que como efecto de una situación educativa siste- hace Scriven entre evaluación intrínseca y eva- mática, siendo unos objetivos bien formulados luación extrínseca, como dos formas diferen- el mejor criterio para valorar este cambio. Así tes de valorar un elemento de la enseñanza. En mismo, se comienza a prestar atención no sólo una evaluación intrínseca se valora el elemen- a los resultados pretendidos, sino también a los to por sí mismo, mientras que en la evaluación efectos laterales o no pretendidos, e incluso a extrínseca se valora el elemento por los efec- resultados o efectos a largo plazo (Cronbach, tos que produce en los alumnos. Esta distin- 1963; Glaser, 1963; Scriven, 1967; Stake, ción resulta muy importante a la hora de con- 1967). siderar el criterio a utilizar, pues en la evalua- ción intrínseca el criterio no se formula en A pesar de las voces críticas con la operativi- términos de objetivos operativos, mientras que zación de objetivos (Eisner, 1967 y 1969; At- sí se hace en la evaluación extrínseca . kin, 1968), no sólo por la estructura de valor que en ello subyace, sino también por centrar la e) Scriven adopta una posición contraria a valoración del aprendizaje en los productos Cronbach, defendiendo el carácter comparati- más fácilmente mensurables, a veces los más vo que deben presentar los estudios de evalua- bajos en las taxonomías del dominio cognosci- ción. Admite con Cronbach los problemas téc- tivo, y de que se prestaba escasa atención a los nicos que los estudios comparativos entrañan y objetivos del dominio afectivo, que presentan la dificultad de explicar las diferencias entre mayor dificultad de tratamiento operativo, el programas, pero Scriven considera que la eva- modelo evaluativo de Tyler se enriquecería luación como opuesta a la mera descripción mucho en estos años, con trabajos sobre los implica emitir un juicio sobre la superioridad o objetivos educativos que continuarían y perfec- inferioridad de lo que se evalúa con respecto a cionarían el camino emprendido en 1956 por sus competidores o alternativas. Bloom y colaboradores (Mager, 1962 y 1973; Lindvall, 1964; Krathwohl y otros, 1964; Gla- Estas dos aportaciones comentadas influyeron ser, 1965; Popham, 1970; Bloom y otros, 1971;decisivamente en la comunidad de evaluadores, Gagné 1971). Entre otras cosas aparecieronincidiendo no sólo en estudios en la línea de la nuevas ideas sobre la evaluación de la interac-investigación evaluativa, a la que se referían pre- ción en el aula y sobre sus efectos en los logrosferentemente, sino también en la evaluación de los alumnos (Baker, 1969).orientada al sujeto, en la línea de evaluación co-mo «assessment» (Mateo, 1986). Estamos ante la Stake (1967) propuso su modelo de evalua-tercera generación de la evaluación que, según ción, The countenance model, que sigue la lí-Guba y Lincoln (1989), se caracteriza por intro- nea de Tyler, pero es más completo al conside-ducir la valoración, el juicio, como un contenido rar las discrepancias entre lo observado y lointrínseco en la evaluación. Ahora el evaluador esperado en los «antecedentes» y «transaccio- nes», y posibilitar algunas bases para elaborarRevista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 19
  10. 10. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmhipótesis acerca de las causas y los fallos en los señala para los primeros, además de los cono-resultados finales. En sus sucesivas propuestas, cidos objetivos de describir la ejecución delStake se irá distanciando de sus posiciones ini- sujeto y tomar decisiones sobre si domina o nociales. domina un contenido, otro objetivo como es el de valorar la eficacia de un programa. Metfessell y Michael (1967) presentaron tam-bién un modelo de evaluación de la efectividad Desde finales de los sesenta los especialistasde un programa educativo en el cual, aún si- se pronunciarán decisivamente a favor de laguiendo el modelo básico de Tyler, proponían la evaluación criterial, en cuanto que es el tipo deutilización de una lista comprensiva de criterios evaluación que suministra una información realdiversos que los evaluadores podrían tener en y descriptiva del estatus del sujeto o sujetoscuenta en el momento de la valoración y, por respecto a los objetivos de enseñanza previstos,consiguiente, no centrarse meramente en los co- así como la valoración de ese estatus por com-nocimientos intelectuales alcanzados por los paración con un estándar o criterio de realiza-alumnos. ciones deseables, siendo irrelevantes, al efecto de contraste, los resultados obtenidos por otros Suchman (1967) profundiza en la convicción sujetos o grupo de sujetos (Popham, 1970 yde que la evaluación debe basarse en datos obje- 1983; Mager, 1973; Carreño, 1977; Gronlund,tivos que sean analizados con metodología cien- 1985).tífica, matizando que la investigación científicaes preferentemente teórica y, en cambio, la inves- En las prácticas evaluativas de esta década detigación evaluativa es siempre aplicada. Su prin- los sesenta se observan dos niveles de actua-cipal propósito es descubrir la efectividad, éxito ción. Un nivel podemos calificarlo como lao fracaso de un programa al compararlo con los evaluación orientada hacia los individuos,objetivos propuestos y, así, trazar las líneas de su fundamentalmente alumnos y profesores. Elposible redefinición. Esta investigación evaluati- otro nivel, es el de la evaluación orientada a lava para Suchman debe tener en cuenta: a) la na- toma de decisiones sobre el «instrumento» oturaleza del destinatario del objetivo y la del pro- «tratamiento» o «programa» educativo. Estepio objetivo, b) el tiempo necesario para que se último nivel, impulsado también por la evalua-realice el cambio propuesto, c) el conocimiento ción de programas en el ámbito social, será lade si los resultados esperados son dispersos o base para la consolidación en el terreno educa-concentrados y d) los métodos que han de em- tivo de la evaluación de programas y de la in-plearse para alcanzar los objetivos. Suchman, vestigación evaluativa.además, defiende la utilización de evaluadoresexternos para evitar todo tipo de tergiversación 5. Desde los años setenta: La consolida-de los profesores muy implicados en los procesos ción de la investigación evaluativainstruccionales. Si con algo se podría caracterizar las aporta- El énfasis en los objetivos y su medida traerá ciones teóricas que nos ofrecen los especialis-también la necesidad de una nueva orientación a tas durante los años setenta es con la prolifera-la evaluación, la denominada evaluación de refe- ción de toda clase de modelos evaluativos querencia criterial. La distinción introducida por inundan el mercado bibliográfico, modelos deGlaser (1963) entre mediciones referidas a nor- evaluación que expresan la propia óptica delmas y criterios tendrá eco al final de la década de autor que los propone sobre qué es y cómo de-los sesenta, precisamente como resultado de las be conducirse un proceso evaluativo. Se trata,nuevas exigencias que a la evaluación educativa por tanto, de una época caracterizada por lase le planteaban. Así, por ejemplo, cuando Ham- pluralidad conceptual y metodológica. Guba ybleton (1985) estudia las diferencias entre tests Lincoln (1982) nos hablan de más de cuarentareferidos al criterio y tests referidos a la norma, modelos propuestos en estos años, y MateoRevista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 20
  11. 11. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm(1986) se refiere a la eclosión de modelos. Estos Metas”. Además de los ya citados de Stake yenriquecerán considerablemente el vocabulario Metfessell y Michael, que corresponden a losevaluativo, sin embargo, compartimos la idea de últimos años sesenta, en esta época destacan laPopham (1980) de que algunos son demasiado propuesta de Hammond (1983) y el Modelo decomplicados y otros utilizan una jerga bastante Discrepancia de Provus (1971). Para estos au-confusa. tores los objetivos propuestos siguen siendo el criterio fundamental de valoración, pero enfati- Algunos autores como Guba y Lincoln (1982), zan la necesidad de aportar datos sobre la con-Pérez (1983) y en alguna medida House (1989), gruencia o discrepancia entre las pautas de ins-tienden a clasificar estos modelos en dos grandes trucción diseñadas y la ejecución de las mismasgrupos, cuantitativos y cualitativos, pero nosotros en la realidad del aula.pensamos con Nevo (1983) y Cabrera (1986) quela situación es mucho más rica en matices. Otros modelos consideran el proceso de eva- luación al servicio de las instancias que deben Es cierto que esas dos tendencias se observan tomar decisiones. Ejemplos notables de elloshoy en las propuestas evaluativas, y que algunos son: probablemente el más famoso y utilizadomodelos pueden ser representativos de ellas, pero de todos, el C.I.P.P. (contexto, input, proceso ylos diferentes modelos, considerados particular- producto), propuesto por Stufflebeam y colabo-mente, se diferencian más por destacar o enfati- radores (1971) y el C.E.S. (toma sus siglas delzar alguno o algunos de los componentes del Centro de la Universidad de California para elproceso evaluativo y por la particular interpreta- Estudio de la Evaluación) dirigido por Alkinción que a este proceso le dan. Es desde esta (1969). La aportación conceptual y metodoló-perspectiva, a nuestro entender, como los dife- gica de estos modelos es valorada positivamen-rentes modelos deben ser vistos, y valorar así sus te entre la comunidad de evaluadores (Popham,respectivas aportaciones en los terrenos concep- 1980; Guba y Lincoln, 1982; House, 1989).tual y metodológico (Worthen y Sanders, 1973; Estos autores van más allá de la evaluaciónStufflebeam y Shinkfield, 1987; Arnal y otros, centrada en resultados finales, puesto que en1992; Scriven, 1994). sus propuestas suponen diferentes tipos de eva- luación, según las necesidades de las decisio- También son varios los autores (Lewy, 1976; nes a las que sirven.Popham, 1980; Cronbach, 1982; Anderson yBall, 1983; De la Orden, 1985) los que conside- Una segunda época en la proliferación deran los modelos no como excluyentes, sino más modelos es la representada por los modelosbien como complementarios y que el estudio de alternativos, que con diferentes concepcioneslos mismos (al menos aquellos que han resultado de la evaluación y de la metodología a seguirser más prácticos) llevará al evaluador a adoptar comienzan a aparecer en la segunda mitad deuna visión más amplia y comprensiva de su tra- esta década de los setenta. Entre ellos destacanbajo. Nosotros, en algún momento nos hemos la Evaluación Responsable de Stake (1975 yatrevido a hablar de enfoques modélicos, más 1976), a la que se adhieren Guba y Lincolnque de modelos, puesto que es cada evaluador el (1982), la Evaluación Democrática de Mac-que termina construyendo su propio modelo en Donald (1976), la Evaluación Iluminativa decada investigación evaluativa, en función del tipo Parlett y Hamilton (1977) y la Evaluación co-de trabajo y las circunstancias (Escudero, 1993). mo crítica artística de Eisner (1985). En este movimiento de propuestas de modelos En líneas generales, este segundo grupo dede evaluación cabe distinguir dos épocas con modelos evaluativos enfatiza el papel de lamarcadas diferencias conceptuales y metodológi- audiencia de la evaluación y de la relación delcas. En una primera época, las propuestas seguí- evaluador con ella. La audiencia prioritaria dean la línea expuesta por Tyler en su planteamien- la evaluación en estos modelos no es quiento, que ha venido a llamarse de “Consecución deRevista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 21
  12. 12. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmdebe tomar las decisiones, como en los modelos tados a la toma de decisiones: la evaluaciónorientados a la toma de decisiones, ni el respon- como el proceso de determinar, obtener ysable de elaborar los currículos u objetivos, como proporcionar información relevante paraen los modelos de consecución de metas. La au- juzgar decisiones alternativas, defendida pordiencia prioritaria son los propios participantes Alkin (1969), Stufflebeam y otros (1971),del programa. La relación entre el evaluador y la MacDonald (1976) y Cronbach (1982).audiencia en palabras de Guba y Lincoln (1982)debe ser «transaccional y fenomenológica». Se Además, el concepto de evaluación de Scri-trata de modelos que propugnan una evaluación ven (1967), como el proceso de estimar elde tipo etnográfica, de aquí que la metodología valor o el mérito de algo, es retomado porque consideran más adecuada es la propia de la Cronbach (1982), Guba y Lincoln (1982), yantropología social (Parlett y Hamilton, 1977; House (1989), con objeto de señalar las dife-Guba y Lincoln, 1982; Pérez 1983). rencias que comportarían los juicios valora- tivos en caso de estimar el mérito (se vincu- Este resumen de modelos de la época de eclo- laría a características intrínsecas de lo que sesión es suficiente para aproximarnos al amplio evalúa) o el valor (se vincularía al uso yabanico conceptual teórico y metodológico que aplicación que tendría para un contexto de-hoy se relaciona con la evaluación. Ello explica terminado).que cuando Nevo (1983 y 1989) pretende realizaruna conceptualización de la evaluación, a partir b) Diferentes criterios. De las definicionesde la revisión de la literatura especializada, aten- apuntadas anteriormente se desprende que eldiendo a los tópicos ¿qué es la evaluación? ¿qué criterio a utilizar para la valoración de la in-funciones tiene? ¿cuál es el objeto de evalua- formación también cambia. Desde la ópticación?... no encuentra una única respuesta a estas de la consecución de metas, una buena ycuestiones. Es fácilmente comprensible que las operativa definición de los objetivos consti-exigencias que plantea la evaluación de progra- tuye el criterio fundamental. Desde la pers-mas de una parte, y la evaluación para la toma de pectiva de las decisiones y situados dentrodecisiones sobre los individuos de otra, conducen de un contexto político, Stufflebeam y cola-a una gran variedad de esquemas evaluativos boradores, Alkin y MacDonald llegan a su-reales utilizados por profesores, directores, ins- gerir incluso la no valoración de la informa-pectores y administradores públicos. Pero tam- ción por parte del evaluador, siendo el quebién es cierto que bajo esta diversidad subyacen toma las decisiones el responsable de su va-diferentes concepciones teóricas y metodológicas loración.sobre la evaluación. Diferentes concepciones que Las definiciones de evaluación que acentú-han dado lugar a una apertura y pluralidad con- an la determinación del «mérito» como obje-ceptual en el ámbito de la evaluación en varios tivo de la evaluación, utilizan criterios es-sentidos (Cabrera, 1986). A continuación desta- tándares sobre los que los expertos o profe-camos los puntos mas sobresalientes de esta plu- sionales están de acuerdo. Se trata de mode-ralidad conceptual. los relacionados con la acreditación y el en- a) Diferentes conceptos de evaluación. Por juiciamiento profesional (Popham, 1980). una parte existe la clásica definición dada por Los autores (Stake, 1975; Parlett y Hamil- Tyler: la evaluación como el proceso de de- ton, 1977; Guba y Lincoln, 1982; House, terminar el grado de congruencia entre las 1983) que acentúan el proceso de evaluación realizaciones y los objetivos previamente es- al servicio de determinar el «valor» más que tablecidos, a la que corresponden los modelos el «mérito» de la entidad u objeto evaluado, orientados hacia la consecución de metas. abogan por que el criterio de valoración fun- Contrasta esta definición con aquella más am- damental sean las necesidades contextuales plia que se propugna desde los modelos orien- en las que ésta se inserta. Así, Guba y Lin-Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 22
  13. 13. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm coln (1982) refieren los términos de la compa- g) Diferencias en el papel jugado por el ración valorativa; de un lado, las característi- evaluador, lo que ha venido a llamarse eva- cas del objeto evaluado y, de otro, las necesi- luación interna vs. evaluación externa. No dades, expectativas y valores del grupo a los obstante, una relación directa entre el eva- que les afecta o con los que se relaciona el ob- luador y las diferentes audiencias de la eva- jeto evaluado. luación es reconocida por la mayoría de los autores (Nevo, 1983; Weiss, 1983; Rutman, c) Pluralidad de procesos evaluativos de- 1984). pendiendo de la percepción teórica que sobre la evaluación se mantenga. Los modelos de h) Pluralidad de audiencia de la evalua- evaluación citados y otros más que pueden en- ción y, por consiguiente, pluralidad en los contrarse en la bibliografía, representan dife- informes de evaluación. Desde informes na- rentes propuestas para conducir una evalua- rrativos, informales, hasta informes muy es- ción. tructurados (Anderson y Ball, 1983). d) Pluralidad de objetos de evaluación. Co- i) Pluralidad metodológica. Las cuestiones mo dice Nevo (1983 y 1989), existen dos con- metodológicas surgen desde la dimensión de clusiones importantes que se obtienen de la la evaluación como investigación evaluativa, revisión de la bibliografía sobre la evaluación. que viene definida en gran medida por la di- Por un lado, cualquier cosa puede ser objeto versidad metodológica. de evaluación y ésta no debería limitarse a es- tudiantes y profesores y, por otro, una clara El anterior resumen recoge las aportaciones identificación del objeto de evaluación es una a la evaluación en los años setenta y ochenta, la importante parte en cualquier diseño de eva- época que se ha denominado época de la pro- luación. fesionalización (Stufflebeam y Skinkfield, 1987; Madaus y otros, 1991; Hernández, 1993; e) Apertura, reconocida en general por todos Mateo y otros, 1993), en la que además de los los autores, de la información necesaria en un innumerables modelos de los setenta, se pro- proceso evaluativo para dar cabida no sólo a fundizó en los planteamientos teóricos y prác- los resultados pretendidos, sino a los efectos ticos y se consolidó la evaluación como inves- posibles de un programa educativo, sea pre- tigación evaluativa en los términos antes defi- tendido o no. Incluso Scriven (1973 y 1974) nida. En este contexto, lógicamente, aparecen propone una evaluación en la que no se tenga muchas nuevas revistas especializadas como en cuenta los objetivos pretendidos, sino valo- Educational Evaluation and Policy Analysis, rar todos los efectos posibles. Apertura tam- Studies in Evaluation, Evaluation Review, New bién respecto a la recogida de información no Directions for Program Evaluation, Evaluation sólo del producto final, sino también sobre el and Program Planning, Evaluation News,..., se proceso educativo. Y apertura en la considera- fundan asociaciones científicas relacionadas ción de diferentes resultados de corto y largo con el desarrollo de la evaluación y las univer- alcance. Por último, apertura también en con- sidades empiezan a ofrecer cursos y programas siderar no sólo resultados de tipo cognitivo, de investigación evaluativa, no sólo en post- sino también afectivos (Anderson y Ball, grados y programas de doctorado, sino también 1983). en planes de estudio para titulaciones de primer y segundo ciclos. f) Pluralidad también reconocida de las fun- ciones de la evaluación en el ámbito educati- 6. La cuarta generación según Guba y vo, recogiéndose la propuesta de Scriven entre Lincoln evaluación formativa y sumativa, y añadiéndo- se otras de tipo socio-político y administrati- A finales de los ochenta, tras todo este vas (Nevo, 1983). desarrollo antes descrito, Guba y Lincoln (1989) ofrecen una alternativa evaluadora, queRevista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 23
  14. 14. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmofrecen una alternativa evaluadora, que denomi- b) Para llevar a cabo lo anterior se necesitanan cuarta generación, pretendiendo superar lo una postura de descubrimiento más que deque según estos autores son deficiencias de las verificación, típica del positivismo.tres generaciones anteriores, tales como una vi-sión gestora de la evaluación, una escasa aten- c) No se tienen en cuenta suficientementeción al pluralismo de valores y un excesivo ape- los factores contextuales.go al paradigma positivista. La alternativa de d) No se proporcionan medios para valora-Guba y Lincoln la denominan respondente y ciones caso por caso.constructivista, integrando de alguna manera elenfoque respondente propuesto en primer lugar e) La supuesta neutralidad de la metodolo-por Stake (1975), y la epistemología postmoder- gía convencional es de dudosa utilidadna del constructivismo (Russell y Willinsky, cuando se buscan juicios de valor acerca de1997). Las demandas, las preocupaciones y los un objeto social.asuntos de los implicados o responsables (stake-holders) sirven como foco organizativo de la Partiendo de estas premisas, el evaluador esevaluación (como base para determinar qué in- responsable de determinadas tareas, que reali-formación se necesita), que se lleva a cabo dentro zará secuencialmente o en paralelo, constru-de los planteamientos metodológicos del para- yendo un proceso ordenado y sistemático dedigma constructivista. trabajo. Las responsabilidades básicas del eva- luador de la cuarta generación son las siguien- La utilización de las demandas, preocupaciones tes:y asuntos de los implicados es necesaria, segúnGuba y Lincoln, porque: 1) Identificar todos los implicados con riesgo en la evaluación. a) Son grupos de riesgo ante la evaluación y sus problemas deben ser convenientemente 2) Resaltar para cada grupo de implicados contemplados, de manera que se sientan pro- sus construcciones acerca de lo evaluado y tegidos ante tal riesgo. sus demandas y preocupaciones al respecto. b) Los resultados pueden ser utilizados en su 3) Proporcionar un contexto y una metodo- contra en diferentes sentidos, sobre todo si es- logía hermenéutica para poder tener en cuen- tán al margen del proceso. ta, comprender y criticar las diferentes cons- trucciones, demandas y preocupaciones. c) Son potenciales usuarios de la informa- ción resultante de la evaluación. 4) Generar el máximo acuerdo posible acerca de dichas construcciones, demandas y d) Pueden ampliar y mejorar el rango de la preocupaciones. evaluación. 5) Preparar una agenda para la negociación e) Se produce una interacción positiva entre acerca de temas no consensuados. los distintos implicados. 6) Recoger y proporcionar la información El cambio paradigmático lo justifican estos necesaria para la negociación.autores porque: 7) Formar y hacer de mediador para un a) La metodología convencional no contem- «forum» de implicados para la negociación. pla la necesidad de identificar las demandas, preocupaciones y asuntos de los implicados. 8) Desarrollar y elaborar informes para ca- da grupo de implicados sobre los distintos acuerdos y resoluciones acerca de los intere-Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 24
  15. 15. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm ses propios y de los de otros grupos (Stake, •Consecución de facilidades y acceso a la 1986; Zeller, 1987). información (Lincoln y Guba, 1985). 9) Reciclar la evaluación siempre que queden 3) Identificación de las audiencias (Guba y asuntos pendientes de resolución. Lincoln, 1982). La propuesta de Guba y Lincoln (1989) se ex- •Agentes.tiende bastante en la explicación de la naturalezay características del paradigma constructivista en •Beneficiarios.contraposición con las del positivista. •Victimas. Cuando se habla de los pasos o fases de la eva- 4) Desarrollo de construcciones conjuntasluación en esta cuarta generación, sus proponen- dentro de cada grupo o audiencia (Glaser ytes citan doce pasos o fases, con diferentes subfa- Strauss, 1967; Glaser, 1978; Lincoln y Gu-ses en cada una de estas. Estos pasos son los si- ba, 1985).guientes: 5) Contraste y desarrollo de las construc- 1) Establecimiento de un contrato con un pa- ciones conjuntas de las audiencias. trocinador o cliente. •Documentos y registros. •Identificación del cliente o patrocinador de la evaluación. •Observación. •Identificación del objeto de la evaluación. •Literatura profesional. •Propósito de la evaluación (Guba y Lin- •Círculos de otras audiencias. coln, 1982). •Construcción ética del evaluador. •Acuerdo con el cliente por el tipo de eva- luación. 6) Clasificación de las demandas, preocu- paciones y asuntos resueltos. •Identificación de audiencias. 7) Establecimiento de prioridades en los •Breve descripción de la metodología a temas no resueltos. usar. 8) Recogida de información. •Garantía de acceso a registros y documen- tos. 9) Preparación de la agenda para la nego- ciación. •Acuerdo por garantizar la confidenciali- dad y anonimato hasta donde sea posible. 10) Desarrollo de la negociación. •Descripción del tipo de informe a elabo- 11) Informes (Zeller, 1987; Licoln y Guba, rar. 1988). •Listado de especificaciones técnicas. 12) Reciclado/revisión. 2) Organización para reciclar la investiga- Para juzgar la calidad de la evaluación, se ción. nos ofrecen tres enfoques que se denominan paralelo, el ligado al proceso hermenéutico y •Selección y entrenamiento del equipo eva- el de autenticidad. luador.Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 25
  16. 16. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm Los criterios paralelos, de confianza, se deno- b) La evaluación es un proceso conjunto deminan así porque intentan ser paralelos a los cri- colaboración.terios de rigor utilizados muchos años dentro delparadigma convencional. Estos criterios han sido c) la evaluación es un proceso de enseñan-validez interna y externa, fiabilidad y objetivi- za/aprendizaje.dad. Sin embargo, los criterios deban ser acordes d) La evaluación es un proceso continuo,con el paradigma fundamentador (Morgan, recursivo y altamente divergente.1983). En el caso de la cuarta generación loscriterios que se ofrecen son los de credibilidad, e) La evaluación es un proceso emergente.transferencia, dependencia y confirmación (Lin-coln y Guba, 1986). f) La evaluación es un proceso con resul- tados impredecibles. El criterio de credibilidad es paralelo al de va-lidez interna, de forma que la idea de isomorfis- g) La evaluación es un proceso que creamo entre los hallazgos y la realidad se reemplaza realidad.por el isomorfismo entre las realidades construi-das de las audiencias y las reconstrucciones del En esta evaluación, se retienen las caracterís-evaluador atribuidas a ellas. Para conseguir esto ticas del evaluador fruto de las tres primerasexisten varias técnicas, entre las que destacan las generaciones, esto es, la de técnico, la de ana-siguientes: a) el compromiso prolongado, b) la lista y la de juez, pero estas deben ampliarseobservación persistente, c) el contraste con cole- con destrezas para recoger e interpretar datosgas, d) el análisis de casos negativos (Kidder, cualitativos (Patton, 1980), con la de historia-1981), e) la subjetividad progresiva y f) el con- dor e iluminador, con la de mediador de jui-trol de los miembros. La transferencia puede cios, así como un papel más activo como eva-verse como paralela a la validez externa, la de- luador en un contexto socio-político concreto.pendencia es paralela al criterio de fiabilidad y la Russell y Willinsky (1997) defienden las po-confirmación puede verse como paralela a la tencialidades del planteamiento de la cuartaobjetividad. generación para desarrollar formulaciones al- Otra manera de juzgar la calidad de la evalua- ternativas de práctica evaluadora entre los im-ción es el análisis dentro del propio proceso, algo plicados, incrementando la probabilidad de queque encaja con el paradigma hermenéutico, a la evaluación sirva para mejorar la enseñanzatravés de un proceso dialéctico. escolar. Esto requiere por parte del profesorado el reconocimiento de otras posiciones, además Pero estos dos tipos de criterios, aunque útiles, de la suya, la implicación de todos desde elno son del todo satisfactorios para Guba y Lin- principio del proceso y, por otra parte, el desa-coln, que defienden con más ahínco los criterios rrollo de aproximaciones más pragmáticas deque denominan de autenticidad, también de base la conceptualización de Guba y Lincoln, adap-constructivista. Estos criterios incluyen los si- tadas a las distintas realidades escolares.guientes: a) imparcialidad, justicia, b) autentici-dad ontológica, c) autenticidad educativa, d) au- 7. El nuevo impulso alrededor de Stuf-tenticidad catalítica y e) autenticidad táctica flebeam(Lincoln y Guba, 1986). Para terminar este recorrido analítico- Este análisis de la cuarta generación de pode- histórico desde los primeros intentos de medi-mos terminarlo con los rasgos con los que defi- ción educativa hasta la actual investigaciónnen Guba y Lincoln a la evaluación: evaluativa en educación, queremos recoger las recomendaciones que más recientemente nos a) La evaluación es un proceso sociopolítico. viene ofreciendo una de las figuras señeras de este campo en la segunda mitad del siglo XX.Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 26
  17. 17. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htmNos estamos refiriendo a Daniel L. Stufflebeam, Para evaluar la educación en una sociedadproponente del modelo CIPP (el más utilizado) a moderna, Stufflebeam (1994) nos dice que sefinales de los sesenta, desde 1975 a 1988 presi- deben tomar algunos criterios básicos de refe-dente del «Joint Committee on Standars for Edu- rencia como los siguientes:cational Evaluation» y actual director del «Eva-luation Center» de la Western Michigan Univer- • Las necesidades educativas. Es necesariosity (sede del Joint Committee) y del CREATE preguntarse si la educación que se propor-(Center for Research on Educational Accounta- ciona cubre las necesidades de los estudian-bility and Teacher Evaluation), centro auspiciado tes y de sus familias en todos los terrenos ay financiado por el Departamento de Educación la vista de los derechos básicos, en este caso,del gobierno americano. dentro de una sociedad democrática (Nowa- kowski y otros, 1985). Recogiendo estas recomendaciones (Stuffle-beam, 1994, 1998, 1999, 2000 y 2001), en las • La equidad. Hay que preguntarse si el sis-que se han ido integrando ideas de diversos eva- tema es justo y equitativo a la hora de pro-luadores también notables, no sólo ofrecemos porcionar servicios educativos, el acceso auna de las últimas aportaciones a la actual con- los mismos, la consecución de metas, el de-cepción de la investigación evaluativa en educa- sarrollo de aspiraciones y la cobertura paración, sino que completamos en buena medida la todos los sectores de la comunidad (Kella-visión del panorama actual, rico y plural, tras gan, 1982).analizar la cuarta generación de Guba y Lincoln. • La factibilidad. Hay que cuestionar la efi- Se parte de los cuatro principios del Joint ciencia en la utilización y distribución de re-Committee (1981 y 1988), esto es, de la idea de cursos, la adecuación y viabilidad de lasque cualquier buen trabajo de investigación eva- normas legales, el compromiso y participa-luativa debe ser: a) útil, esto es, proporcionar ción de los implicados y todo lo que haceinformación a tiempo e influir, b) factible, esto que el esfuerzo educativo produzca eles, debe suponer un esfuerzo razonable y debe máximo de frutos posibles.ser políticamente viable, c) apropiada, adecua- • La excelencia como objetivo permanenteda, legítima, esto es, ética y justa con los impli- de búsqueda. La mejora de la calidad, a par-cados, y d) segura y precisa a la hora de ofrecer tir del análisis de las prácticas pasadas y pre-información y juicios sobre el objeto de la eva- sentes es uno de los fundamentos de la in-luación. Además, la evaluación se ve como una vestigación evaluativa.«transdisciplina», pues es aplicable a muchasdisciplinas diferentes y a muchos objetos diver- Tomando el referente de estos criterios y sussos (Scriven, 1994). derivaciones, Stufflebeam sumariza una serie de recomendaciones para llevar a cabo buenas Stufflebeam invoca a la responsabilidad del investigaciones evaluativas y mejorar el siste-evaluador, que debe actuar de acuerdo a princi- ma educativo. Estas recomendaciones son laspios aceptados por la sociedad y a criterios de siguientes:profesionalidad, emitir juicios sobre la calidad yel valor educativo del objeto evaluado y debe 1) Los planes de evaluación deben satisfa-asistir a los implicados en la interpretación y cer los cuatro requerimientos de utilidad,utilización de su información y sus juicios. Sin factibilidad, legitimidad y precisión (Jointembargo, es también su deber, y su derecho, estar Committee, 1981 y 1988).al margen de la lucha y la responsabilidad políti-ca por la toma de decisiones y por las decisiones 2) Las entidades educativas debentomadas. examinarse por su integración y servicio a los principios de la sociedad democrática, equidad, bienestar, etc.Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 27
  18. 18. Escudero Escorza, T. (2003). Desde los tests hasta la investigación evaluativa actual. Un siglo, el XX, de intesodesarrollo de la evaluación en educación. RELIEVE:, v. 9, n. 1, p. 11-43.http://www.uv.es/RELIEVE/v9n1/RELIEVEv9n1_1.htm 3) Las entidades educativas deben ser valo- 9) La evaluación del contexto (necesida- radas tanto por su mérito (valor intrínseco, ca- des, oportunidades, problemas en un área,...) lidad respecto a criterios generales) como por debe emplearse de manera prospectiva, para su valor (valor extrínseco, calidad y servicio localizar bien las metas y objetivos y definir para un contexto particular) (Guba y Lincoln, prioridades. Asimismo, la evaluación del 1982; Scriven, 1991), como por su significa- contexto debe utilizarse retrospectivamente, ción en la realidad del contexto en el que se para juzgar bien el valor de los servicios y ubica. Scriven (1998) nos señala que usando resultados educativos, en relación con las otras denominaciones habituales, mérito tiene necesidades de los estudiantes (Madaus y bastante equivalencia con el término calidad, otros, 1991; Scriven, 1991) valor con el de relación coste-eficacia y signi- ficación con el de importancia. En todo caso, 10) La evaluación de las entradas (inputs) los tres conceptos son dependientes del con- debe emplearse de manera prospectiva, para texto, sobre todo significación, de manera que asegurar el uso de un rango adecuado de en- entender la diferencia entre dependencia del foques según las necesidades y los planes. contexto y arbitrariedad es parte de la com- 11) La evaluación del proceso debe usarse prensión de la lógica de la evaluación. de manera prospectiva para mejorar el plan 4) La evaluación de profesores, instituciones de trabajo, pero también de manera retros- educativas, programas, etc, debe relacionarse pectiva para juzgar hasta qué punto la cali- siempre con el conjunto de sus deberes, res- dad del proceso determina el por qué los re- ponsabilidades y obligaciones profesionales o sultados son de un nivel u otro (Stufflebean institucionales, etc. Quizás uno de los retos y Shinkfield, 1987). que deben abordar los sistemas educativos es 12) La evaluación del producto es el medio la definición más clara y precisa de estos de- para identificar los resultados buscados y no beres y responsabilidades. Sin ello, la eva- buscados en los participantes o afectados por luación es problemática, incluso en el terreno el objeto evaluado. Se necesita una valora- formativo (Scriven, 1991a). ción prospectiva de los resultados para 5) Los estudios evaluativos deben ser capa- orientar el proceso y detectar zonas de nece- ces de valorar hasta qué medida los profesores sidades. Se necesita una evaluación retros- y las instituciones educativas son responsables pectiva del producto para poder juzgar en y rinden cuentas del cumplimiento de sus de- conjunto el mérito y el valor del objeto eva- beres y obligaciones profesionales (Scriven, luado (Scriven, 1991; Webster y Edwards, 1994). 1993; Webster y otros, 1994). 6) Los estudios evaluativos deben proporcio- 13) Los estudios evaluativos se deben apo- nar direcciones para la mejora, porque no bas- yar en la comunicación y en la inclusión sus- ta con emitir un juicio sobre el mérito o el va- tantiva y funcional de los implicados (stake- lor de algo. holders) con las cuestiones claves, criterios, hallazgos e implicaciones de la evaluación, 7) Recogiendo los puntos anteriores, todo es- así como en la promoción de la aceptación y tudio evaluativo debe tener un componente el uso de sus resultados (Chelimsky, 1998). formativo y otro sumativo. Más aún, los estudios evaluativos deben conceptualizarse y utilizarse 8) Se debe promover la autoevaluación pro- sistemáticamente como parte del proceso de fesional, proporcionando a los educadores las mejora educativa a largo plazo (Alkin y destrezas para ello y favoreciendo actitudes otros, 1979; Joint Committee, 1988; Stronge positivas hacia ella (Madaus y otros, 1991) y Helm, 1991; Keefe, 1994) y de fundamento para la acción contra las discriminaciones sociales (Mertens, 1999).Revista ELectrónica de Investigación y EValuación Educativa [ www.uv.es/RELIEVE ] pag. 28

×