CAPÍTULO DIEZ
EVALUACIÓN DE HABILIDADESESPECIALES
El término aptitud se ha definido tradicionalmente como la habilidad de aprovechar la educación o capacitación obtenida en un campo determinado, mientras que aprovechamiento se refiere al grado de habilidad ya obtenida. La medida de la aptitud se centra en el futuro, la del aprovechamiento en el pasado. Así, las pruebas de aptitud se han diseñado sobre todo para evaluar el aprovechamiento potencial o para predecir el desempeño futuro en algún campo o intento.
Las habilidades de una persona se evalúan con fines de asesoría y colocación académica y laboral. Con información sobre una prueba de aptitud en mano, los asesores o jefes de personal pueden mejorar su trabajo al aconsejar a las personas o ubicarlas en los programas apropia-dos de educación y capacitación o en puestos de trabajo adecuados.
CONCEPTOS Y CARACTERÍSTICAS DE LAS HABILIDADES ESPECIALES
En cierto sentido, el término aptitud no es acertado si se pretende interpretar como una característica innata, inmutable por medirse. Los primeros evaluadores de la mente aspiraban a medir características hereditarias, pues suponían que todas las personas que examinaban tenían las mismas oportunidades para aprovechar las experiencias en que se basaban los materiales de prueba. No obstante, esta suposición era incorrecta: las experiencias, y por ende las oportunidades para aprender, nunca son exactamente iguales para personas distintas, sobre todo si las personas provienen de clases sociales o culturas diferentes.
En la actualidad, generalmente se reconoce que las pruebas de aptitud son medidas de aprovechamiento, un producto complejo de la interacción entre influencias hereditarias y ambientales. A la inversa, si las pruebas de aptitud son instrumentos psicométricos que pueden predecir el logro futuro, entonces las pruebas de aprovechamiento que prefiguran las notas escolares y otros criterios también califican como medidas de habilidad.
Debido a la confusión sobre la diferencia entre aptitud y logro, se ha recomendado que ambos términos se reemplacen con el término único de habilidad. Entonces, dependiendo del propósito para el que se utilice —evaluar el conocimiento y la comprensión presentes o pronosticar el desempeño futuro—, una prueba de habilidad puede ser tanto una medida de aprovechamiento como de aptitud. Pero podría ser un error suponer que la distinción entre aptitud y aprovechamiento carece de consecuencias. Como ejemplo de la diferencia funcional entre medidas de estas dos variables, considérense los resultados de un estudio realizado por Carroll (1973). Se descubrió que el desempeño en un curso de lengua extranjera para estudiantes cuyas calificaciones anteriores al curso en una prueba de aprovechamiento de lengua fueron de cero, podría predecirse a partir de las calificaciones en una prueba de aptitud para aprender lenguas extranjeras. Al final del curso ambas pruebas se aplicaron de nuevo. Como podría esperarse, si la capacitación había mejorado el aprovechamiento sin alterar la aptitud, las calificaciones de la prueba de aprovechamiento aumentaron considerablemente, pero las calificaciones en las pruebas de aptitud permanecieron sin modificaciones en lo esencial.
Habilidades generales y específicas
Las pruebas de inteligencia analizadas en los capítulos 7, 8 y 9 son medidas de aptitud general,en cuanto a que las calificaciones en esas pruebas representan un compuesto de habilidades cognoscitivas que puede usarse para predecir el aprovechamiento y otros comportamientos en un amplio espectro de situaciones. De hecho, las calificaciones en las pruebas de inteligencia general a menudo son mejores para predecir el éxito en situaciones educativas y laborales que las calificaciones combinadas en medidas de habilidades especiales. Pero el que las pruebas de inteligencia general midan una mezcolanza de aptitudes o habilidades específicas es una espada de dos filos.En este hecho radican tanto las ventajas como las deficiencias de estos tipos de pruebas.
Debido a que las pruebas de inteligencia miden una combinación de habilidades, tienen lo que Cronbach (1970) llamaba una extensa amplitud de banda. Una ventaja de su amplio contenido es que las pruebas de inteligencia son moderadamente eficaces para pronosticar un amplio espectro de criterios de desempeño. Una prueba más extensa de sólo una de las habilidades especiales medidas por una prueba de inteligencia, es decir, un instrumento con una amplitud de banda más angosta, al parecer tiene una mayor fidelidad. En otras palabras, se esperaría que midiera una variable específica con mayor precisión y predijera mejor un espectro menor de criterios.
Al observar las correlaciones positivas significativas entre las medidas de habilidades,Vernon (1960) concluyó que la inteligencia general es más importante que las habilidades especiales para determinar el éxito laboral (vea también Hunter y Schmidt, 1996). En la medida en que esto sea cierto, probablemente se deba a que los criterios del éxito laboral, como las calificaciones de las pruebas de inteligencia, son productos complejos de múltiples variables. En otras palabras, los criterios laborales tienen una amplitud de banda extensa y, por lo tanto, mayor probabilidad de predecirse con más precisión a partir de una combinación de medidas, más que por calificaciones de una única prueba de habilidades especiales.
Orígenes de la evaluación vocacional
Un acontecimiento que impulsó el desarrollo de pruebas de habilidades especiales durante las décadas de 1920 y 1930 fue el crecimiento de la administración científica. Quienes promovían la administración científica en los negocios y la industria consideraban que tanto los empleados como los jefes se beneficiarían con el diseño de pruebas psicológicas que pudieran contribuir a conjuntar personas y puestos de trabajo. Sostenían que el uso de pruebas daría como resultado que se eligieran empleados para, y se ubicaran en, los empleos que pudieran desempeñar con mayor eficiencia. Seleccionar empleados más competentes y asignarles puestos para los que fuesen más aptos, incrementando la productividad, beneficiaría tanto a empleados como a empleadores, y a la organización en su totalidad.
Durante los años de la Gran Depresión en la década de 1930, cuando los asuntos relacionados con el empleo eran de particular interés para el gobierno, los programas de investigación y desarrollo en la Universidad de Minnesota, y en otros sitios, dieron origen a la construcción de una serie de pruebas de habilidades especiales para usarse en consejería vocacional y selección y colocación de empleados. A partir de estos programas y de subsecuentes esfuerzos se crearon no sólo numerosas medidas de habilidades individuales, sino también varias baterías de pruebas.
Validez de las pruebas de habilidades especiales
Debido a que las pruebas de aptitudes o de habilidades especiales se diseñan teniendo en mente una predicción diferencial, es razonable preguntarse qué tanto lograrán predecir quién tendrá éxito y quién fracasará en ocupaciones o programas de capacitación particulares. Es decir,¿exactamente qué tan válidas son las pruebas de aptitud vocacional? La respuesta es que, en general, la validez de estas pruebas no es muy elevada. Como se muestra en la tabla 10.1, los coeficientes de validez promedio de diferentes tipos de pruebas de aptitud para predecir el desempeño en varias categorías de empleos suelen encontrarse en los .20 y casi nunca por encima de los .30 (Ghiselli, 1973). Estos coeficientes tan modestos dan puntuaciones más bajas a las limitaciones de estos tipos de pruebas para predecir el desempeño en el trabajo.
Además de las características de las pruebas mismas, la validez resulta alterada por problemas en los criterios para especificar y medir el éxito en el trabajo. Los acontecimientos incidentales o fortuitos que no se previeron, tales como los cambios económicos y sociales que influyen en la situación del empleo, pueden afectar la validez predictiva de las pruebas en contextos institucionales o industriales. A pesar de sus limitaciones, tales pruebas todavía pueden colaborar en la determinación de la ocupación o el programa de capacitación más adecuado para una persona dada. Ciertamente, las pruebas son limitadas cuando se usan solas, pero su valor aumenta cuando se combinan las calificaciones con otro tipo de información (intereses, motivación, actitudes y cuestiones similares) sobre las personas.
Ni siquiera los coeficientes de validez relativamente modestos de la mayoría de las pruebas de habilidades especiales están establecidos: varían con el carácter del criterio, la situación y las personas examinadas. Por ejemplo, es probable que un coeficiente de validez sea más alto cuan-do en un programa de capacitación se valida una prueba contra los grados alcanzados que cuando se valida contra las tasas del desempeño real en el trabajo (vea la tabla 10.1). Un coeficiente de validez también tiende a ser más alto cuando la prueba se administra y los datos del criterio se unifican en un lapso bastante breve que cuando hay una gran demora entre la aplicación de la prueba y la unificación de los datos de criterio.
TABLA 10.1 Correlaciones entre pruebas de habilidad y criterios ocupacionales
Se advierte variabilidad situacional en el coeficiente de validez cuando la correlación entre calificaciones en una prueba de habilidad y las tasas del desempeño son menores en una organización que en otra. Sin embargo, la investigación ha demostrado que muchas pruebas de selección de empleos tienen una gran cantidad de generalización de validez; es decir, son válidas a través de una amplia gama de situaciones (vea, por ejemplo Hunter y Schmidt, 1990; Schmidt et al., 1993; Schmidt, Ones y Hunter, 1992). Sin embargo, la validez de una prueba varía en cierto grado según la situación y las características de las personas que se examinan. Puede variar de acuerdo con el sexo, la etnia y la condición socioeconómica de los examinados, así como con sus intereses vocacionales, motivación y característica de personalidad. Tales diferencias individuales y por grupo, que influyen o moderan la correlación entre una prueba y una medida de criterio, se denominan variables moderadoras.
Las instituciones son como las personas en cuanto a que sienten la motivación no sólo de sobrevivir, sino de crecer; de hecho, en nuestra dinámica sociedad las instituciones deben expandirse o, a largo plazo, fracasarán. En consecuencia, desde la perspectiva de la institución, un factor importante al decidir usar una prueba específica para seleccionar, ubicar o promover al personal es determinar si la prueba contribuye al bienestar económico de la organización. El costo de aplicar la prueba debe sopesarse contra los beneficios que se obtendrán al usarla, y los estudios sobre la validez de la prueba pueden ayudar a medir estos beneficios. Una prueba no sólo debe ser un pronosticador eficiente y válido del desempeño en el trabajo, también deberá ser un pronosticador independientemente válido. ¿Por qué usar la prueba si hay disponibles métodos más baratos de identificar buenos trabajadores y de prever cómo se desempeñarán?
El beneficio económico para la institución no es, desde luego, la única razón que lleva a determinar la validez de una prueba para un fin específico en una situación determinada. Una razón legal importante que justifica llevar a cabo estudios de validez en las empresas y la industria se concentra en el problema del sesgo o la justicia. Por ejemplo, puede ser que la correlación entre prueba y criterio sea considerablemente más alta con un grupo étnico o de género que con otro. De ser así, es injusto usar la misma ecuación de predicción con ambos grupos. La justicia, o relativa carencia de sesgo, de la prueba tiene que demostrarse si se planea usarla con propósitos de selección o de clasificación.
El desempeño y las pruebas de lápiz y papel
Las primeras pruebas de habilidades especiales eran pruebas de desempeño que demandaban a los examinados construir algo o manipular objetos físicos de una forma determinada. Tales pruebas de aparatos con frecuencia son más interesantes que las pruebas de lápiz y papel, en especial para los examinados con problemas de lectura. Pero las confiabilidades de las pruebas de desempeño de velocidad suelen ser menores que las de las pruebas comparables de lápiz y papel, y las pruebas requieren de mucho tiempo y son costosas de aplicar. Asimismo, las correlaciones entre calificaciones en las pruebas de desempeño y las medidas de lápiz y papel para la misma habilidad están lejos de ser perfectas. A pesar de las desventajas de las pruebas de desempeño, las pruebas de muestras de trabajo (o pruebas de réplica del empleo), que demandan a los examinados realizar una muestra de tareas similares a las que comprende determinado trabajo,se encuentran entre las medidas de habilidad más útiles en contextos ocupacionales específicos.
Técnica de charola de pendientes y centros de evaluación
Un ejemplo interesante de una prueba de muestras de trabajo es la técnica de charola de pendientes. Este procedimiento se diseñó originalmente para evaluar al personal administrativo de las escuelas, pero posteriormente se usó con otro tipo de administradores o ejecutivos. En una prueba de charola de pendientes, los candidatos a un puesto administrativo reciben una muestra de problemas del tipo que suele encontrarse en la lista de pendientes de un administrador (car-tas, memorandos, notas, lineamientos, informes, mensajes telefónicos, correos electrónicos, faxes) y requieren de algún tipo de acción. A dichos candidatos se les solicita indicar qué medida debe tomarse en cada uno de los casos, y sus respuestas se evalúan de acuerdo con juicios de expertos sobre lo apropiado de las soluciones.
El método denominado centros de evaluación, introducido por la Compañía de Teléfonos y Telégrafos de Estados Unidos en la década de 1950, combina la técnica de charola de pendientes con otras tareas de simulación, tales como juegos de administración y ejercicios de resolución de problemas en grupo (como en la Prueba de Discusión en Grupo sin Líder). En este método también se utilizan entrevistas, pruebas psicológicas y otros procedimientos de evaluación. El centro de evaluación se ha empleado menos como una técnica de selección que como una forma de evaluar el personal de nivel gerencial para promoción y clasificación. Se instalan entre seis y doce candidatos en una ubicación específica, donde son observados y evaluados por otros ejecutivos entre sí durante varios días. Los principales criterios de examen son el grado de participación activa, las habilidades de organización y la habilidad para tomar decisiones.
Debido a que la técnica de charola de pendientes y otras tareas de simulación son realistas, podría parecer que resultan sumamente válidas. No obstante, los candidatos están conscientes de encontrarse “en un escenario” y pueden desempeñar cierto papel o comportarse de manera diferente a como lo harían en una situación administrativa real. Los gastos y las limitaciones de tiempo también impiden usar dichas técnicas de simulación para fines distintos a la evaluación de personal de gerencia de nivel bastante alto.
HABILIDADES SENSORIO-PERCEPTIVAS Y PSICOMOTRICES
Es importante, y en muchos casos está estipulado por el gobierno y otras organizaciones, que se evalúen periódicamente las habilidades sensorio-perceptivas y psicomotrices tanto de niños como de adultos. Excepto en casos de grandes deficiencias, no siempre es patente la presencia de un defecto en el funcionamiento físico. Dependiendo de que la desventaja pueda corregirse o compensarse y del grado en que afecte el desempeño en el trabajo, un aspirante a una institución educativa o empleo puede o no ser admitido o contratado. Sin embargo, la práctica actual, apoyada por el Acta de Estadounidenses con Discapacidad (ADA), favorece la contratación o admisión de personas con discapacidades y la adopción de medidas para reducir al mínimo los efectos debilitantes de sus desventajas.
Pruebas de visión y audición
La agudeza tanto visual como auditiva puede verificarse mediante distintos tipos de pruebas, algunas de las cuales (tabla de Snellen, prueba de observación) son muy sencillas y otras (oftalmoscopio, audiómetro) mucho más complejas. Usualmente, un maestro o un asistente de personal pueden aplicar pruebas sencillas de la vista y la audición, pero un examen más a fondo requiere los servicios de un optometrista, oftalmólogo o audiólogo profesional.
Un examen de la vista completo incluye pruebas de agudeza cercana y lejana para cada ojo y para ambos ojos juntos, el equilibrio muscular de los ojos a distancias cercanas y lejanas,percepción de profundidad y visión del color. Instrumentos tales como la Prueba de Visión B yL (de Bausch y Lomb) se han usado para revisiones de la vista en contextos industriales. Los resultados de la evaluación con estos instrumentos se evalúan en términos de diversas familias de trabajos visuales, dependiendo de qué habilidades visuales son esenciales para cada ocupación en particular. Una prueba de visión del color común consiste en una serie de cartas seudo isocromáticas que contienen un número o diseño formado por puntos coloreados contra un fondo depuntos contrastantes. La Prueba Dvorine de Visión del Color (The Psychological Corporation)es una prueba de este tipo de amplio uso.
Igual que una buena visión, un buen oído es importante en muchas ocupaciones, en particular en empleos como el de operador de sonares. La agudeza auditiva puede determinarse agrandes rasgos mediante una prueba de reloj,(2) pero una prueba profesional de audición implica el uso de un audiómetro. Los resultados de una prueba audiométrica se trazan en forma de gráfica (audiograma) donde se muestra la sensibilidad de cada oído a los tonos puros, los cuales cu-bren el rango de frecuencia de la audición humana. También puede determinarse la habilidad del individuo para ubicar la dirección de donde provienen los sonidos. Otra característica importante de la audición es la habilidad de discriminar entre estímulos de diferente tono o volumen.
Pruebas de habilidades psicomotrices
Las pruebas de habilidades psicomotrices figuraron entre las primeras medidas de habilidades especiales que se elaboraron. Muchas de las pruebas disponibles de este tipo se introdujeron en las décadas de 1920 y 1930 para predecir el desempeño en ciertos empleos u oficios calificados. Posteriormente, el Centro de Investigación de Capacitación y Personal de la Fuerza Aérea estadounidense realizó un amplio estudio de las habilidades psicomotrices que incluye el desempeño como piloto. De particular importancia en estos análisis era el desempeño en simuladores de vuelo como el Capacitador de Vínculo y la Prueba de Coordinación Compleja. En esta última el examinando usa un timón y tres controles similares a un bastón para ajustarse a un patrón de luces de estímulo que aparecen sobre un panel vertical para simular los movimientos de un aeroplano en vuelo.(3)
La velocidad, la fuerza y la agilidad, en conjunto, contribuyen al desempeño motriz efectivo. Las mediciones de estas características se usan ampliamente para seleccionar trabajadores en varios tipos de empleos y son pronosticadores válidos del desempeño en el trabajo físicamente demandante (vea Blakley, Quinones, Crawford y Jago, 1994; Hogan y Quigley, 1994). Además de las medidas de fuerza isométrica, están disponibles pruebas de precisión y estabilidad que implican varias manipulaciones con dedos, manos, brazos y piernas. Algunas de estas pruebas requieren de movimientos musculares pequeños, otras de movimientos grandes y otras más exigen tanto movimientos pequeños como grandes.
(2)En esta prueba, dependiendo de lo silenciosa que se encuentre la habitación del examen, una persona con oído normal debería ser capaz de oír el tic tac de un “reloj tamaño dólar” a una distancia de entre 75 cm y 1 m del oído.
(3)En las páginas 38-50 de Fleishman y Reilly (1995) se presentan ejemplos de pruebas de diez habilidades psicomotrices (precisión de control, coordinación multiextremidades, orientación de la respuesta, control de tasas, tiempo de reacción, estabilidad brazo-mano, destreza manual, destreza de los dedos, velocidad muñeca-dedo, movimiento de velocidad de extremidades). En las páginas 51-60 de la misma fuente se incluyen ejemplos de pruebas de nueve habilidades físicas(fuerza estática, fuerza explosiva, fuerza dinámica, fuerza del tronco, flexibilidad de extensión, flexibilidad dinámica, coordinación corporal gruesa, equilibrio corporal grueso, vigor).
Para ilustrar las pruebas psicomotrices disponibles, a continuación se describirán algunas medidas seleccionadas de movimientos gruesos, finos o de una combinación de ambos tipos. La mayoría de estos instrumentos son apropiados tanto para adolescentes como para adultos, y se califican en términos de la cantidad de unidades de tarea terminadas en un tiempo específico o el lapso requerido para completar toda la tarea.
Movimientos manuales gruesos. Dos antiguas pruebas diseñadas para medir velocidad y precisión en los movimientos gruesos de dedos, manos y brazos son la Prueba Stromberg de Destreza (The Psychological Corporation) y la Prueba Minnesota de Índice de Manipulación (American Guidance Services). En la Prueba Stromberg de Destreza, se solicita al examinando colocar 54 discos de colores (rojo, amarillo, azul) del tamaño de una galleta en una secuencia preestablecida tan rápidamente como pueda (figura 10.1). Esta prueba se ha usado como medida de destreza manual en trabajadores de lavanderías, operadores de prensas cortadoras, moldeadores de máquinas, ensambladores y soldadores. La Prueba Minnesota de Índice de Manipulación consiste en un tablero de 60 orificios con bloques que son rojos por un lado y amarillos por el otro. La prueba se divide en cinco subpruebas, en las cuales los bloques se giran, mueven y colocan de ciertas maneras. En la parte de la Prueba de Colocación, por ejemplo,se colocan los bloques en los orificios del tablero; en la parte de Prueba de Giro, los bloques se giran y reemplazan en el tablero.
FIGURA 10.1 Prueba Stromberg de Destreza.
Movimientos manuales finos. Como representativas de las pruebas que requieren de manipulación de partes pequeñas figuran la prueba del Tablero de Clavijas Purdue (NCS London Hou-se) y la Prueba Crawford de Destreza con Partes Pequeñas (The Psychological Corporation). Se ha descubierto que las calificaciones de estas pruebas tienen correlaciones significativas con el desempeño en ocupaciones como mecánico de instrumentos, grabador, aguafuertista, ensamblador de electrónica de precisión y reparador de relojes.El Tablero de Clavijas Purdue consiste en cinco tareas (mano derecha, mano izquierda,ambas manos, ensamblado de mano derecha más izquierda más ambas manos) para medir la destreza de mano-dedo-brazo requerida para ciertos tipos de trabajo manual. En la primera par-te de la prueba, el examinando introduce alfileres en orificios, primero con la mano derecha, después con la izquierda, y al final con ambas manos. En la segunda parte, el examinando introduce un alfiler en un orificio, coloca una arandela y un aro sobre el alfiler, coloca otro alfiler en un orificio, y así sucesivamente (figura 10.2).
FIGURA 10.2 Tablero de Clavijas Purdue
La Prueba Crawford de Destreza con Partes Pequeñas, que es una medida de la coordina-ción ojo-mano y de la destreza motriz fina, consta de dos partes. En la primera parte, el examinando utiliza pinzas para insertar alfileres en orificios y colocar aros sobre ellos. En la segunda parte coloca tornillos en orificios de rosca y los atornilla con un destornillador (figura 10.3).
FIGURA 10.3 Prueba Crawford de Destreza con PartesPequeñas, parte II.
Movimientos manuales gruesos y finos. La Prueba Bennett de Destreza Mano-Herramienta (The Psychological Corporation) es una prueba de habilidades psicomotrices que combina la destreza de los dedos con movimientos gruesos de los brazos. En esta prueba se solicita al examinando que primero saque 12 tuercas de 12 tornillos de tres tamaños diferentes montados sobre el lado izquierdo de un marco, y que después atornille de nuevo las tuercas y tornillos en el lado derecho del marco (figura 10.4). Las calificaciones consisten en el tiempo necesario para completar la tarea. En el manual se presentan las normas para administrar esta prueba a diversos grupos de aspirantes industriales.
FIGURA 10.4 Prueba Bennett de Destreza Mano-Herramienta.
Confiabilidad y validez de las pruebas de psicomotricidad
La confiabilidad de las pruebas de habilidades psicomotrices es inferior en promedio (.70 y .80)a la de otras pruebas de habilidades especiales. Una de las razones para que los coeficientes de confiabilidad resulten relativamente bajos en las pruebas de habilidades psicomotrices es que las calificaciones son sumamente susceptibles a la práctica (Fleishman, 1972).
En general, las pruebas de habilidades psicomotrices no han resultado muy útiles en la conserjería vocacional. Su validez suele ser inferior a la que tienen las pruebas de habilidades mecánicas y de trabajos de oficina. Las medidas de habilidades psicomotrices han sido más útiles para predecir el desempeño en programas de capacitación que para pronosticar la destreza en el empleo. También tienen mayor validez para prever el desempeño en trabajos repetitivos, tales como el ensamblado de rutina y la operación de máquinas, que en empleos complejos donde se involucran habilidades cognoscitivas y perceptuales de mayor nivel (Ghiselli, 1973).
HABILIDAD MECÁNICA
Se requiere un cierto nivel mínimo de habilidad psicomotriz para casi cualquier ocupación que involucre la operación de maquinaria; pero, más allá de ese nivel, la percepción espacial, el conocimiento mecánico y otras habilidades cognoscitivas son determinantes más importantes del desempeño. Uno de los primeros y más frecuentes tipos de habilidad especial que se mide es la habilidad mecánica. Hay algunas evidencias de un factor general débil de habilidad mecánica,pero las pruebas que se han diseñado para medirlo incluyen diversas habilidades perceptivo-motrices y cognoscitivas. Se trata de pruebas de habilidades psicomotrices, tales como la coordinación muscular y de velocidad, la percepción de relaciones espaciales y la comprensión de relaciones mecánicas. Los componentes psicomotrices de diversas pruebas de habilidad mecánica, como las pruebas psicomotrices en general, tienen correlaciones bajas entre sí. Sin embargo, las correlaciones entre las calificaciones totales en diversas pruebas de habilidad mecánica a menudo son bastante considerables.
Un hallazgo interesante, aunque no es de sorprender, es la presencia de diferencias de género en las calificaciones de pruebas de habilidad mecánica. Es común que los varones obtengan calificaciones más elevadas en mediciones de comprensión espacial y mecánica, mientras que las mujeres logran calificaciones más altas en destreza manual fina y en ciertos aspectos de discriminación perceptual. Estas diferencias se tornan más pronunciadas en el bachillerato, y sin duda los factores sociales intervienen en su determinación.
Pruebas de relaciones espaciales
Un análisis intensivo de la habilidad mecánica, realizado por D. G. Paterson y sus colaboradores en la Universidad de Minnesota hacia finales de la década de 1920, condujo a la elaboración de tres pruebas: la Prueba Minnesota de Ensamblaje Mecánico, la Prueba Minnesota de Relaciones Espaciales, y el Tablero Minnesota de Formas de Papel (Paterson, Elliott, Anderson, Tooksy Heidbreder, 1930). La primera, una prueba de muestras de trabajo, requería que los examinados ensamblaran de nuevo un conjunto de objetos mecánicos desarmados. La tarea exigía destreza manual y percepción espacial, así como comprensión mecánica. El segundo y tercer instrumentos de esta serie eran pruebas de percepción espacial, habilidad considerada factor importante en los trabajos que involucraban tareas mecánicas. Como su nombre lo indica, la percepción espacial es la habilidad para visualizar objetos en tres dimensiones y manipularlos para producir una configuración particular.
Una descendiente de las pruebas anteriores fue la Prueba Minnesota de Relaciones Espaciales, edición revisada (American Guidance Service). Esta prueba, diseñada para edades de 16 años en adelante, evalúa la visualización espacial y la manipulación tridimensional de objetos.Consiste en cuatro tableros de formas (A, B, C, D) y dos series de bloques de formas geométricas. Una serie de bloques se ajusta en los huecos de los tableros Ay B, y la segunda serie se ajusta a los huecos de los tableros C y D. La prueba empieza con los bloques dispersos fuera de los huecos, y se indica al examinando que tome los bloques y los coloque en los huecos correctos del tablero tan rápidamente como sea posible.
Otra descendiente de la Prueba Minnesota de Ensamblaje Mecánico es la Prueba Minnesota del Tablero de Formas de Papel, revisada (The Psychological Corporation). Esta adaptacióna lápiz y papel de la Prueba Minnesota de Relaciones Espaciales fue diseñada para aplicarse des-de el 9° hasta el 16° grados y en adultos. Consiste en 64 reactivos de opción múltiple, cada uno con un marco que muestra una figura geométrica dividida en varias partes y cinco marcos de res-puestas que contienen una forma armada (figura 10.5). La tarea del examinando es seleccionar el marco de respuesta de los cinco que muestran cómo quedaría la figura al unir las partes entre sí. El Tablero Minnesota de Formas de Papel ha resultado útil para predecir grados en cursos de taller e ingeniería, así como para efectuar evaluaciones de supervisores y registros de producción en inspección, empaque, operación de máquinas y otras ocupaciones industriales. Las calificaciones de la prueba también se relacionan con el aprovechamiento en odontología y arte.
Aunque se pretendía que la Prueba Minnesota del Tablero de Formas de Papel fuera una versión aplicada en forma más eficiente de la Prueba Minnesota de Relaciones Espaciales, la correlación entre calificaciones en las dos pruebas es considerablemente menor que el coeficiente de confiabilidad de pruebas paralelas del instrumento anterior.
FIGURA 10.5 Muestra de reactivos de la Prueba Minnesota del Tablero de Formas de Papel, revisada.
Otras medias de habilidad mecánica en lápiz y papel
Ni la habilidad espacial ni la mecánica constan de un único factor. Por ejemplo, Carroll (1993) identificó cinco factores en pruebas de habilidad espacial: visualización, rotación acelerada, velocidad de cierre, flexibilidad de cierre y velocidad perceptiva. Los resultados del análisis factorial también indican que el desempeño en las pruebas de habilidad mecánica en una función de la habilidad espacial, la habilidad de razonamiento general,. y la experiencia y conocimiento mecánicos (Alderton, 1994). Todos los factores contribuyen a las calificaciones en pruebas de comprensión mecánica, las cuales se diseñan para evaluar la comprensión de los principios mecánicos involucrados en una gama de situaciones prácticas. Dos ejemplos de pruebas de este tipo son la Prueba de Conceptos Mecánicos (NCS London House) y la Prueba de Comprensión Mecánica Bennett (The Psichological Corporation). Las dos formas ( S y T) de la Prueba de Comprensión Mecánica consisten en dibujos y preguntas sobre la operación de relaciones mecánicas y leyes físicas en situaciones prácticas (figura 10.6).
La calificación y confiabilidad promedios de la prueba Bennett son menores para mujeres que para hombres, y se proporcionan normas separadas para cada sexo. Se encuentra evidencia de la validez de la prueba en sus modestas correlaciones con el desempeño en diversos trabajos mecánicos, técnicos y de manufactura.
FIGURA 10.6 Ejemplo de reactivos de la Prueba de Comprensión Mecánica Bennett.
HABILIDADES PARA TRABAJOS DE OFICINA Y LASRELACIONADAS CON LA COMPUTACIÓN
Al igual que muchas otras categorías de habilidad, la habilidad para desempeñar el trabajo de oficina no es un factor unitario distinto de la inteligencia general. La destreza manual y la velocidad para percibir semejanzas y diferencias son necesarias en el trabajo de oficina, pero las habilidades verbales y cuantitativas también son importantes. Por consiguiente, muchas pruebas de habilidades para el trabajo de oficina contienen reactivos similares a los que se encuentran en las pruebas de inteligencia general, así como reactivos para medir la velocidad y la precisión perceptual.
Además de las pruebas más generales de habilidad para el trabajo de oficina, se han diseñado algunos instrumentos para medir solamente la aptitud estenográfica. También hay disponibles pruebas sobre la capacidad para aprender las complejas tareas de oficina y de resolución de problemas de la programación y la operación de computadoras.
Pruebas representativas de la habilidad para el trabajo de oficina general
Las pruebas de habilidad para el trabajo de oficina que se distribuyen comercialmente varían en contenido, comprenden desde las tareas simples de marcar números y nombres en la Prueba Minnesota de Trabajo de Oficina, hasta las tareas combinadas perceptual-motrices y de inteligencia general de la reciente Batería de Habilidades para Trabajo de Oficina. La Prueba Minnesotade Trabajo de Oficina (The Psychological Corporation) fue diseñada para usarse al seleccionar empleados, inspectores y otros especialistas en ocupaciones que incluyen velocidad para percibir y manipular símbolos. Consiste en dos partes, Comparación de Números (ocho minutos) y Comparación de Nombres (siete minutos), en las que el examinando revisa 200 pares de números y 200 pares de nombres buscando errores y marca los pares idénticos (figura 10.7). Ambas partes se califican mediante la fórmula “aciertos menos errores”. Las confiabilidades test-retest de las calificaciones están entre los .70 y 80. Las normas de rangos percentilares para estudian-tes, por sexo y grado (7 a 12), y para grupos de trabajadores de oficina y solicitantes de empleo aparecen en el manual. Las calificaciones están moderadamente correlacionadas con las notas de maestros y supervisores sobre el trabajo de oficina.
En contraste con la Prueba Minnesota de Trabajo de Oficina, que sólo mide la velocidad y precisión de percepción, la Batería de Habilidades para Trabajo de Oficina (The Psychological Corporation) se compone de siete pruebas diseñadas para medir diversas habilidades del trabajo de oficina: Llenado (cinco minutos), Copiar información (cinco minutos), Comparación de información (cinco minutos), Uso de tablas (cinco minutos), Lectura de pruebas (cinco minutos), Habilidades matemáticas básicas (15 minutos) y Razonamiento numérico (20 minutos). Las normas de rangos percentilares basadas en varias poblaciones de empleados bien definidas están disponibles en las formas A y B de la prueba.
FIGURA 10.7 Muestra de reactivos de la Prueba Minnesota de Trabajo de Oficina.
Habilidades relacionadas con la computadora
El rápido crecimiento de la industria de la computación durante las últimas décadas ha provocado cambios en la mayoría de los empleos de oficina y demanda de los programas de cómputo relacionados, es decir, la serie de enunciados lógicos que le dicen a la computadora qué hacer para lograr objetivos específicos. Aprender a programar computadoras y a usar los complejos programas que ya se han diseñado requiere de una combinación de las habilidades para el trabajo de oficina y para resolver problemas. Por lo tanto, es importante identificar a los individuos que poseen las aptitudes y habilidades necesarias para aprender cómo programar y manejar computadoras. Respondiendo a esta necesidad, los especialistas en mediciones han elaborado pruebas de aptitud para programar computadoras, uno de cuyos ejemplos es la Batería de Aptitud para Programador de Computadoras (CPAB) (NCS London House). Esta batería de prueba, que se diseñó para evaluar y seleccionar aspirantes a cursos de programación de computadoras, consiste en subpruebas de Significado Verbal, Razonamiento, Series de Letras, Habilidad para los Números,y Diagramación. El tiempo de evaluación es de 79 minutos para la versión Normal y de 55 minutos para la versión abreviada. Las pruebas se basaron en principiantes y programadores experimentados, y en analistas de sistemas, para desarrollar los reactivos, y en el manual se presentan las normas por rangos percentilares en las calificaciones totales y en las subpruebas. Los estudios sobre validación han demostrado que la CPAB puede predecir el éxito relevante en el trabajo para diversas compañías de producción y servicios.
También están disponibles pruebas que evalúan la capacidad para manejar computadoras.Un ejemplo es la Batería de Aptitud para Operador de Computadoras (COAB). Las tres subprue-bas de esta batería de 45 minutos son: Reconocimiento de Secuencias (“habilidad para reconocer secuencias en forma rápida”), Marcar Formatos (“habilidad para percibir la adecuación de números y letras a un determinado formato”) y Pensamiento Lógico (“habilidad de analizar problemas y visualizar soluciones de manera lógica”). El manual presenta normas de rangos percentilares, obtenidos en muestras relativamente pequeñas de operadores de computadoras con experiencia y aspirantes o aprendices sin experiencia, por subpruebas y por calificación total.
HABILIDADES ARTÍSTICAS Y MUSICALES
Las habilidades medidas por las pruebas de aptitud espaciales, mecánicas y de trabajo de oficina son importantes en ingeniería, mecánica, trabajo de oficina, odontología, y en cierta medida en arte y música. Las pruebas de habilidades artísticas y musicales han sido objeto de décadas de investigación, y algunas de ellas tienen al menos una validez modesta. No obstante, la investigación dedicada a la evaluación de estas habilidades ya no se lleva a cabo con la energía conque alguna vez se realizó (Carson, 1998).
Pruebas de aptitud artística
Como dice la frase: “la belleza está en los ojos de quien la contempla”, el juez último sobre el mérito artístico es el observador. Debido a que el gusto en el arte varía mucho de una persona a otra, de una cultura a otra y de generación a generación, no es sorprendente que los criterios sobre la habilidad artística resulten difíciles de especificar. Sin importar los múltiples problemas que se presentan al tratar de definir criterios confiables y elaborar instrumentos para predecirlos,se han publicado varias pruebas de habilidad para el arte visual y la aptitud musical. Sin embargo, muchas de estas pruebas son obsoletas y ya no están disponibles comercialmente.
Hace algunos años los investigadores de la Universidad de Minnesota encontraron una correlación positiva entre las calificaciones en pruebas de percepción espacial, tales como la Prueba Minnesota del Tablero de Formas de Papel, y la aptitud artística (Paterson et al., 1930).Desde luego que la habilidad espacial no es el único factor que cuenta en la aptitud artística; el juicio, la destreza manual, la imaginación creativa y otros factores también intervienen. Asimismo, una persona que puede reconocer el buen arte no necesariamente es capaz de producirlo. Porello, es importante distinguir entre medidas de apreciación estética (juicio y percepción) y medidas de muestras de trabajo de habilidad productiva en arte. Como ejemplo de pruebas de juicio y percepción del arte están la Prueba Meier de Juicio Artístico, la Prueba Meier de Percepción Estética (Meier, 1942), y la Prueba Graves de Juicio de Diseño (Graves, 1948). A diferencia de la Prueba Meier de Juicio Artístico, que utiliza obras de arte famosas como material de prueba, la de Graves emplea obras abstractas de dos y tres dimensiones para revelar los juicios artísticos. Ejemplo de una prueba de desempeño en arte es el Inventario Horn de Aptitudes Artísticas (Horn y Smith, 1945), donde se requiere que el examinando esboce objetos comunes y figuras geométricas y trace conjuntos de líneas básicas en marcos rectangulares.
Pruebas de aptitud musical
No está clara la importancia relativa de la habilidad innata, la motivación, la instrucción y la práctica para la determinación del talento musical. Hay ciertas muestras de que existe un factor general débil de la aptitud musical, pero la mayoría de las investigaciones han demostrado que son varias las habilidades que contribuyen al logro musical. Uno de dichos factores es la habilidad de discriminar entre diferentes tonos, el tono perfecto que supuestamente ha caracterizado a muchos músicos famosos. Como lo revela la investigación que ha usado técnicas de sondeo cerebral, los factores neuropsicológicos son importantes para determinar el tono perfecto. Porejemplo, Schlaug, Jaencke, Huang y Steinmetz (1995) descubrieron que los músicos con tonoperfecto tenían una marcada asimetría del plano temporal izquierdo que los no músicos o los músicos sin tono perfecto. En una investigación relacionada, Schlaug et al (1995) encontró que la mitad anterior del cuerpo calloso era significativamente mayor en los músicos profesionales que en los no músicos.
La prueba de aptitud musical más antigua, denominada Medidas Seashore de los Talentos Musicales, fue producto de la investigación pionera de Carl Seashore y sus colegas en la Universidad de Iowa durante las décadas de 1920 y 1930 (Seashore, 1939). En contraste con las pruebas de aptitud musical que se desarrollaron más tarde, los materiales de estímulo de las pruebas de Seashore consistían en un conjunto de tonos o notas musicales, más que en selecciones musicales significativas. Este método analítico, atomista de medir la aptitud musical fue seriamente criticado y, en consecuencia, se desarrollaron varias pruebas con un contenido más complejo.Entre éstas están las medidas colectivas como la Prueba Drake de Aptitud Musical (Drake,1954) y el Perfil de Aptitud Musical (por E. E. Gordon, de GIA Publications).
El Perfil de Aptitud Musical (MAP) es una prueba grabada consistente en 250 selecciones breves originales para violín y violonchelo tocadas por músicos profesionales. No se requiere de ningún conocimiento previo sobre hechos musicales o históricos. El MAP consta de tres pruebas que miden siete componentes: Imaginación Tonal (melodía y armonía), Imaginación Rítmica (ritmo y métrica), y Sensibilidad Musical (fraseo, equilibrio y estilo). Según su revisión en 1995, la prueba toma aproximadamente tres horas y media en aplicarse y puede calificarse manualmente.
Otras pruebas de música diseñadas por E. E. Gordon y publicadas por GIA Publications incluyen:
Medidas Avanzadas de Audición de Música. Prueba de aptitud musical para estudiantes universitarios, dura 20 minutos y proporciona calificaciones sobre tono, ritmo y compuestas.
Prueba de Preferencia de Timbre de Instrumento. Ayuda a los estudiantes a partir de los nueve años de edad a seleccionar un instrumento de aliento apropiado, de metal o de madera, para aprender a tocar.
Registro de Prontitud para la Improvisación Armónica y Registro de Prontitud para la Improvisación. Diseñada para funcionar como una ayuda objetiva para maestros (desde el tercer grado hasta escuelas de especialización musical) y ayudar a los alumnos a improvisar música.
Prueba Iowa de Alfabetismo Musical. Una prueba de aprovechamiento musical estandarizada nacionalmente, para grados del cuarto al duodécimo, diseñada para evaluar el progreso, diagnosticar cualidades y deficiencias, y comparar la posición relativa de los alumnos en el aprovechamiento musical.
BATERÍAS DE PRUEBAS DE APTITUDES MÚLTIPLES
En la conserjería vocacional, así como en la clasificación y colocación de empleos, a menudo resulta útil evaluar las habilidades y el conocimiento en varias áreas. Un consejero puede decidir aplicar una serie de pruebas individuales de habilidades, pero éste puede no ser el procedimiento más eficaz. Además, es probable que un conjunto de pruebas separadas se haya estandarizado en tantos grupos de personas distintos como pruebas existan. Debido a que los grupos de norma pueden variar en forma significativa, es difícil establecer una comparación relevante entre la calificación de una persona en una prueba y sus calificaciones en otras pruebas.
Las pruebas separadas de capacidades especiales ciertamente tienen un lugar, sobre todo en la selección y el sondeo de personal, pero son menos útiles en la asesoría y el diagnóstico vocacional. El énfasis en los procedimientos de selección de personal ha cambiado un poco durante las últimas décadas de seleccionar sólo la “crema y nata” a clasificar y colocar a los trabajadores en los empleos más adecuados a sus habilidades y necesidades. Por consiguiente, la aplicación de las pruebas comprendidas en una batería de múltiples habilidades, la cual está diseñada para asignar a las personas con patrones de habilidades particulares a empleos específicos, se considera más eficaz que aplicar una serie de pruebas no relacionadas diseñadas para seleccionar sólo a los mejores y descartar a todos los demás. A diferencia de las pruebas únicas de habilidades especiales, que pueden ser del tipo de lápiz y papel o de ejecución, una batería de habilidades múltiples típica no requiere más dispositivos que lápiz y papel y puede administrarse simultáneamente a un grupo grande de estudiantes, aspirantes a un empleo, reclutas militares y otros grupos.
Debido a que las habilidades cognoscitivas son menos específicas durante los años de la escuela elemental, en general, antes de cursar la secundaria no se recomienda aplicar una bate-ría cara, que tome mucho tiempo, de habilidades múltiples. Durante la secundaria, al ir diferenciándose sus habilidades cognoscitivas con la madurez y la experiencia, los alumnos empiezan a investigar y hacer planes sobre sus futuras carreras, así como a decidir los cursos académicos que tomarán. Para ayudarlos en estos esfuerzos, muchos sistemas escolares aplican una batería de habilidades múltiples en el octavo o noveno grado de bachillerato. La información proporcionada por la batería de pruebas puede aumentar la conciencia de los alumnos sobre sus cualidades y deficiencias y, por lo tanto, guiarlos para tomar decisiones laborales y educativas.
Más que aplicar una larga serie de pruebas de habilidades especiales o una batería de habilidades múltiples, un consejero vocacional puede decidir usar una prueba de inteligencia general y una o más pruebas de habilidades especiales. Ciertamente, nada tiene de malo esta estrategia, porque las habilidades verbales y cuantitativas medidas por las pruebas de inteligencia son importantes en un amplio espectro de posiciones académicas y vocacionales. Además de evaluar varias habilidades especiales, muchas baterías de habilidades contienen una prueba de inteligencia general. Esto proporciona las ventajas combinadas de una aplicación más eficiente y de normas comparables en todas las pruebas.
Diferencias de calificaciones e interpretación de perfiles
Los procedimientos estadísticos del análisis factorial (vea apéndice A) se han usado en la elaboración de varias baterías de pruebas de habilidades. Incluso en baterías no desarrolladas por métodos de análisis factorial, los resultados de estudios que emplean estos métodos usualmente se han considerado para elaborar los reactivos y definir las variables que habrán de medirse.
Los reactivos de las Pruebas de Aptitudes Diferenciales, una de las más populares baterías de pruebas usadas en la asesoría académica en el nivel de bachillerato, se seleccionaron para que tuvieran correlaciones elevadas con otros reactivos en la misma subprueba, pero correlaciones bajas con reactivos de otras subpruebas. El resultado final fue un conjunto de subpruebas internamente consistentes con bajas correlaciones entre sí. Era importante que las correlaciones entre subpruebas fueran bajas; de lo contrario, el traslape entre las habilidades medidas por distintas subpruebas sería demasiado grande como para obtener una interpretación diferencial de las calificaciones de la subprueba.
Confiabilidad y error estándar de las diferencias entre calificaciones. Las magnitudes delas correlaciones entre distintas subpruebas en la misma batería a menudo son notables, y el hecho de que las subpruebas son bastante breves ocasiona que su confiabilidad sea muy baja. No sólo la confiabilidad de las diferencias entre calificaciones en dos pruebas varía directamente con la confiabilidad de las pruebas, también varía inversamente con la correlación entre las pruebas. La correlación considerable entre dos subpruebas dadas, combinada con su baja confiabilidad, origina que la confiabilidad de las diferencias entre calificaciones de las subpruebassea baja.
La siguiente es una fórmula de la confiabilidad de las diferencias (rdd) entre las calificaciones de las mismas personas en dos pruebas o subpruebas con iguales varianzas:
Fórmula (10.1)
donde r11 es la confiabilidad del primer conjunto de calificaciones, r22 la confiabilidad del segundo conjunto de calificaciones, y r12 la correlación entre estos dos conjuntos. Por ejemplo, supóngase que la confiabilidad de calificaciones anteriores a la prueba es r11= .90, la confiabilidad de las calificaciones posteriores a la prueba es de r22= .80, y la correlación entre calificaciones anteriores y posteriores a la prueba es r12= .70. Entonces, la confiabilidad de la diferencia entre calificaciones anteriores y posteriores a la prueba es [.90 ? .80 ? 2(.70)]/[2(1 ?.70)]= .50.
Cuando la confiabilidad de las diferencias entre calificaciones en dos subpruebas es baja,la diferencia entre las calificaciones de una persona en la subpruebas debe ser bastante grande para que pueda resultar significativa. Con el propósito de ilustrar este principio, supongamos que la confiabilidad de las calificaciones T en la prueba de relaciones espaciales de una batería de habilidades es .85, y la confiabilidad de las calificaciones T en la prueba de aptitud mecánica dela misma batería es .90. Un valor aproximado del error estándar de las diferencias (sed) entre calificaciones en dos pruebas con desviaciones estándar iguales puede calcularse mediante:
Fórmula (10.2)
donde r11y r22 representan la mejor confiabilidad de test-retest de las dos pruebas, y s es la desviación estándar de las calificaciones de cada prueba. Recordando que la desviación estándar delas calificaciones T es igual a 10, cuando las calificaciones de ambas pruebas se expresan como calificaciones T, la fórmula 10.2 se convierte en:
En consecuencia, para estar bastante seguros (digamos con una probabilidad de .95) de que la diferencia entre las calificaciones de una persona en estas dos pruebas no se debe al azar, tal diferencia debe ser de al menos 1.96 × 5 = 9.8 unidades de calificaciones T.
Perfil de calificaciones. El proceso de interpretar la calificación de una persona en una batería de aptitudes múltiples constituida por varias pruebas estandarizadas en los mismos grupos de norma o en grupos equivalentes empieza con la construcción de un perfil de calificación. Un perfil de calificación, que es una gráfica de líneas o de barras de las calificaciones obtenidas en distintas pruebas, proporciona una imagen de las ventajas y deficiencias de una persona en varias áreas de aptitud. A partir de las normas es posible construir un perfil de las calificaciones dela persona en diversas pruebas para su uso en asesoría académica o vocacional. Más que trazar las calificaciones de una persona como puntos específicos en una gráfica, éstas pueden representarse como una serie de barras horizontales o verticales que van de uno o dos errores de medición estándar a cada lado de la calificación (vea la figura 5.2, en la página 92). Entonces, si las barras verticales de las dos pruebas no se traslapan, la diferencia entre las calificaciones de la persona en estas dos pruebas puede interpretarse como significativa.
Con el fin de apoyar la conserjería vocacional y la selección y colocación ocupacional,puede ser útil comparar el perfil de las calificaciones de una persona en una batería de habilidades múltiples con el perfil de las calificaciones promedio de la gente ubicada en ocupaciones seleccionadas para tal efecto. Aunque los trabajadores de una misma ocupación difieren en cierta medida en cuanto a sus patrones de habilidad, ciertas familias de empleos parecen requerir un conjunto particular de habilidades. Los perfiles similares en una batería de aptitudes múltiples indican patrones similares de habilidades.
Pruebas de aptitud diferencial
Cierto número de baterías de pruebas de aptitud han sido diseñadas para, y estandarizadas principalmente en, situaciones escolares y se han usado para pronosticar el aprovechamiento académico. Una importante batería de este tipo se conoce como Pruebas de Aptitud Diferencial (DAT) (The Psychological Corporation). Las DAT se han usado sobre todo para consejería educativa y vocacional en estudiantes de bachillerato, pero también se ha empleado en educación básica para adultos, programas universitarios, vocacional-técnicos y correccionales. Hay dos niveles de la última (quinta) edición de las DAT: el Nivel 1 para grados del 7° al 9°, y el Nivel 2 para grados del 10° al 12°.
Las DAT comprenden ocho pruebas: Razonamiento Verbal, Razonamiento Numérico,Razonamiento Abstracto, Velocidad y Exactitud Perceptual, Razonamiento Mecánico, Relaciones Espaciales, Ortografía y Uso del Lenguaje. El tiempo para resolver toda la batería es de 156 minutos, pero una Batería Parcial de las DAT consistente en Razonamiento Verbal y Razona-miento Numérico requiere sólo de 90 minutos de trabajo. Además, se ha adaptado una edición computarizada de toda la batería que sólo toma 90 minutos en promedio para resolverse. Usando la teoría de respuesta al item, la versión adaptada presenta un subconjunto de reactivos de prueba que son los más adecuados para la persona que se somete a la prueba.
La quinta edición de las DAT fue estandarizada sobre una muestra nacional representativa de los estudiantes estadounidenses de bachillerato, se estratificó de acuerdo con el tamaño del distrito escolar, la región geográfica, el estatus socioeconómico de la comunidad y el tipo de escuela (pública o privada). Hay considerables diferencias de género en las calificaciones de lasDAT: las mujeres tienen calificaciones más elevadas en Uso del Lenguaje y en Velocidad y Exactitud Perceptual, mientras que los hombres obtienen mayores puntuaciones en Razonamiento Mecánico y Relaciones Espaciales. Debido a estas diferencias de género, las normas por rango percentilar, estanina, y de la calificación escalada se presentan por separado para hombres y mujeres, así como para ambos sexos combinados.
Los datos estadísticos en la quinta edición del manual para el DAT, así como para la prueba misma, son bastante añejos, lo que debe tomarse en cuenta al usar esta batería de pruebas. Los coeficientes de la consistencia interna de las ocho pruebas varían de .82 a .95, y los coeficientes de formas paralelas están entre .73 y .90. Las correlaciones entre las pruebas van desde casi cero entre la Velocidad y Exactitud Perceptual y otras pruebas de la batería, hasta .70 entre las pruebas de Razonamiento y Uso del Lenguaje. Los extensos datos presentados en el manual indican que las escalas de las DAT, y especialmente el Razonamiento Verbal más el Razonamiento Numérico en conjunto, son válidas para pronosticar los grados de bachillerato y universitario.La batería de las DAT es útil para predecir el nivel del empleo dentro de las ocupaciones, perolas normas para varias ocupaciones son limitadas. En consecuencia, como pronóstico diferencial del éxito vocacional, las escalas de las DAT deben usarse con precaución.
Batería Multidimensional de Aptitudes, II
La Batería Multidimensional de Aptitudes, II (MAB-II) es una adaptación administrada de manera colectiva de la Escala de Inteligencia para Adultos de Wechsler, revisada. Como la WAIS-R, la MAB-II consiste en dos escalas (Verbal y de Desempeño) con cinco subpruebas cada una.Las cinco subpruebas Verbales son: Información, Comprensión, Aritmética, Semejanzas y Vocabulario. Las cinco subpruebas de Desempeño son: Símbolos en Dígitos, Completamiento de Dibujos, Espacial, Acomodamiento de Imágenes y Ensamblado de Objetos. El tiempo límite para cada subprueba es de siete minutos, de modo que toda la batería puede terminarse en menos de hora y media. Es posible obtener calificaciones estándar y CI a partir de las baterías Verbal, de Ejecución y de Escala Completa, así como calificaciones escaladas de subpruebas, y un informe detallado de las calificaciones y su interpretación, a través del servicio de calificaciones por computadora de los Sistemas de Asesoría Sigma. En la figura 10.8 se muestra un ejemplo de perfil de calificaciones de la MAB-II.
FIGURA 10.8 Perfil de Calificaciones en la Batería Multidimensional de Aptitudes, II.
El manual MAB-II (Jackson, 1998) registra la confiabilidad test-retest durante un periodo de 45 días como de .95 para la calificación Verbal, de .96 para la de Ejecución , y de .97 para la de Escala Completa. En un estudio con 500 personas de entre 16 y 20 años de edad, los coeficientes de consistencia interna para los CI Verbal, de Ejecución y de Escala Completa estaban entre los altos niveles de .90. Las correlaciones entre las calificaciones MAB y los CI de la WAIS-R en una muestra de 145 adultos fueron de .94 para la prueba Verbal, de .79 en Ejecución y de .91 para la Escala Completa de calificaciones WAIS-R . Los resultados de los análisis factoriales de las calificaciones de las subpruebas indican que, al igual que la Wais-R, la batería MAB-II mide un factor de inteligencia general así como factores de ejecución y verbal por separado.
Batería de Pruebas de Aptitud General
Se han diseñado varias baterías de pruebas de habilidades múltiples específicamente para la selección y colocación de personal en el medio empresarial e industrial. Entre éstas se encuentra la Batería de Pruebas de Aptitud General, las Pruebas Flanagan de Clasificación de Aptitud, lasPruebas Industriales Flanagan y el Estudio de Habilidades para Empleados. Una de las más antiguas baterías de prueba orientadas hacia la industria fue diseñada en la década de 1930 por el personal del Instituto de Investigación para la Estabilización del Empleo de Minnesota (MES-RI). La batería MESRI contenía pruebas de inteligencia general, así como para medir la habilidad numérica, perceptual, mecánica y psicomotriz. Los perfiles de las calificaciones promediode estas pruebas obtenidas por empleados de oficina, trabajadores mecánicos, vendedores y muchos otros grupos ocupacionales, se establecieron como un conjunto de patrones de habilidad ocupacional (OAP) con los cuales podía compararse el desempeño individual.
El enfoque OAP de la batería MESRI se conservó al desarrollarse la Batería de Pruebas de Aptitud General (GATB) del Servicio de Empleo de Estados Unidos. La GATB, diseñada con base en el análisis del empleo y en un análisis factorial de 59 pruebas, se compone de ocho pruebas de lápiz y papel y cuatro pruebas con aparatos. Estas 12 pruebas en conjunto producen calificaciones sobre nueve habilidades principales requeridas para el éxito laboral: Habilidad de Aprendizaje General (G), Habilidad Verbal (V), Habilidad Numérica (N), Habilidad espacial (S), Percepción de Formas (P), Percepción del Trabajo de Oficina (Q), Coordinación Motriz (K), Destreza de Dedos(F) y Destreza Manual (M). Las puntuaciones crudas en estas nueve variables se convierten a rangos percentilares o calificaciones estándar con una media de 100 y una desviación estándar de 20. Estas tres calificaciones compuestas se obtienen de combinaciones apropiadas de las puntuaciones alcanzadas en los nueve factores: Cognoscitivo = G + V + N, Perceptual = S + P + Qy Psicomotriz = K + F + M.
Las calificaciones estándar de una persona en las variables GATB pueden compararse con las de los aproximadamente 36 patrones de habilidad ocupacional (OAP) determinados a partir de un análisis de las calificaciones de personas en más de 800 empleos. Un OAP consiste en un conjunto de calificaciones de GATB mínimas consideradas esenciales para el desempeño eficaz en determinada ocupación.
Toda la batería GATB tarda 21/2 horas en administrarse y es adecuada para los últimos grados de bachillerato (en general, el 12° grado) y adultos. Los coeficientes de confiabilidad test-retest y de formas paralelas para las pruebas separadas van de .80 a .90, con un error estándar de medición de aproximadamente 7 puntos para las calificaciones estándar. La validez de las nueve pruebas de habilidad y los 36 OAP para predecir los criterios de éxito ocupacional y académico está entre .00 y .90.
La GATB ha sido una de las herramientas más usadas en consejería vocacional y colocación laboral para estudiantes de los grados 9° al 12° y adultos, y probablemente es la batería de pruebas más adecuada para tal propósito. Debido a la supuesta injusticia de la GATB para grupos minoritarios, en 1981 se aplicó un sistema de normas por raza para las calificaciones como parte del programa de acción afirmativa del Departamento del Trabajo de Estados Unidos. Esta medida consistía en usar normas de rangos percentilares separadas para blancos, negros y latinos, y en registrar sólo los rangos percentilares de candidatos dentro del grupo. Sin embargo, los críticos consideraron esta práctica como discriminación invertida y en 1990 el uso de la GATB fue suspendido por el Departamento de Justicia mientras podían arreglarse los problemas concernientes a la justicia y la discriminación invertida. El Congreso de Estados Unidos también incluyó al lenguaje en el Acta de Derechos Civiles de 1991 para efectos de que ya no se aplicaran normas y ajustes a las calificaciones para diferenciar grupos.(4)
(4)Al parecer está en desacuerdo con la disposición del Acta de Derechos Civiles de 1991, que evitaba los ajustes de calificaciones para las diferencias de grupos, el requisito del Acta de Estadounidenses con Discapacidad, de 1990, de que los jefes proporcionen colocación en la evaluación para individuos con discapacidades sensoriales, manuales o del habla. Sin embargo, como lo señala Tenopyr (1996), eso es un desacuerdo sobre una medida de política pública más que un conflicto científico o psicométrico.
Posteriormente el Servicio de Empleo de Estados Unidos reanudó el uso de la GATB, pero los informes para los empleadores ya no están regulados por la raza. Más bien, las puntuaciones crudas para varias de las pruebas que conforman la batería se convierten a calificaciones estándar con base en normas combinadas para todos los grupos raciales.
Batería de Aptitud Vocacional de las Fuerzas Armadas
A partir de los Exámenes Army Alfa y Army Beta en la Primera Guerra Mundial, a lo largo delos años se han utilizado diversas pruebas para seleccionar y clasificar al personal de las Fuerzas Armadas de Estados Unidos. La Prueba de Clasificación General del Ejército (AGCT) y la Prueba de Clasificación General de la Marina (NGCT) se aplicaron a millones de reclutas mili-tares durante y después de la Segunda Guerra Mundial para clasificar los en trabajos capacitados y no capacitados, para seleccionar a quienes podrían beneficiarse de una mayor capacitación y rechazar a aquellos que, por una habilidad mental baja, se consideraran inadecuados para el servicio militar (vea Harrell, 1992). Algunos años después de la Segunda Guerra Mundial, la Prueba de Capacitación de las Fuerzas Armadas (AFQT) reemplazó a la AGCT y a la NGCT.
Durante la década de 1970, la Batería de Aptitud Vocacional de las Fuerzas Armadas se convirtió en la prueba uniforme de selección y clasificación de los servicios armados en conjunto. La forma actual de esta batería (ASVAB, 18/19), que es la prueba de habilidades múltiples más aplicada en Estados Unidos, consiste en diez pruebas:
Ciencia General (GS): 25 reactivos que miden el conocimiento en ciencias físicas y biológicas.
Razonamiento Aritmético (AR): 30 reactivos que miden la capacidad de resolver problemas verbales de aritmética.
Conocimiento de Palabras (WK): 35 reactivos para medir la habilidad de seleccionar el significado correcto de las palabras presentadas en contexto e identificar el mejor sinónimo de una palabra determinada.
Comprensión de Párrafos (PC): 15 reactivos que miden la habilidad para obtener información a partir de textos escritos.
Operaciones Numéricas (NO): 50 reactivos que miden la habilidad de realizar cálculos aritméticos.
Velocidad de Codificación (CS): 84 reactivos que miden la habilidad para usar una clave y asignar códigos de números a palabras.
Información sobre Autos y Talleres (AS): 25 reactivos que miden el conocimiento sobre automóviles, herramientas y terminología y prácticas de talleres.
Conocimiento Matemático (MK): 25 reactivos que miden el conocimiento de principios matemáticos a nivel de bachillerato.
Comprensión Mecánica (MC): 25 reactivos que miden el conocimiento de principios mecánicos y físicos y la habilidad para visualizar cómo funcionan las herramientas de trabajo ilustradas.
Información sobre Electrónica (EI): 20 reactivos para medir el conocimiento sobre electricidad y electrónica.
El tiempo de administración para las pruebas de ASVAB varía desde 3 minutos para las Operaciones Numéricas hasta 36 minutos para el Razonamiento Aritmético, con un total de 144 minutos para completar las diez pruebas. Se registran calificaciones T estándar y bandas de calificaciones de rangos percentilares para cada una de las pruebas y tres calificaciones compuestas: Habilidad Verbal (VA) = WK + PC, Habilidad Matemática (MA) = AR + MK, y Habilidad Académica (AA) = VA + MA. Las calificaciones de cuatro combinaciones ocupacionales también pueden calcularse como combinaciones adecuadas de calificaciones en las diez pruebas básicas: Mecánica y Oficios (MC); Negocios y Trabajo de Oficina (BC); Electrónica y Electricidad(EE), Salud, Social y Tecnología (HST).
Como se ilustra en la figura 10.9, el desempeño de una persona en la ASVAB puede representarse mediante una serie de bandas de calificaciones de rangos percentilares que indican los rangos dentro de los cuales es probable que caigan las verdaderas calificaciones de las pruebas de una persona. Además de trazar las bandas de calificaciones de rangos percentilares de mismo grado-mismo sexo, pueden trazarse las calificaciones T de mismo grado-mismo sexo y mismo grado-sexo opuesto. Dos datos adicionales que se incluyen en la hoja del perfil son los códigos primario y secundario de la ASVAB de la persona y la Calificación de las Carreras Militares. Los códigos se interpretan mediante un OCCU-FIND especial en un cuaderno diseñado para ayudara los examinados a identificar las ocupaciones militares con las que concuerdan más sus calificaciones. La Calificación de las Carreras Militares, la cual se usa en conjunto con las gráficas de un folleto de Carreras Militares que se proporciona al examinado, colabora en el proceso de evaluar sus posibilidades como candidato a las ocupaciones militares incluidas (vea Departamento de Defensa de Estados Unidos, septiembre de 1995).
FIGURA 10.9 Perfil de Calificaciones en la Batería de Aptitud Vocacional de las Fuerzas Armadas.
Los coeficientes de confiabilidad por consistencia interna van desde los bajos .70 hasta los bajos .90 para las diez pruebas de ASVAB, y desde los bajos hasta los intermedios .90 para las tres calificaciones compuestas. Los coeficientes de confiabilidad de las formas opcionales están en su mayoría en los .70 y .80 para las diez pruebas, y en .90 para las calificaciones compuestas. En el Manual Técnico para la ASVAB 18/19 (Departamento de Defensa de Estados Unidos, diciembre de 1999) se presenta gran cantidad de datos sobre la validez de la ASVAB para empleos tanto militares como civiles. Al igual que con la batería de las DAT, debido a que pueden aparecer las mismas pruebas en distintas combinaciones de ASVAB, estas combinaciones están positivamente correlacionadas. Así, la información proporcionada por diversas pruebas a menudo es redundante y refleja más la habilidad cognoscitiva que habilidades diferenciales específicas.
Además de una versión estándar en lápiz y papel, está disponible una versión de la ASVAB administrada por computadora (la CAT-ASVAB) que emplea una metodología de evaluación adaptativa. La CAT-ASVAB tiene las ventajas de un tiempo de administración menor, mayor seguridad,más precisión en la medición en los extremos de la habilidad, retroalimentación inmediata para los examinados sobre su desempeño, y tiempos de inicio flexibles (vea Segall y Moreno, 1999).
Evaluación diagnóstica y claves de trabajo
Desde su inicio en la década de 1920, la elaboración y el uso de pruebas de aptitudes múltiples se han basado en la suposición razonable de que distintos programas educativos y laborales requieren de distintas habilidades humanas. Idealmente, cuando se usan con propósitos de asesoría y colocación, dichos instrumentos de calificación múltiple cumplen la función diagnóstica de determinar los tipos de programas o empleos para los que la gente es más apta. En el futuro, sin duda, estas evaluaciones diagnósticas serán más adaptativas e individualizadas, y se aplicarán ya sea en una situación de interrelación entre personas o por computadora. Un posible escenario consiste en que el proceso de evaluación diagnóstica comience con una breve prueba de reto, se siga con pruebas para identificar las habilidades constitutivas en un área en que el examinado tenga problemas, luego de lo cual podrá iniciarse la construcción de un perfil de las aptitudes y deficiencias del examinando, y finalizar con la presentación de la instrucción o la capacitación necesarias como remedio. Las pruebas diagnósticas se propondrán, sobre todo, ayudar a los estudiantes y a los solicitantes de empleo a aprender y tener éxito, más que a simplemente proporcionar calificaciones para la toma de decisiones institucionales u organizacionales, y servirán como guía para la instrucción y capacitación en forma continua, más que sólo para comparar el desempeño de los examinados.
Durante muchos años las baterías de pruebas de aptitudes, tales como las DAT, la GATB y la ASVAB, se han administrado en contextos escolares y laborales para ayudar a los individuos a tomar decisiones educativas y vocacionales. Hay un procedimiento similar, pero más complejo y coordinado, el cual fue desarrollado por el American College Testing Program y pareciera de mayor utilidad. Este procedimiento, conocido como Sistema de Claves de Trabajo, consta de tres componentes o etapas: (1) un análisis de empleo o proceso de elaboración de perfiles con el cual determinar los niveles de habilidad requerida para un desempeño competente en trabajos específicos; (2) la evaluación de las habilidades de las personas en el lugar de trabajo, (3) la instrucción de apoyo para ayudar a los educadores a enseñar las habilidades requeridas. Durante la etapa 1, grupos intensivos concentrados y compuestos por trabajadores que realmente desempeñan un trabajo determinado son dirigidos por personas dedicadas a elaborar perfiles de trabajo para identificar la habilidad o habilidades requeridas en un empleo en particular. El resultado es un perfil de trabajo que proporciona a empleadores, estudiantes, aspirantes a un empleo y a escuelas, un marco de referencia único para comprender cuáles son las habilidades que se necesitan para competir por determinado empleo. En la etapa 2, los alumnos o aspirantes que solicitan determinado empleo se someten a pruebas de dominio en cada una de las distintas áreas relevantes para el puesto: matemáticas aplicadas, tecnología aplicada, escuchar, ubicación de información,observación, lectura, trabajo en equipo y escritura. A continuación, las calificaciones individua-les de estas evaluaciones se comparan con el perfil del trabajo en particular para revelar cual-quier laguna en las habilidades. En la etapa 3, la información resultante obtenida en la etapa 2 se usa no sólo para proporcionar retroalimentación a quienes han realizado las pruebas, sino también para capacitarlos en las habilidades necesarias para el trabajo de que se trate. La capacitación necesaria para reducir las lagunas diagnosticadas en las habilidades consiste en instrucción basada en la computadora y de aula ajustada hacia metas específicas de Claves de Trabajo.
Además de funcionar como una base para la instrucción de reparación de lagunas, comparar las calificaciones de los estudiantes con los perfiles del trabajo también puede ayudar a los educadores a identificar los programas escolares que deben mejorarse. Asimismo, ejecutivos corporativos y administradores gubernamentales de desarrollo de la fuerza de trabajo pueden usar la información sobre las discrepancias entre calificaciones de evaluación de los empleados y los perfiles de trabajo para modificar sus programas de capacitación y contratación, y encauzar los fondos necesarios hacia las modificaciones requeridas (Doebele, 1999).
RESUMEN
Las pruebas de aptitudes o de habilidades especiales se centran en el futuro, es decir, en medir la habilidad para aprovechar de la capacitación adicional o de la experiencia en determinada área. Las pruebas de habilidades especiales también tienen amplitudes de banda más estrechas que las pruebas de inteligencia convencionales, en cuanto a que predicen logros más específicos. Aunque ciertas pruebas de habilidades especiales son del tipo de muestra de trabajo o de desempeño, se aplican con mayor frecuencia las pruebas de lápiz y papel.
Las pruebas que comprenden una batería de aptitudes múltiples se han estandarizado en la misma muestra de personas y, por ende, permiten comparar las diferencias existentes entre calificaciones individuales y calificaciones de varias personas. Las diferencias entre las calificaciones de una persona en una batería de aptitudes deberán interpretarse con precaución, y considerarse significativas sólo si son mayores que una o dos veces el error estándar de la medición de las diferencias entre calificaciones. Debido a que en una batería de aptitudes múltiples las pruebas, en general, son más cortas que las pruebas de capacidades específicas, las primeras suelen tener confiabilidades menores y, por lo tanto, errores estándar de medición mayores que las segundas.
La validez predictiva de las pruebas de habilidad es bastante baja en general, pero las calificaciones de tales pruebas pueden contribuir a predecir diversos criterios de desempeño cuando se usan en combinación con otras medidas de habilidad, así como con calificaciones previas sobre medidas de intereses, motivación y desempeño.
Existen algunas pruebas que tienen la finalidad de medir las agudezas visual y auditiva, la visión del color y otros aspectos relacionados con la sensación y la percepción. Además, se encuentran disponibles otros instrumentos de propósitos múltiples para la medición visual y de las habilidades perceptoras y motrices.
Las habilidades psicomotrices parecen ser altamente específicas y las calificaciones de pruebas de estas habilidades a menudo tienen menor confiabilidad que otras pruebas de habilidad. Las calificaciones de habilidades psicomotrices también son muy susceptibles a los efectos de la práctica. Como ejemplos de pruebas psicomotrices figuran la Prueba Minnesota de Índice de Manipulación para medir movimientos manuales gruesos, la Prueba Crawford de Destreza con Partes Pequeñas para medir movimientos manuales finos, y la Prueba Bennett de Destreza Mano-Herramienta para medir movimientos manuales tanto gruesos como finos.
Las pruebas de habilidades mecánicas y para el trabajo de oficina fueron de las primeras medidas estandarizadas de habilidades especiales en diseñarse. Sin embargo, ni la habilidad mecánica ni la habilidad para el trabajo de oficina constituyen una dimensión psicológica unitaria. Las pruebas de habilidad mecánica pueden incluir habilidades psicomotrices, además de la percepción y la comprensión mecánica.
Entre los ejemplos de pruebas de habilidad mecánica se encuentran la Prueba de Comprensión Mecánica Bennett y la Prueba de Conceptos Mecánicos. Las pruebas de habilidad para el trabajo de oficina pueden medir la velocidad y precisión perceptuales, así como la habilidad verbal y numérica. Las pruebas representativas de la capacidad para el trabajo de oficina incluyen la Prueba Minnesota de Trabajo de Oficina y la Batería de Capacidades para Trabajo de Oficina.
Se han diseñado varias pruebas con el propósito de medir las habilidades para la programación y operación de computadoras, incluyendo la Batería de Aptitud para Programador de Computadoras y la Batería de Aptitud para Operador de Computadoras.
Entre otras habilidades especiales para las que se han diseñado pruebas de habilidad se encuentra la de aptitud artística y musical. Sin embargo, la mayoría de las pruebas más antiguas de aptitud artística y musical ya no están disponibles comercialmente. Algunas de estas pruebas miden la apreciación artística (juicio y percepción), mientras que otras evalúan el desempeño artístico o el conocimiento sobre arte. Dos de las más populares han sido las Pruebas Meier de Percepción Estética y Juicio Estético, y la Prueba Graves de Juicio de Diseño.
Las Medidas Seashore de los Talentos Musicales, la prueba de habilidad musical más antigua publicada, ponen énfasis en la discriminación, el juicio y la memoria para las notas o combinaciones de notas. Otras pruebas de habilidad musical, por ejemplo el Perfil de Aptitud Musical, incluyen el juicio y la discriminación de música significativa. No obstante, el éxito ya sea en música o en arte depende de muchos factores adicionales al talento.
Las baterías de aptitudes múltiples se diseñan para medir las aptitudes y deficiencias en diversas áreas de habilidad. Las baterías de pruebas de aptitud, que por lo común no se aplican antes de los primeros años de bachillerato, son herramientas útiles en la asesoría, selección y colocación académicas y vocacionales. Ciertas baterías de habilidades múltiples, por ejemplo el Estudio de Habilidades Guilford-Zimmerman y la Batería de Pruebas de Aptitud General, se basan en los resultados del análisis factorial; no así otras como las Pruebas de Aptitud Diferencial y el Estudio de Aptitud del Empleado.
Las Pruebas de Aptitud Diferencial han sido una de las baterías más útiles para la asesoría académica, mientras que la Batería de Pruebas de Aptitud General se ha empleado más extensamente en consejería vocacional. La Batería de Aptitud Vocacional de las Fuerzas Armadas(ASVAB), la que más se ha aplicado de todas las baterías de aptitudes múltiples, se emplea para propósitos de colocación y selección ocupacional en el ejército estadounidense, y para asesoría de estudiantes de bachillerato que se interesan por carreras militares.
Las calificaciones de una batería de aptitudes, por sí solas, son inadecuadas para lograr una asesoría académica o vocacional efectiva. También deben tomarse en cuenta el desempeño pasado, los intereses y la motivación, las características de personalidad y todos los factores relacionados con la situación.
PREGUNTAS Y ACTIVIDADES
1. El apoyo empírico para distinguir entre aptitud y aprovechamiento se obtuvo en una investigación de corte transversal realizada por Burket (1973). Se encontró que las calificaciones de aprovechamiento se elevaban al aumentar el nivel de grado cuando las calificaciones de habilidad se mantenían constantes, pero las calificaciones de habilidad disminuían con el aumento del nivel de grado cuando las calificaciones de aprovechamiento se mantenían constantes. Estos hallazgos, combina-dos con los de otros investigadores (por ejemplo Carroll, 1973), pueden interpretarse en términos dela siguiente ecuación descriptiva: Aprovechamiento = Aptitud × Experiencia. Explique esto.
2. Identifique por lo menos dos pruebas en cada una de las siguientes categorías de habilidad: psicomotriz, espacial, mecánica, para el trabajo de oficina, artística, musical.
3. ¿Cuáles son las ventajas y desventajas de aplicar una batería de pruebas de aptitud en lugar de varias pruebas individuales de habilidades especiales?
4. ¿Cómo difieren los objetivos de la selección y el sondeo de personal de los de clasificación y colocación? ¿Qué tipos de pruebas son más adecuados para ayudar en el proceso de toma de decisiones para la selección y/o el sondeo? ¿En la clasificación y ubicación?
5. Escriba una reseña crítica sobre cualquiera de las pruebas individuales de habilidades especiales descritas en este capítulo; siga el lineamiento dado en el ejercicio 9 de la sección de Preguntas y Actividades del capítulo 6.
6. Haga una cita con un optometrista u oftalmólogo de su localidad y pídale que describa los procedimientos e instrumentos empleados para probar la visión de una persona. ¿Cuáles aspectos de la visión se miden de rutina y cuáles se miden sólo en circunstancias especiales? Prepare un informe sobre sus hallazgos.
7. Planee una visita a las oficinas administrativas de la escuela de su distrito y entreviste al psicólogo del plantel o al director de educación especial sobre las pruebas psicológicas aplicadas por ellos. Por ejemplo, ¿qué pruebas se usan para evaluar las habilidades o discapacidades especiales de los alumnos? ¿Con qué frecuencia se prueba o revisa la visión de los estudiantes para detectar problemas?Elabore un informe sobre sus hallazgos.
8. Juan obtiene una calificación T de 65 en la prueba de comprensión verbal y otra T de 75 en la prueba de razonamiento numérico de una batería de pruebas de aptitud múltiple. Si la confiabilidad delas dos pruebas es de .90 y .85, respectivamente, ¿puede el examinador estar 95% seguro de que Juan tiene más deficiencias en comprensión verbal que en habilidad numérica? Apoye su respuesta en cálculos adecuados.
9. ¿Cuáles son algunas de las diferencias de género en aptitudes o habilidades especiales que ha observado? ¿A qué factores atribuye estas diferencias?