EstadisticaDescriptiva V2020

Estadística Descriptiva en
Ciencias del Comportamiento

Adolfo López Suárez
Universidad Autónoma del Estado de México

Facultad de Ciencias de la Comducta
2
En este capítulo me propongo clasificar a los hombres, según sus capacidades, en

clases separadas por grados iguales y mostrar el número relativo de individuos que
incluye cada clase. Quizás alguien se sentiría inclinado a conjeturar que el número
de personas que quede en cada clase será aproximadamente el mismo. Si así lo
cree, le puedo asegurar que está del todo equivocado.
El método que emplearé para descubrir esto es una aplicación de la curiosa ley
teórica de la desviación del promedio ...
Esta ley es muy general. El señor Quetelet, Astrónomo Real de Bélgica y máxima
autoridad en estadística social y de población, la ha usado ampliamente en sus
investigaciones. También ha construido tablas numéricas a partir de las que pueden
hacerse los cálculos necesarios siempre que se requiera aplicar la ley. ...
Se ha publicado tanto en años recientes acerca de las deducciones estadísticas que
estoy seguro que el lector estará preparado para aceptar el siguiente caso hipotético:
Supóngase una gran isla habitada por una sola raza, que permitiera libremente los
matrimonios y que hubiera vivido por muchas generaciones bajo condiciones
constantes; en tal población el promedio de estatura de los varones adultos sería
indudablemente el mismo año tras año. También, según la experiencia de la
estadística moderna, que da resultados constantes en casos menos especiales,
encontraríamos año tras año la misma proporción entre hombres de diferentes
estaturas. Quiero decir que si la estatura media fuera de 165 centímetros y se
descubriera que en cualquier año 100 sujetos entre un millón pasaban de los 195
centímetros, la misma proporción se mantendría en otros años. Una constancia
análoga de proporciones se mantendría entre cualesquiera otros límites de estatura
que quisiéramos tomar. Las experiencias estadísticas son invariablemente
confirmatorias y lo dicho hace innecesario describir más casos. En este momento la
ley de la desviación del promedio entra en acción. Ella muestra que el número por
millón de sujetos cuyas estaturas están entre 170 y 174 centímetros (o entre
cualesquiera otros límites que queramos establecer) puede predecirse a partir de un
promedio conocido, o de cualquier otro dato disponible como, por ejemplo, si
supiéramos que 100 sujetos por cada millón rebasan los 195 centímetros de estatura.
Hereditary Genius
Francis Galton (1822-1911)
Contacto
Adolfo López Suárez
Psicólogo, investigador titular del Instituto de
Estudios sobre la Universidad y profesor de la
Facultad de Ciencias de la Conducta de la
Universidad Autónoma del Estado de México.
adolfolopezsuarez@yahoo.com.mx
Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

Ejercicio 5.4 ........................................... 116
CONTENIDO Ejercicio 5.5 ........................................... 117
Ejercicio 5.6 ........................................... 118
Presentación.................................................. 4
Ejercicio 6.1 ........................................... 118
Competencias................................................ 6
Ejercicio 6.2 ........................................... 119
Sugerencias................................................... 7
Ejercicio 6.3 ........................................... 119
Estructura del curso ....................................... 9
Ejercicio 6.4 ........................................... 120
Términos Clave ........................................... 10
Ejercicio 6.5 ........................................... 121
Lección 1. Un bosquejo histórico ................. 11
Ejercicio 7.1 ........................................... 122
Lección 2. Nociones básicas ....................... 19
Ejercicio 7.2 ........................................... 124
Lección 3. La masa de datos ....................... 25
Ejercicio 7.3 ........................................... 126
Lección 4. Organización de datos ............... 32
Ejercicio 8.1 ........................................... 128
Lección 5. Representación gráfica............... 42
Ejercicio 8.2 ........................................... 128
Lección 6. Medidas de proporción ............... 54
Ejercicio 8.3 ........................................... 129
Lección 7. Medidas de ubicación ................. 61
Ejercicio 8.4 ........................................... 129
Lección 8. Medidas de tendencia central..... 66
Ejercicio 8.5 ........................................... 130
Lección 9. Medidas de variabilidad .............. 73
Ejercicio 8.6 ........................................... 131
Lección 10. Medidas de forma ..................... 81
Ejercicio 9.1 ........................................... 132
Lección 11. Medidas de correlación ............ 86
Ejercicio 9.2 ........................................... 133
Epílogo ........................................................ 99
Ejercicio 9.3 ........................................... 134
Notación .................................................... 104
Ejercicio 9.4 ........................................... 136
Bibliografía................................................. 105
Ejercicio 10.1 ......................................... 137
Respuestas a los ejercicios ....................... 108
Ejercicio 10.2 ......................................... 138
Ejercicio 3.1........................................... 108
Ejercicio 10.3 ......................................... 139
Ejercicio 3.2........................................... 108
Ejercicio 11.1 ......................................... 140
Ejercicio 3.3........................................... 109
Ejercicio 11.2 ......................................... 142
Ejercicio 3.4........................................... 109
Ejercicio 11.3 ......................................... 143
Ejercicio 3.5........................................... 110
Ejercicio 11.4 ......................................... 147
Ejercicio 4.1........................................... 111
Ejercicio 4.2........................................... 111
Ejercicio 4.3........................................... 111
Ejercicio 4.4........................................... 112
Ejercicio 4.5........................................... 112
Ejercicio 5.1........................................... 113
Ejercicio 5.2........................................... 114
Ejercicio 5.3........................................... 115
PRESENTACIÓN
Desde los trabajos pioneros que realizaron en el siglo XIX Quetelet en el campo de
la demografía y Fechner en la psicología, la estadística ha sido la puerta de entrada
al análisis cuantitativo del comportamiento. Si es cierto, como afirmaron los filósofos
griegos, que no hay ciencia sin matemáticas, entonces tendremos que aceptar que
no hay ciencias de la conducta sin estadística. La estadística es la rama de la
matemática que mayores aplicaciones directas tiene para el estudio de la conducta,
y la estadística descriptiva constituye, a su vez, la puerta de entrada tanto al estudio
de la probabilidad como a la inferencia y a la proyección estadística. En
consecuencia, comprender la descripción estadística es la base para comprender
las matemáticas necesarias para estudiar el comportamiento de los organismos
vivos.
Este texto fue diseñado para estudiar la descripción estadística partiendo desde sus
conceptos más elementales. Puede aplicarse como un primer curso de matemáticas
en el nivel de licenciatura, preferentemente en los primeros semestres, en
disciplinas tales como psicología, antropología, sociología, comunicación y ciencias
políticas.
Su diseño aplica principios de la tecnología educativa, orientados a estimular la
participación activa del alumno y a facilitar la conducción eficaz por parte del
profesor, dentro de un proceso integrado de enseñanza–aprendizaje. Proporciona,
además, los elementos para evaluar el aprendizaje de manera objetiva, planeada y
eficiente mediante problemas tipo que pueden adaptarse a las necesidades de la
disciplina que se estudie.
Este texto tiene una clara orientación a la comprensión conceptual y a la aplicación
de técnicas, evitando la demostración de teoremas que podrían interesar a un
profesional de las matemáticas, pero no ocurre así en el campo de las ciencias de
la conducta, donde se ha observado que la demostración lógica de teoremas
matemáticos, como técnica didáctica, suele tener en el estudiante un efecto muy
poco motivador, cuando no francamente disuasivo. En las ciencias del
comportamiento las matemáticas tienen un carácter aplicado.
Nuestro análisis inicia con un breve bosquejo histórico, que tiene como propósito
apreciar la estrecha relación que existe entre el desarrollo de la estadística y las
ciencias de la conducta, desde las teorías pioneras hasta la actualidad. Se trata de
acercarse a una conceptualización estructural, de manera que el estudiante
comience a integrar desde el principio una comprensión gestáltica de la disciplina.
Esto constituye las primeras dos lecciones, que no incluyen ejercicios sino reactivos
para autoevaluación del estudiante. Sin embargo, debe prestarles atención, pues
de ellas depende en gran medida comprender estructuralmente a la estadística y no
limitarse a la mera acumulación de competencias dispersas, de manera que supere
la falsa dicotomía metodológica entre lo cuantitativo y lo cualitativo.
A partir de la tercera lección se abordan los procesamientos estadísticos
propiamente dichos. Se comienza por el principio de toda la estadística, estudiando
la masa de datos, insumo de cualquier procesamiento estadístico, pero que suele
5
obviarse en los cursos. En la tercera se revisan las técnicas para organizar los datos
y en la cuarta la representación gráfica. Las seis lecciones restantes se destinan al
estudio de las medidas estadísticas: de proporción, ubicación, tendencia central,
variabilidad, forma y correlación. Al término de cada una de estas lecciones, se
plantean problemas-tipo para cada competencia a desarrollar. Para facilitar el
aprendizaje, los temas estudiados se presentan como lecciones, las cuales fueron
organizadas bajo un riguroso orden lógico-psicológico.


6
COMPETENCIAS
Al término del curso el alumno:
1. Conocerá el desarrollo histórico de la estadística.
2. Conceptualizará la estructura de esta disciplina.
3. Conceptualizará la masa de datos y obtendrá sus parámetros.
4. Organizará los datos conforme a sus características y propiedades.
5. Representará gráficamente los datos conforme a sus características y
propiedades.
6. Obtendrá e interpretará medidas de proporción.
7. Obtendrá e interpretará medidas de ubicación.
8. Obtendrá e interpretará medidas de tendencia central.
9. Obtendrá e interpretará medidas de variabilidad.
10. Obtendrá e interpretará medidas de forma.
11. Obtendrá e interpretará medidas de correlación bivariable.


7
SUGERENCIAS
1. Revise continuamente la Estructura del curso y la Tabla de términos clave para
que vaya construyendo paulatinamente una estructura conceptual del curso.
2. Observe que tanto las lecciones como los párrafos están numerados. Esto nos
permite dirigirnos de forma inequívoca a cualquier parte del texto. Por ejemplo, para
referirnos al séptimo párrafo de la cuarta lección, daremos la dirección: [4:7].
3. Es muy importante comprender que este material no pretende sustituir la lectura
de libros y otras fuentes documentales. En el mismo texto se hace referencia a
bibliografía especializada, cuyas fichas se presentan al final con un breve
comentario anexo. Este texto resultará realmente útil cuando impulse al alumno al
estudio independiente, buscando en diversas fuentes para obtener información y
comprender críticamente los temas de estudio.
4. Conviene, lo antes posible, leer este material por completo. Con esta primera
lectura no se pretende lograr una comprensión cabal del contenido, sino más bien
integrar una visión preliminar, panorámica, que deberá ir ganando precisión
conforme se avance en el curso.
5. Posteriormente, habrá que leer a fondo el material que se discutirá en la
siguiente clase, para lo cual puede apoyarse en diccionarios, enciclopedias y, sobre
todo, en las fuentes que se refieren aquí mismo. Debe observarse que casi cualquier
libro de estadística propone lo mismo sobre un tema dado, aunque desde luego
varían los enfoques y los matices; esto ampliará la comprensión del tema. De esta
forma el alumno estará desarrollando verdaderos hábitos de estudio independiente.
6. Una vez que el alumno, por sí mismo, haya estudiado el material, podrá aprove-
charse el tiempo dentro del aula para discusiones que aclaren dudas y profundicen
en los temas de interés para cada estudiante. Estaremos desterrando la exposición
rígida por parte del maestro y se entrará a auténtica una dinámica de enseñanza-
aprendizaje.
7. Deben resolverse los reactivos de la Guía de evaluación que vienen al final de
cada lección. Para ello hay que notar que también los reactivos se numeran para
que puedan contestarse por separado, identificarse por lección y confrontar las
respuestas en la sección correspondiente. De este modo el estudiante podrá
depurar sus respuestas.
8. Pero lo más importante, como en cualquier curso de matemáticas, es que el
alumno habrá de esforzarse en resolver los ejercicios antes de la sesión en la que
vayan a trabajarse, aun cuando tenga dudas. Cuando posteriormente se resuelvan
en clases, podrá confrontar y corregir sus respuestas. Esto será decisivo para su
aprendizaje y para su rendimiento en los exámenes de acreditación de la asignatura.
9. La estrategia educativa que aquí se propone se orienta al desarrollo –y, por
supuesto, a la evaluación– de competencias, por lo cual todos los reactivos
consisten en la solución de problemas, estrictamente del tipo presentados en cada
8
lección. Se sugiere permitir que el alumno pueda consultar cualquier material

durante los exámenes, pero deberá evitarse cualquier comunicación con sus
compañeros. La corrección de los procedimientos y la comprensión del problema
deberán ser los criterios fundamentales para que el profesor asigne la calificación.
10. Finalmente, en la sección Para aprender más se proponen algunas ideas y retos
para ampliar los contenidos del curso hasta el límite que marque el interés de cada
estudiante.


9
ESTRUCTURA DEL CURSO

1. Bosquejo histórico
Descriptiva
Estadística Inferencial
Proyectiva
Variable Continua
2. Nociones básicas Discreta
Dato Puntual
Intervalar
Medida estadística Parámetro

Estadígrafo
3. Masa de datos Tamaño

Medidas
Clasificación
4. Organización de datos Ordenación Ascendente

Descendente
Agrupación Puntual
Distribución de frecuencias Intervalar
Dimensión Una variable

Dos variables
Clasificación Circulograma
5. Representación gráfica Gráfica de barras
Datos puntuales Frecuencia simple (polígono)

Distribución de frecuencias Frecuencia acumulada (ojiva lineal)
Datos intervalares Frecuencia simple (histograma)

Frecuencia acumulada (ojiva escalera)
6. Proporción
7. Ubicación
Media
8. Tendencia central Mediana
Modo
Rango
Medidas estadísticas Rango semintercuartilar
9. Variabilidad Desviación media
Desviación estándar
Varianza
10. Forma Sesgo

Curtosis
Nominal
11. Correlación Ordinal
Intervalar
Los números indican lecciones



10
TÉRMINOS CLAVE
Variable Algoritmo
Dato
Medida de proporción
• Puntual
• Porcentaje
• Intervalar
Dígito
Nivel de medición
Cifra
• Nominal Redondeo
• Ordinal Ajuste de sumas
• Intervalar Límite exacto
• De razón Medida de ubicación
Dígito • Fractil
Cifra • Rango percentilar
Estadística Tendencia
• Descriptiva Tendencia central
• Inferencial • Media
o Paramétrica o Aritmética
o No paramétrica o Ponderada
• Proyectiva • Mediana
Población • Modo
Muestra Variabilidad
Parámetro • Rango
Estadígrafo
• Rango semiintercuartilar
Masa de datos
• Desviación media
• Pequeña / Grande
• Desviación estándar
• Cualitativa / Cuantitativa
• Varianza
• Univariable / Bivariable / Multivariable
Forma de una distribución
Frecuencia
• Sesgo
Distribución
• Curtosis
• Empírica
Correlación
• Teórica
• Simple
Clasificación
Plano coordenado • Múltiple
• Abscisa • Lineal
• Ordenada • No lineal
• Punto • Coeficiente de correlación
o Negativo
• Nube de puntos
o Neutro
Gráfica
o Positivo
• Gráfico de barras
• Predictor
• Circulograma
• Criterio
• Histograma
• Recta de tendencia
• Polígono de frecuencias
• Parámetros de la recta
• Gráfico de escalera
• Regresión
• Ojiva
• Gráfico de dispersión

11
LECCIÓN 1. UN BOSQUEJO HISTÓRICO

La filosofía está escrita en este magno libro, el universo, que
permanece continuamente abierto a nuestra mirada. Pero
el libro no puede ser entendido a menos que uno aprenda
primero a comprender el lenguaje y leer las leras en las que
está escrito. Está escrito en el lenguaje de las matemáticas
y sus letras son los triángulos, los círculos y otras figuras
geométricas sin las cuales es humanamente imposible
comprender una sola palabra de él. Sin ellos, uno se
encuentra errante.
Il sagiattore
Galileo Galilei
EL ORIGEN: EL RECUENTO PRIVADO
1. Probablemente nunca se sabrá con certeza la forma en que nacieron los
registros de grupos de datos, que pueden considerarse como el antecedente más
remoto de la estadística. Por lo que se sabe, en un proceso evolutivo que se remonta
a cerca de veinte millones de años los primates hominoideos evolucionaron hasta
surgir de ellos los homínidos, de los cuales, luego de varios ensayos –muchos
fallidos, que terminaron en extinciones- surgió el homo sapiens hace alrededor de
150 mil años. Entonces, la nueva especie comenzó su propia lucha para sobrevivir,
compensando su debilidad estructural y escasa fuerza con la formidable arma que
representaba su capacidad de pensamiento, muy superior a la de sus competidores.
2. En un ejercicio de imaginación, situémonos en el amanecer de la razón humana
durante el Neolítico, cuando comenzaron a establecerse los primeros
asentamientos humanos semifijos. Pensemos en un pastor que hace 10 mil años,
al terminar el invierno, sacaba a su rebaño a los pastizales que reverdecían en
cerros y valles para la temporada de engorda y reproducción. En una bolsa de cuero
colocaba una piedrecilla (calculus en latín, origen de nuestro término moderno para
referirnos al cálculo) por cada animal que salía del corral; más aún, podemos
imaginar que utilizaba piedrecillas blancas para identificar a los machos y negras
para las hembras, tradición oriental que se ha preservado en el yin y el yang,
símbolos de la dualidad universal. Terminada la temporada de pastoreo, cuando el
rebaño regresaba a los corrales de la aldea para pasar el invierno, el pastor repetía
el proceso de recuento colocando piedrecillas en una segunda bolsa. Acomodaba
entonces en una hilera, primero las blancas y después las negras, las piedrecillas
de la primera bolsa, que era el registro de la salida del rebaño; debajo, en una
segunda hilera, organizadas por color en el mismo orden, colocaba las piedrecillas
de la segunda bolsa, el registro del rebaño al regresar. Quitando una piedrecilla a la
vez, por color, en cada una de las dos hileras hasta que se agotara una de ellas y
contando las sobrantes podía saber, por sexo, cuántas habían regresado de más,
lo que representaba su ganancia, o de menos, en cuyo caso se habían registrado
pérdidas al final de la temporada. Con los años de experiencia, es fácil imaginar que
el pastor sustituiría las bolsitas de cuero por registros más duraderos como las
marcas en las paredes de una cueva, o bien en trozos de madera o hueso, que
12
resultan transportables. Así imaginamos el origen de la estadística. Este ejercicio

distaba mucho de ser un pasatiempo, pues el rebaño no sólo constituía la riqueza
de una tribu, sino que significaba, en lo concreto, la diferencia entre la alimentación
y el hambre o incluso la muerte. Así, las más rudimentarias técnicas estadísticas
surgieron de una necesidad concreta y ayudaron a la sobrevivencia del hombre en
las duras condiciones en que se separó de los demás animales y comenzó a
compensar su intrínseca debilidad corporal con el desarrollo de su inteligencia.
EL SURGIMIENTO DE LA CIVILIZACIÓN: EL CONTROL PÚBLICO
3. Con el desarrollo de técnicas de cultivo agrícola capaces de preservar la
productividad del suelo, hace alrededor de 5 mil años los asentamientos
semipermanentes comenzaron a convertirse en asentamientos urbanos
permanentes. Al volverse sedentarios, los grupos humanos ganaron en seguridad y
aumentaron su tamaño y complejidad. La agricultura y la ganadería, por citar solo
las actividades productivas primarias, comenzaron a producir cada vez más
excedentes, dando origen a la división del trabajo y al desarrollo económico.
Conforme se integraban más territorios al control de la creciente ciudad, el gobierno
enfrentaba con nuevos problemas para identificar la riqueza y poder administrar un
sistema eficaz de impuestos. Así surge la necesidad de técnicas estadísticas más
eficaces.
4. Hacia 4 mil años a. C. los sumerios ya escribían en tablillas de arcilla sobre una
matemática notablemente avanzada. De hecho, estos parecen ser los registros más
antiguos de escritos. Es posible que los primeros escritos hayan sido sobre las
propiedades y no sobre ideas religiosas o filosóficas. Estos registros contables
evolucionaron para satisfacer las necesidades de la administración pública,
principalmente para el control de impuestos por castas sacerdotales que
preservaban y desarrollaban el conocimiento en los grandes templos.
5. Según Heródoto (484-425 a. C.), hacia 3050 a.C. en Egipto los faraones
disponían de eficientes administradores que registraban la población y la riqueza
para organizar el sistema de tributos en especie y en fuerza de trabajo, lo que
permitió la construcción de obras enormes, como las pirámides. Existen registros
de que Ramsés II (reinó en el siglo XIII a. C.) realizó un censo de tierras con el
propósito de reorganizar su tenencia.
6. Por la misma época, la Biblia (en Números) registra los censos que ordenó
Moisés de la población hebrea y de su ejército, el primero antes de partir del Sinaí
y el segundo una generación después en Moab. Recuerda al rebaño del pastor
neolítico.
GRECIA Y ROMA: EL NACIMIENTO DE LA CIENCIA Y LA TECNOLOGÍA
7. Aunque mantuvieron su aplicación principal en la administración pública, los
griegos formalizaron la matemática y con ello dieron un nuevo impulso al desarrollo
de técnicas estadísticas que les permitieron mejorar la eficiencia de la distribución
de terrenos, la administración del servicio militar, el cobro de impuestos, así como
la planeación y aprovisionamiento de sus colonias.
8. A partir de los avances logrados por los griegos, Roma llevó la aplicación de la
13
estadística al más alto grado de amplitud, sistematización, perfección y aplicación

que hasta entonces se había alcanzado. El vasto imperio requería de una avanzada
organización jurídica y política para su adecuada administración, por lo que se
establecieron los census cada cinco años, obligando a los funcionarios a efectuar
empadronamientos que permitieron recuentos precisos de nacimientos,
defunciones y situación legal de las personas. Durante la dinastía Antonina (que
gobernó de 96 a 192, lo que la convierte en la más longeva) se implantó un auténtico
registro civil en el templo de Saturno, donde debían registrarse los nacimientos
antes de que se cumplieran treinta días después del parto. También se controlaban
tierras, productos y riqueza con propósitos fiscales. Todo se registraba en cada
demarcación administrativa y se concentraba para su control central en la Metrópoli.
Nunca habrían podido extender, gobernar y consolidar su vasto imperio sin tal
información. Con la decadencia de Roma, tal nivel de aplicación de la estadística
para la administración pública no volvería a verse en el mundo hasta la época
moderna.
UN IMPASSE, LA EDAD MEDIA
9. Después de la caída de Roma la estadística compartió con el resto de la cultura
una involución en Europa, apenas interrumpida por los esfuerzos de Carlomagno
(c. 742-814) que trató de restablecer las estadísticas en su imperio para el cobro de
impuestos, así como de Guillermo el Conquistador (c. 1028-1087) quien en
Inglaterra ordenó el catastro de la extensión y valor de tierras y fincas del reino,
conocido como el Domesday Book.
10. Pero fue la iglesia quien jugó el papel más importante durante este periodo
histórico para conservar la cultura. En lo tocante a la estadística, al principio el clero
generalmente se limitaba a registrar sus posesiones; en este rubro destaca el
recuento realizado durante el reinado de Pipino el Breve (715-768), rey de los
francos. Sin embargo, ya para inicios del Renacimiento, a partir del Concilio de
Trento (1545-1563) la iglesia estableció en sus parroquias el registro de
nacimientos, matrimonios y defunciones, reiniciando así la función registral que es
la base de la estadística demográfica.
LA ESTADÍSTICA COMO RAMA DE LAS MATEMÁTICAS
11. Al término de la Edad Media las crecientes ciudades ya contaban con grandes
masas de datos en sus registros civiles, fiscales y mercantiles. Con el Renacimiento,
y con el auge del comercio internacional que trajo el descubrimiento de América y
las nuevas rutas al Asia, la estadística regresó de lleno al campo de la matemática
con los trabajos de genios como Nicolás Copérnico, Galileo Galilei, John Napier,
Francis Bacon y René Descartes. A partir de aquí la estadística se desarrolló como
una rama de la matemática aplicada.
12. John Graunt (1620-1674) publicó en 1663 Natural and Political Observations
Made upon the Bills of Mortality (Observaciones políticas y naturales sobre los
registros de mortalidad), donde analiza la necesidad de que las políticas
demográfica y económica se fundamenten en datos objetivos y desarrolla métodos
para el censo y el análisis tabular de los datos.

14
13. Kaspar Neumann (1648-1715), vicario de Santa María Magdalena en Breslau, a

partir de los registros de la ciudad estudió la tasa de mortalidad y escribió el tratado
Reflexionen über Leben und Tod bey denen in Breslau Geborenen und Gestorbenen
(Reflexiones sobre la vida y la muerte en Breslau, a partir de los nacimientos y las
defunciones), donde realiza uno de los primeros análisis estadísticos modernos y
demuestra, entre otras cosas, que es falsa la creencia popular que afirmaba que las
muertes se incrementaban en los años terminados en siete. Presentó su informe a
Leibnitz, quien a su vez lo envió a la Royal Society donde fue apreciado y publicado
en 1693 en sus Transactions.
14. Gottfried Achenwall (1719-1772), filósofo y matemático alemán reconocido como
uno de los impulsores de la nueva estadística, en su estudio Staatsverfassung der
Europäischen Reiche im Grundrisse (Esquema de la constitución política de los
imperios europeos) realiza análisis estadísticos para estudiar la agricultura,
manufacturas y comercio de las naciones europeas. A él se atribuye usar por
primera vez en una publicación el término statistik para referirse a esta disciplina.
NACE UNA NUEVA CIENCIA: LA TEORÍA DE LA PROBABILIDAD
15. Sorprendentemente ni los sumerios, ni los egipcios, ni los griegos, ni los romanos
ni la Europa medieval lograron formalizar matemáticamente el constructo de
probabilidad. Fue Gerolamo Cardano (1501-1576), un médico y astrólogo italiano
que prácticamente nació con el Renacimiento, quien escribió en 1560 (publicado
póstumamente en 1663) el Liber de ludo aleae (Libro de los juegos de azar), obra
pionera en la que presenta los primeros cálculos de probabilidad. Así nace la teoría
de la probabilidad, un producto neto del Renacimiento. Debe observarse el origen
etimológico del término “aleatorio”, del latín aleatorĭus, relativo al juego de dados.
16. Posteriormente B. Pascal (1623-1662) presentó por correspondencia sus ideas
a P. de Fermat (1601-1665) y a partir de ahí inició la formalización matemática de
una teoría de la probabilidad.
17. Ya Cardano había postulado, sin prueba, que la precisión de los pronósticos
estadísticos mejoraba conforme aumentaba el número de observaciones; por
ejemplo, entre más años se registra el clima en un lugar, más clara aparece una
regularidad que permite formular pronósticos. Sin embargo, fue Jakob Bernoulli
(1655-1705), primero de una dinastía de célebres matemáticos suizos, quien por
primera vez demostró con experimentos binarios esta ley empírica a la que él llamó
su “Teorema dorado”, al que hoy se conoce como el Teorema de Bernoulli y
constituye una de las columnas sobre las que se construyó la teoría de la
probabilidad. Este teorema fue publicado en 1713, póstumamente, en su Ars
conjetandi (Arte de la conjetura). En 1835, S. Poisson (1781-1840) formalizó este
teorema y lo llamó con el nombre que hoy conocemos: Ley de los grandes números.
Más tarde P. Chebyshev (1821-1894), A. Markov (1856-1922) y otros fueron
refinando y generalizando paulatinamente esta ley, hasta que A. Khinchin (1894-
1959) presentó una prueba completa para cualquier variable aleatoria.
18. La segunda columna que sostiene a la teoría de la probabilidad, y que constituye
un caso particular de la Ley de los grandes números, es el Teorema del límite
central. En su forma más general. Postula que, dado un número suficientemente
15
grande de ensayos, cualquier distribución de probabilidad se aproxima a la

Distribución normal hasta el punto en que puede despreciarse el error de ajuste y
aplicar este modelo. Esto implica que, cuando las muestras son suficientemente
grandes (conforme a la ley de los grandes números), puede utilizarse la distribución
normal como modelo probabilístico. La primera formalización matemática del
Teorema del límite central fue el Teorema de Moivre-Laplace, por A. de Moivre
(1667-1754) y P. S. Laplace (1749-1827).
19. Es así como de Moivre postuló la Distribución normal y Laplace la aplicó al
análisis de errores, pero fue C. F. Gauss (1777-1855) quien la utilizó ampliamente
para analizar datos astronómicos y finalmente la formalizó en 1809, por lo que se le
asocia con su nombre y frecuentemente se la llama Distribución gaussiana. La
importancia de esta distribución para las ciencias de la conducta es tal que sin ella
no es posible definir rigurosamente (más allá de nociones o preconcepciones) el
constructo fundamental de normalidad y, en consecuencia, las zonas de
subnormalidad y supranormalidad, en campos como la inteligencia, la memoria o la
psicopatología, por sólo mencionar algunos.
20. De este modo, surgida para explicar los juegos de azar, en menos de dos siglos
la teoría de la probabilidad creció hasta convertirse en el fundamento matemático
de nuevas ciencias como la psicología, la economía y la sociología. Actualmente
sería difícil señalar una ciencia empírica que pueda prescindir de la teoría de la
probabilidad, trátese de las leyes de la herencia en genética, el movimiento de los
colectivos de partículas o los cuanta de luz o calor en física, o los sistemas de
seguros en economía. Hoy podemos ver que en cualquier ciencia empírica existen
dos tipos de leyes: las deterministas y las probabilistas. En las ciencias de la
conducta prevalecen las segundas.
21. Desde su nacimiento la teoría de la probabilidad se apoyó en la estadística
descriptiva, utilizando sus técnicas para procesar grupos de datos para el estudio
matemático de los fenómenos aleatorios. Hoy podemos ver que la teoría de la
probabilidad y la estadística tienen una relación sinérgica en la que la primera (que
actualmente se ubica en la rama de los fundamentos de la matemática) parte de la
estadística descriptiva -principalmente de la distribución de frecuencias- y, a su vez,
la probabilidad constituye la base teórica sobre la que se ha construido la estadística
inferencial y las técnicas de proyección estadística.
ESTADÍSTICA Y PROBABILIDAD EN LA PSICOLOGÍA
22. La existencia de la estadística y la probabilidad permitió el nacimiento de la
psicología científica (y muchas otras ciencias que estudian el comportamiento). Para
fundamentar esta afirmación basta con revisar, aunque solo sea superficialmente,
el trabajo de algunos pioneros de la psicología.
23. G. T. Fechner (1801-1887), fundador de la psicofísica, realizó los primeros
trabajos experimentales que involucraron múltiples mediciones de la sensación
mediante el reporte verbal ante la manipulación de estímulos (como sostener pesos
o la gustación de sal de mesa disuelta) e introdujo el uso de la mediana para el
análisis de datos. Aunque posteriormente su famosa Ley de Weber-Fechner sería
revisada y corregida, el hecho es que abrió el campo de la psicología experimental
16
e introdujo la estadística como método de análisis de datos.

24. Fechner propuso la kollektivemasslehre (que podríamos traducir por “teoría de
la medición de colectivos”), la cual plantea que un grupo de datos, visto como una
entidad colectiva, tiene características propias que, aunque están condicionadas por
los datos que lo integran, resultan esencialmente diferentes a las características de
cada dato individual. En consecuencia, el grupo de datos puede y debe ser
estudiado como una entidad propia, que es independiente de los datos individuales
que lo conforman. Es interesante ver que la idea de kollectivemasslehre prefigura la
noción central de la teoría de la Gestalt. Esta idea matemática, formulada por un
matemático, proporcionó las herramientas necesarias para interpretar los primeros
estudios estrictamente empíricos sobre la sensación. Así nació la psicología
científica, en forma semejante a lo que ocurrió con la física moderna, en la que el
cálculo infinitesimal proporcionó a Newton las herramientas que necesitaba para
formular su teoría de la gravitación universal.
25. Regresando a las ciencias del comportamiento, el trabajo de W. M. Wundt (1832-
1920), fundador del primer laboratorio de psicología experimental en 1879 en
Leipzing, partió de los trabajos de Fechner, y así lo reconoció el propio Wundt. En
su laboratorio, la aplicación de la estadística fue fundamental.
26. F. Galton (1822-1911), británico, destacó en múltiples ramas del conocimiento,
desde la psicología y antropología hasta la meteorología. En psicología fue pionero
en el estudio de las diferencias individuales, principalmente en la inteligencia,
centrando su interés en el estrato superior de la población, los dotados. Para ello,
contribuyó a la formulación de la distribución normal y desarrolló constructos tan
importantes como la línea de regresión y la correlación como alternativa a la
causalidad.
27. K. Pearson (1857-1936), matemático británico, colaboró a la formulación
definitiva de la estadística como rama de la matemática aplicada y fue pionero en la
bioestadística. Se le conoce principalmente por su formulación del análisis Chi-
cuadrada y, a partir del trabajo de Galton, del coeficiente de correlación producto-
momento, muy conocido también como el Coeficiente de Pearson, fundamental en
psicometría. Su obra científico-filosófica The grammar of science (La gramática de
la ciencia, 1892) fue tan influyente que el grupo llamado Academia Olimpia, al que
pertenecía Einstein, lo utilizó como inspiración para el desarrollo de sus innovadoras
teorías físicas. Esta obra debería ser leída por quienes se empeñan en dividir a las
ciencias en naturales y sociales.
28. S. S. Stevens (1906-1973), psicólogo estadounidense, formuló una teoría de la
medición en la que establece sus famosos cuatro niveles, también fundamental para
la psicometría. Además, revisó la Ley de Weber-Fechner y propuso en su lugar la
que se conoce como Ley de la energía o Ley de la potencia (Steven’s power law)
en 1957.
29. R. Fisher (1890-1962), científico inglés que destacó en matemáticas, estadística,
evolución y genética, desarrolló el análisis de varianza (AVAR, o ANOVA por sus
siglas en inglés: ANalysis Of VAriance), un método inferencial para probar
diferencias de tendencia central en más de dos grupos. También formuló la
17
Distribución F (llamada así en honor a su apellido), que permite probar hipótesis en

el AVAR.
30. C. Spearman (1863-1945), psicólogo inglés famoso por su teoría de la
inteligencia, formalizó el coeficiente de correlación aplicable a medidas ordinales
conocido como el Coeficiente de correlación por rangos de Spearman. Para
demostrar su teoría bifactorial de la inteligencia (que postula la existencia de un
factor general y otros específicos), también desarrolló el análisis factorial, método
estadístico que permite aislar factores (por ejemplo, pero no exclusivamente en el
estudio de la inteligencia) y medir su peso o influencia.
31. G. Rasch (1901-1980), matemático, estadístico y psicómetra danés, alumno de
Fisher, revisó la teoría de los niveles de medición y propuso un nuevo modelo.
Estuvo entre los pioneros que en la década de los 1950s formularon la Teoría de la
respuesta al ítem (TRI, o IRT por sus siglas en inglés), que no pudo comenzar a
demostrarse y aplicarse hasta que a finales de los 1970s se dispuso del poder de
cómputo suficiente.
32. Vemos que la probabilidad, y la estadística como se conciben actualmente, son
ramas de la matemática muy recientes. También es claro que el nacimiento de la
psicología científica estuvo estrechamente asociado a –quizá no sería exagerado
decir que dependió de- el desarrollo de la probabilidad y la estadística. Es un hecho
que actualmente estadística y probabilidad se siguen desarrollando en una relación
sinérgica con la psicología, la Teoría de la respuesta al ítem, con la que cerramos
nuestra superficial panorámica histórica así lo demuestra.

GUÍA DE EVALUACIÓN
1. En el origen de la estadística pudo estar el recuento de bienes por particulares.
Discuta esta afirmación
2. ¿Qué aplicaciones tuvo la estadística en las primeras civilizaciones?
3. Indique dos aplicaciones de la estadística en el Imperio Romano.
4. Indique dos aplicaciones de la estadística en la Edad media.
5. ¿De dónde surgió el término estadística?
6. Antes del Renacimiento no existía una teoría matemática capaz de estudiar el
azar. Discuta esta proposición.
7. ¿De dónde surge el término aleatorio?
8. ¿Cuál es la primera obra publicada en la que se estudia el cálculo de
probabilidades?
9. ¿Cuál es el primer antecedente conocido sobre la Ley de los grandes números?
10.¿Cuál es el antecedente del Teorema del límite central?
11.¿Por qué a la Distribución normal también se le llama Distribución gaussiana?
12.La teoría de la probabilidad no habría podido desarrollarse sin el antecedente de
la estadística. Discuta esta proposición.
13.La Ley de Weber-Fechner no habría sido posible sin la estadística. Discuta esta
proposición.
14.Explique el concepto de kollektivemasslehre propuesta por Fechner.
15.¿Qué aportaciones hizo Galton a la estadística?
18
16.¿Qué aplicaciones hizo Galton de la estadística a la psicología?

17.Indique dos aportaciones de Pearson a la estadística.
18.Indique una aportación de Fisher a la estadística.
19.Indique dos aportaciones de Spearman a la estadística.
20.Indique una aportación de Rasch a la psicometría.

PARA APRENDER MÁS
1. Escriba un ensayo sobre la relación entre la Kollektivemasslehre propuesta por
Fechner y la Teoría de la Gestalt.
2. Tome alguno de los estudios realizados por Fechner, Galton o Pearson y escriba
un ensayo explicando la forma en que aplican la estadística.
3. Escriba un ensayo describiendo la corrección que Stevens hace a la Ley de
Weber-Fechner.
4. Escriba un ensayo explicando la contribución de Rasch a la Teoría de la
respuesta al ítem.
5. Revise el reporte del último censo de población y escriba un ensayo explicando
la forma en que se describe estadísticamente a la población mexicana.


19
LECCIÓN 2. NOCIONES BÁSICAS

La libertad consiste en poder afirmar, sin restricciones, que
dos más dos son cuatro. Si esto es posible, todo lo demás
caerá por su propio peso.
1984
George Orwell
ESTADÍSTICA Y PROBABILIDAD, ESTRUCTURA CONCEPTUAL
1. La estadística y la probabilidad se encuentran tan relacionadas entre sí, que en
ocasiones se les confunde en una sola y misma disciplina. En la figura 2.1 aplicamos
la idea de árbol para analizar sistemáticamente su estructura.
FIGURA 2.1. ESTRUCTURA DE LA ESTADÍSTICA Y LA PROBABILIDAD

...
• Pura • Teoría de la probabilidad
...
Matemática
... • Descriptiva
• Aplicada • Estadística • Inferencial • Paramétrica
... • No paramétrica
• Proyectiva
2. Veamos, en principio, algo obvio: tanto la probabilidad como la estadística

forman parte de la matemática. La matemática suele dividirse en dos grandes
ramas: la matemática pura (también llamada fundamentos de la matemática) la cual
no requiere de referentes empíricos para existir y la matemática aplicada, aquella
que se aplica a fenómenos empíricos.
3. Después hemos de observar que la teoría de la probabilidad constituye una de
las ramas de los fundamentos de las matemáticas. La teoría de la probabilidad se
encarga del análisis de la noción de azar, mediante el desarrollo de modelos
matemáticos capaces de tratar con los fenómenos aleatorios. En el campo de las
ciencias del comportamiento, debemos tener claro que la conducta de los
organismos vivos es un fenómeno aleatorio1.
4. En la otra rama, la matemática aplicada, se ubica la estadística. Podemos definir
a la estadística como un conjunto de técnicas matemáticas encargadas de procesar
1. La teoría de la probabilidad, fundamental para comprender la psicología moderna, requiere de todo un curso
aparte. Aquí sólo la mencionamos para avanzar hacia una concepción completa de la estadística.
20
grupos de datos para describir sus características y para tomar decisiones en

ausencia de una información completa. Observemos dos implicaciones de esta
definición general:
a) La estadística no se interesa por la captura de datos; ello es asunto de los
métodos de investigación. El propósito de la estadística consiste en procesar
datos. El grupo de datos constituye el insumo del procesamiento estadístico.
b) La estadística, cualquiera que sea su tipo, se interesa por estudiar grupos de
datos y no por datos individuales. Sin embargo, el grupo constituye una referencia
indispensable para interpretar un dato individual.
5. Los procesos estadísticos pueden clasificarse en tres tipos: descripción,
inferencia y proyección. Esto da origen a tres ramas de la estadística.
6. La estadística descriptiva, como su nombre lo indica, se encarga de describir
grupos de datos. A partir de un conjunto de datos crudos, tal como se obtuvieron,
los organiza, los representa mediante gráficas y calcula medidas capaces de
describirlos.
7. La estadística inferencial parte de las características conocidas de una
muestra para inferir (también suele decirse inducir) las características desconocidas
de la población de que fue tomada. Esta inferencia puede realizarse de dos formas:
a) Cuando se utilizan parámetros, se llama inferencia paramétrica.
b) Cuando la inferencia se hace directamente a partir de los datos, sin involucrar
parámetros, entonces se llama inferencia no paramétrica.
8. El tercer tipo, la estadística proyectiva, utiliza una serie de observaciones
obtenidas en periodos de tiempo determinados sobre cierto fenómeno; estas
observaciones permiten hacer pronósticos hacia el futuro. En otras palabras, a partir
del comportamiento observado en el pasado, se pronostica (en otros términos, se
proyecta) el comportamiento que, se espera, el fenómeno tendrá en el futuro.
A veces se considera a la proyección estadística como una forma más de inferencia,
pero esto no es válido, pues una proyección no involucra en absoluto muestras y
poblaciones, condición que define a la inferencia estadística. Pensemos en un
ejemplo simple: tomamos los registros de cosechas obtenidas en los últimos veinte
FIG. 2.2. INFERENCIA VERSUS PROYECCIÓN

Inferencia estadística Proyección estadística
Población
Comportamiento
observado
Muestreo Comportamiento
Inferencia
estadística proyectado
Muestra Descripción
estadística Tiempo
21
años en cierta región; a partir de estos datos, aplicando técnicas de proyección

estadística, podemos proyectar las cosechas que se esperan en los próximos años.
9. Por ahora no debemos preocuparnos por términos que pueden resultarnos
desconocidos, tales como distribución de frecuencias o parámetros. Más adelante
los definiremos formalmente.
10. En este trabajo nos limitaremos al estudio de la estadística descriptiva.
LA ESTRUCTURA DE LA ESTADÍSTICA DESCRIPTIVA
11. Para poder describir las características de un grupo de datos se requiere primero
organizarlos, de tal forma que podamos comenzar a descubrir sus características.
12. Los datos pueden organizarse simplemente ordenándolos, o bien construyendo
una distribución de frecuencias.
13. También podemos describir a un grupo de datos mediante números, tomando
medidas del grupo mismo en forma similar a como lo haríamos para describir a un
individuo por su estatura, peso, tamaño de su tórax, cintura, etc. A las medidas de
un grupo de datos se les llama medidas estadísticas y pueden ser de seis tipos:
proporción, ubicación, tendencia central, variabilidad, forma y, cuando se involucran
dos (o más) variables relacionadas entre sí, correlación. Nótese que las medidas
estadísticas pueden calcularse directamente de la masa de datos o bien a partir de
datos ya organizados. Veremos que esto da origen a diversos procedimientos
aplicables.
14. La tercera forma de describir un grupo de datos es representándolo mediante
imágenes a las que llamaremos gráficas. Las gráficas se construyen a partir de
datos ya organizados, y en ellas también pueden representarse las medidas
estadísticas.
FIG. 2.3. EL PROCESAMIENTO ESTADÍSTICO DESCRIPTIVO
Organización de datos
• Clasificación
• Ordenación
• Distribución de frecuencias
Representación gráfica
• Clasificación
Masa • Distribución de frecuencias Descripción
de datos estadística
Medidas estadísticas
• Proporción
• Ubicación
• Tendencia central
• Variabilidad
• Forma
• Correlación

22
15. En la figura 2.3 se representa un mapa conceptual del procesamiento estadístico

descriptivo. Conviene analizarlo, pues nos resultará útil para conceptualizar
estructuralmente todo este libro. Veamos:
a) La masa de datos es, como ya dijimos, el insumo, la entrada de todo el
procesamiento estadístico y, consecuentemente, no forma parte de él. En el otro
extremo está la descripción estadística, que resulta ser la salida o producto.
b) La primera caja en el cuadro de procesos se conforma por la organización de los
datos, tarea que ya es un proceso estadístico propiamente dicho y que puede
consistir simplemente en ordenar los datos o en construir una distribución de
frecuencias.
c) La segunda caja contiene a las medidas estadísticas, desde las simples
proporciones hasta la correlación. Debe tenerse presente, para más adelante,
que el orden en que se presentan las medidas no es accidental, sino que obedece
a un ordenamiento lógico-psicológico; en algunos casos las primeras medidas
son prerrequisito a las que siguen. En otras palabras, es un orden didáctico.
d) En el tercer cuadro se encuentran las gráficas que, como veremos más adelante,
pueden representar frecuencias o clasificaciones. Las gráficas no pueden
construirse a partir de una masa de datos, requieren de su organización; pero las
medidas estadísticas pueden construirse sin necesidad de graficar previamente,
aunque pueden representarse en las gráficas.
e) Finalmente veamos en conjunto el orden de precedencia entre los procesos.
Podemos organizar los datos directamente a partir de la masa de datos; el cálculo
de medidas estadísticas puede realizarse a partir de la masa de datos (en cuyo
caso se le llama cálculo con datos no agrupados), o bien a partir de los datos
organizados (entonces hablamos de cálculo con datos agrupados); la
representación gráfica, por último, requiere como antecedentes a la organización
de datos y al cálculo de medidas estadísticas.
ALGUNOS TÉRMINOS CLAVE
16. Comencemos a definir formalmente algunos términos que utilizaremos más
adelante2.
17. Variable. Decimos que una propiedad de una cosa es variable cuando puede
asumir más de un valor, esto es, cuando puede variar. Por definición, todas las
propiedades estudiadas por la estadística son variables, por lo que este concepto
resulta fundamental aquí. Como ejemplos de variables tenemos el cociente
intelectual, el aprovechamiento escolar, el cociente de memoria, el ingreso por
familia, el tipo de alimentación, etc.
18. Dato. Es una medida de cualquier variable. Por ejemplo, si afirmamos que Juan
tiene un CI de 118, entonces 118 es un dato que indica la medida en que Juan tiene
2. En realidad, los conceptos de variable, dato, medición, población, muestra y otros relacionados, no
corresponden a la estadística, sino a los métodos de investigación. Una discusión más completa puede
encontrarse en López [2001].
23
la propiedad (que es variable) llamada inteligencia.

19. Población. También llamada universo de estudio, es el conjunto completo de
elementos que nos interesa estudiar.
20. Muestra. Es una parte de la población.
21. Medida estadística es una medida de un grupo de datos. Existen dos tipos de
medidas estadísticas:
22. Parámetro. Es una medida estadística de la población.
23. Estadígrafo. Es una medida estadística de la muestra. Algunos autores llaman
estadísticos a las medidas estadísticas de la muestra. Pero aquí preferiremos utilizar
el término estadígrafo para evitar confusiones terminológicas y destacar su carácter
descriptivo.
24. Debemos observar que la masa de datos puede constituir una población o una
muestra. Sin embargo, conceptualmente es fundamental que, antes de iniciar
cualquier procesamiento estadístico, determinemos si la masa de datos con la que
trabajaremos constituye una población o a una muestra, pues de ello –y de ninguna
otra cuestión- dependerá que las medidas estadísticas que obtengamos tengan el
carácter de parámetros o estadígrafos.
25. En la gran mayoría de los casos la estadística descriptiva trabaja con muestras.
Cuando las describimos, obtenemos estadígrafos a partir de los cuales se estimarán
los parámetros de la población correspondiente. Pero esto deberá estudiarse en
cursos de estadística inferencial, aquí lo apuntamos únicamente como un anclaje
conceptual para posteriores cursos.

1. ¿Qué es la teoría de la probabilidad?
2. ¿Qué es la estadística?
3. La estadística y la probabilidad pueden considerarse como una sola y misma
disciplina. Discuta esta proposición.
4. Entre otras cosas, la estadística estudia los procesos de captura de datos.
Discuta esta proposición.
5. ¿Qué es la estadística descriptiva?
6. ¿Qué es la estadística inferencial?
7. ¿En qué consiste una inferencia paramétrica?
8. ¿En qué consiste una inferencia no paramétrica?
9. ¿Qué es la estadística proyectiva?
10.La proyección estadística en realidad es una forma de inferencia estadística.
11.¿En qué consiste la organización de datos?
24
12.¿En qué consiste el cálculo de medidas estadísticas?

13.¿Cómo se llaman al cálculo de medidas estadísticas cuando se parte de una
masa de datos?
14.¿Cómo se llama al cálculo de medidas estadísticas cuando se parte de una
ordenación o de una distribución de frecuencias?
15.¿Para qué se construyen gráficas en estadística descriptiva?
16.¿Qué es una variable?
17.¿Qué es un dato?
18.¿Qué es una población?
19.¿Qué es una muestra?
20.¿Qué es una medida estadística?
21.¿Qué es un parámetro?
22.¿Qué es un estadígrafo?
23.¿En qué afecta el hecho de que el grupo de datos con el que trabajamos en
estadística sea una población o una muestra?

PARA APRENDER MÁS
1. Escriba un ensayo en que analice la relación entre estadística y probabilidad.
2. Escriba un ensayo en que se analice la diferencia entre estadística descriptiva y
estadística inferencial.
3. Escriba un ensayo en que se analice la diferencia entre inferencia estadística y
proyección estadística.
4. Puede decirse que existen dos formas de describir grupos de datos: la gráfica y
la métrica. Escriba un ensayo en que discuta esta proposición.
5. Escriba un ensayo explicando el concepto de CI, enfatizando su naturaleza
estadística.


25
LECCIÓN 3. LA MASA DE DATOS

Conocer algo de forma meramente cualitativa es conocerlo
de manera muy vaga. Cuando tenemos conocimiento
cuantitativo –captando alguna medida numérica que lo
distinga de un número infinito de posibilidades– estamos
comenzando a conocerlo a profundidad, comprendemos
algo de su belleza y accedemos a su poder y al
conocimiento que proporciona. El miedo a la cuantificación
implica limitarse y renunciar a una de las perspectivas más
firmes para entender y cambiar el mundo.
Miles de Millones
Carl Sagan
EL CONCEPTO DE MASA DE DATOS
1. Llamaremos masa de datos al grupo de datos crudos, tal como se obtuvieron
luego del proceso de captura, sin aplicarles corrección o modificación alguna.
FIG. 3.1. LA OBTENCIÓN DE LA MASA DE DATOS
Metodología de Investigación
• Selección de sujetos
Masa
• Definición operacional de variables de datos
• Proceso de medición
• ...
2. Consideremos un ejemplo. Nos interesa conocer el cociente de memoria de un

grupo de sujetos, para lo cual seleccionamos un test adecuado y procedemos a
calificarlo, obteniendo de este modo el puntaje correspondiente a cada elemento del
grupo. Cuando reunimos los puntajes de los sujetos, sin ordenarlos ni modificarlos
en forma alguna, tenemos una masa de datos. Este proceso se representa en la
figura 2.1.
FIG. 2. 2. EL MODELO EPS APLICADO A LA ESTADÍSTICA DESCRIPTIVA
Procesamiento estadístico
Entrada Salida
Masa Descripción
de datos estadística
Hasta aquí no ha intervenido en absoluto la estadística. Todos los procesos

26
(selección de sujetos, definición operacional y medición de la variable, etc.)

ejecutados para obtener los puntajes que conforman la masa de datos,
corresponden a la metodología de investigación. En este sentido, podemos decir
que la masa de datos constituye la entrada, la materia prima, para iniciar el trabajo
de la estadística descriptiva. A partir de aquí comenzamos a interesarnos por
analizar el grupo en su conjunto; en lo sucesivo nos interesará conocer las
características del grupo de datos, más que analizar los puntajes individuales en sí
mismos y esto es lo que hace la estadística descriptiva, como se representa en la
figura 2.2.
3. Regresando a lo visto en [2: 6, 11-15] podemos resumir: La estadística
descriptiva toma como entrada una masa de datos, la procesa con técnicas
matemáticas y produce como salida una descripción de sus características.
TAMAÑO DE LA MASA DE DATOS
4. Para facilitar la comprensión de las técnicas estadísticas que veremos más
adelante, conviene ahora clasificar las masas de datos, conforme a su tamaño, en
dos tipos:
a) Masa de datos pequeña. Es aquella que tiene un número de elementos no mayor
de 25.
b) Masa de datos grande. Cuando tiene más de 25 elementos.
5. Por supuesto, los límites de esta clasificación son convencionales, pero tienen
un fundamento matemático: la Ley de los grandes números. En Winkler [1975: 65-
69] puede estudiarse este concepto, que resultará central para quien se interese en
la teoría de la probabilidad y, en particular, para la teoría del muestreo.
Sea
N  Número de elementos (tamaño o cardinalidad) de la masa de datos
DEFINICIÓN
N  25  Masa de datos pequeña
N > 25  Masa de datos grande
6. Conviene observar desde aquí, para cuando se estudie la estadística inferencial

en futuros cursos que, aplicando la Ley de los grandes números, las muestras (que
constituyen, estrictamente, masas de datos) se clasifican en grandes y pequeñas.
Por esta razón a la estadística inferencial paramétrica se le ha llamado estadística
inferencial de grandes muestras, y a la inferencial no paramétrica estadística
inferencial de pequeñas muestras, según la clasificación que vimos en [2: 1-10].
7. Más adelante veremos que el tamaño de la masa de datos influye en la selección
y aplicación de las técnicas de procesamiento estadístico.
MASA DE DATOS Y NIVEL DE MEDICIÓN
8. Recordemos: un dato es una medida de una variable. Es necesario conocer el
nivel en que se midió la variable de interés para poder determinar los
27
procesamientos que podemos aplicar válidamente a una masa de datos dada. Con
este criterio, identificamos dos tipos de masas de datos.
a) Cualitativas. Cuando tenemos datos nominales, que por definición carecen de
sentido cuantitativo, procede la clasificación en categorías mutuamente
excluyentes. Por ejemplo, si medimos la variable sexo, sólo podremos clasificar
a los sujetos en dos categorías: masculino o femenino, y no tendrá sentido
preguntar cuál es mayor o tratar de ordenarlas, ni menos aún operar
aritméticamente con los datos.
b) Cuantitativas. Cuando disponemos de datos medidos a nivel ordinal o superior,
aparece el sentido cuantitativo, que ya permite operaciones aritméticas, además
de la simple clasificación.
Del carácter cualitativo o cuantitativo de los datos depende, por supuesto, el tipo de
procesamiento estadístico que se pueda realizar sobre ellos.
MEDIDAS DE LA MASA DE DATOS
9. Para comenzar a describir una masa de datos debemos obtener medidas que la
caractericen. Conforme al tipo de datos con que trabajemos, podemos obtener las
siguientes medidas:
Sea
X  Un dato
XMIN  Dato menor
XMAX  Dato mayor
MEDIDAS DE LA MASA DE DATOS
Nivel nominal Nivel ordinal o superior
N N
XMIN
XMAX
MASA DE DATOS Y NÚMERO DE VARIABLES

10. Terminaremos esta lección distinguiendo tres tipos básicos de masas de datos,
conforme al número de variables que involucran.
11. Las masas de datos univariables involucran una sola variable. Como ya vimos,
asumen la forma general:
X1, X2, ..., XN.
12. Masas de datos bivariables involucran dos variables. Asumen la siguiente forma
general:
(X1,Y1), (X2,Y2), ..., (XN,YN).
Donde cada pareja entre paréntesis indica los datos X y Y correspondientes a cada
elemento (indicado por el subíndice) de la masa de datos. Por ejemplo, (X1,Y1)
28
indica los datos correspondientes al primer elemento de la masa de datos.

13. Masas de datos multivariables. Esta es la forma general, involucran k variables
y asumen la siguiente forma general:
(X1,1, X2,1 ... Xk,1), (X1,2, X2,2 ... Xk,2) ... (X1,N, X2,N ... Xk,N)
No debemos pensar que esta generalización tiene un interés puramente teórico; en
la práctica representa el fundamento de procedimientos matemáticos que resultan
indispensables para el estudio del comportamiento, ya sea para calificar por
computadora un test o bien para construirlo mediante análisis multivariables
(análisis de varianza, análisis factorial, etc.).
14. En todos los casos tenemos masas de datos que cumplen exactamente los
mismos principios básicos, independientemente del número de variables que
involucren. Lo que cambia es el nivel de complejidad.
15. Debido precisamente a esta complejidad, hasta hace pocos años el análisis
multivariable resultaba accesible sólo a unos pocos expertos. Pero la computadora
ha abierto este campo a cualquier profesional del comportamiento que quiera ir más
allá de simplemente limitarse a aplicar instrumentos y recursos creados por otros y
que decida, en cambio, construirlos o adecuarlos para los fines particulares que
persigue y para la población específica con la que trabaja.
16. Esta es una de las razones por las que la matemática, y en particular la
estadística y la probabilidad, resultan insustituibles para la práctica profesional en
las ciencias del comportamiento.

1. ¿Qué es una masa de datos?
2. La masa de datos constituye la materia prima del procesamiento estadístico.
3. ¿Cuándo una masa de datos es grande y cuándo es pequeña?
4. ¿Cuál es el fundamento matemático para establecer la distinción entre masas
de datos grandes y pequeñas?
5. Explique la relación entre masa de datos y muestra.
6. ¿Qué es una masa de datos cualitativa?
7. ¿Qué es una masa de datos cuantitativa?
8. ¿Qué efectos tiene para el procesamiento estadístico distinguir entre masas de
datos cualitativas y cuantitativas?
9. ¿Qué procesamientos pueden aplicarse cuando disponemos de datos
cualitativos?
10.¿Qué procesamientos pueden aplicarse cuando disponemos de datos
cuantitativos?
29
11.¿Qué medidas de la masa de datos pueden obtenerse cuando se tienen

variables medidas a nivel nominal?
12.¿Qué medidas de la masa de datos pueden obtenerse cuando se tienen
variables medidas a nivel ordinal o superior?
13.Explique los tres tipos de masas de datos, conforme al número de variables que
involucran.

EJERCICIOS
3.1. En 1997 el Departamento de Personal de la Fábrica El Águila midió el estado
civil de sus empleados. Utilizando el conjunto numeral:
1  Soltero
2  Casado
3  Divorciado
4  Unión libre
Se obtuvo la siguiente masa de datos:
2, 4, 1, 3, 1, 2, 1, 1, 2, 1,
1, 1, 2, 1, 1, 2, 1, 1, 4, 1,
2, 1, 1, 1, 2, 1, 4, 4, 1, 2,
1, 1, 3.
a) ¿En qué nivel se midió la variable? Justifique su respuesta.

b) ¿Tenemos una masa de datos grande o pequeña? Justifique su respuesta.
c) ¿Cuáles son sus medidas? Justifique su respuesta.
3.2. El Departamento de Psicología del Centro de Rehabilitación Social No. 387, en
1999 midió autoconcepto en un grupo de guardias penitenciarios, utilizando el
conjunto numeral:
1 Muy bajo
2 Bajo
3 Medio
4 Alto
5 Muy alto
Y se obtuvo la siguiente masa de datos:
2, 4, 1, 3, 3, 2, 3, 1, 1, 3,
3, 2, 4, 3, 1, 3, 1, 5, 2, 3,
2, 4, 2.

c) ¿Cuáles son sus medidas?

30
3.3. En un estudio realizado en 2001 por la Unidad de Recursos Humanos de la

empresa Seguros Total, se midió aprovechamiento escolar en un grupo de
aspirantes a ingresar a la empresa. Se midieron los promedios finales de carrera y
se redondearon a enteros. Se obtuvo la siguiente masa de datos
7, 8, 8, 6, 7, 7, 8, 7, 7, 8,
8, 9, 7, 8, 8, 6, 7, 6, 8, 7,
7, 7, 10, 8, 7, 9, 9, 7, 6, 10,
9, 6, 7, 8, 7, 7, 7, 8, 8, 7,
9, 8, 6, 8, 9, 8, 8, 8, 8, 8,
8, 9, 9, 8, 6, 7, 7, 9, 9, 10,
8, 8, 6.

3.4. En 2001 el Departamento de Personal midió el cociente intelectual en los

policías de la Región IV. Se obtuvo la siguiente masa de datos:
104, 99, 109, 114, 108, 106, 116, 111, 101, 105,
111, 109, 111, 100, 118, 111, 109, 115, 121, 116,
103, 110, 112, 118, 114, 103, 124, 95, 107, 109,
117, 94, 101, 107, 91, 112, 112, 111, 122, 105,
106, 116, 108, 96, 111, 101, 113, 108, 92, 108,
119, 97, 106, 103, 105, 100, 108, 126, 113, 125,
103, 105, 107, 91, 109, 105, 120, 96, 119, 104,
102, 98, 113, 106, 97, 115, 107, 122, 113, 122,
100, 114, 98, 108, 110, 113, 117, 107, 94, 127,
106, 108, 109, 102, 105, 116, 99, 110, 102.

3.5. Para estudiar la validez predictiva de un examen de admisión sobre el

aprovechamiento escolar, en 1998 el Departamento de Control Escolar de la
Universidad Sigma obtuvo los puntajes de un grupo de alumnos; se registraron por
parejas (X, Y), donde
X  Calificación obtenida en el examen de admisión.
Y  Promedio general de carrera.
Las dos variables se midieron en escala de 0 a 100 con aproximación a enteros y
se obtuvieron los siguientes datos.
(50, 80) (39, 84) (58, 87) (49, 84) (38, 67) (51, 67) (55, 78) (59, 80) (39, 79) (42, 82)
(43, 71) (55, 84) (47, 64) (48, 69) (62, 77) (64, 58) (47, 73) (48, 86) (69, 78) (69, 88)
31
(61, 72) (39, 76) (64, 90) (39, 92) (42, 76) (50, 74) (45, 73) (64, 75) (47, 82) (40, 69)
(40, 79) (54, 59) (48, 94) (59, 78) (54, 79) (60, 69) (59, 93) (48, 74) (64, 78) (55, 77)
(56, 68) (38, 66) (59, 74) (49, 72) (63, 57) (51, 57) (45, 65) (67, 82) (44, 63) (69, 72)
(42, 56) (56, 77) (44, 83) (53, 72) (40, 79) (59, 78) (70, 80) (37, 82) (70, 84) (55, 74)
(59, 90) (42, 72) (54, 80) (64, 70) (63, 75) (54, 93) (46, 78) (52, 83) (52, 74) (66, 85)
(37, 74) (57, 78) (37, 77) (47, 78) (46, 67) (39, 62) (68, 64) (65, 73) (70, 67) (40, 71)
(43, 78) (49, 80) (51, 78) (54, 75) (60, 79) (53, 82) (57, 64) (44, 75) (59, 85) (66, 73)
(54, 63)
a) ¿En qué nivel se midió cada una de las variables? Justifique su respuesta.
c) ¿Cuáles son sus medidas? Considere las dos variables

PARA APRENDER MÁS
1. Podemos afirmar que:
a) Una población finita w es un conjunto de tamaño N.
b) Una muestra m es un subconjunto de w, con tamaño n.
Ahora, aplicando la teoría de conjuntos a las dos proposiciones anteriores:
i. ¿Cómo se relacionan w y m?
ii. Explique la relación entre N y n como cardinalidad de los conjuntos W y m
respectivamente.
iii. Explique otras relaciones entre N y n.
Puede encontrar información en Winkler [1975]; Budnick [1992]; Lipschultz [1980].
2. Escriba un ensayo explicando la Ley de los grandes números en sus versiones
débil, mediana y fuerte. Relaciónela con los conceptos de masa de datos grande
y masa de datos pequeña. Puede consultar a Winkler [1975]; Lipschultz [1979];
Johnson [1979].
3. Proponga un ejemplo en las ciencias del comportamiento de una masa de datos
multivariable (k>2), indique sus medidas, clasifíquela por tamaño y determine el
nivel en que se midió cada una de las variables involucradas. Puede encontrar
información en Daniel [1982] y en Runyon [1985].


32
LECCIÓN 4. ORGANIZACIÓN DE DATOS

En mi opinión, son vanas y erróneas todas las ciencias que
no han nacido de la experiencia, madre de todas las
certidumbres.
Leonardo Da Vinci
¿PARA QUÉ ORGANIZAR LOS DATOS?
1. Si revisamos los ejercicios de la lección anterior veremos que la masa de datos,
por sí misma, resulta amorfa y tiene muy poco significado. Además, conforme
aumenta su tamaño se vuelve cada vez más difícil encontrar la configuración del
grupo de datos.
Requerimos organizar de alguna manera los datos para comenzar a descubrir su
forma, apreciar sus características y trabajar eficientemente con ellos. Esto es lo
que veremos en esta lección, cómo se organizan los datos. Comencemos por
recordar dos conceptos básicos:
2. La frecuencia indica el número de veces que aparece un dato dentro del grupo.
3. Distribución es un concepto central en estadística y aparece al organizar una
masa de datos. La distribución se construye cuando organizamos los datos y
determinamos la frecuencia con que aparece cada uno de ellos.
Como ya se dijo, es aquí donde comienza el procesamiento estadístico,
organizando los datos de forma tal que obtengamos su distribución. A partir de este
punto comenzamos a apreciar sistemáticamente las características del grupo de
datos en su conjunto.
4. Identificamos tres grandes estrategias para organizar los datos: la clasificación,
la ordenación y la distribución de frecuencias. Veamos cada una de ellas.
LA CLASIFICACIÓN
5. La clasificación aplica cuando se trabaja con masas de datos cualitativas [3: 8].
Una clasificación sólo cuenta el número de veces que se repite cada dato; esto es,
los clasifica, los agrupa en clases llamadas categorías.
6. Una clasificación es un arreglo que indica la frecuencia con que aparece cada
dato. Adopta la siguiente forma general.

33
Sea
Ci  Categoría (o clase) i-ésima
f  Frecuencia con que aparece el dato
k  Número de categorías
FORMA GENERAL DE UNA CLASIFICACIÓN
X f
C1 f(C1)
... ...
Ck f(Ck)
7. Esta es la forma más elemental de organizar los datos. Sin embargo, la

clasificación ya produce una distribución, pues indica las categorías en que se midió
la variable y la frecuencia con que aparece cada una.
EL RANGO
8. Para pasar de la masa de datos cualitativa (nivel nominal) a la cuantitativa (nivel
ordinal o superior), requerimos introducir un concepto nuevo, el rango (también
llamado oscilación, recorrido o amplitud total). El rango está definido como la
distancia exacta entre el dato mayor y el menor de una masa de datos.
Sea
R  Rango de una masa de datos
entonces
R = XMAX–XMIN+1
Por el momento basta con aplicar esta fórmula. Más adelante, cuando estudiemos
las medidas de variabilidad, se analizará con mayor detalle el concepto de rango.
LA ORDENACIÓN
9. Esta forma de organización de datos se aplica cuando:
a) Tenemos datos medidos a nivel ordinal o superior; y
b) La masa de datos es pequeña [3: 4-7]
10. Una ordenación es un arreglo en que los datos se organizan de menor a mayor.
FORMA GENERAL DE UNA ORDENACIÓN

XMIN, ..., XMAX
En sentido estricto, esta definición corresponde a una ordenación ascendente; si

en cambio arreglamos los datos de mayor a menor, tendríamos una ordenación
descendente. Pero esto es trivial, porque si quisiéramos una ordenación
descendente, bastaría con seguir el arreglo en sentido inverso, de derecha a
izquierda. Por tanto, cuando hablemos de ordenación, asumiremos que se trata de
34
un arreglo ascendente.
11. Nótese que una simple ordenación ya se aproxima a una distribución y nos
proporciona mucha información sobre la configuración del grupo: cuántas veces se
repite cada dato y, en su caso, qué datos no aparecen (llamamos a estos datos
ausentes huecos en la distribución, es decir, datos con frecuencia cero).
LA DISTRIBUCIÓN DE FRECUENCIAS
12. Esta forma de organización de datos se aplica cuando:
a) La masa de datos es cuantitativa; y
b) La masa de datos es grande [3: 4-7].
13. Cualquier distribución de frecuencias adopta la siguiente forma general:
Sea
X  Dato
FORMA GENERAL DE UNA DISTRIBUCIÓN DE FRECUENCIAS
Dato Frecuencia
XMIN f(X)
... ...
XMAX f(X)
Veremos que existen diferentes tipos de distribuciones de frecuencias, pero todas

respetan esta forma general.
14. Aunque una distribución de frecuencias es, estrictamente, un arreglo de parejas
dato, frecuencia del dato, desde que se construye la distribuciónconviene calcular
otros valores que resultarán necesarios en posteriores etapas del procesamiento
estadístico. Tales valores son:
Sea
fa  Frecuencia acumulada
FORMA COMPLETA DE UNA DISTRIBUCIÓN DE FRECUENCIAS
X f fa fX X2 fX2
Más adelante veremos el procedimiento para construir distribuciones de frecuencias

con todos estos valores.
DATOS PUNTUALES Y DATOS INTERVALARES
15. Un dato puntual es aquel que constituye un punto en la recta numérica.
16. Sin embargo, cuando la masa de datos tiene un rango muy grande, una
distribución de frecuencias construida con datos puntuales podría tener demasiados
renglones, lo que dificultaría su manejo.
35
Pongamos un ejemplo: medimos memoria en escala de 0-100 y en la masa de datos

encontramos que
XMIN = 22
XMAX = 89
donde el rango es
R = 89–22+1 = 68
Esto indica que en la distribución existen 68 unidades (datos puntuales), por lo cual
se requieren 68 filas (aunque existieran huecos, deben considerarse). Esto
resultaría poco práctico.
Para resolver esta dificultad podemos abrir intervalos para reducir el número de
renglones.
17. Las escalas de datos intervalares tienen dos características:
a) Todos los intervalos deben tener el mismo tamaño.
b) Al abrir intervalos renunciamos a los datos puntuales y perdemos precisión.
Cuando un dato queda dentro de un intervalo, lo más que podemos afirmar es
eso, que está dentro del intervalo, pero no podemos precisar cuál de los datos
puntuales que lo componen es. Por ejemplo, si un sujeto queda en el intervalo
40-44, sabemos que el dato no será menor que 40 ni mayor que 44, pero no
podemos saber si es 40, 41, 42, 43 o 44.
DISTRIBUCIÓN DE FRECUENCIAS PUNTUAL
18. Una regla práctica: conviene construir la distribución de frecuencias con datos
puntuales cuando el rango de la masa de datos implica un número de renglones no
demasiado grande.
Qué se entiende aquí por grande, es cuestión de conveniencia, pero podemos
proponer que cuando una distribución de frecuencias tenga más de 15 renglones,
habría que pensar en la conveniencia de abrir intervalos.
19. Para construir una distribución de frecuencias puntual se aplica el siguiente
algoritmo.
Sea
  Suma total
TAB  Tabulación
ALGORITMO PARA CONSTRUIR UNA DISTRIBUCIÓN DE FRECUENCIAS PUNTUAL
COMIENZA
PASO 1. Construir la columna X comenzando en XMIN y terminando en XMAX.

PASO 2. Construir la columna TAB, tabulando cada dato que aparezca en la masa
de datos.
PASO 3. Construir la columna f contando las tabulaciones de cada renglón.

36
PASO 4. Construir la columna fa, sumando cada frecuencia con las anteriores.
PASO 5. Obtener f.
PASO 6. SI (f  N) o (faMAX  N) ENTONCES existe error en la tabulación.
PASO 7. Construir la columna fX.
PASO 8. Obtener fX.
PASO 9. Construir la columna X2.
PASO 10. Construir la columna fX2.
PASO 11. Obtener fX2.
TERMINA
DISTRIBUCIÓN DE FRECUENCIAS INTERVALAR

20. Como ya dijimos, cuando el rango de la masa de datos implica un número de
renglones demasiado grande, conviene construir una distribución intervalar.
21. Tamaño del intervalo. Para decidir el tamaño que tendrán los intervalos, se
divide el rango entre el número de datos que tendrá cada intervalo; el cociente
redondeado al entero sucesor indica el número de renglones que tendrá la
distribución de frecuencias.
Tomemos el ejemplo propuesto en [4: 16]. Sabemos que R = 68, podemos ensayar
con diferentes tamaños de intervalo:
Sea
i  Tamaño del intervalo
Sabemos que
XMIN = 22
XMAX = 89
R = 68
Entonces
Si i=3 entonces 68/3 = 22.67
Si i=5 entonces 68/5 = 13.60
Es decir, con un tamaño de intervalo de 3, requeriríamos 23 renglones para construir

la distribución; si aumentamos el tamaño de intervalo a 5, ya sólo requeriríamos 14
renglones.
Supongamos que elegimos i=5, entonces podríamos elegir como primer intervalo a
21-25, pues XMIN=22; y como XMAX=89, el último intervalo sería 86-90. La distribución
de frecuencias tendría la siguiente forma:

37
X f
21-25
26-30
31-35
36-40
41-45
46-50
51-55
56-60
61-65
66-70
71-75
76-80
81-85
86-90
22. Pasemos a otro concepto. El punto medio (también llamado marca de clase) de
un intervalo está dado por
Sea
PM  Punto medio del intervalo
IMIN  Dato menor del intervalo
IMAX  Dato mayor del intervalo
entonces
PM = (IMIN+IMAX)/2
Puesto que no podríamos realizar directamente operaciones aritméticas con

intervalos, el punto medio asume el papel de X en los cálculos para construir una
distribución de frecuencias intervalar.
23. Siempre que sea posible, conviene elegir tamaños de intervalo impares porque
esto implica disponer de puntos medios enteros, lo que facilita los cálculos.
24. Ahora podemos ver el algoritmo para construir una distribución intervalar.
ALGORITMO PARA CONSTRUIR UNA DISTRIBUCIÓN DE FRECUENCIAS INTERVALAR

COMIENZA
PASO 1. Decidir el tamaño de intervalo (i)

PASO 2. Construir la columna X, comenzando en el intervalo que contenga a XMIN y
terminando en el intervalo que contenga a XMAX.
PASO 3. Construir la columna PM.
PASO 4. Construir la columna TAB, ubicando cada dato dentro el intervalo al que
corresponda.

38
PASO 5. Construir la columna f, contando las tabulaciones de cada renglón.

PASO 6. Construir la columna fa, sumando cada frecuencia con las anteriores.
PASO 7. Obtener f.
PASO 8. SI (f  N) o (faMAX  N) ENTONCES existe error en la tabulación.
PASO 9. Construir la columna fX, multiplicando PM por f.
PASO 10. Obtener fX.
PASO 11. Construir la columna X2, elevando PM al cuadrado.
PASO 12. Construir la columna fX2.
PASO 13. Obtener fX2.
TERMINA
DISTRIBUCIONES DE FRECUENCIAS MULTIVARIABLES

25. Como ya vimos en la lección anterior, existen masas de datos con una, dos o k
variables. Esto implica que también existen distribuciones de frecuencias con una,
dos o k variables.
26. Como veremos al trabajar con el Ejercicio 2.5, procesar una masa de datos con
más de una variable resulta realmente laborioso cuando se utiliza solo lápiz, papel
y calculadora. Aquí es donde se puede comprobar el enorme poder de cálculo de la
computadora, pues con ella realmente se facilita el trabajo y se eliminan errores
humanos.
27. Una distribución de frecuencias bivariable asume la siguiente forma:
Sea
X  Dato de la variable X
Y  Dato de la variable Y
f(X,Y)  Frecuencia de la pareja (X,Y)
FORMA GENERAL DE UNA DISTRIBUCIÓN DE FRECUENCIAS BIVARIABLE
XMIN ... XMAX
YMIN f(X,Y) ... f(X,Y)
... ... ...
YMAX f(X,Y) ... f(X,Y)
28. Para construir una distribución de frecuencias bivariable, ya sea con datos
puntuales o intervalares, se aplican los mismos criterios que si se tratara de una
distribución con una sola variable.
29. Aquí nos limitaremos al caso bivariable, porque resultará necesario para
39
introducirnos al estudio de la correlación en la última lección. Sin embargo, todos

los procedimientos que vimos en esta lección pueden generalizarse a k variables.
30. Para comprobar que los procedimientos aplicados a una variable son aplicables
a dos (o más) variables, determinaremos la frecuencia de cada pareja de datos y
calcularemos todos los valores definidos para las distribuciones de frecuencias. Se
trata de ver lo laborioso que esto resulta; como veremos en la última lección, al final
de cuentas todo este trabajo de cálculo es prescindible en casos prácticos.

1. ¿Cuál es el primer procesamiento estadístico propiamente dicho?
2. ¿Para qué debemos organizar una masa de datos?
3. ¿Qué es una frecuencia?
4. ¿Qué es una distribución?
5. ¿Qué es una clasificación?
6. ¿Cuál es la forma general de una clasificación?
7. ¿La simple clasificación produce una distribución? Justifique su respuesta.
8. ¿Cuándo se aplica la clasificación?
9. La clasificación implica realizar operaciones aritméticas. Discuta esta
proposición.
10.¿Qué es el rango de una masa de datos?
11.¿Con que otros nombres se conoce al rango?
12.¿Podría calcularse el rango cuando la variable se midió a nivel nominal?
Justifique su respuesta.
13.¿Cuándo se aplica la ordenación?
14.¿Cuál es la forma general de una ordenación?
15.¿Cuándo debe aplicarse la ordenación ascendente y cuándo la descendente?
16.¿Qué es un hueco en la distribución?
17.¿Cuándo se aplica la distribución de frecuencias?
18.¿Cuál es la forma general de la distribución de frecuencias?
19.¿Cuáles son todos los valores que conviene calcular cuando se construye una
distribución de frecuencias?
20.¿Qué es un dato puntual?
21.¿Qué es un dato intervalar?
22.¿Por qué se justifica el uso de intervalos cuando se construyen distribuciones de
frecuencias?
40
23.¿Cuáles son las dos características de las escalas de datos intervalares?

24.¿Cuándo se aplica la distribución de frecuencias puntual?
25.¿Cuándo se aplica la distribución de frecuencias intervalar?
26.¿Cómo se decide el tamaño del intervalo en una distribución de frecuencias
intervalar?
27.¿Por qué conviene utilizar un tamaño de intervalo impar?
28.¿Cómo se determina el punto medio del intervalo?
29.¿Cuál es la función del punto medio del intervalo?
30.¿Cómo se obtienen las frecuencias acumuladas?
31.Los conceptos y procedimientos aplicados para construir distribuciones de
frecuencias univariables pueden adaptarse a los casos de dos o k variables.
Discuta esta proposición

EJERCICIOS
4.1. Utilizando la masa de datos del Ejercicio 3.1, construya la clasificación.
4.2. Utilizando la masa de datos del Ejercicio 3.2, construya la ordenación.
4.3. Utilizando la masa de datos del Ejercicio 3.3, construya la distribución de

frecuencias puntual, en su forma completa.

frecuencias intervalar, en su forma completa. Aplique i = 5; primer intervalo (90-94).

frecuencias intervalar, en su forma general. Aplique i = 5; primer intervalo en X
(36-40); primer intervalo en Y (56-60).

PARA APRENDER MÁS
1. Aceptando la definición de clasificación dada en esta lección, ¿podríamos
clasificar variables medidas a nivel ordinal o superior? Escriba un ensayo
contestando esta pregunta.
2. Redondear una medida a nivel de razón implica necesariamente bajar al nivel
intervalar. Por ejemplo, si medimos aprovechamiento escolar en la escala de 0
a 10 redondeando a enteros, tendríamos el conjunto numeral
X = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
y cada puntaje posible constituye un intervalo. Demuestre esta proposición.
3. En este curso vimos un criterio para construir los intervalos a partir de un grupo
de datos puntuales. Aplicando este criterio, elabore un procedimiento en Excel
41
para construir la distribución intervalar utilizando el Ejercicio 3.4.

4. Existe un procedimiento para estimar el número de intervalos llamado Regla de
Sturges, que establece que:
Sea
c ≡ El número de intervalos que tendrá la distribución
N ≡ Tamaño de la masa de datos
entonces
c = 1+log2(N)
Cuando el resultado c es par, se redondea a enteros sumando 1, para obtener
siempre un número de intervalos impar. Aplique esta regla al Ejercicio 3.4 y
discuta el resultado.
5. Escriba un ensayo en el que explique cómo puede representarse mediante
matrices las distribuciones de frecuencias con una, dos o k variables. Puede
consultar a Kerlinger [1982], Daniel [1982] y Runyon [1984].
6. Proponga un ejemplo de masa de datos pequeña, con tres variables y construya
su distribución de frecuencias. Puede consultar a Kerlinger [1982], Daniel [1982]
y Runyon [1984].


42
LECCIÓN 5. REPRESENTACIÓN GRÁFICA

Aquellos que contemplan la esencia inmutable de las cosas,
ésos tienen conocimiento y no meras opiniones.
La República, Libro Quinto
Platón
¿PARA QUÉ CONSTRUIR GRÁFICAS?
1. En la lección anterior pudimos observar que al organizar los datos ya comienzan
a volverse evidentes las características del grupo. Sin embargo, la organización de
datos –al igual que casi todos los procesos estadísticos– produce descripciones
numéricas, y no todas las personas encuentran atractivo, o aún accesible,
interpretar tablas que únicamente presentan números. Interpretar medidas
estadísticas requiere de aún más abstracción, como lo veremos en las siguientes
lecciones. En tales casos suelen utilizarse imágenes para facilitar la interpretación
de grupos de datos.
2. Por esta razón, cuando se desea presentar información estadística a públicos
numerosos, en los que no podemos suponer la habilidad ni el interés por interpretar
números, se opta por presentar gráficas.
3. En estadística, una gráfica es una imagen de un grupo de datos. La información
que contiene una distribución construida con números es la misma que la que
contiene una gráfica, pero esta última resulta bastante más accesible y ayuda a
evitar el bloqueo emocional que muchas personas tienen hacia los números, aunque
la gráfica carece de la precisión que aportan los datos numéricos.
LOS RIESGOS DE LAS GRÁFICAS
4. Sin embargo, la facilidad de interpretación de las gráficas muchas veces resulta
engañosa y, cuando las analizamos sin una actitud crítica, podemos creer que
estamos viendo características del grupo que realmente no existen o, peor aún,
puede ocurrir que las características reales del grupo de datos sean totalmente
contrarias a lo que la gráfica nos sugiere a primera vista.
5. La representación gráfica, cuando se manipula sesgadamente, es uno de los
principales recursos utilizados para falsear información estadística.
6. Una anécdota nos puede ayudar a comprender mejor el problema de provocar
falsas percepciones manipulando sesgadamente los datos estadísticos. Se cuenta
que cuando Winston Churchill asumió el comando militar británico en la Segunda
Guerra Mundial, ordenó a la administración militar que le preparara un informe
detallado sobre las condiciones generales de las fuerzas armadas. Después de
estudiar el reporte que le enviaron, y de confrontarlo contra el conocimiento directo
que tenía sobre el estado de las tropas, declaró ante el Parlamento que con el
informe recibido había podido comprobar que existen mentiras, mentiras infames...
y estadísticas. La información presentada en el informe inducía a creer que el
ejército británico estaba perfectamente preparado para la guerra, pero las
inspecciones en campo que realizó Churchill, le demostraban todo lo contrario.
43
7. Las gráficas son quizá el recurso más usado para hacer que los datos digan lo
que conviene a quien los manipula. Puede ocurrir que quien presenta los datos
tenga interés en que el receptor de la información los perciba de determinada forma
y, para lograr esto, las gráficas pueden diseñarse de modo que, aún sin alterar los
datos, las imágenes induzcan a quien las vea a interpretar la información conforme
a los intereses de quien las presenta.
8. Los usos tendenciosos de la construcción de gráficas son bastante comunes.
Basta con analizar con cuidado los apoyos gráficos de informes de dependencias
públicas o empresas para comprobar que la representación gráfica suele contener
muchas trampas perceptuales difíciles de detectar, sobre todo porque se encubren
con mensajes escritos y recursos estéticos que, al hacer atractiva la imagen,
distraen la atención y conducen al observador a creer lo que se le propone, sin
mayor crítica. Tal es el poder de la comunicación tendenciosa, y toda gráfica no es
más que un medio de comunicación. He aquí un área de estudio para la psicología
de la percepción.
9. En cambio, la información numérica no puede ser deformada sin caer en un error
demostrable, por lo que siempre será preferible a la gráfica. Sin embargo, para ser
comprendida la información numérica requiere de un público con mayor
preparación, mientras que la gráfica, sobre todo si se diseña para ser atractiva,
cualquiera puede verla y creer que la entiende, aunque muchos no resistirían la
menor prueba para demostrar que realmente la comprendieron.
10. Pero no debemos llegar a conclusiones apresuradas, las gráficas son de gran
utilidad para comunicar información estadística, incluso para detectar relaciones
complejas en grandes grupos de datos, por lo que no podemos simplemente
renunciar a ellas. Lo que debemos hacer es estudiar algunas técnicas que nos
permitan comunicar objetivamente los datos a través de gráficas y que, a la vez, nos
capaciten para detectar posibles trampas perceptuales.
CRITERIOS PARA LA CONSTRUCCIÓN DE GRÁFICAS
11. Veamos algunos criterios para construir gráficas, cualquiera que sea su tipo.
Aplicándolos, podremos preservar la objetividad y comunicar los datos con claridad.
12. Origen métrico. Cuando las gráficas utilizan alguna forma de espacios
coordenados, debemos recordar que siempre el cruce de los ejes X (abscisa) y Y
(ordenada) constituye el origen y corresponden a cero. Cuando resulte necesario,
puede contraerse uno cualquiera o incluso los dos ejes, pero si lo hacemos se debe
indicar claramente, de manera que los ejes se crucen siempre en cero y el origen
del espacio de la gráfica quede ubicado sin ambigüedad.
Cuando se elaboren gráficas con forma circular, debe evitarse desplazar el centro
o rotar la gráfica en su conjunto de manera que se distorsione.
13. Ubicación de las variables en los ejes. En los casos de distribuciones
univariables, el eje X debe utilizarse para representar los datos y el Y para las
frecuencias. En principio, nada impide que se haga al revés, pero no se percibe
igual una distribución cuando está colocada verticalmente que cuando lo está
horizontalmente. No representa lo mismo una gráfica de frecuencias que un perfil
44
psicológico.
14. Graduación de los ejes. Debe indicarse con claridad la graduación de cada eje,
conforme a la escala que se represente.
15. Proporción entre ejes. Las proporciones entre altura y ancho tienen un gran
efecto sobre la percepción total de la gráfica, por lo que suelen utilizarse para
manipular la percepción de la información que contiene. Para evitar esto, se
recomienda que la longitud del eje Y sea entre el 70% y el 80% de la que tenga el
eje X.
16. Rotulación. Los ejes, barras o sectores que representen el espacio numeral de
las variables deben rotularse claramente para facilitar su identificación. Siempre que
sea necesario, también se indicarán frecuencias y/o proporciones para facilitar la
comunicación cuantitativa.
17. Datos generales. Toda gráfica debe indicar:
a) Título, indicando claramente lo que se representa.
b) Fecha a que corresponden los datos.
c) Fuente de donde se obtuvieron los datos.
d) Responsable de la elaboración, sea este particular o institucional.
e) Fecha en que se elaboró la gráfica.
Más los datos que se estimen necesarios, conforme al caso particular de que se
trate.
TIPOS DE GRÁFICAS
18. Existen muchos tipos de gráficas; en realidad puede haber tantos como nuestras
necesidades de comunicar información lo requieran y nuestra imaginación nos
permita crear, pero aquí sólo veremos los principales.
En la tabla siguiente se resumen los tipos de gráficas que estudiaremos en esta
lección y las condiciones en que puede aplicarse cada tipo.
FIG. 5.1. TIPOS DE GRÁFICAS Y CONDICIONES DE APLICACIÓN

Variable Medición Frecuencia simple Frecuencia acumulada
Nominal Circulograma
Discreta
Nominal / Ordinal Barras
Intervalar Histograma Escalera
Continua
De razón Polígono de frecuencias Ojiva
Veamos ahora cada tipo de gráfica.

EL CIRCULOGRAMA
19. El circulograma (también llamado gráfico de pastel o gráfico de sectores) se
45
utiliza cuando se representan datos nominales. Está diseñado para enfatizar la

naturaleza categórica de la variable que se representa y las frecuencias (o
porcentajes) son mostrados como sectores angulares de un círculo. Por su mismo
carácter nominal, los sectores pueden colocarse en cualquier orden.
20. El circulograma asume la siguiente forma general:
Sea
Ci  Categoría (o clase) i-ésima
%  Porcentaje respecto al total
FORMA GENERAL DE UN CIRCULOGRAMA
C1
f(Ci)
%(Ci)
Cn
...
f(Cn)
%(Cn)
21. Para construir un circulograma se aplica el siguiente algoritmo:
Sea
Ang  Ángulo de la categoría i-ésima
ALGORITMO PARA CONSTRUIR UN CIRCULOGRAMA
COMIENZA
PASO 1. Construir la nota de cálculo

Categoría f Ang = (f/N)360 % = (f/N)100
C1
... ... ... ...
CN
Totales N 360° 100%
PASO 2. Trazar un círculo.
PASO 3. Medir los ángulos correspondientes a cada categoría.
PASO 4. Trazar los radios de cada sector.
PASO 5. Rotular cada sector con el nombre de la categoría, su frecuencia y su

46
porcentaje y completar datos generales.

TERMINA
EL GRÁFICO DE BARRAS
22. El gráfico de barras se aplica para representar datos medidos a nivel ordinal.
Las barras se colocan en el orden jerárquico que implica la escala y deben estar
separadas entre sí para enfatizar su carácter discreto.
23. El gráfico de barras asume la siguiente forma general:
FORMA GENERAL DE UN GRÁFICO DE

BARRAS
f
X
X1 X2 XN
24. Para construir un gráfico de barras se aplica el siguiente algoritmo:
ALGORITMO PARA CONSTRUIR UN GRÁFICO DE BARRAS

COMIENZA
PASO 1. Trazar un plano coordenado en que la longitud del eje Y sea entre 70% y
80% de la de X.
PASO 2. Marcar en X las barras necesarias y rotular bajo el eje, cuidando de que
todas las barras estén ordenadas, tengan el mismo ancho y queden separadas por
distancias iguales.
PASO 3. Graduar Y desde 0 hasta la frecuencia más alta de la distribución.
PASO 4. Trazar las barras hasta la altura de su frecuencia.
PASO 5. Rotular los ejes y completar datos generales.
TERMINA
EL HISTOGRAMA
25. El histograma se utiliza para representar distribuciones de frecuencias
47
intervalares. Cada graduación del eje X corresponde a una barra y representa un

intervalo. En sentido estricto, un intervalo constituye una clase (un conjunto de datos
puntales) y eso es lo que se representa por las barras. Las barras se construyen
juntas entre sí y las líneas verticales marcan los límites exactos del intervalo (la
izquierda el límite inferior y la derecha el superior). Más adelante analizaremos con
detalle el concepto de límite exacto. Las barras representan la naturaleza discreta
de los intervalos.
26. El histograma asume la siguiente forma general:
FORMA GENERAL DE UN HISTOGRAMA
X
XMIN ... XMAX
27. Para construir un histograma se aplica el siguiente algoritmo:
ALGORITMO PARA CONSTRUIR UN HISTOGRAMA

COMIENZA
80% de la de X.
PASO 2. Marcar en X las graduaciones desde XMIN hasta XMAX y rotularlas cuidando
de que todas las barras tengan el mismo ancho, y rotular cada marca con el
intervalo correspondiente.
PASO 4. Trazar las barras hasta la altura de su frecuencia.
TERMINA
EL POLÍGONO DE FRECUENCIAS
28. El polígono de frecuencias se aplica para representar distribuciones de
frecuencias puntuales. Los puntos coordenados se unen entre sí con líneas rectas,
que representan el carácter continuo de los datos. Si reducimos la distancia entre
las graduaciones del eje X –lo que implicaría aumentar la precisión de la medida–
48
los ángulos tienden a suavizarse y se acercan a la forma de una curva; por esta
razón al polígono de frecuencias también se le conoce como curva de frecuencias.
Lo que debe quedar claro es que el polígono de frecuencias representa datos que
realmente tienen naturaleza continua. Cuando tengamos duda sobre la naturaleza
realmente continua de la variable, debe preferirse al histograma para representar
los datos.
29. El polígono de frecuencias asume la siguiente forma general:
FORMA GENERAL DE UN POLÍGONO DE FRECUENCIAS
X
XMIN ... XMAX
30. Para construir un polígono de frecuencias se aplica el siguiente algoritmo:
ALGORITMO PARA CONSTRUIR UN POLÍGONO DE FRECUENCIAS

COMIENZA
80% de la de X.
PASO 2. Marcar en X las graduaciones necesarias conforme a la columna de datos
de la distribución, comenzando en el dato anterior a X MIN y terminando en el dato
posterior a XMAX; cuidando que todas tengan la misma distancia.
PASO 4. Trazar los puntos coordenados (dato, frecuencia).
PASO 5. Unir los puntos coordenados con líneas rectas, comenzando en el dato
anterior a XMIN y terminando en el dato posterior a XMAX.
TERMINA
EL GRÁFICO DE ESCALERA
31. El gráfico de escalera, también llamado ojiva discreta, se utiliza para
49
representar distribuciones intervalares de frecuencias acumuladas. Aquí se utiliza

la misma distribución que en el histograma, sólo que el gráfico de escalera se
construye a partir de la columna de frecuencias acumuladas (fa), lo que le da su
forma ascendente característica. La altura de cada escalón representa la frecuencia
simple del intervalo. Por tanto, si encontramos un escalón con el doble de ancho
significa que el intervalo de la derecha tiene frecuencia cero, es decir, se trata de un
hueco en la distribución. Obsérvese que los escalones son análogos a las barras
del histograma.
32. El gráfico de escalera asume la siguiente forma general:
FORMA GENERAL DE UN GRÁFICO DE ESCALERA
fa
X
XMIN ... XMAX
Nótese que representamos un hueco en el penúltimo escalón.
33. Para construir un gráfico de escalera se aplica el siguiente algoritmo:
ALGORITMO PARA CONSTRUIR UN GRÁFICO DE ESCALERA

COMIENZA
80% de la de X.
PASO 2. Marcar en X las graduaciones necesarias desde XMIN hasta XMAX, cuidando
de que todas tengan el mismo ancho.
PASO 3. Graduar Y desde 0 hasta la N, que es la frecuencia acumulada más alta
en la distribución.
PASO 4. Trazar los escalones hasta la altura de su frecuencia acumulada.
PASO 5. Trazar las líneas verticales para cerrar la escalera a izquierda y derecha.
TERMINA

50
LA OJIVA
34. La ojiva, también llamada gráfico acumulativo, es el equivalente al gráfico de
escalera. Se utiliza para representar distribuciones puntuales de frecuencias
acumuladas. Pero, al igual que en el caso del polígono de frecuencias, en la ojiva
los cruces de coordenadas se unen entre sí con líneas rectas para enfatizar su
carácter continuo.
35. La ojiva asume la siguiente forma general:
FORMA GENERAL DE UNA OJIVA

fa
X
XMIN ... XMAX
36. Para construir una ojiva se aplica el siguiente algoritmo:
ALGORITMO PARA CONSTRUIR UNA OJIVA

COMIENZA
80% de la de X.
PASO 2. Marcar en X las graduaciones necesarias comenzando en XMIN y
terminando en XMAX, cuidando de que todas tengan la misma distancia.
PASO 3. Graduar Y desde 0 hasta N, que es la frecuencia acumulada más alta de
la distribución.
PASO 4. Trazar los puntos coordenados (dato, frecuencia acumulada).
PASO 5. Unir los puntos coordenados con líneas rectas, comenzando en X MIN y
terminando en XMAX.
TERMINA
UNA OBSERVACIÓN IMPORTANTE

37. Este es el momento para introducir una noción fundamental para comprender
51
una de las razones por la que cualquier ciencia del comportamiento tiene una
naturaleza estadística. Cuando, para estudiar un fenómeno conductual, medimos
alguna variable, obtenemos un grupo de datos, los organizamos en una distribución
de frecuencias y a partir de ella construimos un histograma o un polígono de
frecuencias, podemos esperar que la gráfica tenderá a tomar la forma de una
campana. La mayor densidad de frecuencias se ubicará en el centro y el techo de
la distribución se aproximará continuamente hacia el piso conforme se aleje hacia
cada uno de los extremos. Esto implica que en las ciencias del comportamiento las
distribuciones tienden a adoptar una forma característica que se conoce como curva
normal o distribución gaussiana.
DISTRIBUCIÓN NORMAL
f
Este modelo matemático, fundamental para estudiar cualquier tipo de

comportamiento en los organismos vivos, deberá analizarse a profundidad en
cursos de teoría de la probabilidad, pues sus aplicaciones prácticas son de enorme
importancia. La gráfica se construyó con datos empíricos; por lo tanto, desde aquí
podemos ver que la distribución normal, aunque constituye un concepto teórico,
tiene un origen estrictamente empírico.
Los fenómenos conductuales se distribuyen normalmente. Esta es una ley natural
que puede comprobarse científicamente, de la misma forma que ocurre con la ley
de la gravedad en física. Comprenderla nos acerca a una concepción realmente
científica del comportamiento de los organismos vivos.

1. ¿Qué es una gráfica?
2. ¿Para qué se construyen gráficas?
3. La información que contiene una gráfica es la misma que la que contiene una
distribución de frecuencias. Discuta esta proposición.
4. Existen mentiras, mentiras infames... y estadísticas. Discuta esta afirmación.
5. ¿Cómo debe representarse el origen en un plano cartesiano para evitar la
manipulación de la interpretación de la gráfica?
6. ¿Cómo deben ubicarse los datos y las frecuencias en un plano cartesiano con el
fin de evitar la manipulación de la interpretación de la gráfica?
7. ¿Cómo deben graduarse los ejes en un plano cartesiano con el fin de evitar la
52
manipulación de la interpretación de la gráfica?

8. ¿Qué proporción deben guardar los ejes en un plano cartesiano con el fin de
evitar la manipulación de la interpretación de la gráfica?
9. Explique el criterio de rotulación que debe aplicarse con el fin de evitar
manipulación de la interpretación de la gráfica.
10.¿Qué datos generales deben incluirse con el fin de evitar la manipulación de la
interpretación de la gráfica?
11.¿Con qué otros nombres se conoce al circulograma?
12.¿Cuándo se utiliza el circulograma?
13.¿Qué representa el tamaño angular de un sector en el circulograma?
14.¿Cuándo se utiliza el gráfico de barras?
15.¿Por qué las barras se construyen separadas entre sí en un gráfico de barras?
16.¿Cuándo se utiliza el histograma?
17.¿Qué representan las barras en un histograma?
18.¿Por qué las barras están unidas entre sí en un histograma?
19.¿Cómo se vería un hueco en un histograma?
20.¿Con qué otro nombre se conoce al polígono de frecuencias?
21.¿Cuándo se utiliza el polígono de frecuencias?
22.¿Por qué los puntos cartesianos se unen entre sí con líneas rectas en un
polígono de frecuencias?
23.¿Cómo se vería un hueco en un polígono de frecuencias?
24.¿Con qué otro nombre se conoce al gráfico de escalera?
25.¿Cuándo se utiliza el gráfico de escalera?
26.¿Qué representan los escalones en un gráfico de escalera?
27.¿Cómo se vería un hueco en un gráfico de escalera?
28.¿Con qué otro nombre se conoce a la ojiva?
29.¿Cuándo se utiliza la ojiva?
30.¿Por qué los puntos cartesianos se unen entre sí con líneas rectas en una ojiva?
31.¿Cómo se vería un hueco en una ojiva?

EJERCICIOS
5.1. Utilizando la clasificación del Ejercicio 4.1, construya un circulograma.
5.2. Utilizando la ordenación del Ejercicio 4.2, construya un gráfico de barras.

53
5.3. Utilizando la distribución de frecuencias intervalar del Ejercicio 4.4, construya

el histograma.
5.4. Utilizando la distribución de frecuencias puntual del Ejercicio 4.3, construya el

polígono de frecuencias.
5.5. Utilizando la distribución de frecuencias intervalar del ejercicio 4.4, construya

el gráfico de escalera.
5.6. Utilizando la distribución de frecuencias puntual del ejercicio 4.3, construya la

ojiva.

PARA APRENDER MÁS
1. El plano cartesiano constituye el fundamento matemático de gráficas como el
histograma y el polígono de frecuencias. Escriba un ensayo demostrando esta
proposición. Puede consultar a Barnett [1978: Cap. 7]
2. Las gráficas estadísticas tienen como principal propósito disponer de imágenes
que faciliten la comprensión de los datos numéricos. Pero las gráficas también
cumplen condiciones matemáticas. Por ejemplo, el histograma y el polígono de
frecuencias, aunque adoptan formas diferentes, son estrictamente isomorfas en
las propiedades matemáticas de su área. Toda distribución puede verse como
un conjunto de áreas parciales (barras en el histograma, secciones en el
polígono de frecuencias), con suma 1. Demuestre el isomorfismo entre el
polígono de frecuencias y el histograma en cuanto a áreas. Puede consultar a
Sarramona [1980, Cap. IV] y a Ayres [1979: Caps. 15-16]
3. Justifique las siguientes proposiciones:
a) Para representar gráficamente datos medidos a nivel nominal debemos
utilizar un circulograma.
b) Para representar gráficamente datos medidos a nivel ordinal debemos utilizar
un gráfico de barras.
c) Para representar gráficamente datos medidos a nivel intervalar debemos
utilizar un histograma.
d) Para representar gráficamente datos medidos a nivel de razón debemos
utilizar un polígono de frecuencias.
4. En las ciencias del comportamiento las variables tienden a distribuirse
normalmente. Escriba un ensayo discutiendo esta proposición.


54
LECCIÓN 6. MEDIDAS DE PROPORCIÓN

El número es el símbolo de la necesidad causal. Contiene,
como el concepto de Dios, el último sentido del universo,
considerado como naturaleza.
El sentido de los Números
Spengler (1966)
CONCEPTOS ELEMENTALES
1. Comencemos esta lección recordando algunos conceptos elementales, que nos
resultarán de utilidad para entrar al análisis propiamente numérico de la descripción
estadística.
2. Un dígito es un signo elemental, que representa un número. Los números
dígitos definidos en el sistema decimal son:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9.
3. Una cifra (o guarismo) es un conjunto de dos o más dígitos que representan un
número. Por ejemplo3:
23
3,789
34’345,671
45.878
0.67865
De este modo, en la cifra que representa a un número real se distinguen dos partes:
a) La parte entera, que es la que queda a la izquierda del punto decimal.
b) La fracción decimal, que queda a la derecha del punto decimal.
De manera que, estrictamente,
345.0259
debería leerse “trescientos cuarenta y cinco enteros con doscientos cincuenta y
nueve diezmilésimos”. Sin embargo, por facilidad, generalmente lo leemos
“trescientos cuarenta y cinco punto cero dos cincuenta y nueve.
4. Los números reales pueden tener muchos dígitos, incluso una cantidad infinita,
en la fracción decimal. Como no resultaría práctico –o simplemente sería imposible–
escribir todos los dígitos de la fracción decimal, debemos establecer
convencionalmente el número de posiciones decimales significativas y los criterios
para redondear la cifra, de manera que en cualquier cálculo que realicemos
podamos obtener resultados completamente definidos.
3. Aplicamos la notación más usual en nuestro medio, aunque no la aceptada internacionalmente. En la notación
que usaremos, en una cifra el punto separa la parte entera de la decimal. En la parte entera, de derecha a
izquierda, agrupamos los dígitos de tres en tres, separando el primer periodo con una coma, el siguiente con un
apóstrofe, el tercero con coma y así sucesivamente. De este modo se facilita la lectura de cifras grandes y se
reducen los errores de escritura y trascripción.
55
REDONDEO
5. El redondeo de una cifra es un procedimiento que permite ajustar la fracción
decimal a un número de dígitos preestablecido.
6. ¿Cuántos dígitos debe tener la fracción decimal? Desde luego que no existe una
sola respuesta a esta pregunta, pero en este curso convendremos en aplicar dos
criterios:
a) Si la cifra representa una proporción, la fracción decimal se redondeará a cuatro
dígitos. Esto permitirá que cuando la proporción se transforme a porcentaje su
fracción decimal quede con dos dígitos.
b) En otro caso, la fracción decimal se redondeará a dos dígitos.
Siempre que sea necesario, la fracción decimal se completará con ceros a la
derecha hasta ajustar el número de dígitos definido.
7. Puede aplicarse el siguiente algoritmo para redondear una cifra cualquiera:
Sea
X  La cifra que será redondeada (XR).
d  Número de dígitos decimales que tendrá la cifra redondeada.
u  Último dígito decimal correspondiente a d.
s  Sucesor de d.
ALGORITMO PARA REDONDEAR UN NÚMERO REAL
COMIENZA
PASO 1. Si X representa una proporción, entonces

d4
en otro caso
d  2.
PASO 2. Escribir X con d+1 dígitos decimales; si es necesario, completar con
ceros a la derecha.
PASO 3. Si s>4, entonces u  u+1.
TERMINA
PROPORCIONES
8. Una proporción es el resultado de dividir la cardinalidad de un conjunto a entre
la cardinalidad de un conjunto b.
Debemos observar que ésta es una definición general de proporción, pero
adecuándola a nuestro tema de estudio, a puede ser un dato o un rango de datos y
b generalmente es igual a N, el tamaño de la masa de datos que se está analizando.
9. Cuando una proporción se multiplica por 100 obtenemos un porcentaje.

56
Sea
a  Cardinalidad del conjunto a
b  Cardinalidad del conjunto b
p  Proporción de a respecto a b
X%  Porcentaje de a respecto a b
Entonces
DEFINICIÓN DE PROPORCIÓN
p = a/b
X% = p100
10. El cálculo de medidas de proporción sólo involucra cardinalidades (que no son

más que frecuencias); por tanto, pueden usarse para describir variables medidas en
cualquier nivel. Sin embargo, resultan particularmente útiles en la descripción de
masas de datos obtenidas de una variable medida a nivel nominal.
DISTRIBUCIÓN DE PROPORCIONES
11. A partir de cualquier clasificación o distribución de frecuencias se puede construir
una distribución de proporciones, que adopta la siguiente forma general:
Sea
p  Proporción de X respecto a N
pa  Proporción acumulada hasta X
FORMA GENERAL DE UNA DISTRIBUCIÓN DE PROPORCIONES

Dato p pa
XMIN p(XMIN) pa(XMIN)
... ... ...
XMAX p(XMAX) 1.0000
p = 1.0000
12. Conviene observar que en una distribución de proporciones la suma siempre es

1.0000. La interpretación de este hecho es muy simple: como vimos en [4: 12-19]
en una distribución de frecuencias f=N. Esto es, la suma de las frecuencias de
cada dato es igual al tamaño de la masa de datos. Si N representa el 100% de los
casos, la suma de todas las frecuencias de la distribución también debe representar
el 100% de los casos.
AJUSTE DE SUMAS
13. Cuando se calcula una distribución de proporciones, el redondeo de cifras puede
causar imprecisiones y entonces la suma de proporciones podrá no ser igual a
1.0000, aunque debe observarse que las imprecisiones por redondeo generalmente
se reducen a uno o dos diezmilésimos.
Cuando en una distribución de proporciones la suma de proporciones no es igual
57
1.0000 y esta diferencia es causada por el redondeo de cifras, debe ajustarse.

Podría parecer trivial, pero esto resulta importante cuando la distribución de
proporciones se utilizará para tomar decisiones o para fines de diagnóstico.
14. Para ajustar la suma de una distribución de proporciones se aplica la siguiente
regla:
REGLA PARA AJUSTAR LA SUMA DE UNA DISTRIBUCIÓN DE PROPORCIONES

a) Cuando la suma es mayor que 1.0000, restar un diezmilésimo a la proporción
más grande, si es necesario, otro a la siguiente hasta ajustar la suma a 1.0000.
b) Cuando la suma es menor que 1.0000, aumentar un diezmilésimo a la
proporción más pequeña, otro a la siguiente hasta ajustar la suma a 1.0000.
15. De este modo, siempre que construyamos una distribución de proporciones

aseguraremos que se obtendrá p = 1.0000, lo cual permitirá utilizar la distribución
sin ambigüedades4.
ALGORITMO
16. Ahora podemos resumir el proceso de construcción de distribuciones de
proporciones en el siguiente algoritmo:
Sea
p  Proporción
pa  Proporción acumulada
ALGORITMO PARA CONSTRUIR UNA DISTRIBUCIÓN DE PROPORCIONES
COMIENZA
PASO 1. Construir la columna X. Cuando tenemos datos nominales no hay un

orden definido; con datos de nivel ordinal o superior, comenzar en XMIN y terminar
en XMAX.
PASO 2. Construir la columna p calculando f/N, tomando los valores de la
clasificación o distribución de frecuencias.
PASO 3. Sumar la columna p.
SI (p1.0000) en una o unas pocas diezmilésimas ENTONCES aplicar la regla de
ajuste de suma.
SI (p1.0000) en una cantidad mayor, ENTONCES hay error en los cálculos y
debe revisarse toda la distribución.
PASO 4. SI tenemos datos de nivel ordinal o superior ENTONCES construir la
columna pa, sumando cada proporción con las anteriores.
TERMINA
4 En teoría de la probabilidad se verá que esto es importante en las distribuciones de probabilidad.

58

1. ¿Qué es un digito?
2. ¿Qué es una cifra o guarismo?
3. ¿Cómo se llama la parte ubicada a la izquierda del punto decimal en un número
real?
4. ¿Cómo se llama la parte que queda a la derecha del punto decimal en un número
real?
5. Cuando se tiene una cifra grande, ¿cómo se escribe la parte entera para facilitar
su lectura y reducir los errores de transcripción?
6. Aplicando la notación estricta, lea los siguientes números:
84.2
7,421
56.34567
76,485’204,002.3
7. ¿Qué es el redondeo?
8. ¿A cuántos dígitos decimales debe redondearse una cifra?
9. ¿Qué es una proporción?
10.¿Qué es un porcentaje?
11.¿En qué nivel de medición deben medirse las variables para que puedan
calcularse proporciones?
12.¿Qué forma de organización de datos se requiere para construir una distribución
de proporciones?
13.¿tendría sentido calcular proporciones acumuladas con variables medidas a
nivel nominal? Justifique su respuesta.
14.¿Cuánto deben sumar las proporciones de una distribución? Justifique su
respuesta.
15.¿Qué significa que la suma de una distribución de proporciones sea 1.0000?
16.¿Qué debe hacerse cuando la suma de una distribución de proporciones es
diferente de 1.0000 debido a imprecisiones por redondeo?

EJERCICIOS
6.1. Redondeé y rescriba las siguientes cifras:

a) La varianza del grupo fue 347.63597
b) La proporción de alumnos no aprobados en el curso fue 0.333333...
c) La media de aprovechamiento escolar fue 89.0029928
59
d) La proporción de trabajadores afiliados al sindicato fue 0.4947621

e) El promedio de desempeño en el grupo fue 89.6547993
f) La suma de cuadrados intra fue 444’397,651.0971
g) La suma de los tiempos de respuesta fue 3,842.004932
h) La proporción de sujetos con CI menor a normal fue: 0.345
i) El total de errores fue 267
6.2. Utilizando la clasificación del Ejercicio 4.1

a) Construya la distribución de proporciones.
b) ¿Cuál es la proporción de empleados casados?
c) ¿De empleados no solteros?
6.3. Utilizando la Ordenación del Ejercicio 4.2

b) ¿Cuál es la proporción de guardias con nivel medio de autoconcepto?
c) ¿Con nivel menor a medio?
d) ¿Con nivel medio o mayor a medio?
6.4. Utilizando la distribución de frecuencias puntual del Ejercicio 4.3

b) ¿Cuál es la proporción de aspirantes con promedio final de carrera de 7 o
menor?
c) ¿Con promedio entre 7 y 9?
d) ¿Con promedio de 7 o mayor?
6.5. Utilizando la distribución de frecuencias intervalar del ejercicio 4.4

b) ¿Cuál es la proporción de policías con CI entre 100 y 119?
c) ¿Con CI de 109 o menor?
d) ¿Con CI de 110 o mayor?
e) Sería posible calcular la proporción de policías con CI entre 103 y 119?
Justifique su respuesta.

PARA APRENDER MÁS
1. Las mediciones a nivel nominal no producen números. Escriba un ensayo
justificando esta proposición. Puede consultar a Kerlinger [1982: passim].

60
2. Las mediciones a nivel ordinal producen números ordinales. Escriba un ensayo

explicando la naturaleza y propiedades del conjunto de los números ordinales.
Puede consultar a Lovaglia [1980: Cap. 3].
3. Las mediciones a nivel intervalar o a nivel de razón producen números reales.
Escriba un ensayo explicando la naturaleza y propiedades del conjunto de los
números reales. Puede consultar a Rich [1978: Cap. 3].
4. Estudie una tabla de áreas bajo la distribución normal y explíquela como una
distribución de proporciones de una variable continua. Puede consultar a
Kerlinger [1982] y Winkler [1975].


61
LECCIÓN 7. MEDIDAS DE UBICACIÓN

Se puede argumentar que la ciencia es posible únicamente
porque puede uno decir algo sin saberlo todo. Anhelar la
completitud del universo puede ser, entonces,
esencialmente infructuoso.
El Señuelo de la Completitud
H. Bondi
LÍMITES EXACTOS
1. Al trabajar con variables continuas, debemos tener claro que cualquier puntaje
empírico realmente corresponde al punto medio de un rango.
2. Por ejemplo, en una distribución puntual, si medimos la variable CI en enteros y
sabemos que Juan tiene un CI de 103 entonces, en sentido estricto, lo que decimos
es que el CI de Juan se encuentra entre 102.50 y 103.50. Representado
gráficamente tendríamos:
LÍMITES EXACTOS EN DATOS PUNTUALES
102 103 104 puntajes
101.50 102.50 103.50 104.50 límites exactos
3. Con distribuciones intervalares el concepto de límite exacto se aplica de la

misma forma, pero tomando los límites de intervalo [4: 22-23]. Supongamos en este
caso que el puntaje de memoria de Luis se ubica en el intervalo (71-75), entonces
sus límites exactos serían 70.50 el inferior y 75.50 el superior.
LÍMITES EXACTOS EN DATOS INTERVALARES

(66-70) (71-75) (76-80) Intervalos
69 70 71 72 73 74 75 76 77 puntajes
70.50 75.50 límites exactos
4. En general, en una variable continua el límite exacto entre dos medidas

consecutivas se obtiene sumándolas y dividiendo el resultado entre 2. Se distinguen
dos límites exactos:
a) El límite inferior exacto (Li) es el que queda a la izquierda del dato;
b) El límite superior exacto (Ls) es el que queda a la derecha del dato.
Debe observarse que dos datos sucesivos comparten un mismo límite exacto. El
62
límite superior exacto del antecesor es el mismo que el límite inferior exacto del
sucesor (esta es la noción de límite).
5. El concepto de límites exactos supone continuidad en la variable y, por tanto,
para aplicarlo se requieren medidas a nivel intervalar o de razón, pues las nominales
y ordinales implican discreción.
LOS FRACTILES
6. Las medidas de ubicación permiten posicionar datos individuales (y, por tanto,
al sujeto que tiene el dato) dentro de su masa de datos (grupo), en términos de
proporciones.
7. Pueden definirse medidas de ubicación para limitar cualquier proporción de la
distribución. Por ejemplo:
a) Si dividimos una distribución en dos partes iguales, cada una de ellas contendrá
el 50% de los datos; a la medida que limita la mitad de la distribución se le llama
mediana.
b) Si dividimos la distribución en cuatro partes iguales, cada una de ellas contendrá
el 25% de los datos y se les llama cuartiles.
c) Si la dividimos en diez partes, cada una se llamará decil y contendrá 10% de la
distribución.
d) Si la dividimos en cien partes, cada una se llamará centil y contendrá 1% de la
distribución.
8. En la siguiente tabla se presentan algunos ejemplos de medidas de ubicación.
EJEMPLOS DE MEDIDAS DE UBICACIÓN

Símbolo Nombre Proporción
Md Mediana 0.5000
Q1 Cuartil 1 0.2500
Q2 = Md Cuartil 2 0.5000
Q3 Cuartil 3 0.7500
D1 Decil 1 0.1000
D7 Decil 7 0.7000
P89 Percentil 89 0.8900
9. Es claro que podríamos seguir indefinidamente haciendo particiones de la
distribución: cinco partes o quintiles, seis partes o hexiles, siete partes o heptiles,
etc. Pero esto resultaría realmente ocioso, y es prescindible.
Más aún, podríamos encontrar (y de hecho en la mayoría de los textos de
estadística se encuentran) fórmulas o procedimientos para calcular las medidas de
ubicación más comunes (una fórmula para la mediana, otra para cada cuartil, etc.),
pero esto provoca una confusión gratuita que puede evitarse introduciendo el
concepto de fractil.
10. Definimos a un fractil como el dato o puntaje (X) que limita por la derecha una
proporción cualquiera de una distribución.
63
11. Si podemos calcular fractiles, podemos calcular cualquier medida de ubicación

–no importa como se llame– con sólo determinar la proporción de la distribución que
limita. Cualquier medida de ubicación limita una proporción P por la derecha; es
decir, si fp es el fractil que limita la proporción P, entonces P es la proporción de
casos que tienen un puntaje menor o igual al dato correspondiente a fp.
FRACTILES Y PROPORCIONES
fp
12. Para calcular fractiles se aplica el siguiente:
ALGORITMO PARA CALCULAR FRACTILES

COMIENZA
PASO 1. Obtener los siguientes valores:

N  Tamaño de la masa de datos.
p  Proporción de casos que limita el fractil.
PASO 2. R1  el dato puntual o el intervalo que contiene a (pN).
Li  Límite inferior exacto de R1.
Fa  Frecuencia acumulada hasta antes de R1.
fp  Frecuencia simple de R1.
i  Tamaño del intervalo. (En una distribución puntual i=1).
PASO 4. Sea Fp  Fractil buscado, entonces:
Fp = Li+((((pN)–Fa)/fp)i)
TERMINA
EL RANGO PERCENTILAR
13. Definimos al rango percentilar como la proporción de la distribución que queda
limitada por un dato dado.
14. El rango percentilar es la medida inversa al fractil. Cuando calculamos un fractil
partimos de una proporción determinada de la distribución para encontrar el dato
que la limita por la derecha; al calcular el rango percentilar hacemos exactamente
lo contrario: dado un dato, calculamos la proporción limitada por él.
15. El rango percentilar se calcula con el siguiente:
64
ALGORITMO PARA CALCULAR RANGOS PERCENTILARES

COMIENZA

N  Tamaño de la masa de datos.
PASO 2. R1  Renglón que contiene al dato puntual o intervalo.
i  Tamaño del intervalo. (En una distribución puntual i=1).
Fa  Frecuencia acumulada hasta antes de R1.
fp  Frecuencia simple de R1. SI la distribución es intervalar ENTONCES fp = fp/i
X  Dato correspondiente a R1; SI la distribución es intervalar ENTONCES se toma
el punto medio.
Li  Límite inferior del intervalo.
PASO 4. Sea RP  Rango percentilar, entonces:
RP = (((X–Li)fp)+Fa)/N
TERMINA
16. Concluimos esta lección insistiendo en que RP, el resultado obtenido al aplicar
el algoritmo, es la proporción de casos que limita el dato dado (X). Multiplicando
RP100, obtendremos el porcentaje del grupo que obtuvo puntajes iguales o
menores a X.

1. ¿Cómo se obtiene el límite exacto entre dos datos sucesivos?
2. ¿Podemos establecer los límites exactos de una variable medida a nivel nominal
u ordinal? Justifique su respuesta.
3. El límite inferior exacto del sucesor es el mismo que el límite superior exacto del
antecesor. Discuta esta proposición.
4. ¿Para qué se utilizan las medidas de ubicación?
5. ¿Qué es un fractil?
6. ¿Qué fractil debe calcularse para encontrar el Octil 7?
7. ¿Qué fractil debe calcularse para encontrar el Quintil 3?
8. P50 = Md = D5 = Q2 = F0.5000. Discuta esta proposición.
9. ¿Qué fractil debe calcularse para encontrar el Percentil 57.36?
10.¿Qué es un rango percentilar?
11.Explique la relación entre fractil y rango percentilar.

65
EJERCICIOS
7.1. Utilizando la distribución de frecuencias del Ejercicio 4.3, calcule las siguientes
medidas
a) Decil 7
b) Mediana
c) Cuartil 3
7.2. Utilizando la distribución de frecuencias del Ejercicio 4.4, conteste lo siguiente:

a) Será aceptado a un curso de formación el 12% superior del grupo. ¿A partir
de qué CI serán aceptados los aspirantes?
b) José obtuvo un CI de 115. Calcule e interprete su rango percentilar.
c) Encuentre el fractil que limita a la proporción encontrada en (b).
d) Comparando los procesos realizados en (b) y (c), explique la relación entre
fractil y rango percentilar.
7.3. Definimos convencionalmente el siguiente modelo de normalización:

Norma %
Deficiente 8.00
Muy bajo 11.50
Bajo 16.25
Medio 28.50
Alto 16.25
Muy alto 11.50
Superior 8.00
Utilizando la distribución de frecuencias del Ejercicio 4.4, construya la tabla de
normas.

PARA APRENDER MÁS
1. Busque la distribución de proporciones del modelo estanina, y establezca las
medidas de ubicación que deben calcularse para encontrar los límites de norma.
Puede encontrar información en Anastasi [1973: Cap. 3] y Garret [1974: Cap. 4).
2. Busque el modelo de normalización AGCT y establezca las medidas de
ubicación que deben calcularse para encontrar los límites de norma. Puede
encontrar información en Anastasi [1973: Cap. 3] y Garret [1974: Cap. 4).


66
LECCIÓN 8. MEDIDAS DE TENDENCIA CENTRAL

La llamo, en general, la ciencia de los números y del cálculo.
¿No es verdad que ninguna ciencia puede ser sin ella?
La República, Libro Séptimo
Platón
LA NOCIÓN DE TENDENCIA CENTRAL
1. Comencemos por recordar una noción fundamental en matemáticas: hablamos
de una tendencia cuando una variable o función se aproxima progresivamente a un
valor o modelo, sin que necesariamente llegue a alcanzarlo.
2. Por ejemplo, cuando decimos que en la naturaleza las variables tienden a
distribuirse normalmente, esto significa que las distribuciones de frecuencias
empíricas se aproximan a la forma de campana de la distribución normal, sin que
necesariamente lleguen a adoptar una forma estrictamente normal.
3. Esta noción resulta fundamental para las ciencias de la conducta. Cuando los
fenómenos conductuales se miden empíricamente, tienden a distribuirse en forma
normal. Una característica de la distribución normal consiste en que las medidas
de tendencia central, como su propio nombre lo indica, tienden a ubicarse en el
centro de la distribución, aproximándose entre sí al mismo tiempo. Veremos más
adelante que la distancia que existe entre ellas es una medida de la asimetría de la
distribución.
MEDIDAS DE TENDENCIA CENTRAL
Media
f
Mediana
Modo
4. Las medidas de tendencia central son tres: la media, la mediana y el modo.

Debemos observar que existen diversos tipos, y aún diversas condiciones de
cálculo, de cada una de estas medidas, pero en este curso sólo veremos las más
usuales en ciencias del comportamiento, estas son:

67
Aritmética
Media Ponderada
...
Medidas de tendencia central
Mediana
Modo
LA MEDIA ARITMÉTICA
5. Suele utilizarse el término promedio como sinónimo de media aritmética pero,
estrictamente, esto no es correcto. Un promedio, como su nombre lo indica, es una
medida que se ubica en el medio (del latín pro, por y medio), es decir, hacia el centro
de la distribución. En este sentido, las tres medidas de tendencia central son
promedios, pues todas tienden al centro.
6. La media aritmética es el dato que constituye el punto de equilibrio de una
distribución de frecuencias. Esto significa que en términos de área o de masa,
tomando como límite a la media aritmética, el lado izquierdo de la distribución tiene
la misma área o peso.
7. Decimos que una medida estadística es confiable (o estable) cuando en
diferentes procesos de medición tiende a mantenerse constante (desde luego,
dentro de ciertos límites de error). El concepto de confiabilidad resultará
fundamental en próximos cursos, cuando se estudie la construcción de instrumentos
de medición.
8. En estos términos, la media aritmética es la medida de tendencia central más
confiable y por tanto:
a) Es la medida más utilizada en la estadística para describir la tendencia central de
un grupo de datos.
b) Las medidas de variabilidad que más se utilizan se calculan precisamente a partir
de la media aritmética, como veremos en la próxima lección.
9. Cuando la media aritmética se calcula a partir de una masa de datos, está dada
por:
FÓRMULA PARA CALCULAR LA MEDIA ARITMÉTICA EN UNA MASA DE DATOS

Sea
  Media aritmética.
Entonces
 = ΣX/N
10. Ahora, cuando disponemos de una distribución de frecuencias podemos aplicar

68
la siguiente:
FÓRMULA PARA CALCULAR LA MEDIA ARITMÉTICA EN UNA DISTRIBUCIÓN DE FRECUENCIAS

 = ΣfX/N
11. Comparando las dos fórmulas anteriores, resulta claro que son totalmente
equivalentes, porque trabajando con distribuciones puntuales
ΣfX = ΣX
pues cada producto fX equivale a sumar f veces X.
12. En el caso de trabajar con una distribución de frecuencias intervalar, pueden
aparecer (y casi siempre aparecen) pequeñas diferencias entre los resultados de
las dos sumas, diferencias que se deben al nivel de medición y no a la fórmula
aplicada. Es claro que, siguiendo con distribuciones intervalares, ΣX es más preciso
que ΣfX; por tanto la diferencia entre ambas es un error debido al nivel intervalar de
medición. Lo mismo ocurre con cualquier otra medida calculada a partir de
distribuciones de frecuencias intervalares, ya que trabajar con intervalos involucra
una menor precisión que la que se obtiene con mediciones a nivel de razón. Para
comprender esto conviene revisar [4: 15-24].
LA MEDIA PONDERADA
13. Cuando calculamos la media aritmética, al sumar los datos (X) y dividir el
resultado entre el número de sumandos (N), asumimos implícitamente que todos
los datos tienen el mismo peso.
Pero existen casos en que debemos considerar que los datos difieren entre sí en
cuanto a su peso. Esto es, algunos datos “pesan” más que otros, y esto debe
considerarse al calcular la media. En estos casos se aplica la media ponderada (o
media pesada).
14. La media ponderada está dada por:
FÓRMULA PARA CALCULAR LA MEDIA PONDERADA

Sea
MP  Media ponderada.
w  peso asignado a cada dato (X).
Entonces
MP = Σ(wX)/w
LA MEDIANA
15. La mediana es una medida menos confiable que la media aritmética, pero lo es
más que el modo.
16. La mediana se define como el dato que limita a la mitad de las frecuencias de
la distribución; esto es, la mitad de los datos quedan a cada lado de la mediana.

69
17. La mediana es una medida de tendencia central, porque tiende a ubicarse en el

centro de la distribución; pero debemos observar también es una medida de
ubicación porque limita a una proporción de la distribución (el 50%).
18. Por tanto, como vimos en [7: 6-12], para encontrar la mediana en una distribución
de frecuencias basta con calcular el fractil que limita al 50% de los datos, esto es,
F0.5000.
19. Cuando trabajamos con una ordenación, puede aplicarse el siguiente:
ALGORITMO PARA ENCONTRAR LA MEDIANA EN UNA ORDENACIÓN

COMIENZA
PASO 1. Localizar en la ordenación el punto que separa la mitad de los datos.

PASO 2. SI N es impar ENTONCES el dato central es la mediana. SI N es par
ENTONCES la mediana es la media de los dos datos centrales.
TERMINA
EL MODO
20. El modo es la medida de tendencia central más fácil de obtener, pero también
es la menos confiable.
21. El modo se define simplemente como el dato más frecuente de una distribución.
22. Aplicando esta definición, puede ocurrir que en una distribución:
a) Exista más de un modo. Es decir, podemos encontrar distribuciones bimodales,
trimodales o, en general, polimodales.
b) No exista modo, lo que ocurriría en el caso de que todos los datos de una
distribución tengan la misma frecuencia; esto ocurre cuando se tiene una
distribución uniforme.
23. Esto implica que el modo no se calcula, simplemente se localiza buscando en la
distribución el dato que presente la frecuencia más alta.

1. Explique la noción matemática de tendencia.
2. ¿Por qué la media, la mediana y el modo se llaman medidas de tendencia
central?
3. Media aritmética y promedio son sinónimos. Discuta esta proposición.
4. ¿Qué es la media aritmética?
5. Cuando calculamos medidas estadísticas a partir de una distribución de
frecuencias intervalar, siempre obtenemos exactamente el mismo resultado que
si lo hacemos a partir de una masa de datos. Discuta esta proposición.
70
6. Explique la diferencia entre media aritmética y media ponderada.

7. ¿Qué es la mediana?
8. La mediana es una medida de tendencia central y también es una medida de
ubicación. Discuta esta proposición.
9. ¿Qué es el modo?
10.En una distribución cualquiera puede existir más de un modo. Discuta esta
proposición.
11.Puede existir una distribución carente de modo. Discuta esta proposición.
12.¿Por qué la media aritmética es la medida de tendencia central más utilizada?
13.Ordene las tres medidas de tendencia central en cuanto a su confiabilidad.

EJERCICIOS
8.1. Utilizando la ordenación del Ejercicio 4.2:
a) Calcule la media aritmética.
b) Localice la mediana.
c) Localice el modo.
8.2. Utilizando la distribución de frecuencias del Ejercicio 4.3:

b) Calcule la mediana.

8.4. Utilizando la distribución de frecuencias bivariable del Ejercicio 4.5:

a) Calcule las medias aritméticas en X y Y.
b) Calcule las medianas en X y Y.
c) Localice los modos en X y Y.
8.5. Se midió aprendizaje terminal en matemáticas en los egresados de tres

escuelas y se obtuvo:

71
Escuela Número de egresados Media

A 897 6.43
B 86 8.74
C 411 7.33
a) Calcule la media aritmética general.
b) Calcule la media ponderada general, conforme al número de egresados
c) Compare la media aritmética con la ponderada y explique la diferencia.
d) ¿Cuál de las dos medias sería más representativa de la población general de
egresados?
8.6. Se presentan las calificaciones finales y la carga horaria

(horas/semana/semestre) de cada asignatura obtenida por un alumno:
Asignatura Calificación Carga horaria
A 8.30 2
B 6.81 4
C 9.43 3
D 7.12 6
E 8.83 2
b) Calcule la media ponderada, conforme a la carga horaria de cada asignatura.
d) ¿Cuál de las dos medias sería más representativa de la población general de
egresados?

PARA APRENDER MÁS
1. Tome como ejemplos las distribuciones de frecuencias de los ejemplos 4.3, 4.4
y 4.5, construya las gráficas adecuadas, calcule sus medidas de tendencia
central, represéntelas en las gráficas y explique a partir de este ejercicio el
concepto de tendencia central.
2. En la distribución gaussiana, como modelo teórico, las tres medidas de tendencia
central se ubican exactamente en el centro de la distribución. Explique cómo se
ubicarían en:
a. Una distribución exponencial.
b. Una distribución con forma de campana invertida
Puede encontrar información en Winkler [1975].
3. Phillips [1979: Cap. 3] dice que la media aritmética puede conceptualizarse como
el punto de balance de una distribución. Explique este concepto gráficamente.
4. Además de la media aritmética y la media ponderada, existe la media
geométrica, que tiene aplicaciones muy especializadas en las ciencias del
72
comportamiento. Explique cómo se calcula y proponga un ejemplo de aplicación

en el estudio de la conducta. Puede consultar a Yamane [1975: Cap. 3] o Spiegel
[1975: Cap. 3].
5. Además de la media aritmética y la media ponderada, existe la media cuadrática,
que tiene aplicaciones muy especializadas en las ciencias del comportamiento.
Explique cómo se calcula y proponga un ejemplo de aplicación en el estudio de
la conducta. Puede consultar a [Spiegel, 1975: Cap. 3].
6. Además de la media aritmética y la media ponderada, existe la media armónica,
que tiene aplicaciones muy especializadas en las ciencias del comportamiento.
Explique cómo se calcula y proponga un ejemplo de aplicación en el estudio de
la conducta. Puede consultar a Spiegel [1975: Cap. 3].


73
LECCIÓN 9. MEDIDAS DE VARIABILIDAD

Todo es número.
Círculo Pitagórico, c. 450 a. C.
LA NOCIÓN DE VARIABILIDAD
1. En la lección anterior vimos que la tendencia central mide precisamente la
tendencia de los datos a agruparse en el centro de la distribución, como es
característico de los fenómenos conductuales. Ahora veremos la noción inversa y a
la vez complementaria: la variabilidad.
2. A diferencia de la tendencia central, la variabilidad permite medir qué tanto se
alejan entre sí los datos de la distribución. Las medidas de variabilidad más
confiables se obtienen con referencia a una medida de tendencia central.
3. Podemos representar gráficamente la idea de variabilidad de una distribución como
sigue:
MEDIDAS DE VARIABILIDAD
f
Esto es, al contrario que las medidas de tendencia central, las medidas de
variabilidad miden el alejamiento de los datos del centro hacia los extremos.
4. Comparando las nociones de tendencia central y variabilidad, tenemos:
DIFERENCIA EN TENDENCIA CENTRAL DIFERENCIA EN VARIABILIDAD
A
A B
A la izquierda vemos dos distribuciones con igual variabilidad (sus formas son
idénticas) pero con diferente tendencia central; tomando la media como referencia,
74
es claro que en B es mayor que en A. En cambio, en la figura de la derecha vemos

que las distribuciones A y B están en el mismo punto de la abscisa, por lo que tienen
la misma media (son iguales en tendencia central), pero su forma es distinta,
claramente A está más dispersa que B; esto es, los datos de la distribución A varían
más que los de B, lo que provoca que la primera se extienda más sobre la abscisa
que la segunda. Este es precisamente el concepto de variabilidad.
5. Veremos cinco medidas para describir la variabilidad de una distribución:
Rango
Rango semintercuartilar
Medidas de variabilidad Desviación media
Desviación estándar
Varianza
RANGO
6. El rango (también llamado amplitud total, oscilación o recorrido) mide la
distancia exacta entre el dato menor y el dato mayor de una distribución.
7. El rango está dado por:
FÓRMULA PARA CALCULAR EL RANGO

Sea
R  Rango
entonces
R = XMAX–XMIN+1
Debe observarse que al sumar 1 a la diferencia entre el dato mayor y el menor,

estamos corrigiendo la distancia hasta los límites exactos. Precisamente por esto
definimos al rango como la distancia exacta entre los datos mayor y menor de una
distribución. Cuando la fórmula no aplica esta corrección, en cálculos posteriores
deberá aplicarse, y entonces se vuelve confusa la razón de hacerlo.
8. Cuando se trabaja con una distribución intervalar, XMIN corresponde al límite
izquierdo del intervalo menor y XMAX al límite derecho del intervalo mayor.
Por otra parte, no está de más insistir en que, como ocurre con cualquier otra medida
estadística, cuando el rango se obtiene en una distribución intervalar, tendrá un
valor aproximado.
RANGO SEMINTERCUARTILAR
9. Regresemos por un momento a los fractiles. Sabemos que cada fractil es un
dato que limita una proporción dada de la distribución y, por tanto, es un valor en X.
La mitad central de una distribución estará limitada por los cuartiles uno
75
(Q1 = F0.2500) y tres (Q3 = F0.7500). Por lo tanto la distancia entre ambos (Q3–Q1)
constituye el rango intercuartilar, esto es, la amplitud total de los dos cuartiles
internos de la distribución5; en otras palabras, el rango intercuartilar es la amplitud
total de la zona que contiene a la mitad central de la distribución. Naturalmente, la
mitad del rango intercuartilar será el rango semintercuartilar.
10. Por tanto, el rango semintercuartilar está dado por:
FÓRMULA PARA CALCULAR EL RANGO SEMINTERCUARTILAR

Sea
RSIC  Rango semintercuartilar
entonces
RSIC = (F0.7500–F0.2500)/2
11. El RSIC es una medida de desviación que se calcula en términos de frecuencias,

al igual que la mediana. En consecuencia, debe aplicarse cuando se utilice ésta
como parámetro de tendencia central. Es particularmente útil para describir datos
medidos en el nivel ordinal.
12. El RSIC permite comparar grupos en cuanto a su variabilidad. Pero debe
considerarse que es una medida de desviación menos confiable que la desviación
estándar, que veremos un poco más adelante.
DESVIACIÓN MEDIA
13. Esta es otra medida simple de calcular, pero de gran interés cuando se trata de
conocer cuánto se desvía un sujeto respecto a su grupo. La desviación media es
una medida fundamental para el diagnóstico psicológico.
14. La desviación media mide la distancia desde un dato (y, en consecuencia, el
sujeto que lo posee) hasta la media del grupo al que pertenece. Está dada por:
FÓRMULA PARA CALCULAR LA DESVIACIÓN MEDIA

Sea
DM(X)  Desviación media de X.
entonces
DM(X) = X–
15. Aquí queda claro que la media, la medida de tendencia central más confiable
[8: 5-12], es el punto de referencia para determinar cuánto se aleja un dato
cualquiera del grupo. Esto le da una gran confiabilidad a la desviación media, así
como a una medida derivada de ella: la desviación estándar.
16. También es muy importante observar que la desviación media generalmente se
calcula a partir de la media aritmética, pero no necesariamente tiene que ser así,
5. Nótese que aquí no se suma uno a la diferencia porque los fractiles son medidas exactas, pues
se obtienen a partir de un límite inferior exacto.
76
puede utilizarse la media ponderada o cualquier otro tipo de media 6 que se

considere la más representativa del grupo.
17. De la fórmula para obtener la desviación media se deduce directamente que:
a) X =   DM = 0
b) X >   DM > 0
c) X <   DM < 0
Lo que puede interpretarse como sigue:
a) Cuando el dato coincide con la media, no existe desviación media; el sujeto
queda en la media.
b) Cuando el dato es mayor que la media, la DM asume signo positivo; el sujeto
queda sobre la media.
c) Cuando el dato es menor que la media, la DM asume signo negativo; el sujeto
queda bajo la media.
A primera vista esto puede resultar, además de obvio, trivial, pero no es así: tiene
enormes implicaciones al interpretar datos psicométricos, pues permite calcular no
sólo la posición absoluta de cualquier sujeto respecto a su grupo, sino también la
dirección que tiene respecto a él.
18. Más aún, hemos definido a la media como el punto de equilibrio en una
distribución y esto implica que en cualquier distribución:
ΣDM = 0
Propiedad que determina la definición misma de desviación estándar, como
veremos enseguida.
19. Aquí conviene observar que la desviación media mide la distancia a que se
encuentra el dato respecto a su media (esto es, respecto a su grupo), mientras que
las medidas de ubicación ubican al dato con respecto a una proporción dada en
términos de frecuencias. Aunque la desviación media posiciona a un sujeto respecto
a su grupo y el rango percentilar también lo hace, como ya vimos ambas medidas
estadísticas parten de conceptos muy diferentes.
DESVIACIÓN ESTÁNDAR
20. En este punto debemos introducir una nueva noción, que resultará fundamental
para la psicometría: la estandarización (también llamada tipificación) es un proceso
mediante el cual se ajustan todos los datos de un grupo a una sola medida.
6. En la sección Para aprender más de la Lección 8 se apunta la existencia de otros tres tipos de
media además de la aritmética y la ponderada (geométrica, cuadrática y armónica), que pueden
utilizarse como parámetro de tendencia central para representar a un grupo. ¿Cuál es el tipo de
media más adecuado? Eso depende de la naturaleza de los datos con se trabaje y de los fines que
se persigan. En cualquier caso, la diferencia de valores entre los tipos de media no suele ser
demasiado grande. Por otra parte, insistimos, el tipo más usado es la media aritmética, al grado que
llega a pensarse que esta es la única que existe.
77
Digámoslo en otros términos: un puntaje estándar es un puntaje que relaciona al

sujeto con todo el grupo al que pertenece.
21. Ya dijimos que la desviación media mide cuánto se aleja un dato particular de la
media de su grupo. Ahora podemos preguntarnos: ¿Cómo medir la desviación del
grupo en su conjunto respecto a la media? Para contestar esta pregunta se
desarrolló el concepto de desviación estándar.
22. La desviación estándar es la medida de variabilidad más utilizada y, junto con la
media, constituye la base conceptual de prácticamente cualquier sistema de
medición cuantitativa, clasificación y tipología en las ciencias del comportamiento y,
particularmente, en la psicometría. Tal es su importancia.
23. La desviación estándar se define como la raíz cuadrada del promedio de los
cuadrados de las desviaciones medias de una distribución.
24. Es necesario calcular los cuadrados de las desviaciones medias porque, como
ya vimos, en cualquier distribución
ΣDM = 0
lo que implica que no podríamos obtener el promedio de desviaciones medias
directamente de la distribución (pues al sumarlas se cancelarían y siempre valdría
cero). Elevando al cuadrado cada desviación media eliminamos los signos; después
se extrae raíz cuadrada al cociente para regresar a la escala original, con valores
absolutos.
25. En una masa de datos, la desviación estándar está dada por:
FÓRMULA PARA CALCULAR LA DESVIACIÓN ESTÁNDAR EN UNA MASA DE DATOS

Sea
  Desviación estándar.
entonces
 = (Σ(X–)2/N)
26. Esta fórmula supone que estamos calculando la desviación estándar de una
población. Cuando se calcula la desviación estándar de una muestra, debe restarse
uno al denominador para corregir por grados de libertad, lo que hace que la fórmula
quede:
S = (Σ(X–)2/(N–1))
Donde S representa a la desviación estándar muestral ( es poblacional). Pero este
es un tema de estadística inferencial, específicamente de estimación de
parámetros, por lo cual aquí no profundizaremos en él.
27. Para calcular la desviación estándar en una distribución de frecuencias la
fórmula anterior se adapta para quedar como sigue:

78
FÓRMULA PARA CALCULAR LA DESVIACIÓN ESTÁNDAR EN UNA DISTRIBUCIÓN DE

FRECUENCIAS
 = ((ΣfX2–((ΣfX)2/N))/N)
VARIANZA
28. La varianza se representa por 2 y, como lo indica su símbolo, se define
simplemente como el cuadrado de la desviación estándar.
29. Sería trivial presentar una fórmula para calcular la varianza, pues para obtenerla
basta con eliminar la raíz cuadrada en la fórmula de la desviación estándar o, como
es más común, elevar la desviación estándar al cuadrado.
30. La desviación estándar se calcula a partir de desviaciones medias y, por tanto,
mide distancias a la media. La varianza, en cuanto valor cuadrado, mide áreas.

1. ¿Qué miden las medias de variabilidad?
2. Todas las medidas de variabilidad se obtienen en relación con las medidas de
tendencia central. Discuta esta proposición.
3. ¿Qué es el rango de una distribución?
4. ¿Cuál es la utilidad principal del rango?
5. ¿Con qué otros nombres se conoce al rango?
6. ¿Por qué para obtener el rango se suma uno a la distancia entre los datos mayor
y menor?
7. ¿Qué es el rango semintercuartilar?
8. ¿Cuál es la utilidad principal del rango semintercuartilar?
9. ¿En relación con qué medida de tendencia central debe utilizarse el rango
semintercuartilar?
10.¿Qué es la desviación media?
11.¿Cuándo debe aplicarse la desviación media?
12.La desviación media sólo se calcula en relación con la media aritmética. Discuta
esta proposición.
13.Explique el significado de los signos en la desviación media.
14.En cualquier distribución, la suma de sus desviaciones medias es igual a cero.
15.La desviación media permite posicionar a un sujeto respecto a su grupo de la
misma forma que lo hace el rango percentilar. Discuta esta proposición.
16.Explique la noción de estandarización en psicometría.
79
17.¿Qué es la desviación estándar?

18.¿Con qué otro nombre se conoce a la desviación estándar?
19.¿Cuándo se aplica la desviación estándar?
20.¿Por qué deben elevarse al cuadrado las desviaciones medias para calcular la
desviación estándar?
21.¿Cuándo se resta uno al denominador en el cálculo de la desviación estándar?
22.¿Qué es la varianza?
23.¿Cómo se obtiene la varianza de una distribución?
24.¿Cuál es la medida de variabilidad más confiable?

EJERCICIOS
9.1. Utilizando la ordenación del Ejercicio 4.2:

a) Calcule e interprete el rango.
b) José es un guardia del grupo y tuvo un puntaje de 4; calcule e interprete su
desviación media.
c) Calcule e interprete la desviación estándar.
d) Calcule e interprete la varianza.

b) Calcule e interprete el rango semintercuartilar.
c) Pedro es un aspirante del grupo y tuvo un puntaje de 7; calcule e interprete su
desviación media.
d) Calcule e interprete la desviación estándar.
e) Calcule e interprete la varianza.

b) Calcule e interprete el rango semintercuartilar.
c) Luis es un policía del grupo y tuvo un CI de 92; calcule e interprete su
desviación media.
d) Calcule e interprete la desviación estándar.
e) Calcule e interprete la varianza.
9.4. Utilizando la distribución de frecuencias bivariable del Ejercicio 4.5:

80
a) Calcule, compare e interprete los rangos en X y Y.

b) Calcule, compare e interprete los rangos semintercuartilares en X y Y.
c) Juan obtuvo los puntajes (39, 76). Calcule, compare e interprete su desviación
media en ambas variables.
d) Calcule, compare e interprete las desviaciones estándar en X y Y.
e) Calcule, compare e interprete las varianzas en X y Y.

PARA APRENDER MÁS
1. Demuestre matemáticamente que ΣDM = 0.
2. Explique la relación entre media cuadrática y desviación estándar.
3. Sabemos que en datos no agrupados la desviación estándar está dada por
 = (Σ(X–)2/N))
Y en una distribución de frecuencias (datos agrupados) por
 = ((ΣfX2–((ΣfX)2))/N)/N)
Demuestre que la segunda fórmula se deriva directamente de la primera.
4. Explique gráficamente el concepto de varianza de una distribución.


81
LECCIÓN 10. MEDIDAS DE FORMA

La naturaleza está escrita en lenguaje matemático.
El ensayador, Galileo
CONCEPTOS ELEMENTALES
1. En este punto ya debemos tener claro el concepto de distribución empírica,
aquella que se obtiene a partir de datos obtenidos por observación de la realidad,
así como la forma de construirla a partir de una masa de datos [4: 9-30].
2. Una distribución teórica, por otra parte, es un modelo matemático y, en sentido
estricto, no existe en la realidad. Sin embargo, como todo modelo, las distribuciones
teóricas son poderosas herramientas para estudiar la realidad.
3. Entonces, las medidas de forma miden el grado en que una distribución
empírica se ajusta a un modelo teórico determinado.
4. Al representar gráficamente una distribución empírica vimos [5: 25-36] que, en
general, los datos de una distribución tienden acumularse en el centro y a disminuir
su frecuencia conforme se alejan hacia los extremos, lo que hace que la distribución
adopte la forma de una campana. También vimos [5: 37] que a este modelo se le
conoce como distribución normal o gaussiana.
TIPOS DE SESGO
, Md, Mo  = Md = Mo Mo, Md, 
Sesgo negativo Sin sesgo, simetría Sesgo positivo
5. Existen métodos apropiados para medir el ajuste de una distribución empírica a

un modelo cualquiera (binomial, Poisson, etc.). Pero aquí nos limitaremos al caso
de la distribución normal que es, con mucho, el modelo más utilizado en las ciencias
del comportamiento.
6. Debemos insistir en que la distribución normal es un modelo teórico y, por tanto,
es prácticamente imposible encontrar una distribución empírica que se ajuste
perfectamente a ella, punto por punto. El propósito de las medidas de forma es,
precisamente, medir cómo y cuánto se aleja una distribución empírica del modelo
normal.
7. Las medidas de forma son dos: sesgo y curtosis.

82
SESGO
8. La distribución normal es simétrica, lo que significa que una ordenada vertical
colocada en el centro, corresponderá exactamente a la media, la mediana y el
modo. En consecuencia, las dos mitades son idénticas, pero inversas.
9. El sesgo es un coeficiente que mide el grado en que una distribución se aleja
del modelo normal en cuanto a la tendencia central. Conforme una distribución
empírica pierde simetría, tiende a cargarse hacia uno u otro lado de la media, lo que
da origen a tres tipos de sesgo:
a) Sesgo negativo, cuando está coleada hacia la izquierda, lo que implica que los
datos mayores a la media aritmética constituyen más del 50% de la distribución.
b) Sesgo cero, la distribución es perfectamente simétrica. En este caso media,
mediana y modo asumen el mismo valor (se ubican en el mismo punto de la
abscisa), y exactamente la mitad de los datos queda a cada lado de la media.
c) Sesgo positivo, prevalecen los datos menores a la media aritmética.
10. Ya sabemos que la media es el parámetro de tendencia central más estable,
seguido por la mediana. Por ello se utiliza a estos dos parámetros para medir el
sesgo. El sesgo puede entonces calcularse aplicando la siguiente fórmula
FÓRMULA PARA CALCULAR EL SESGO DE UNA DISTRIBUCIÓN

Sea
So  Sesgo.
Entonces
So = (3(–F0.5000))/
CURTOSIS
11. Se llama curtosis o apuntamiento de una distribución al grado en que la curva
eleva su techo sobre el piso y, en consecuencia, adelgaza su base. La curtosis
mide el grado en que una distribución se aleja del modelo normal en términos de
variabilidad.
12. El valor de la curtosis en la distribución normal es de 0.2632. Esto da origen a

tres tipos de distribución, en términos de su curtosis:
a) Distribución planocúrtica, cuando el valor de la curtosis es menor que 0.2632.
Entonces la variabilidad de la distribución es mayor a la normal: la base se amplía
y el techo se aplana.
b) Distribución mesocúrtica (normal), cuando el valor de la curtosis es igual a
0.2632. Entonces la variabilidad de la distribución es normal.
c) Distribución leptocúrtica, cuando el valor de la curtosis es mayor a 0.2632.
Entonces la variabilidad de la distribución es menor a la normal. Aquí la base se
angosta y el techo se apunta.

83
TIPOS DE CURTOSIS
Planocúrtica Mesocúrtica o normal Leptocúrtica
13. Así como el sesgo depende de la tendencia central, la curtosis depende de la

variabilidad. Existe una relación inversa entre curtosis y variabilidad: a mayor
curtosis, menor variabilidad, esto es, a mayor apuntamiento, menor variabilidad.
14. En consecuencia, la curtosis es independiente del sesgo. Una distribución puede
ser completamente simétrica (con sesgo cero), pero alejarse de la curtosis normal,
o viceversa, puede tener curtosis normal y sesgarse hacia uno u otro lado. En
consecuencia, para describir la forma de una distribución deben calcularse ambas
medidas.
15. Existen diversas fórmulas para calcular la curtosis de una distribución. Aquí
veremos la que utiliza medidas de ubicación.:
FÓRMULA PARA CALCULAR LA CURTOSIS DE UNA DISTRIBUCIÓN

Sea
K  Curtosis.
Entonces
K = ((F0.7500–F0.2500)/2)/(F0.9000–F0.1000)
Debemos observar que la curtosis -como la define la fórmula- es el cociente que

resulta de dividir el RSIC (dividendo de la fórmula) entre el rango extremo (distancia
entre F0.9000 y F0.1000).
16. De este modo, conociendo tanto el sesgo como la curtosis de una distribución
empírica cualquiera, podemos conocer la medida en que se ajusta al modelo teórico
de la distribución normal.
17. Debe notarse que sesgo y curtosis, como ya se dijo, sólo miden el ajuste de la
distribución empírica al modelo normal en cuanto a simetría y apuntamiento. En este
sentido, son medidas descriptivas. Existen pruebas de bondad de ajuste que miden
la aproximación de dos distribuciones punto por punto de su techo, pero
nuevamente esto queda para un curso de estadística inferencial.

84
1. ¿Qué es una distribución empírica?
2. ¿Qué es una distribución teórica?
3. ¿Qué miden las medidas de forma?
4. ¿Cuáles son las medidas de forma?
5. ¿Qué mide el sesgo?
6. Explique los tres tipos de sesgo.
7. Explique la relación entre sesgo y tendencia central.
8. ¿Qué mide la curtosis?
9. Explique los tres tipos de curtosis.
10.¿Cuál es el valor de la curtosis en la distribución normal?
11.Sesgo y curtosis son medidas mutuamente dependientes. Discuta esta
afirmación.
12.Explique la relación entre curtosis y variabilidad en una distribución.

EJERCICIOS

a) Calcule e interprete el sesgo.
b) Calcule e interprete la curtosis.

a) Calcule e interprete el sesgo.
b) Calcule e interprete la curtosis.

a) Calcule e interprete el sesgo de ambas variables.
b) Compare ambos sesgos
c) Calcule e interprete la curtosis de ambas variables.
d) Compare ambas curtosis.

PARA APRENDER MÁS
1. Existen diversas formas de calcular la simetría de una distribución. Explique el
coeficiente de asimetría de Fisher.
2. Explique el coeficiente de Curtosis de Pearson.
85
3. Explique el coeficiente de asimetría de Bowley.

4. Escriba un ensayo explicando los signos del sesgo. Puede consultar a Mood
[1978].
5. Suponga que la distribución de CI de cierto grupo escolar presenta un notable
sesgo negativo. ¿Cómo interpretaría esta medida de forma?
6. Calculamos la curtosis con la fórmula k = ((F0.7500-F0.2500)/2)/(F0.9000-F0.1000)). Por
otra parte, hemos dicho que en la distribución normal el valor de la curtosis es
k = 0.2632. Demuéstrelo utilizando Excel. Adicionalmente, puede consultar a
Runyon [1985].
7. Suponga que la distribución de frecuencias de los puntajes de aprovechamiento
escolar en un grupo muestra ser notablemente leptocúrtica. ¿Cómo interpretaría
esta medida de forma?
8. Generalmente se mide la bondad de ajuste de una distribución empírica respecto
al modelo gaussiano, pero esta no es la única posibilidad; realmente podemos
probar qué tan bien se ajusta una distribución empírica a un modelo cualquiera
(uniforme, Poisson, etc.). Desarrolle un ejemplo de prueba de bondad de ajuste
para un modelo diferente al gaussiano. Puede encontrar información en Winkler
[1975].


86
LECCIÓN 11. MEDIDAS DE CORRELACIÓN

La ciencia no es, en efecto, un instrumento perfecto,
sino un instrumento inestimable y superior, que sólo
produce el mal cuando pretendemos convertirla en un
fin en sí mismo.
El Secreto de la Flor de Oro, Carl G. Jung
LA NOCIÓN DE CORRELACIÓN
1. Sabemos que variables y relaciones constituyen dos nociones fundamentales en
la ciencia7. Sabemos también que la relación entre variables puede ser de dos tipos:
relación de causa-efecto y correlación. En esta lección nos interesa el segundo tipo.
2. Decimos que existe correlación entre las variables X y Y cuando a un cambio en
el valor de X corresponde un cambio concomitante en el valor de Y. En otras
palabras, X y Y varían relacionadamente, esto es cuando una cambia, la otra cambia
también.
3. Desde aquí debemos observar que cuando correlacionamos una sola X con una
sola Y, estamos realizando un análisis de correlación simple. Pero una Y puede ser
predicha a partir de dos o más variables predictoras (X1, X2, ... Xn), en cuyo caso
estaríamos realizando un análisis de correlación múltiple.
4. En este curso nos limitaremos al caso de la correlación simple. Por ejemplo,
afirmamos que estatura y tamaño del pie son dos variables que están
correlacionadas, porque la estatura de una persona varía concomitantemente con
su tamaño de pie; estaturas altas se asocian con mayor tamaño de pie, y viceversa.
5. Para conceptualizar correctamente la correlación debe comprenderse que el
cambio en una variable no necesariamente es la causa del cambio en la otra.
Cuando estudiamos una correlación, lo único que podemos afirmar es que cuando
X presenta cierto valor, puede esperarse un valor determinado en Y. Si quisiéramos
ir más allá, siguiendo con nuestro ejemplo, resultaría absurdo preguntarse si la
estatura determina el tamaño del pie o el tamaño del pie determina la estatura. No
existe una relación de causa-efecto entre ambas variables.
6. Pero sí podemos utilizar la estatura de una persona para predecir qué tamaño
de pie tendrá, o viceversa. Esta es quizá la aplicación más importante de la
correlación: la predicción. Si cada valor de X nos permite calcular el valor esperado
de su Y asociada, entonces podemos utilizar las X para predecir los valores de las
Y.
7. En consecuencia, desde aquí debemos distinguir los papeles que juegan las dos
variables en una correlación:
7. Estas nociones deben haberse estudiado en un curso introductorio de metodología científica.

Puede consultarse a López [2002: Lección 3].
87
a) A X se le llama variable predictora, pues es la que se utiliza para predecir el

valor de Y.
b) A Y se le llama variable criterio y es la variable cuyo valor puede predecirse a
partir del valor de la X con la que está asociada.
En cualquier análisis de correlación, desde el principio debe quedar claro el papel
que juega cada una de las variables, pues cuando se confunden los papeles de X y
Y pueden cometerse errores al realizar predicciones.
8. Puesto que no existe una relación de causa-efecto entre las variables en una
correlación, sus papeles se asignan conforme a nuestra conveniencia. Dadas dos
variables cualesquiera, entre las que exista correlación, llamamos X a aquella que
queramos utilizar como predictora.
9. Muy relacionado con lo anterior, debemos evitar otra confusión conceptual: a
veces en el análisis de correlación a X se le llama variable independiente y a Y
variable dependiente, pero esto es un error. El término variable independiente
implica la noción de causa y el de variable dependiente la de efecto, y estos
conceptos, como ya dijimos, no son aplicables en el campo de la correlación.
10. Cuando a partir de cierta X se predice un valor en Y (al que llamaremos Yc) y se
compara con el valor que se observa empíricamente con su correspondiente dato
observado (al que llamaremos Yo), casi siempre se encuentra una diferencia. A esta
diferencia, obtenida por Yo–Yc, que constituye un error de predicción, se le conoce
como regresión.
LA MEDIDA DE LA CORRELACIÓN
11. La estadística nos permite medir el grado en que están correlacionadas dos
variables. A esta medida se le conoce como coeficiente de correlación y varía en
el siguiente rango:
EL RANGO DEL COEFICIENTE DE CORRELACIÓN

Sea
r  Coeficiente de correlación
Entonces
–1  r  1
Más adelante estudiaremos algunos métodos para calcular este coeficiente.

12. Por ahora nos interesa distinguir tres casos límite dentro del rango de valores
que puede asumir un coeficiente de correlación:
a) Cuando r = –1 tenemos una correlación negativa perfecta.
b) Cuando r = 0 tenemos una correlación nula perfecta; en otros términos, podemos
decir que hay una ausencia total de correlación entre X y Y.
c) Cuando r = 1 tenemos una correlación positiva perfecta.
Cualquier coeficiente de correlación se mueve entre estos límites.
88
13. Como suele suceder en matemáticas, los casos límite son teóricos.
Habitualmente estos valores extremos no se encuentran en casos empíricos en
ciencias de la conducta.
Las correlaciones perfectas solo suelen encontrarse en la teoría matemática. Por
ejemplo, sea un círculo plano de circunferencia c y radio r, entonces la
circunferencia está dada por c = 2r. Si calculamos r para n valores dados de c y
tabulamos los resultados, encontraremos que el coeficiente de correlación entre las
variables c y r será 1.00. En otras palabras, en un círculo plano la circunferencia y
el radio están correlacionados perfectamente. Observemos además que c y r,
indistintamente, pueden utilizarse como variable predictora o criterio; esto es, dada
la circunferencia podemos determinar el radio del círculo, y viceversa.
Pero esto no sucede en los casos empíricos en las ciencias del comportamiento.
Cuando estudiamos fenómenos conductuales es prácticamente imposible encontrar
dos variables que presenten una correlación perfecta, sea ésta positiva o negativa.
Lo mismo ocurre con la correlación cero, no se encuentra que dos variables
cualesquiera carezcan por completo de correlación. En la realidad encontramos
coeficientes de correlación con valores que se ubican dentro del rango ya definido.
En ciencias del comportamiento no hablamos de correlaciones de –1, 0 ó 1.
Generalmente hablamos de cierto grado de correlación que corresponde a valores
intermedios.
Por tanto, cuando disponemos de un coeficiente de correlación debemos probar su
significación; esto es, debemos demostrar matemáticamente si el valor de la
correlación es suficientemente grande para que aceptemos que X y Y están
correlacionadas. A este proceso se le conoce como prueba de hipótesis. La prueba
de hipótesis es un tema de estadística inferencial y no lo abordaremos aquí, pero
éste es su fundamento conceptual.
LA RECTA DE TENDENCIA
14. En un análisis de correlación simple y lineal, asumiendo que X es la variable
predictora, a partir de un valor observado de X puede calcularse el valor esperado
de la variable criterio, a este valor se le llama Y esperada y se le representa por Yc.
Calculando las Yc para diferentes X puede ubicarse una línea que se conoce como
recta de tendencia (o recta de predicción o recta de regresión). Esta línea
constituye el conjunto de los valores esperados para Y a partir de su X asociada.
La recta de tendencia es tal que minimiza las distancias a los puntos coordenados.
15. Si representamos la recta de tendencia en un plano coordenado, tomando
siempre a X como variable predictora, podemos observar que:
a) Cuando la correlación es negativa, la recta de tendencia describe un ángulo
menor a 90°, medido desde la izquierda respecto de la abscisa.
b) Cuando la correlación es positiva, la recta de tendencia describe un ángulo
mayor a 90°, medido desde la izquierda respecto de la abscisa.
c) Cuando la correlación es nula, la recta de tendencia es paralela con la abscisa.

89
16. Hasta aquí hemos asumido implícitamente que la línea de correlación es una
recta, pero realmente este es un caso especial. Cuando la correlación traza una
línea recta tenemos una correlación lineal; cuando la línea resultante no es recta
(sea curva o de cualquier otro tipo), decimos que es una correlación no lineal. En
este curso solo estudiaremos el caso de la correlación lineal.
EL SIGNO DE LA CORRELACIÓN
17. Siguiendo con la correlación lineal. Con estos conceptos, ya debe resultarnos
claro que el signo de un coeficiente de correlación debe interpretarse como sigue:
a) Un coeficiente de correlación negativo significa que cuando X aumenta, Y
disminuye y cuando X disminuye, Y aumenta. Esto es, entre ambas variables
existe una correlación inversa.
b) Un coeficiente de correlación positivo significa que cuando X aumenta, Y
aumenta y cuando X disminuye, Y también lo hace. La correlación es directa.
c) Un coeficiente de correlación cero significa que cuando X aumenta o disminuye,
en cualquier proporción, Y no cambia su valor. En otros términos, podríamos
decir que la correlación no existe, es nula8.
LOS SIGNOS DE LA CORRELACIÓN
Y Y Y
X X X
r<0 r=0 r>0
Correlación Correlación Correlación
negativa nula positiva
Obsérvese que en una correlación negativa perfecta el ángulo medido desde la

izquierda será de 45°; si es positiva será de 135°.
EL DISPERSIGRAMA
18. Una distribución bivariable con n parejas de datos (X,Y) puede representarse en
un plano coordenado y obtener una gráfica a la que se le llama dispersigrama (o
gráfico de dispersión). Cada cruce de coordenadas en el espacio cartesiano
representa una pareja de datos (X,Y) y al conjunto de puntos cartesianos se le
conoce como nube de puntos.
8. En cursos de estadística inferencial habrá que relacionar estos conceptos con los de hipótesis
nula e hipótesis alternativa.
90
EL DISPERSIGRAMA
Y
+
+++++
+
++++++
++
++ +++
+
+ X
19. Cuando comprendemos el concepto de correlación, podemos realizar un análisis

cualitativo de la forma que asume el dispersigrama para deducir su naturaleza (lineal
o curva), el signo del coeficiente (positivo o negativo) y, aproximadamente, su
magnitud. ¿A qué tipo de correlación corresponderá el ejemplo anterior?
CORRELACIÓN Y NIVEL DE MEDICIÓN
20. Sabemos que el nivel en que se midieron las variables determina las
operaciones que pueden realizarse con ellas y, desde luego, el análisis de
correlación no es la excepción a esta regla.
21. Para seleccionar un método de análisis de correlación debe aplicarse una regla
básica: cuando X se midió en un nivel y Y en otro diferente, el método aplicable
depende del nivel más bajo que se utilizó.
Por ejemplo si una variable la medimos a nivel de intervalar y la otra a nivel ordinal,
deberá aplicarse un método que acepte variables medidas a nivel ordinal, que es el
más bajo en este ejemplo.
22. Existen muchos métodos para calcular el grado en que se correlacionan dos
variables, tantos como condiciones específicas se puedan presentar en cada caso
real. En este curso sólo revisaremos tres métodos para calcular el coeficiente de
correlación simple (cuando se involucran dos variables) y lineal (cuando la
correlación es una línea recta).
CORRELACIÓN Y NIVEL DE MEDICIÓN
Coeficiente Símbolo Nivel de medición

Contingencia rc Nominal
Spearman rs Ordinal
Pearson rp Intervalar
De razón
23. Por otra parte, podemos ordenar los tres métodos conforme a su capacidad para
detectar la correlación entre dos variables9:
9. En realidad la “capacidad para detectar la correlación” que tiene un método se evalúa por su
potencia pero, nuevamente, este concepto deberá estudiarse en un curso de estadística inferencial.
91
Pearson > Spearman > Contingencia

y siempre deberá elegirse en este orden el método, en función del nivel en que se
hayan medido las variables X y Y.
24. Por último, antes de pasar a estudiar estos métodos para analizar la correlación,
debemos considerar que existen modalidades de los algoritmos que veremos,
dependiendo de las características específicas de la masa de datos con la que
vayamos a trabajar.
Además, aquí sólo veremos los casos más simples. En un curso de estadística
inferencial deberán estudiarse con mayor detalle los métodos para analizar la
correlación y probar su significación.
EL COEFICIENTE DE CONTINGENCIA
25. Este es el método de correlación más elemental. Acepta que una o las dos
variables hayan sido medidas a nivel nominal.
26. Debemos ser muy cuidadosos al interpretar un coeficiente de contingencia: es
tan rudimentario que ni siquiera tiene signo. No puede tener signo porque una
variable medida a nivel nominal no tiene sentido cuantitativo y, en consecuencia, no
puede ordenarse de menor a mayor.
Por tanto, el coeficiente de contingencia es una medida de asociación simple, sólo
nos indica el grado en que se asocian X y Y.
27. Más aún, nunca puede esperarse que este coeficiente alcance el valor de uno;
Kendall y McNemar [citados en Siegel, 1979] demuestran que en la práctica el valor
límite del coeficiente de contingencia es 0.8160.
28. Por tanto, el coeficiente de contingencia debe utilizarse únicamente cuando no
tenemos la posibilidad de medir a un nivel superior al nominal.
29. No importa el nivel en que se hayan medido X y Y, para calcular el coeficiente
de contingencia ambas variables deben categorizarse. Por ejemplo, cuando una
variable es continua, puede transformarse en discreta mediante una escala
intervalar; entonces cada intervalo se tratará como una categoría.
30. El algoritmo que veremos aquí para calcular el coeficiente de contingencia no es
aplicable directamente cuando:
a) Existen huecos en la distribución; esto es, una o más celdas de la tabla de
contingencia tiene frecuencia cero; o
b) Más del 20% de las celdas tiene una frecuencia esperada menor a 5. Nótese que
cuando tenemos una tabla de 22, con una sola frecuencia esperada menor que
5 (lo que representaría 25% de las celdas) se invalida el uso de este coeficiente.
Sin embargo, cuando se presenta una de estas condiciones, o incluso las dos, en
algunas ocasiones es posible que fusionando categorías pueda eliminarse la
restricción.
31. Para calcular el coeficiente de contingencia se aplica el siguiente algoritmo:

92
Sea
rc  Coeficiente de contingencia
fo  Frecuencia observada.
fe  Frecuencia esperada.
2  Chi-cuadrada.
ALGORITMO PARA CALCULAR EL COEFICIENTE DE CONTINGENCIA
COMIENZA
PASO 1. Definir para las variables X y Y su nivel de medición y categorías. En caso

de que una de las variables esté medida a nivel superior al nominal, deberá
categorizarse.
PASO 2. Construir la tabla de cálculo:
Categorías X
X1 ... Xj Sumas
fo ... fo Σfo(Y1)
Y1 fe ... fe
Categorías Y
2C ... 2C

... ... ... ... ...
fo ... fo Σfo(Yk)
Yk fe ... fe
2C ... 2C
Sumas Σfo(X1) ... Σfo(Xj) N
Donde, para cada celda (Xi,Yj):
fo: frecuencia observada, obtenida al tabular la masa de datos
fe = [Σfo(Xi)×Σfo(Yj)]/N, es decir, la frecuencia esperada se obtiene
multiplicando los totales marginales y dividiendo el producto entre N
 C = (fo-fe)2/fe es el valor Chi-cuadrada de cada celda
2
PASO 3. Calcular Chi cuadrada total: 2T = Σ(fo–fe)2/fe

PASO 4. Calcular el coeficiente de contingencia: rC = (2T/(N+2T))
TERMINA
EL COEFICIENTE DE SPEARMAN
32. Podemos aplicar este método cuando disponemos de variables medidas a nivel
ordinal o transformadas a él.
33. A diferencia del coeficiente de contingencia, el de Spearman ya tiene signo y
puede producir valores en todo el rango.
34. Para calcular el coeficiente de Spearman se aplica el siguiente algoritmo:

93
ALGORITMO PARA CALCULAR EL COEFICIENTE DE SPEARMAN

Sea
rS  Coeficiente de correlación de Spearman.
COMIENZA
PASO 1. Definir para X y Y su nivel de medición.

PASO 2. Construir la siguiente tabla de cálculo:
Sujeto X Y R(X) R(Y) d d2
1 X1 Y1
... ... ...
N XN YN
d2 =
Donde:
X y Y son los puntajes de cada sujeto.
R(X) es el ordinal de cada X; se obtiene asignando 1 al menor y N al mayor.
Cuando una o más X se repiten, se promedian los rangos que le tocarían a
cada una.
R(Y) es el ordinal de cada Y; se obtiene igual que en R(X).
d = R(X) – R(Y)
PASO 3. rS = 1–((6d2)/(N3–N))
TERMINA
EL COEFICIENTE DE PEARSON
35. Este método puede aplicarse cuando las dos variables fueron medidas a nivel
intervalar o superior. Es la medida de correlación más potente y permite la
predicción de cualquier valor de Y a partir de su X asociada.
36. Para calcular el coeficiente de Pearson se aplica el siguiente algoritmo:

94
ALGORITMO PARA CALCULAR EL COEFICIENTE DE PEARSON

Sea
rP  Coeficiente de correlación de Pearson.
COMIENZA
PASO 1. Definir para X y Y su nivel de medición.

PASO 2. Calcular:
Sujeto X Y XY X2 Y2
1 X1 Y1
... ... ...
N XN YN
X Y XY X2 Y2
PASO 3. rP = ((NXY)–(XY))/(((NX2)–(X)2)((NY2)–(Y)2))
TERMINA
37. Ahora, para predecir valores de Y en función de X, se aplica el siguiente

algoritmo:
ALGORITMO PARA PREDECIR Y EN FUNCIÓN DE X EN EL MÉTODO DE PEARSON

Sea
a  Parámetro de intersección, intercepto de la recta de regresión.
b  Parámetro de pendiente de la recta.
Yc(X)  Valor esperado de Y para la X asociada.
COMIENZA
PASO 1. b = ((NXY)–(XY ))/((NX2)–(X)2)

PASO 2. a = (Y–(bX))/N
PASO 3. Yc(X) = a+(bX)
TERMINA
38. Para representar gráficamente la masa de datos y la recta de tendencia se aplica

el siguiente algoritmo:
ALGORITMO PARA CONSTRUIR UN DISPERSIGRAMA Y UBICAR LA RECTA DE TENDENCIA

COMIENZA
PASO 1. Trazar un plano coordenado en el cual X represente a la variable

predictora y Y a la variable criterio.
PASO 2. Graduar los dos ejes con el rango de valores de cada variable.

95
PASO 3. Ubicar los puntos coordenados para cada pareja de datos.

PASO 4. Calcular Yc(XMIN) y Yc(XMAX).
PASO 5. Ubicar a Yc(XMIN) y Yc(XMAX) en el plano coordenado y unir ambos puntos
con una línea recta; ésta es la recta de tendencia.
TERMINA
39. Para terminar, regresemos a un concepto que será de gran utilidad para futuros
cursos. Dado un valor cualquiera en Y, se llama regresión a la distancia que separa
a su valor observado (Yo) de su valor predicho (Yc), tal que:
Regresión = Yo–Yc
Es claro que el signo de la regresión indica si queda sobre (+) o bajo (–) la recta de
tendencia. Su interpretación diagnóstica depende de cada caso.

1. ¿Qué es una correlación?
2. Distinga entre correlación simple y correlación múltiple.
3. En una correlación, los cambios en Y son causados por los cambios en X.
Discuta esta proposición
4. Explique la predicción como aplicación de la correlación.
5. ¿Cómo se llama a X en un análisis de correlación?
6. ¿Cómo se llama a Y en un análisis de correlación?
7. En un análisis de correlación, el carácter de predictor o criterio se asigna
arbitrariamente. Discuta esta proposición.
8. En un análisis de correlación, a X puede llamársele variable independiente y a Y
variable dependiente. Discuta esta proposición.
9. Distinga entre correlación lineal y correlación no lineal.
10.¿Qué es un coeficiente de correlación?
11.Explique el rango de un coeficiente de correlación.
12.Explique los tres valores límite que puede asumir un coeficiente de correlación.
13.Explique el ángulo que describe la recta de tendencia respecto a la abscisa en
un plano coordenado.
14.En estudios empíricos del comportamiento es frecuente encontrar coeficientes
de correlación con valores límite (-1, 0, ó 1). Discuta esta proposición.
15.Explique el signo de un coeficiente de correlación.
16.Explique la relación entre el nivel en que se midieron las variables y el método
de correlación.
96
17.Cuando X se midió en un nivel y Y en otro diferente, ¿Cuál debe determinar el

método aplicable para el análisis de correlación?
18.¿Cuándo se aplica el coeficiente de contingencia?
19.El coeficiente de contingencia no tiene signo. Discuta esta proposición.
20.El coeficiente de contingencia nunca alcanza el valor de uno. Discuta esta
proposición.
21.El coeficiente de contingencia puede aplicarse cuando una variable es continua.
22.¿Cuáles son las restricciones para aplicar el coeficiente de contingencia?
23.¿Cuándo se aplica el coeficiente de Spearman?
24.¿El coeficiente de Spearman produce valores signados?
25.¿Cuál es el rango de valores del coeficiente de Spearman?
26.¿Cuándo se aplica el coeficiente de Pearson?
27.¿Qué es un dispersigrama?
28.¿Qué es una nube de puntos?
29.¿Qué es una recta de tendencia?
30.¿Qué es la regresión?
31.¿Qué indica el signo de la regresión?

EJERCICIOS
11.1. Para medir el grado en que el estado civil está asociado con el sector en que
trabajan las mujeres, en cierta comunidad se tomó una muestra y se obtuvieron los
siguientes datos:
Sector en que trabaja la mujer
Público Privado Práctica privada
Soltero 25 12 18
Estado Unión libre 28 9 15
civil Casado 8 13 16
Divorciado 29 8 10
a) Calcule el coeficiente de contingencia.
b) Interprete el coeficiente obtenido.
c) Justifique el uso de este método de correlación.
11.2. En una empresa se midió autoritarismo del supervisor (en escala de 1 a 3) y

accidentes laborales y se obtuvieron los siguientes datos:

97
Supervisor Nivel de autoritarismo Accidentes laborales

1 2 4
2 3 2
3 1 3
4 1 4
5 3 1
6 2 2
7 1 5
8 3 1
9 3 2
a) Calcule el coeficiente de Spearman.
11.3. Con los datos del ejercicio 4.5, defina al examen de admisión como variable
predictora y al promedio general de carrera como variable criterio y:
a) Calcule el coeficiente de Pearson.
b) Construya el dispersigrama.
c) Ubique la recta de tendencia.
d) José es el sujeto número 33 de la masa de datos, obtuvo los puntajes (48, 94).
Calcule el valor esperado (predicción) que debería haber obtenido como
promedio general de carrera, calcule su regresión e interprete el resultado.
11.4. Para evaluar la validez predictiva de un test de inteligencia emocional sobre el

desempeño en el puesto en mediadores judiciales se definió:
X ≡ Puntaje de inteligencia emocional
Y ≡ Puntaje de desempeño en el puesto.
Se midieron las variables y se obtuvieron los siguientes datos:
Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X 114 102 118 125 109 101 117 119 115 122 117 121 109 116 117
Y 88 76 92 86 77 72 80 88 73 86 75 86 76 79 83
d) María es el sujeto número 5 de la masa de datos. Calcule su regresión e
interprete el resultado.

PARA APRENDER MÁS
1. Dijimos que en un círculo plano la circunferencia y el radio están correlacionados
98
perfectamente. Pruebe esta afirmación definiendo como predictora a cualquiera

de las dos variables, asignando10 valores aleatorios a X, calculando los
correspondientes valores de Y y calculando el coeficiente de Pearson. Explique
por qué elegimos este coeficiente en particular.
2. Explique la regresión (o error de predicción) utilizando como analogía a la
desviación media.
3. Estudie un coeficiente de correlación no visto en la lección y explique sus
condiciones de aplicación y forma de cálculo. Puede consultar a Siegel [1979],
Yamane [1975] y Calvo [1980].
4. Explique un coeficiente de correlación no lineal. Puede consultar a Yamane
[1975] y Calvo [1980].
5. Explique un coeficiente de correlación múltiple. Puede consultar a Yamane
[1975] y Calvo [1980].


99
EPÍLOGO
El concepto de ciencia en la actualidad hace referencia a una rama del conocimiento
que tiene como objeto de estudio a los entes empíricos, cuya existencia se prueba
por percepción sensorial. Sin embargo, para salvar algunas disputas
epistemológicas, al conocimiento científico a veces se le llama conocimiento fáctico
porque es un conocimiento de hechos, a diferencia del conocimiento metafísico.
Para crear conocimiento científico se aplica un método que, en esencia, se compone
de cuatro pasos: 1) Formular hipótesis; 2) obtener evidencia empírica en forma de
datos, aplicando la teoría de la medición; 3) someter los datos a un procesamiento
y análisis del que se obtengan consecuencias que apunten a la veracidad o falsedad
de la hipótesis, y; 4) concluir.
Debemos hacer varias observaciones para comprender la importancia de la
estadística en las ciencias del comportamiento. Una característica fundamental del
tercer paso del método científico consiste en que el procesamiento de datos siempre
es de carácter matemático; no existe ciencia alguna que pueda prescindir de la
matemática. Respecto al cuarto paso, es importante comprender que en el caso de
las ciencias del comportamiento las conclusiones siempre implican un cierto grado
de incertidumbre, nunca son deterministas. Por otra parte, el conocimiento científico
postula verdades que siempre serán provisionales y serán sometidas a revisión
continua, de manera que evolucionan continuamente; en la ciencia no existen las
verdades eternas.
Entonces, no puede estudiarse científicamente el comportamiento sin matemáticas.
A diferencia de la ciencia (fáctica, si se desea agregar), la matemática es una
disciplina formal que se ocupa del estudio de entes abstractos (cantidades,
relaciones, formas), los cuales no necesariamente existen en el mundo empírico, en
el mundo que podemos percibir. El método que se aplica en matemáticas es muy
diferente al método científico. La matemática parte de proposiciones cuya verdad
tiene que ser demostrada mediante razonamiento lógico (no mediante observación
empírica). Cuando una proposición matemática se demuestra verdadera, se tiene
un teorema. A diferencia de las científicas, las verdades matemáticas son absolutas
y atemporales, en términos estrictos, son eternas. El Teorema de Pitágoras no
acepta discusión alguna y no es perecedero, será verdadero por siempre, aun
cuando ya no existan hombres.
Ahora centremos la atención en las ciencias de la conducta. Lo primero que debe
observarse es que todo conocimiento científico sobre la conducta de los organismos
vivos tiene un carácter probabilista, no se conoce ninguna ley científica del
comportamiento de los organismos vivos que sea determinista. Además, la
conducta individual no puede interpretarse sin recurrir a la población a la que
pertenece; solo comparando la conducta del sujeto con su grupo es posible hacer
interpretaciones y, eventualmente, construir leyes científicas. Esto implica que las
ramas de la matemática aplicables al estudio científico de la conducta son dos, la
teoría de la probabilidad, que es parte de la matemática pura y se encarga del

100
análisis matemático del azar y la estadística, que ya es matemática aplicada y se

encarga del estudio de grupos de datos.
Comenzamos el estudio de la estadística con una revisión somera de su desarrollo
histórico. Vimos que se remonta hasta los orígenes mismos de la humanidad,
cuando apareció la necesidad que los grupos recolectores y cazadores tenían de
contar (primera operación estrictamente matemática). Con el desarrollo de las
ciudades se requirieron recuentos y registros más complejos, hasta llegar a
verdaderos sistemas estadísticos (aunque aún no existía la disciplina propiamente
dicha) como los censos y los sistemas tributarios de Roma. En la Grecia clásica se
formalizan las matemáticas y, después de un receso de mil años en la Edad Media
europea, con el Renacimiento resurge el interés en la matemática y en unos pocos
siglos se esta disciplina se transforma completamente. Surge, por primera vez en la
historia, el estudio matemático del azar dando origen a la teoría de la probabilidad.
La estadística, a su vez, se transforma en una rama de la matemática y a finales del
siglo XIX se formaliza la rama inferencial, que habrá de experimentar un desarrollo
acelerado en el siglo XX. En importante observar que el surgimiento de las ciencias
de la conducta sigue al desarrollo de estas ramas de la matemática.
En la segunda lección revisamos nociones básicas, comenzando por la estructura
conceptual de la probabilidad y de la estadística como ramas de las matemáticas y
ubicando dentro de la estadística a la rama descriptiva, materia de este curso. Vimos
que el insumo del procesamiento estadístico descriptivo es la masa de datos.
Careciendo de este marco histórico y conceptual, el estudio de la estadística (como
el de cualquier otra rama de la matemática) suele reducirse a presentar y aplicar
fórmulas y procedimientos sin una gestalt capaz de estructurarlos y darles
significado. Este es un factor de primera importancia para entender el fracaso en la
enseñanza de las matemáticas.
Existen tres procesos básicos para describir el grupo de datos: la organización de
datos, la representación gráfica y las medidas estadísticas.
A veces se plantea que la estadística incluye la recolección de datos, pero en este
curso rechazamos tal idea. La recolección de datos es objeto de estudio de la
metodología de investigación, que se encarga de la selección de variables, de su
definición operacional y de su medición. El producto inicial de cualquier
investigación es una masa de datos, que constituye la materia prima, el input del
procesamiento estadístico. La diferencia conceptual no es trivial, asegurar que los
datos que se someterán a procesamiento estadístico sean válidos y confiables es
objeto de la metodología. Cuando la masa de datos es válida y confiable, y se aplica
un procesamiento estadístico correcto, se obtendrán conclusiones válidas y
confiables. En el caso contrario, cuando la masa de dato no es válida y confiable,
no importa el procesamiento estadístico que se aplique, las conclusiones serán
espurias. Esta es una ley en la investigación científica: Basura entra, basura sale.
Entonces, partiendo de una masa de datos, tal como se obtuvieron, sin ningún orden
ni procesamiento, el primer paso es describir sus características. La primera medida
del grupo de datos es su tamaño, el número de elementos, el cual determina si
tenemos una masa de datos grande o pequeña, lo cual resultará fundamental
101
cuando se entre al estudio de la inferencia estadística. En segundo lugar, debemos

determinar si los datos son de carácter cuantitativo (se trabaja con números) o
cualitativo (se tienen nominadores). Cuando son datos cuantitativos, debe
identificarse el menor y el mayor, con lo cual se establecen los límites de variabilidad
de la masa de datos; cuando son cualitativos, deben identificarse las categorías en
que se midió la variable; esto determina las operaciones que podrán realizarse
sobre los datos. Así inicia la descripción estadística.
Después viene la organización, lo que puede hacerse bajo dos condiciones.
Primera, cuando la variable se midió en el nivel nominal, aplica la clasificación; se
enlistan las categorías en las que se midió la variable y se determina la frecuencia
de cada categoría. En la segunda condición se trabaja con medidas de nivel ordinal
o superior y entonces los datos pueden organizarse mediante ordenaciones o bien
mediante distribuciones de frecuencias puntuales o intervalares (que, en este caso,
implican orden). Con la organización comenzamos a ver con mayor claridad la forma
en la que se distribuyen los datos, principalmente en términos de frecuencias.
La representación gráfica permite apreciar, en forma de imágenes, las
características del grupo de datos. Vimos que la construcción de gráficas no debería
ser un proceso artístico, sino técnico, orientado a evitar trampas que permitan
manipular la percepción y hacer que el destinatario vea lo que conviene que vea y
no que vea una imagen objetiva de los datos. En consecuencia, debe seleccionarse
la gráfica adecuada al tipo de datos que se representan. Toda gráfica estadística
debe construirse con criterios que impidan la distorsión (intencionada o no) y debe
proporcionarse la información necesaria para que se pueda juzgar la validez y
confiabilidad de los datos.
Pero el análisis numérico de los datos siempre es más objetivo y potente que el
análisis gráfico. A partir de aquí se entra al análisis numérico del grupo de datos
mediante medidas estadísticas, también llamadas parámetros. Si un dato es una
medida de una variable, un parámetro es una medida de un grupo de datos, Vimos
seis tipos de medidas estadísticas.
Las medidas de proporción, que son especialmente adecuadas a datos nominales
(aunque pueden aplicarse en cualquier nivel de medición), simplemente identifican
particiones del grupo de datos y miden el tamaño proporcional de cada partición,
presentándolo comúnmente en forma de porcentajes, de cada partición. Estas
medidas, tan elementales como son, resultan fundamentales en estudios de
encuesta, por solo poner un ejemplo.
Las medidas de ubicación se obtienen a partir de proporciones. Sin embargo, las
medias de ubicación son particularmente útiles cuando se trabaja con niveles de
medición superiores al nominal. Los fractiles permiten, dada una proporción del
grupo, encontrar el puntaje que la limita por la izquierda. Su inverso, el rango
percentilar, dado un puntaje cualquiera calcula la proporción del grupo que obtuvo
puntajes menores o iguales a él. Las medidas de ubicación constituyen una de las
bases del concepto de normalidad y son, en consecuencia, esenciales para
diagnosticar a un sujeto en función de un grupo de referencia.

102
Las medidas de tendencia central se llaman así porque, principalmente con datos
conductuales, todas tienden a localizarse en el centro de la distribución. La medida
de tendencia central más elemental es el modo, que indica cuál es el puntaje más
frecuente de la distribución; es una medida tan inestable, que en una distribución
puede encontrarse más de un modo. La mediana es el puntaje que limita a la mitad
de la distribución, en términos de frecuencias; es claro que la mediana es una
medida de tendencia central, pero también es una medida de ubicación, que
corresponde al fractil 0.5000. Modo y mediana pueden calcularse con datos
nominales, pues ambos solo implican contar frecuencias. La media ya requiere
datos cuantitativos, de nivel ordinal o superior. La media es el punto de equilibrio (o
centro de masa) de una distribución, lo que implica que, en cualquier distribución,
los datos menores a la media (la suma de desviaciones medias negativas) pesan lo
mismo que los datos mayores (desviaciones medias positivas). La media es la
medida de tendencia central más confiable. Pueden definirse varios tipos de media,
en este curso solo vimos la media aritmética (que es la más usual, tanto que llega
a creerse que es la única) y la media ponderada.
El complemento de las medidas de tendencia central son las medidas de
variabilidad, que miden el grado en que se dispersan los datos de una distribución.
Las medidas de variabilidad ya requieren de datos cuantitativos, de nivel ordinal o
superior. El rango mide la distancia completa (considerando los límites exactos)
entre el puntaje mayor y el menor. El rango semintercuartilar mide la mitad de la
distancia entre los dos cuartiles centrales; a partir de él se mide cuánto se aleja la
distribución que estudiamos del modelo normal, concepto esencial para probar
normalidad, un constructo básico en ciencias del comportamiento. La desviación
media indica cuánto se aleja un dato individual de la media, lo que permite
posicionar con precisión a un individuo respecto a su grupo; cuando la desviación
media es positiva, el individuo se encuentra en el grupos superior, cuando es
negativa está en el grupo inferior. La desviación estándar es la medida de
variabilidad más confiable y se obtiene promediando los valores absolutos de las
desviaciones medias. Finalmente, la varianza no es más que el cuadrado de la
desviación estándar.
Con las medidas de forma introducimos el concepto de los modelos distribución,
también llamados modelos teóricos, en este curso centramos la atención en el
modelo normal. El sesgo mide cuánto se aleja nuestro grupo de datos del modelo
normal; cuando el sesgo es positivo, indica que en el grupo de datos prevalecen los
sujetos bajo la media, cuando es positivo prevalecen los sujetos altos; esto es, el
sesgo permite conocer la prevalencia en el grupo de sujetos altos o bajos respecto
a la media. Para evaluar la forma de un grupo de datos, el complemento del sesgo
es la curtosis, que mide cuánto se aleja, en términos de variabilidad, la distribución
que estudiamos del modelo normal; cuando la curtosis es mayor que la normal
(leptocúrtica) indica que la distribución empírica varía menos que la normal, cuando
es menor (planocúrtica) la distribución que estudiamos tiene mayor variabilidad que
la normal. Desde luego, las medias de forma pueden aplicarse a modelos distintos
al normal, pero ese tema ya excede los límites de este curso.

103
Hasta aquí vimos medidas que involucran una sola variable. Terminamos el curso
estudiando la correlación simple y lineal, que mide el grado en que dos variables
están asociadas. Existen varios métodos para medir la correlación entre dos
variables, pero aquí solo vimos los tres casos más usuales: el coeficiente de
contingencia aplicable a variables medidas a nivel nominal, el coeficiente de
Spearman para medidas ordinales y el coeficiente de Pearson para medidas
intervalares o superiores.

La estadística descriptiva es la forma más simple de análisis de los datos, pero
constituye la base misma sobre la que se construye la teoría de la probabilidad, así
como la inferencia y la proyección estadística. Tal es su importancia.


104
NOTACIÓN
+ Suma  Asignar el término de la derecha
− Resta i Tamaño del intervalo
 Multiplicación IMIN Dato menor del intervalo

/ División IMAX Dato mayor del intervalo
 Raíz cuadrada p Proporción
 Significa, denota, representa % Porcentaje
 Implica, por tanto FP Fractil que limita a la proporción P

= Igual a Li Límite inferior exacto del intervalo
 Aproximadamente Ls Límite superior exacto del intervalo
 Menor que RP Rango percentilar
 Menor o igual que  Media aritmética
 Mayor que MP Media ponderada
 Mayor o igual que Md Mediana

X Dato, una medida de la variable X Mo Modo
XI Dato i-ésimo R Rango
XMAX Dato mayor de la masa de datos RSIC Rango semiintercuartilar
XMIN Dato menor de la masa de datos DM(X) Desviación media del puntaje X
N Número total de datos del grupo  Desviación Estándar
R Rango 2 Varianza
TAB Tabulación, recuento So Sesgo
f Frecuencia con que aparece un dato K Curtosis
f(X,Y) Frecuencia de la pareja (X,Y) r Coeficiente de correlación
PM Punto medio de un intervalo
Σ Sumar todos los datos


105
BIBLIOGRAFÍA
Anastasi, A.: “TESTS PSICOLOGICOS”. Ed. Aguilar, España, 1973. (680 pp)
Texto clásico sobre psicometría, indispensable para quienes quieran internarse en los problemas
de evaluación y construcción de instrumentos, más allá de su mero procedimiento de aplicación.
Ayres, F.: “ALGEBRA MODERNA”. Ed. McGraw-Hill, México, 1979. (242 pp.)
Como todos los textos de la serie Schaum, éste presenta un mínimo de explicación conceptual y
pone el énfasis en los ejercicios. Muy útil para practicar el proceso matemático.
Barnett, R.: “ALGEBRA ELEMENTAL MODERNA”. Ed. McGraw-Hill, México, 1978.

(392 pp.)
Otro texto de la Serie Schaum, básico para entender y manipular fórmulas matemáticas.
Budnick, F.: “MATEMATICA APLICADAS PARA ADMINISTRACION, ECONOMIA

Y CIENCIAS SOCIALES”. Ed. McGraw-Hill, México, 1992. (948 pp. más anexos)
Extenso estudio de la aplicación a la estadística a las ciencias del comportamiento. Adopta un
enfoque rigurosamente cuantitativo y lo vincula con la computación.
Calvo, F. y Sarramona, J.: “INVESTIGACION Y ESTADISTICA APLICADA A LA

EDUCACION”. Ed. CEAC, España, 1980. (249 pp.)
Aunque sus ejemplos estadísticos pueden resultar engañosamente simples, presenta ideas que
no exigen mucha formación matemática.
Daniel, W.: “ESTADISTICA CON APLICACIONES A LAS CIENCIAS SOCIALES Y

A LA EDUCACION”. Ed. McGraw-Hill, México, 1982. (504 pp)
Texto útil para acercarse a la estadística en el nivel licenciatura. Enfatiza las explicaciones
conceptuales.
Garret, H.: “ESTADISTICA EN PSICOLOGIA Y EDUCACION”. Ed. Paidós,

Argentina, 1974, (509 pp)
Este texto presenta algunas deficiencias matemáticas, pero se recomienda por contener
excelentes explicaciones conceptuales sobre algunos complejos temas de estadística aplicada a la
psicología.
Johnson, R.: “ESTADISTICA ELEMENTAL”. Ed. Trillas, México, 1979. (515 pp.)
Como su nombre lo indica, es un texto elemental, pero muy útil para introducirse al estudio de la
estadística a partir de conocimientos básicos de matemáticas.
Kerlinger, F. N.: “INVESTIGACION DEL COMPORTAMIENTO: Técnicas y

Metodología”. Ed. Interamericana, México, 1982. (525 pp.)
Es una obra clásica y un compendio indispensable para el estudio de la metodología en ciencias
de la conducta. También estudia técnicas estadísticas y propone ejemplos de gran interés.
Lipschultz, S.: “PROBABILIDAD”. Ed. McGraw-Hill, Serie Schaum, México, 1979.

(151 pp.)
Como todos los textos de la serie Schaum, este texto presenta un mínimo de explicación
conceptual y pone el énfasis en los ejercicios. Muy útil para practicar el proceso matemático.
Lipschultz, S.: “TEORIA DE CONJUNTOS Y TEMAS AFINES”. Ed. McGraw-Hill,

Serie Schaum, México, 1980. (231 pp.)
106
Otro texto de ejercicios de la Serie Schaum.
López-Suárez, A.: “EL METODO EN CIENCIAS DEL COMPORTAMIENTO”.

Inédito, México, 2001. (75 pp.)
Crestomatía elaborada para un curso introductorio a la metodología.
Lovaglia, F. et al.: “ALGEBRA”. Ed. Harla, México, 1980. (395 pp.)

Texto matemático que puede resultar una fuente de consulta muy útil para los psicólogos en
temas específicos.
Pagels, H.: “LOS SUEÑOS DE LA RAZON: El ordenador y los nuevos horizontes

de las ciencias de la complejidad”. Ed. Gedisa, España, 1991. (343 pp).
Crónica clara y profunda que linda con la filosofía de la ciencia, aunque su propósito declarado
consiste en analizar la computadora, la inteligencia artificial y sus posibilidades de desarrollo.
Phillips, J.: “LA LOGICA DEL PENSAMIENTO ESTADISTICO: Un enfoque

estructural”. Ed. El Manual Moderno, México, 1979. (126 pp).
En poco más de cien páginas de pequeño formato, este excelente texto pone todo su énfasis en
los conceptos, más allá de fórmulas y procedimientos matemáticos, que con frecuencia producen
resultados incomprensibles para el estudiante. Indispensable para profundizar en la estadística.
Rich, B.: “ALGEBRA ELEMENTAL MODERNA”. Ed. McGraw-Hill, Serie Schaum,

México, 1978. (392 pp.)
Runyon, R. y Habel, A.: “ESTADISTICA PARA LAS CIENCIAS SOCIALES”. Ed.

Fondo Educativo interamericano, México, 1984. (467 pp)
Enfocado a las ciencias del comportamiento, este texto, además del procedimiento de solución,
aborda la interpretación de resultados.
Sagan, C.: “MILES DE MILLONES: Reflexiones sobre la vida y el universo”. Ed.

Punto de Lectura, España, 2002. (452 pp.)
Texto de divulgación científica muy útil para comprender la naturaleza de la ciencia actual, en
particular su carácter matemático, y su capacidad para acercarnos a los misterios de la vida y del
universo.
Siegel, S.: “ESTADISTICA NO PARAMETRICA: Aplicada a las ciencias de la

conducta”. Ed. Trillas, México, 1979. (346 pp.)
Texto fundamental para el estudio de la estadística inferencial no paramétrica.
Spengler, O.: "LA DECADENCIA DE OCCIDENTE". Espasa-Calpe, Madrid.

Escrita en 1918, es una obra de historia y filosofía que, a un siglo de distancia, invita a la reflexión
sobre nuestra situación actual. En todo caso, para este curso es importante porque muestra el poder
del número (y de la estadística en particular) para comprender fenómenos que de otra forma se
antojan imposibles de pronosticar.
Spiegel, M.: “ESTADISTICA”. Ed. McGraw-Hill, Serie Schaum, México, 1975. (357
pp.)
Winkler, R. & Hays, W.: “STATISTICS: Probability, inference and decision”. Ed. Holt,
Rinehart and Winston, USA, 1975. (889 pp. más índices)
107
Excelente para profundizar en la comprensión de la estadística. Pone una gran atención en la

explicación conceptual y la vincula con la teoría matemática.
Yamane, T.: “ESTADISTICA”. Ed. Harla, México, 1975. (573 pp.)

Texto indispensable para estudiar estadística, aunque muy orientado a la matemática.

108
RESPUESTAS A LOS EJERCICIOS

EJERCICIO 3.1
En 1997 el Departamento de Personal de la Fábrica El Águila midió el estado civil de sus empleados.
Utilizando el conjunto numeral:
1  Soltero
2  Casado
3  Divorciado
4  Unión libre
2, 4, 1, 3, 1, 2, 1, 1, 2, 1,
1, 1, 2, 1, 1, 2, 1, 1, 4, 1,
2, 1, 1, 1, 2, 1, 4, 4, 1, 2,
1, 1, 3.

c) ¿Cuáles son sus medidas? Justifique su respuesta.
Respuestas
a) Se midió en el nivel nominal, porque los numerales utilizados son nominadores
que sólo clasifican y no podemos asignarles sentido cuantitativo. Por ejemplo, no
tendría sentido afirmar que unión libre es mayor que divorciado (4>3):
b) Es una masa de datos grande, porque su cardinalidad (N = 33) es mayor a 25.
c) N = 33. Puesto se midió a nivel nominal no procede identificar XMIN y XMAX.

EJERCICIO 3.2
El Departamento de Psicología del Centro de Rehabilitación Social No. 387, en 1999 midió
autoconcepto en un grupo de guardias penitenciarios, utilizando el conjunto numeral:
1 Muy bajo
2 Bajo
3 Medio
4 Alto
5 Muy alto
Y se obtuvo la siguiente masa de datos:
2, 4, 1, 3, 3, 2, 3, 1, 1, 3,
3, 2, 4, 3, 1, 3, 1, 5, 2, 3,
2, 4, 2.


109
Respuestas
a) Se midió a nivel ordinal, porque puede afirmarse que 5>4>3>2>1, pero no se
establecen intervalos (distancias numéricamente iguales).
b) Es una masa de datos pequeña, porque su cardinalidad no es mayor que 25.
c) N = 23; XMIN = 1; XMAX = 5.

EJERCICIO 3.3
En un estudio realizado en 2001 por la Unidad de Recursos Humanos de la empresa Seguros Total,
se midió aprovechamiento escolar en un grupo de aspirantes a ingresar a la empresa. Se midieron
los promedios finales de carrera y se redondearon a enteros. Se obtuvo la siguiente masa de datos
7, 8, 8, 6, 7, 7, 8, 7, 7, 8,
8, 9, 7, 8, 8, 6, 7, 6, 8, 7,
7, 7, 10, 8, 7, 9, 9, 7, 6, 10,
9, 6, 7, 8, 7, 7, 7, 8, 8, 7,
9, 8, 6, 8, 9, 8, 8, 8, 8, 8,
8, 9, 9, 8, 6, 7, 7, 9, 9, 10,
8, 8, 6.

Respuestas
a) Podría afirmarse que se midió a nivel de razón, porque cada puntaje representa
una razón del número de aciertos entre el total de reactivos. Esto es, X = ((número
de aciertos / Total de reactivos)  100); 100 en este caso es la escala de
calificación. Sin embargo, como se aproximó a enteros (para fines prácticos), la
variable debe considerarse transformada al nivel intervalar. En este ejemplo se
puede observar que el nivel de medición depende de la forma en que se defina
operacionalmente la variable.
b) Es una masa de datos grande porque su cardinalidad es mayor a 25.
c) N = 63; XMIN = 6; XMAX = 10.

EJERCICIO 3.4
En 2001 el Departamento de Personal midió el cociente intelectual en los policías de la Región IV.

110
104, 99, 109, 114, 108, 106, 116, 111, 101, 105,
111, 109, 111, 100, 118, 111, 109, 115, 121, 116,
103, 110, 112, 118, 114, 103, 124, 95, 107, 109,
117, 94, 101, 107, 91, 112, 112, 111, 122, 105,
106, 116, 108, 96, 111, 101, 113, 108, 92, 108,
119, 97, 106, 103, 105, 100, 108, 126, 113, 125,
103, 105, 107, 91, 109, 105, 120, 96, 119, 104,
102, 98, 113, 106, 97, 115, 107, 122, 113, 122,
100, 114, 98, 108, 110, 113, 117, 107, 94, 127,
106, 108, 109, 102, 105, 116, 99, 110, 102.

Respuestas
a) Se midió a nivel intervalar porque, aunque todo CI se obtiene por
CI = ((edad mental / edad cronológica)  100)
y esta es una medida de razón. Sin embargo, observamos que los puntajes se
aproximan a enteros, lo que constituye un intervalo. Por ejemplo, (101.5–102.5)
produce 102, tal que 102 realmente es el punto medio del intervalo.
b) Es una masa de datos grande porque su cardinalidad es mayor a 25.
c) N = 99; XMIN = 91; XMAX = 127.

EJERCICIO 3.5
Para estudiar la validez predictiva de un examen de admisión sobre el aprovechamiento escolar, en
1998 el Departamento de Control Escolar de la Universidad Sigma obtuvo los puntajes de un grupo
de alumnos; se registraron por parejas (X,Y), donde
X  Calificación obtenida en el examen de admisión.
Y  Promedio general de carrera.
Las dos variables se midieron en escala de 0 a 100 con aproximación a enteros y se obtuvieron los
siguientes datos.
(50, 80) (39, 84) (58, 87) (49, 84) (38, 67) (51, 67) (55, 78) (59, 80) (39, 79) (42, 82)
(43, 71) (55, 84) (47, 64) (48, 69) (62, 77) (64, 58) (47, 73) (48, 86) (69, 78) (69, 88)
(61, 72) (39, 76) (64, 90) (39, 92) (42, 76) (50, 74) (45, 73) (64, 75) (47, 82) (40, 69)
(40, 79) (54, 59) (48, 94) (59, 78) (54, 79) (60, 69) (59, 93) (48, 74) (64, 78) (55, 77)
(56, 68) (38, 66) (59, 74) (49, 72) (63, 57) (51, 57) (45, 65) (67, 82) (44, 63) (69, 72)
(42, 56) (56, 77) (44, 83) (53, 72) (40, 79) (59, 78) (70, 80) (37, 82) (70, 84) (55, 74)
(59, 90) (42, 72) (54, 80) (64, 70) (63, 75) (54, 93) (46, 78) (52, 83) (52, 74) (66, 85)
(37, 74) (57, 78) (37, 77) (47, 78) (46, 67) (39, 62) (68, 64) (65, 73) (70, 67) (40, 71)
(43, 78) (49, 80) (51, 78) (54, 75) (60, 79) (53, 82) (57, 64) (44, 75) (59, 85) (66, 73)
(54, 63)
a) ¿En qué nivel se midió cada una de las variables? Justifique su respuesta.
c) ¿Cuáles son sus medidas? Considere las dos variables

111
Respuestas
a) Ambos son puntajes de aprovechamiento escolar, que se obtienen dividiendo
aciertos sobre total de reactivos. Sin embargo, al igual que en los dos ejemplos
anteriores, tenemos que decir que se midió a nivel intervalar, porque cada puntaje
constituye un intervalo entre dos puntos de corte para el redondeo. Por ejemplo,
8 representa al intervalo (7.5 – 8.5).
b) Es una masa de datos grande, porque su cardinalidad es mayor a 25.
c) XMIN = 37; XMAX = 70 ; YMIN = 56; YMAX = 94; N = 91.

EJERCICIO 4.1
Utilizando la masa de datos del Ejercicio 3.1, construya la clasificación:
Respuesta
Estado civil TAB f
Soltero |||| |||| |||| |||| 19
Casado |||| ||| 8
Divorciado || 2
Unión libre |||| 4
Total 33

EJERCICIO 4.2
Utilizando la masa de datos del Ejercicio 3.2, construya la ordenación:
Respuesta
1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5.
ΣX = 58; N = 23

EJERCICIO 4.3
Utilizando la masa de datos del Ejercicio 3.3, construya la distribución de frecuencias puntual, en su
forma completa:
Respuesta
X TAB f fa fX X2 fX2
6 |||| ||| 8 8 48 36 288 f = 63
7 |||| |||| |||| |||| 19 27 133 49 931
fX = 485
8 |||| |||| |||| |||| ||| 23 50 184 64 1,472
9 |||| |||| 10 60 90 81 810 fX2 = 3,801
10 ||| 3 63 30 100 300


112
EJERCICIO 4.4
Utilizando la masa de datos del Ejercicio 3.4, construya la distribución de frecuencias intervalar, en
su forma general. Aplique i=5; primer intervalo (90–94).
Respuesta
X PM TAB f fa fX X2 fX2
90-94 92 |||| 5 5 460 8,464 42,320
95-99 97 |||| |||| 9 14 873 9,409 84,681
100-104 102 |||| |||| |||| 15 29 1,530 10,404 156,060
105-109 107 |||| |||| |||| |||| |||| |||| 29 58 3,103 11,449 332,021
110-114 112 |||| |||| |||| |||| 20 78 2,240 12,544 250,880
115-119 117 |||| |||| ||| 12 90 1,404 13,689 164,268
120-124 122 |||| | 6 96 732 14,884 89,304
125-129 127 ||| 3 99 381 16,129 48,387
f = 99
fX = 10,723
fX2 = 1’167,921

EJERCICIO 4.5
Utilizando la masa de datos del Ejercicio 3.5, construya la distribución de frecuencias intervalar, en
su forma general. Aplique i = 5; primer intervalo en X (36-40); primer intervalo en Y (56-60).
Respuesta
Tabulando la masa de datos del Ejercicio 3.5 y completando los cálculos tenemos
la siguiente distribución de frecuencias bivariable en su forma general:
X
36-40 41-45 46-50 51-55 56-60 61-65 66-70 PMY fY faY fY Y2 fY2
56-60 1 2 2 58 5 5 290 3364 16820
61-65 1 2 1 1 1 1 63 7 12 441 3969 27783
66-70 3 2 1 2 1 1 68 10 22 680 4624 46240
71-75 2 4 4 4 1 4 2 73 21 43 1533 5329 111909
Y
76-80 5 2 4 5 6 2 2 78 26 69 2028 6084 158184
81-85 2 2 2 3 1 3 83 13 82 1079 6889 89557
86-90 1 2 1 1 88 5 87 440 7744 38720
91-95 1 1 1 1 93 4 91 372 8649 34596
fX 14 11 15 17 14 10 10
faX 14 25 40 57 71 81 91
PMX 38 43 48 53 58 63 68
fX 532 473 720 901 812 630 680
X2 1444 1849 2304 2809 3364 3969 4624
fX2 20216 20339 34560 47753 47096 39690 46240
Y las sumas totales por variable son:

113
X Y
f = 91 f = 91
fX = 4,748 fY = 6,863
fX = 255,894 fY2 = 523,809
2
Que serán utilizadas más adelante.


EJERCICIO 5.1
Utilizando la clasificación del ejercicio 4.1, construya un circulograma.
Respuesta
Nota de cálculo
Estado civil f ANG = (f / N)360 % = (f / N)100
Soltero 19 207.27 57.58
Casado 8 87.27 24.24
Divorciado 2 21.82 6.06
Unión libre 4 43.64 12.12
Totales 33 360.00 100.00
Estado civil de los empleados de la Fábrica El Águila
Unión libre
4 empleados
12.12%
Soltero
Divorciado Casado 19 empleados
2 empleados 8 empleados 57.58%
6.06% 24.24%
Datos obtenidos en: 1997

Fuente: Departamento de personal
Responsable: Adolfo López Suárez
Fecha de elaboración: Octubre de 1999

114
EJERCICIO 5.2
Utilizando la ordenación del Ejercicio 4.2, construya un gráfico de barras.
Respuesta
Autoconcepto de un grupo de guardias penitenciarios
8
6
5
3
1
Muy Bajo Medio Alto Muy

Bajo Alto
Fuente: Departamento de psicología
Fecha de elaboración: Diciembre de 2005

115
EJERCICIO 5.3
Utilizando la distribución de frecuencias intervalar del ejercicio 4.4, construya el histograma.
Respuesta
Cocientes intelectuales de policías de la Región IV
f
30
20
10
X
0 90-94 100-104 110-114 120-119
95-99 105-109 115-119 125-129

Fecha de elaboración: Enero de 2001

116
EJERCICIO 5.4
Utilizando la distribución de frecuencias puntual del ejercicio 4.3, construya el polígono de
frecuencias.
Respuesta
Promedios finales de carrera de los aspirantes a ingresar a Seguros Total

f
24
20
10
X
0 5 7 9 11
6 8 10

Fuente: Unidad de Recursos Humanos
Fecha de elaboración: Marzo de 2001

117
EJERCICIO 5.5
Utilizando la distribución de frecuencias intervalar del ejercicio 4.4, construya el gráfico de escalera.
Respuesta
Cocientes intelectuales de un grupo de policías de la Región IV0

fa
99
100 96
90
80 78
60 58
40
29
20 14
0
X
90-94 100-104 105-109 110-114 115-119 120-124 125-129
95-99


118
EJERCICIO 5.6
Utilizando la distribución de frecuencias puntual del ejercicio 4.3, construya la ojiva.
Respuesta
Promedios finales de carrera de los aspirantes a ingresar a Seguros Total

fa
60
40
20
X
0 5 7 9
6 8 10

Fuente: Unidad de Recursos Humanos

EJERCICIO 6.1
Redondeé las siguientes cifras:
Respuesta
a) La varianza del grupo fue 347.63597 347.64
b) La proporción de alumnos no aprobados en el curso fue 0.333333... 0.3333
c) La media de aprovechamiento escolar fue 89.0029928 89.00
d) La proporción de trabajadores afiliados al sindicato fue 0.4947621 0.4948
e) El promedio de desempeño en el grupo fue 89.6547993 89.65
f) La suma de cuadrados de la distribución fue 444’397,651.0971 444’397,651.10
g) La suma de los tiempos de respuesta fue 3,842.004932 3,842.00
h) La proporción de sujetos con CI menor a normal fue 0.345 0.3450
i) El total de errores fue 267 267.00

119
EJERCICIO 6.2
Utilizando la clasificación del Ejercicio 4.1
Respuesta
Del ejercicio 4.1 sabemos que:
Estado civil f
Soltero 19
Casado 8
Divorciado 2
Unión libre 4
Total 33
Por tanto, la distribución de proporciones es:
Estado civil p
Soltero 0.5758
Casado 0.2424
Divorciado 0.0606
Unión libre 0.1212
p = 1.0000
Observaciones: 1) No fue necesario ajustar la suma de proporciones. 2) Cuando se
trabaja con una variable medida a nivel nominal, que necesariamente implica la no
existencia de orden en los datos, no procede calcular proporciones acumuladas.
b) ¿Cuál es la proporción de empleados casados?
Respuesta
P(Casado) = 0.2424 = 24.24%
c) ¿De empleados no solteros?
Respuesta
P(Casado ó Divorciado ó Unión Libre) = 1.0000 - 0.5758 = 0.4242
o bien
P(Casado ó Divorciado ó Unión Libre) = 0.2424 + 0.0606 + 0.1212 = 0.4242

EJERCICIO 6.3
Utilizando la Ordenación del Ejercicio 4.2
Respuesta
Del ejercicio 4.2 tenemos la ordenación
1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5.
Su distribución de frecuencias es:
120
X f
51
62
83
34
15
N = 23

X p pa
1 0.2174 0.2174
2 0.2609 0.4783
3 0.3478 0.8261
4 0.1304 0.9565
5 0.0435 1.0000
Observaciones: 1) No fue necesario ajustar la suma de p. 2) Puesto que la medición
ordinal es cuantitativa, procede calcular proporciones acumuladas.
b) ¿Cuál es la proporción de guardias con nivel medio de autoconcepto?
Respuesta
P(3) = 34.78%
c) ¿Con nivel menor a medio?
Respuesta
P(X  2) = 47.83%
d) ¿Con nivel medio o mayor a medio?
Respuesta
P(X  3) = 52.17%

EJERCICIO 6.4
Utilizando la distribución de frecuencias puntual del Ejercicio 4.3
Respuesta
X f
6 8
7 19
8 23
9 10
10 3
Σf= 63
121
De donde la distribución de proporciones es:

X p pa
6 0.1270 0.1270
7 0.3016 0.4286
8 0.3651 0.7937
9 0.1587 0.9524
10 0.0476 1.0000
Observación: No fue necesario ajustar la suma de p.
b) ¿Cuál es la proporción de aspirantes con promedio final de carrera de 7 o menor?
Respuesta
P(X  7) = 42.86%
c) ¿Con promedio entre 7 y 9?
Respuesta
P(7  X  9) = 82.54%
d) ¿Con promedio de 7 o mayor?
Respuesta
P(X  7) = 87.30%

EJERCICIO 6.5
Utilizando la distribución de frecuencias intervalar del ejercicio 4.4
Respuesta
X f
90-94 5
95-99 9
100-104 15
105-109 29
110-114 20
115-119 12
120-124 6
125-129 3
Σf= 99

122
X p pa
90-94 0.0505 0.0505
95-99 0.0909 0.1414
100-104 0.1515 0.2929
105-109 0.2929 0.5858
110-114 0.2020 0.7878
115-119 0.1212 0.9090
120-124 0.0606 0.9696
125-129 0.0304 1.0000
ajuste
Observación: Se ajustó la suma de p.

b) ¿Cuál es la proporción de policías con CI entre 100 y 119?
Respuesta
P(100  X  119) = 76.76%
c) ¿Con CI de 109 o menor?
Respuesta
P(X  109) = 58.58%
d) ¿Con CI de 110 o mayor?
Respuesta
P(X  110) = 41.42%
e) ¿Sería posible calcular la proporción de policías con CI entre 103 y 119? Justifique su respuesta.
Respuesta
No, porque 103 no está definido en la distribución; queda dentro del intervalo (100-
104).

EJERCICIO 7.1
Utilizando la distribución de frecuencias del Ejercicio 4.3, calcule las siguientes medidas
X f fa
6 8 8
7 19 27
8 23 50
9 10 60
10 3 63
a) Decil 7
Respuesta
N = 63
123
D7  p = 0.7000
pN = 0.7000  63 = 44.10
R1 = 8 (este renglón contiene frecuencias de 27.51 a 50.50)
Li = 7.50
Fa = 27
fp = 23
i=1
Observación: Puesto que trabajamos con una distribución puntual, eliminamos i de
la fórmula. Lo mismo aplica en los demás incisos de este ejercicio.
F0.7000 = 7.50+((44.10–27)/23)
F0.7000 = 8.24
Esto significa que 70.00% de los aspirantes tuvieron promedios de carrera de 8.24
o menor.
b) Mediana
Respuesta
N = 63
Md  p = 0.5000
pN = 0.500063 = 31.50
Li = 7.50
Fa = 27
fp = 23
i = 1 (por tanto, se omite en la fórmula)
F0.5000 = 7.50 + ((31.50 – 27) / 23)
F0.5000 = 7.70
Esto es, la mitad (50.00%) de los aspirantes presentaron promedios de carrera de
7.70 o menor.
c) Cuartil 3
Respuesta
N = 63
Q3  p = 0.7500
pN = 0.7500  63 = 47.25
Li = 7.50
Fa = 27
fp = 23
F0.7500 = 7.50 + ((47.25 – 27) / 23)
F0.7500 = 8.38
El 75.00% de los aspirantes presentaron promedios de carrera de 8.38 o menor.
124

EJERCICIO 7.2
Utilizando la distribución de frecuencias del Ejercicio 4.4, conteste lo siguiente:
Del ejercicio 4.4. sabemos que:
X f fa
90-94 5 5
95-99 9 14
100-104 15 29
105-109 29 58
110-114 20 78
115-119 12 90
120-124 6 96
125-129 3 99
a) Será aceptado a un curso de formación el 12% superior del grupo. ¿A partir de qué CI serán
aceptados los aspirantes?
Respuesta
En este caso nos dan la proporción (12.00%) superior, pero sabemos los fractiles
limitan a la proporción inferior, es decir, la que queda a la izquierda de la distribución.
Por tanto, buscamos (100–12 = 88%). Veámoslo con un croquis:
12.00%
88.00%
CI
De donde:
N = 99
p = 0.8800
pN = 0.880099 = 87.12
R1 = [115-119] (este renglón contiene frecuencias de 78.51 a 90.50)
Li = 114.50
Fa = 78
fp = 12
i=5
Aplicando la fórmula:
F0.8800 = 114.50+(((87.12–12)/99)5)
F0.8800 = 118.30

125
Como el CI se mide en enteros, truncamos a 118; puesto que buscamos el límite

inferior de la norma derecha, sumamos 1 y tenemos 119. Esto es, deberán ser
aceptados al curso los aspirantes con CI de 119 o superior.
b) José obtuvo un CI de 115. Calcule e interprete su Rango Percentilar.
Respuesta
N = 99
R1 = [115-119] (este renglón contiene a 117)
i=5
Fa = 78
fp = 12/5 = 2.40 (porque la distribución es intervalar).
Li = 114.50
Observación: El CI de José está en el intervalo [115-119] y PM = 117; a partir de
este dato intervalar se realiza el cálculo y esto implica reducir la precisión debido al
nivel de medición.
RP = (((117–114.50)2.40)+78)/99
RP = 0.8485
Esto significa que el 84.85% del grupo de policías al que pertenece José tiene un
CI igual o menor al suyo.
c) Encuentre el Fractil que limita a la proporción encontrada en (b).
Respuesta
Buscamos F0.8485, entonces:
N = 99
p = 0.8485
R1 = [115-119] (intervalo que contiene pN = 0.848599 = 84.00 frecuencias).
Li = 114.50
Fa = 78
fp = 12
i=5
F0.8485 = 114.50+(((84.00–78)/12)5)
F0.8485 = 117.00
d) Comparando los procesos realizados en (b) y (c), explique la relación entre Fractil y Rango
Percentilar.
Respuesta
En el inciso (b) partimos del CI(José) = 117 y encontramos un RP = 0.8485. En el
inciso (c) realizamos la operación inversa: partimos de un RP = 0.8485 y
encontramos un CI = 117. De este modo se observa que el Fractil es la medida de
ubicación inversa al Rango Percentilar.


126
EJERCICIO 7.3
Utilizando la distribución de frecuencias del Ejercicio 4.4, construya la tabla de normas.
Respuesta
Primero completamos la distribución de proporciones.
Norma % p pa
Deficiente 8.00 0.0800 0.0800
Muy bajo 11.50 0.1150 0.1950
Bajo 16.25 0.1675 0.3575
Medio 28.50 0.2850 0.6425
Alto 16.25 0.1625 0.8050
Muy alto 11.50 0.1150 0.9200
Superior 8.00 0.0800 1.0000
Ahora podemos representar gráficamente el esquema de proporciones:
0.9200
0.8050
0.6425
0.3575
0.1950
0.0800
0.8000 0.1625 0.1625 0.0800

0.1150 0.2850 0.1150
X1 X2 X3 X4 X5 X6 CI
Puede observarse que al acumular la proporción de cada categoría con las

anteriores, estamos definiendo una distribución acumulativa específica para el
modelo de normalización que aplicamos y cada límite exacto de norma es un fractil.
En el ejemplo que estamos trabajando, N = 99. Calculamos las frecuencias por
cuartil:
Norma Fractil pN
Deficiente X1 0.080099 = 7.92
Muy bajo X2 0.195099 = 19.31
Bajo X3 0.357599 = 35.39
Medio X4 0.642599 = 63.61
Alto X5 0.805099 = 79.70
Muy alto X6 0.920099 = 91.08
Ahora, tomando la distribución de frecuencias, procedemos a la ubicación de los
intervalos que contienen a cada fractil.

127
X f fa
pN = 7.92
90-94 5 5
pN = 19.31
95-99 9 14
100-104 15 29 pN = 35.39
105-109 29 58 pN = 63.61
110-114 20 78 pN = 79.70
115-119 12 90
pN = 91.08
120-124 6 96
125-129 3 99
Una vez ubicados los fractiles, construimos la nota de cálculo:

Sabemos que i = 5. La fórmula para calcular fractiles es:
Fp = Li+(((pN–Fa)/fp)i)
Ahora podemos obtener los valores de cada literal de la fórmula Aplicándola
tenemos la siguiente nota de cálculo:
p pN Li Fa fp Fp
0.0800 7.92 94.50 5 9 96.12
0.1950 19.31 99.50 14 15 101.27
0.3575 35.39 104.50 29 29 105.60
0.6425 63.61 109.50 58 20 110.90
0.8050 79.70 114.50 78 12 115.21
0.9200 91.08 119.50 90 6 120.40
Repitamos, cada fractil es un límite exacto entre dos categorías del modelo
normativo. Pero las categorías normativas deben ser mutuamente excluyentes, por
lo queden discretizarse. Puesto que los CI manejan en enteros, para discretizar la
variable se aplica la siguiente regla de cortadura:
a) Los extremos de la tabla (el límite inferior de la categoría más baja y el
superior de la más alta) se definen por el marco teórico (principalmente por
la definición operacional de la variable).
b) El límite superior de la norma antecesora es la parte entera truncada del
fractil.
c) El límite inferior de la norma sucesora es la parte entera, truncada, del fractil
más 1.
Por tanto, la tabla de normas es:
Normas para la interpretación de los CI del grupo de policías
Norma Límites
Deficiente 0 96
Muy bajo 97 101
Bajo 102 105
Medio 106 110
Alto 111 115
128
Norma Límites
Muy alto 116 120
Superior 121 
Con esta tabla podemos interpretar el CI de cualquier policía del grupo.

EJERCICIO 8.1
Utilizando la ordenación del Ejercicio 4.2:
Respuesta
ΣX = 58
N = 23
Entonces
 = ΣX/N
 = 58/23
 = 2.52
Observación: Revisando la definición de la variable se observa que el autoconcepto
de los guardias penitenciarios estudiados se acerca más a Medio que a Bajo.
b) Localice la mediana.
Respuesta
Sabemos que N = 23, por tanto la mediana es el dato central.
Md = 3
Respuesta
Vemos que 3 es el dato que más se repite (f = 8), por tanto:
Mo = 3

EJERCICIO 8.2
Utilizando la distribución de frecuencias del Ejercicio 4.3:

Respuesta
ΣfX = 485
N = 63
Por tanto:
 = f X/N
129
 = 485/63
 = 7.70
Respuesta
Buscamos F0.5000, ya conocemos el proceso de cálculo.
F0.5000 = 7.50+((31.50–27)/23)
F0.5000 = 7.70
Observación: Coincidentemente, media y mediana cayeron en el mismo dato en
este ejemplo.
Respuesta
Mo = 8

EJERCICIO 8.3
Respuesta
Sabemos que:
ΣfX = 10,723
N = 99
Por tanto:
 = ΣfX/N
 = 10,723/99
 = 108.31
F0.5000 = 104.50+(((49.50–29)/29)5)
F0.5000 = 108.03
Mo = [105 – 109]
Observación: El modo está contenido en el intervalo 105 a 109. No se puede decir
más.

EJERCICIO 8.4
Utilizando la distribución de frecuencias bivariable del Ejercicio 4.5:

130
Respuesta
Primero, de la distribución bivariable podemos derivar las distribuciones de X y Y
X PM f fa Y PM f fa
36-40 38 14 14 56-60 58 5 5
41-45 43 11 25 61-65 63 7 12
46-50 48 15 40 66-70 68 10 22
51-55 53 17 57 71-75 73 21 43
56-60 58 14 61 76-80 78 26 69
61-65 63 10 81 81-85 83 13 82
66-70 68 10 91 86-90 88 5 87
91-95 93 4 91
fX = 4,748 fy = 6,863
Ahora podemos contestar los incisos.

a) Calcule las medias aritméticas en X y Y.
Respuesta
X Y
 = f X / N  = f Y / N
 = 4,748 / 91  = 6,863 / 91
 = 52.18  = 75.42
b) Calcule las medianas en X y Y.
Respuesta
X Y
F0.5000 = 50.50+(((45.50–40)/17)5) F0.5000 = 75.50+(((45.50–43)/26)5)
F0.5000 = 52.12 F0.5000 = 75.98
c) Localice los modos en X y Y.
X Y
Mo = [51-55] Mo = [76-80]

EJERCICIO 8.5
Se midió aprendizaje terminal en matemáticas en los egresados de tres escuelas y se obtuvo:
Escuela Número de egresados Media
A 897 6.43
B 86 8.74
C 411 7.33
a) Calcule la media aritmética general.

131
Respuesta
La media aritmética general es la media de las medias, por tanto:
 = Σ /N
 = (6.43+8.74+7.33)/3
 = 22.50/3
 = 7.50
b) Calcule la media ponderada general, conforme al número de egresados

Respuesta
En este caso, el número de egresados es el peso (w) de cada escuela. Por tanto:
MP = Σ(w×X) / Σw
MP = ((8976.43)+(868.74)+(4117.33))/(897+86+411)
MP = 6.84
Respuesta
Comparación: Es claro que ( = 7.50) > (MP = 6.84). Esto es, en este caso se reduce
el valor al ponderar los puntajes.
Explicación: En el ejemplo analizado, la media ponderada reduce su valor porque
los puntajes más altos corresponden a las matrículas de egresados más pequeñas;
es decir, las matrículas más pequeñas pesan más.
d) ¿Cuál de las dos medias sería más representativa de la población general de egresados?
Respuesta
Suponiendo que el número de egresados se considere un criterio, la media
ponderada debe preferirse a la media aritmética. Sin embargo, siempre debe
informarse que se está utilizando la media ponderada, así como el criterio de
ponderación.

EJERCICIO 8.6
Se presentan las calificaciones finales y la carga horaria (horas/semana/semestre) de cada
asignatura obtenida por un alumno:
Asignatura Calificación Carga horaria
A 8.30 2
B 6.81 4
C 9.43 3
D 7.12 6
E 8.83 2

132
Respuesta
En este caso, la media aritmética es la media de las calificaciones, por tanto:
 = ΣX/N
 = (8.30+6.81+9.43+7.12+8.83)/5
 = 8.10
b) Calcule la media ponderada, conforme a la carga horaria de cada asignatura.
Respuesta
En este caso el criterio de ponderación es la carga horaria de cada asignatura, por
tanto:
MP = Σ(w×X)/w
MP = ((8.302)+(6.814)+(9.433)+(7.126)+(8.832))/(2+4+3+6+2)
MP = 7.79
Respuesta
Vemos de () > (), lo que implica que el promedio de este alumno se reduce cuando
sus calificaciones se ponderan conforme al número de horas que se dedican al
estudio de cada asignatura; es decir, se asume que mientras mayor es su carga
horaria, mayor es su importancia.
d) ¿Cuál de las dos medias sería más representativa de la población general de egresados?
Respuesta
Ocurre lo mismo que en el ejercicio 7.5. Pero esto solo es una coincidencia. No
debe pensarse que siempre que se calcule una media ponderada el valor del
promedio se reducirá.

EJERCICIO 9.1
Utilizando la ordenación del Ejercicio 4.2:
a) Calcule el rango.
Respuesta
Sabemos que:
XMAX = 5
XMIN = 1
por tanto
R = XMAX–XMIN+1
R = 5–1+1
R=5
Esto es, existen cinco puntajes en el rango (1, 2, 3, 4, 5).
b) JOSÉ ES UN GUARDIA DEL GRUPO Y TUVO UN PUNTAJE DE 4; CALCULE E INTERPRETE SU DESVIACIÓN
133
MEDIA.
Sabemos que
X(José) = 4
y del ejercicio 8.1
 = 2.52
Por tanto:
DM(José) = 4–2.52
DM(José) = 1.48
José tiene un autoconcepto superior en 1.48 a la media de su grupo.
c) Calcule la desviación estándar.
 = ((X–)2 / N)
De la ordenación, abreviando, tenemos
 = ((5(1–2.52)2+6(2–2.52)2+8(3–2.52)2+3(4–2.52)2+(5–2.52)2 )/23)
 = 1.10
d) Calcule la varianza.
2 = 1.21

EJERCICIO 9.2
Respuesta
Sabemos que:
XMAX = 10
XMIN = 6
Entonces:
R = XMAX–XMIN+1
R = 10–6+1
R=5
b) Calcule el rango semintercuartilar.
Respuesta
Comencemos por calcular los fractiles con el procedimiento que ya conocemos:
F0.7500 = 7.50+((47.25–27)/23)
F0.7500 = 8.38
F0.2500 = 6.50+((15.75–8)/19)
F0.2500 = 6.91
Ahora podemos calcular RSIC:
134
RSIC = (8.38–6.91)/2
RSIC = 0.74
c) Pedro es un aspirante del grupo y tuvo un puntaje de 7; calcule e interprete su desviación media.
Respuesta
Sabemos que:
 = 7.70
Entonces
DM(Pedro) = 7–7.70
DM(Pedro) = –0.70
Pedro tiene un promedio general de carrera inferior en 0.70 a la media de su grupo.
d) Calcule la desviación estándar.
Respuesta
Sabemos que:
ΣfX = 485
ΣfX2 = 3,801
N = 63
Entonces:
 = ((ΣfX2–((ΣfX)2/N))/N)
 = ((3,801–(4852/63))/63)
 = 1.03
e) Calcule la varianza.
Respuesta
2 = 1.07

EJERCICIO 9.3
Respuesta
Sabemos que:
XMAX = 129
XMAX = 90
Entonces:
R = XMAX–XMIN+1
R = 129–90+1
R = 40
b) Calcule el rango semintercuartilar.

135
Respuesta
Para calcular el F0.7500:
F0.7500 = 109.50+((74.25–58)/20)5
F0.7500 = 113.56
Para el F0.2500:
F0.2500 = 99.50+((24.75–14)/15)5
F0.2500 = 103.08
Ahora el RSIC:
RSIC = (F0.2500–F0.2500)/2
RSIC = (113.56–103.08)/2
RSIC = 5.24
c) Luis es un policía del grupo y tuvo un CI de 92; calcule e interprete su desviación media.
Respuesta
 = 108.31
y
CI (Luis) = 92
Por tanto
DM(X) = X–
DM(Luis) = 92–108.31
DM(Luis) = –16.31
Luis tiene un CI inferior en 16.31 a la media de su grupo.
d) Calcule la desviación estándar.
Respuesta
Sabemos que:
ΣfX =10,723
ΣfX2 =1'167,921
N = 99
Entonces:
 = ((ΣfX2–((ΣfX)2/N))/N)
 = ((1’167,921–((10,723)2/99))/99)
 = 8.09
e) Calcule la varianza.
Respuesta
2 = 65.45


136
EJERCICIO 9.4
Utilizando la distribución de frecuencias bivariable del Ejercicio 4.5:
a) Calcule y compare los rangos en X y Y.
Respuesta
Sabemos que:
XMAX = 70
XMIN = 36
YMAX = 95
YMIN = 56
Por tanto:
R = XMAX–XMIN+1 R = XMAX–XMIN+1
R(X) = 70–36+1 R(Y) = 95–56+1
R(X) = 35 R(Y) = 40
Comparación: Primero tenemos que observar que las dos variables, el examen de
admisión y el promedio general de carrera, se miden en la misma escala (0 a 100),
por lo cual es válido compararlas directamente.
Ahora, puesto que R(X) < R(Y), podemos afirmar que existe menor amplitud en la
distribución del examen de admisión que del promedio general de carrera. Esto se
puede observar desde la distribución de frecuencias pues, con el mismo tamaño de
intervalo, X tiene siete renglones y Y ocho. Ya desde el rango se observa que existe
menor variabilidad en el examen de admisión (X) que el el promedio general de
carrera (Y).
b) Calcule y compare los rangos semintercuartilares en X y Y.
Respuesta
Nuevamente, puesto que ya conocemos el procedimiento, calculamos directamente
los fractiles en las dos variables.
X Y
F0.7500 = 55.50+(((68.25–57)/14)5) F0.7500 = 75.50+((68.25–43)/26)5
F0.7500 = 59.52 F0.2500 = 80.36
F0.2500 = 40.50+(((22.75–14)/11)5) F0.2500 = 70.50+((22.75–22)/21)5

F0.2500 = 44.48 F0.2500 = 70.68
Ahora calculamos los RSIC
RSIC = (F0.7500–F0.2500)/2
RSIC(X) = (59.52–44.48)/2 RSIC = (80.36–70.68)/2
RSIC(X) = 7.52 RSIC(Y) = 4.84
Comparación: A diferencia del rango, aquí encontramos que RSIC(X) > RSIC(Y): la
zona central en X varía más que su contraparte en Y. Para comprender el significado
de esto debe revisarse la distribución de frecuencias y podrá observarse que las
137
frecuencias en X están más “aplanadas” que en Y, mientras que en el promedio

general de carrera las frecuencias se acumulan más en el centro de la distribución,
lo que necesariamente reduce su variabilidad en la zona intercuartilar. En términos
más conceptuales, la zona de normalidad es más amplia en el examen de admisión
que en el promedio general de carrera.
c) Juan es el elemento número 9 en la masa de datos. Calcule y compare las desviaciones medias
en ambas variables.
Respuesta
Sabemos que:
De la masa de datos, Juan obtuvo los puntajes (39,79).
y
X = 52.18
Y = 75.42
Entonces:
DMX(Juan) = 39–52.18 DMY(Juan) = 79–75.42
DMX(Juan) = –13.18 DM(Juan) = 3.58
Comparación: Juan tuvo mejor desempeño en la carrera que en el examen de

admisión. En el examen de admisión quedó más de 13 puntos por debajo de su
grupo, en cambio en el promedio general de carrera quedó ligeramente por encima
del grupo. Este puntaje apunta a un pobre poder predictivo del examen de admisión.
Además, en la distribución de frecuencias puede notarse que cuatro sujetos más
quedaron en el mismo cuadro que Roberto
d) Calcule y compare las desviaciones estándar en X y Y.
Respuesta
Pasemos directamente al cálculo:
 = ((255,894–((4,748)2/91))/91)  = ((523,809–((6,863)2/91))/91)
X = 9.47 X = 8.27
Comparación: Aunque en menor medida, aquí ocurre lo mismo que en el RSIC:

encontramos que (X) > (Y), lo que implica que la variabilidad del grupo respecto
a la media es mayor en el examen de admisión que en el promedio general de
carrera.
e) Calcule y compare las varianzas en X y Y.
2X = 89.71 2Y = 68.33

Comparación: Puesto que la varianza no es más que el cuadrado de la desviación
estándar, la interpretación aquí es igual que en la anterior medida de variabilidad.

EJERCICIO 10.1
Utilizando la distribución de frecuencias del Ejercicio 4.3
a) Calcule e interprete el sesgo
138
Respuesta
 = 7.70
F0.5000 = 7.70
y del ejercicio 9.2:
 = 1.03
Observación: Puesto que Sabemos que en este ejemplo, media y mediana

coinciden en el mismo valor, desde aquí sabemos que So = 0, es decir, la
distribución no está sesgada.
Calculando:
So = (3( –F0.5000)) / 
So = (3(7.70–7.70))/1.03
So = 0
b) Calcule e interprete la curtosis
Respuesta
Ya sabemos calcular los fractiles:
F0.7500 = 8.38
F0.2500 = 6.91
F0.9000 = 9.17
F0.1000 = 6.29
Por tanto:
K = ((F0.7500–F0.2500)/2)/(F0.9000–F0.1000)
K = ((8.38–6.91)/2)/(9.17–6.29)
K = 0.2552
Puesto que la curtosis observada es menor al valor normal (0.2632), concluimos
que tenemos una distribución planocúrtica.

EJERCICIO 10.2
Utilizando la masa de datos del Ejercicio 4.4,
a) Calcule e interprete el sesgo
Respuesta
 = 108.31
F0.5000 = 108.03
Y del ejercicio 9.3
 = 8.09
Entonces:
So = (3(–F0.5000))/
So = (3(108.31–108.03))/8.09
139
So = 0.1038
Lo que significa que esta distribución está sesgada positivamente con un coeficiente
de sesgo de 0. 1038.
b) Calcule e interprete la curtosis
Respuesta
Calculando los fractiles:
F0.7500 = 113.56
F0.2500 = 103.08
F0.9000 = 119.13
F0.1000 = 97.22
K = ((113.56–103.08)/ 2)/(119.13–97.22)
K = 0.2392
Por lo que concluimos que tenemos una distribución planocúrtica.

EJERCICIO 10.3
Utilizando la distribución de frecuencias del Ejercicio 4.5,
a) Calcule el sesgo de ambas variables

Respuesta
De los ejercicios 7.4 y 8.4 sabemos que
X Y
 = 52.18  = 75.42
 = 9.47  = 8.27
F0.7500 = 59.52 F0.7500 = 80.36
F0.5000 = 52.12 F0.5000 = 75.98
F0.2500 = 44.48 F0.2500 = 70.68
Entonces;
X Y
So = (3(52.18–52.12))/9.47 So = (3(75.42–75.98))/8.27
So = 0.0190 So = –0.2031
b) Compare ambos sesgos
Respuesta
El sesgo del examen de admisión (X) es positivo y por tanto está cargado a la
izquierda (prevalecen los puntajes bajos); ocurre lo contrario el sesgo en el
promedio general de carrera (Y) es negativo. Debe observarse también que la
distribución de y tiene un mayor sesgo en términos absolutos, pues |0.2031| >
|0.0190|.

140
c) Calcule la curtosis de ambas variables.

Respuesta
Calculemos los fractiles faltantes:
X Y
F0.9000: F0.9000:
pN = 0.900091= 81.90 pN = 0.900099 = 81.90
F0.9000 = 65.50+(((81.90–81)/10)5) F0.9000 = 80.50+(((81.90–69)/13)5)
F0.9000 = 65.95 F0.9000 = 85.46
F0.1000: F0.1000:
pN = 0.100091 = 9.10 pN = 0.100091 = 9.10
F0.1000 = 35.50+(((9.10–0)/14)5) F0.1000 = 60.50+(((9.10–5)/7)5)
F0.1000 = 38.75 F0.1000 = 63.43
Con lo que podemos ya calcular las curtosis
X Y
K = ((59.52–44.48)/2)/(65.95–38.75) K = ((80.36–70.68)/2)/(85.46–63.43)
K = 0.2765 K = 0.2197
d) Compare ambas curtosis
Respuesta
Sabemos que la curtosis normal es 0.2632. Por tanto, la distribución del examen de
admisión (X) es leptocúrtica, mientras que la distribución del promedio general de
carrera es planocúrtica. Es claro que el promedio general de carrera presenta mayor
variabilidad que el examen de admisión.

EJERCICIO 11.1
Para medir el grado en que el estado civil está asociado con el sector en que trabajan las mujeres,
en cierta comunidad se tomó una muestra y se obtuvieron los siguientes datos:
Público Privado Práctica privada
Soltero 25 12 18
Estado Unión libre 28 9 15
civil Casado 8 13 16
Divorciado 29 8 10
a) Calcule el coeficiente de contingencia.
Respuesta
Es claro que tanto el sector en que trabaja la mujer (X) como su estado civil (Y) son
variables nominales. En este ejemplo no hubo necesidad de transformar variables
medidas en otro nivel.
Podemos, entonces, proceder a construir la tabla de cálculo:

141

Público Privado Práctica privada Sumas
25 12 18 55
Soltero 25.92 12.09 16.99
0.03 0.00 0.06
28 9 15 52
Unión libre 24.50 11.43 16.06
Estado 0.50 0.52 0.07
civil 8 13 16 37
Casado 17.43 8.14 11.43
5.10 2.90 1.83
29 8 10 47
Divorciado 22.15 10.34 14.52
2.12 0.53 1.41
Sumas 90 42 59 191
Observe los valores en cada celda: el superior es la frecuencia observada (fo); el
intermedio es la frecuencia esperada (fe); el inferior es Chi-cuadrada de la celda.
Por ejemplo, en la primera celda: fo = 0 28; fe = (52×90)/191 = 24.50; Chi-cuadrada
de la celda = (28-24.50)2/24.50 = 0.50.
Ahora calculamos el valor de Chi-cuadrada total, sumando los valores inferiores de
cada celda (que son las Chi-cuadradas parciales).:
2 = Σ((fo–fe)2/fe)
2 = 15.07
Finalmente, calculamos el coeficiente de contingencia:
rC = (2/(N+2))
rC = (15.07/(191+15.07))
rC = 0.2704
Respuesta
Primero, debemos recordar que el coeficiente de contingencia produce un valor no
signado, por lo cual no podemos afirmar que el valor obtenido sea positivo (ni
negativo).
Segundo, recordemos que, según [9:28], en la práctica el valor límite del coeficiente
de contingencia es 0.8160.
Ahora, podemos afirmar que las variables estado civil y sector en que trabaja la
mujer están correlacionadas en 0.2704; lo que significa que ambas variables están
asociadas con una fuerza del 27.04%. Interpretar la significación de este coeficiente
requeriría aplicar una prueba de hipótesis, procedimiento que sale de los límites de
este curso.

142
Respuesta
Puesto que ambas variables están medidas en el nivel nominal, el coeficiente de
contingencia es el método aplicable.

EJERCICIO 11.2
En una empresa se midió autoritarismo del supervisor (en escala de 1 a 3) y accidentes laborales y
se obtuvieron los siguientes datos:
Supervisor Nivel de autoritarismo Accidentes laborales
1 2 4
2 3 2
3 1 3
4 1 4
5 3 1
6 2 2
7 1 5
8 3 1
9 3 2
a) Calcule el coeficiente de Spearman.
Respuesta
Comenzamos por definir el nivel de medición de las variables: el nivel de
autoritarismo (X) es una variable ordinal, pues podemos afirmar que cada puntaje
implica un orden de magnitud; por ejemplo, un puntaje de 3 implica mayor nivel de
autoritarismo que un puntaje de 2. Por otra parte, la variable accidentes laborales
podría medirse a nivel intervalar o aún a nivel de razón (indicando número de
accidentes por cierta unidad de tiempo); en cualquier caso, su nivel de medición no
es inferior al ordinal y por tanto puede transformarse a ordinal.
Después se rankean los puntajes ordenándolos de menor a mayor y promediando
sus ordinales cuando hay puntajes repetidos. Por ejemplo: En X el valor menor es
1 y aparece tres veces, por tanto sus ordinales son 1, 2 y 3; entonces, el rango que
corresponde a los supervisores que obtuvieron 1 en autoritarismo es
R(X=1) = (1+2+3)/3 = 2.00, que es el que anota en la tabla de cálculo:
Supervisor X (NA) Y (AL) R(X) R(Y) d d2
1 2 4 4.50 7.50 –3.00 9.00
2 3 2 7.50 4.00 3.50 12.25
3 1 3 2.00 6.00 –4.00 16.00
4 1 4 2.00 7.50 –5.50 30.25
5 3 1 7.50 1.50 6.00 36.00
6 2 2 4.50 4.00 0.50 0.25
7 1 5 2.00 9.00 –7.00 49.00
8 3 1 7.50 1.50 6.00 36.00
9 3 2 7.50 4.00 3.50 12.25
Σd2 = 201.00

143
Ahora podemos aplicar la fórmula para calcular el coeficiente de correlación de

Spearman:
rS = 1-((6×201.00)/(93-9))
rS = -0.6750
Respuesta
Sabemos que el coeficiente de Spearman es un valor signado; aquí tenemos una
correlación inversa (a mayor autoritarismo, menor número de accidentes) y su
fuerza es del 67.50%.
Respuesta
Aunque la variable Y, número de accidentes, está medida a un nivel superior al
ordinal, puede aplicarse el método de Spearman porque ésta permitido bajar de
nivel, pero no subir. No sería válido aplicar el método de Pearson porque una
variable
Observación: Para un cálculo riguroso del coeficiente de Spearman debería
introducirse en esta fórmula una corrección por ligas, misma que reduce el valor de
rS. Aquí no se consideró porque su aplicación principal está en la prueba de
hipótesis. Además, como lo prueba Siegel [1979: 241y sig.], la corrección por ligas
tiene un efecto mínimo sobre el valor final del coeficiente de correlación.

EJERCICIO 11.3
Con los datos del ejercicio 4.5, defina al examen de admisión como variable predictora y al promedio
general de carrera como variable criterio y:
Respuesta
Comenzamos por definir los niveles de medición. tanto el puntaje obtenido en el
examen de admisión (X) como el promedio general de carrera son medias a nivel
de razón (Aciertos / Total de reactivos). Sin embargo, la distribución de frecuencias
que utilizamos para el cálculo transformó las variables al nivel intervalar. Sigue
siendo válido aplicar el coeficiente de Pearson.
para construir la tabla de cálculo, partimos de la distribución de frecuencias
construida en el ejercicio 4.5:
X
36-40 41-45 46-50 51-55 56-60 61-65 66-70
56-60 1 2 2
61-65 1 2 1 1 1 1
66-70 3 2 1 2 1 1
Y
71-75 2 4 4 4 1 4 2
76-80 5 2 4 5 6 2 2
81-85 2 2 2 3 1 3
144
X
36-40 41-45 46-50 51-55 56-60 61-65 66-70
86-90 1 2 1 1
91-95 1 1 1 1
Entonces, para construir la tabla de cálculo solo requerimos los puntos medios de
los intervalos en X y en Y, así como las frecuencias. Además, para simplificar
omitimos las celdas vacías (huecos, frecuencia cero). De este modo tenemos la
tabla de cálculo:
X Y f fX fY fXY X2 fX2 Y2 fY2
38 63 1 38 63 2394 1444 1444 3969 3969
38 68 3 114 204 7752 1444 4332 4624 13872
38 73 2 76 146 5548 1444 2888 5329 10658
38 78 5 190 390 14820 1444 7220 6084 30420
38 83 2 76 166 6308 1444 2888 6889 13778
38 93 1 38 93 3534 1444 1444 8649 8649
43 58 1 43 58 2494 1849 1849 3364 3364
43 63 2 86 126 5418 1849 3698 3969 7938
43 73 4 172 292 12556 1849 7396 5329 21316
43 78 2 86 156 6708 1849 3698 6084 12168
43 83 2 86 166 7138 1849 3698 6889 13778
48 63 1 48 63 3024 2304 2304 3969 3969
48 68 2 96 136 6528 2304 4608 4624 9248
48 73 4 192 292 14016 2304 9216 5329 21316
48 78 4 192 312 14976 2304 9216 6084 24336
48 83 2 96 166 7968 2304 4608 6889 13778
48 88 1 48 88 4224 2304 2304 7744 7744
48 93 1 48 93 4464 2304 2304 8649 8649
53 58 2 106 116 6148 2809 5618 3364 6728
53 63 1 53 63 3339 2809 2809 3969 3969
53 68 1 53 68 3604 2809 2809 4624 4624
53 73 4 212 292 15476 2809 11236 5329 21316
53 78 5 265 390 20670 2809 14045 6084 30420
53 83 3 159 249 13197 2809 8427 6889 20667
53 93 1 53 93 4929 2809 2809 8649 8649
58 63 1 58 63 3654 3364 3364 3969 3969
58 68 2 116 136 7888 3364 6728 4624 9248
58 73 1 58 73 4234 3364 3364 5329 5329
58 78 6 348 468 27144 3364 20184 6084 36504
58 83 1 58 83 4814 3364 3364 6889 6889
58 88 2 116 176 10208 3364 6728 7744 15488
58 93 1 58 93 5394 3364 3364 8649 8649
63 58 2 126 116 7308 3969 7938 3364 6728
145
X Y f fX fY fXY X2 fX2 Y2 fY2

63 68 1 63 68 4284 3969 3969 4624 4624
63 73 4 252 292 18396 3969 15876 5329 21316
63 78 2 126 156 9828 3969 7938 6084 12168
63 88 1 63 88 5544 3969 3969 7744 7744
68 63 1 68 63 4284 4624 4624 3969 3969
68 68 1 68 68 4624 4624 4624 4624 4624
68 73 2 136 146 9928 4624 9248 5329 10658
68 78 2 136 156 10608 4624 9248 6084 12168
68 83 3 204 249 16932 4624 13872 6889 20667
68 88 1 68 88 5984 4624 4624 7744 7744
Σ= 91 4748 6863 358289 255894 523809
De donde obtenemos los valores para calcular el coeficiente de correlación:
N = 91
ΣfX = 4,748 = ΣX
ΣfY = 6,863 = ΣY
ΣfXY =358,289 = ΣXY
ΣfX2 = 255,894 = ΣX2
ΣfY2 = 523,809 = ΣY2
Recordemos que, en general, ΣfX = ΣX. De manera que estos son los valores que
se utilizan para los cálculos siguientes.
Ya podemos calcular el coeficiente de correlación de Pearson.
rP = ((NΣXY)–(ΣXΣY))/(((NΣX2)–( ΣX)2)((NΣY2)–(ΣY)2))
rP = ((91358,289)–(4,7486,863))/(((91255894)–(4,748)2)((91523,809)–(6,863)2))
rP = 0.0290
Como el coeficiente es positivo, vemos que entre el examen de admisión y el
promedio general de carrera existe una correlación directa de 0.0290. En términos
psicométricos, se concluye, que en nuestro ejemplo, el examen de admisión tiene
un poder predictivo del 2.90% sobre el promedio general de carrera. Observemos
que se trata de un índice de validez realmente pobre, pero probar su significación
ya es un asunto de la inferencia estadística.
Respuesta
De la masa de datos del Ejercicio 3.5 sabemos que:
XMIN = 37; XMAX = 70; YMIN = 56; YMAX = 94.
Pero aquí estamos trabajando con una distribución intervalar, en la que tomamos
los puntos medios, por lo que los puntajes extremos son:
Y son estos los que representaremos en la gráfica. Entonces, utilizando la
distribución de frecuencias bivariable, tenemos:
146

Respuesta
Comenzamos por calcular los parámetros de la recta:
Calculamos la pendiente:
b = ((NXY)–(XY))/((NX2)–(X)2)
b = ((91358,289)–(4,7486,863))/((91255,894)–(4,748)2)
b = 0.03
Ahora calculamos el intercepto:
a = (Y–(bX))/N
a = (6,863–(0.034,748))/91
a = 73.85
Disponiendo de los parámetros de la recta, calculamos los valores esperados (Yc)
para los valores extremos de X:
XMIN = 38 XMAX = 68
Yc(X=38) = 73.85+(0.0338) Yc(X=68) = 73.85+(0.0368)
Yc(X=38) = 74.99 Yc(X=68) = 75.89
Con estos dos valores se ubica la recta de tendencia (Yc) como se muestra en el
dispersigrama anterior.
d) José es el sujeto número 33 de la masa de datos, obtuvo los puntajes (48, 94). Calcule el valor
esperado (predicción) que debería haber obtenido como promedio general de carrera, calcule su
regresión e interprete el resultado.

147
Respuesta
El puntaje obtenido por José en el examen de admisión fue de 48, por tanto:
X(José) = 48
Yc(José) = 73.85+(0.03*48)
Yc(José) = 75.29
Esto es, conforme al desempeño de José en el examen de admisión (variable
predictora), el valor esperado para el promedio general de carrera es de Yc = 75.29:
sin embargo, el valor observado fue de Yo = 94. En consecuencia, su regresión es:
REGRESIÓN(José) = 94.00-75.29
REGRESIÓN(José) = 18.71
Esto significa que José desempeñó en la carrera 18.71 puntos por encima de lo que
predijo el examen de admisión.

EJERCICIO 11.4
Para evaluar la validez predictiva de un test de inteligencia emocional sobre el desempeño en el
puesto en mediadores judiciales se definió:
X ≡ Puntaje de inteligencia emocional
Y ≡ Puntaje de desempeño en el puesto.
Se midieron las variables y se obtuvieron los siguientes datos:
Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
X 114 102 118 125 109 101 117 119 115 122 117 121 109 116 117
Y 88 76 92 86 77 72 80 88 73 86 75 86 76 79 83
Respuesta
Construimos la tabla de cálculo directamente de la masa de datos;
Sujeto X Y XY X2 Y2
1 114 88 10032 12996 7744
2 102 76 7752 10404 5776
3 118 92 10856 13924 8464
4 125 86 10750 15625 7396
5 109 77 8393 11881 5929
6 101 72 7272 10201 5184
7 117 80 9360 13689 6400
8 119 88 10472 14161 7744
9 115 73 8395 13225 5329
10 122 86 10492 14884 7396
11 117 75 8775 13689 5625
12 121 86 10406 14641 7396
13 109 76 8284 11881 5776
14 116 79 9164 13456 6241
15 117 83 9711 13689 6889
Σ = 1722 1217 140114 198346 99289
148
Disponiendo de los valores necesarios, pasamos a aplicar la fórmula:

rP = ((NΣXY)–(ΣXΣY))/(((NΣX2)–( ΣX)2)((NΣY2)–(ΣY)2))
rP = ((15140,114)–(1,7221,217))/(((15198,346–(1,722)2)((1599,289)–(1,217)2))
rP = 0.6678
Encontramos que la correlación es positiva, por lo que se concluye que el test de
inteligencia emocional tiene un poder predictivo del 66.78% sobre el desempeño en
el puesto de mediador judicial.
Respuesta
De la masa de datos tenemos:
Y construyendo el dispersigrama:

Respuesta
Calculamos la pendiente:
b = ((NXY)–(XY))/((NX2)–(X)2)
b = ((15140,114)–(1,7221,217))/((15198,346)–(1,722)2)
b = 0.61
El intercepto:
a = (Y–(bX))/N
a = (1,217–(0.611,722))/15
a = 11.11
Ahora calculamos las Yc para los valores extremos de X:
XMIN = 101 XMAX = 125
149
Yc(X=101) = 11.11+(0.61101) Yc(X=125) = 11.11+(0.61125)

Yc(X=101) = 72.72 Yc(X=125) = 87.36
Con estos dos valores se ubica la recta de tendencia, que queda como se muestra
en la gráfica anterior.
d) María es el sujeto número 5 de la masa de datos. Calcule su regresión e interprete el resultado.
Respuesta
En la masa de datos vemos que María obtuvo un puntaje de 109 en inteligencia
emocional y uno de 77 en el desempeño del puesto. Calculamos su valor esperado
(predicción):
X(María) = 109
Yc(María) = 11.11+(0.61109)
Yc(María) = 77.60
Esto es, conforme a su puntaje de inteligencia emocional, se predijo que María
tendría un puntaje de 77.60 en el desempeño del puesto; pero el puntaje que
realmente obtuvo (el valor observado) fue de Yo = 77. En consecuencia, su
regresión es:
REGRESIÓN = Yo-Yc
REGRESIÓN(María) = 77.00-77.60
REGRESIÓN(María) = -0.60
Esto significa que María desempeñó en su puesto como mediadora judicial 0.60 por
debajo de lo esperado. La diferencia (que es un error de predicción) es tan pequeña
que probablemente podría despreciarse, pero probar la significación de la diferencia
es un tema avanzado de estadística inferencial. En este curso llegamos hasta la
descripción.


EstadisticaDescriptiva V2020

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

EstadisticaDescriptiva V2020

Cargado por

Copyright:

Formatos disponibles

Estadística Descriptiva en

Ciencias del Comportamiento

Universidad Autónoma del Estado de México

En este capítulo me propongo clasificar a los hombres, según sus capacidades, en

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

lección. Se sugiere permitir que el alumno pueda consultar cualquier material

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

ESTRUCTURA DEL CURSO

Medida estadística Parámetro

3. Masa de datos Tamaño

4. Organización de datos Ordenación Ascendente

Dimensión Una variable

Datos puntuales Frecuencia simple (polígono)

Datos intervalares Frecuencia simple (histograma)

10. Forma Sesgo

Los números indican lecciones

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

LECCIÓN 1. UN BOSQUEJO HISTÓRICO

resultan transportables. Así imaginamos el origen de la estadística. Este ejercicio

estadística al más alto grado de amplitud, sistematización, perfección y aplicación

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

13. Kaspar Neumann (1648-1715), vicario de Santa María Magdalena en Breslau, a

grande de ensayos, cualquier distribución de probabilidad se aproxima a la

e introdujo la estadística como método de análisis de datos.

Distribución F (llamada así en honor a su apellido), que permite probar hipótesis en

16.¿Qué aplicaciones hizo Galton de la estadística a la psicología?

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

LECCIÓN 2. NOCIONES BÁSICAS

FIGURA 2.1. ESTRUCTURA DE LA ESTADÍSTICA Y LA PROBABILIDAD

2. Veamos, en principio, algo obvio: tanto la probabilidad como la estadística

grupos de datos para describir sus características y para tomar decisiones en

FIG. 2.2. INFERENCIA VERSUS PROYECCIÓN

años en cierta región; a partir de estos datos, aplicando técnicas de proyección

FIG. 2.3. EL PROCESAMIENTO ESTADÍSTICO DESCRIPTIVO

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

15. En la figura 2.3 se representa un mapa conceptual del procesamiento estadístico

la propiedad (que es variable) llamada inteligencia.

12.¿En qué consiste el cálculo de medidas estadísticas?

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

LECCIÓN 3. LA MASA DE DATOS

FIG. 3.1. LA OBTENCIÓN DE LA MASA DE DATOS

2. Consideremos un ejemplo. Nos interesa conocer el cociente de memoria de un

FIG. 2. 2. EL MODELO EPS APLICADO A LA ESTADÍSTICA DESCRIPTIVA

Hasta aquí no ha intervenido en absoluto la estadística. Todos los procesos

(selección de sujetos, definición operacional y medición de la variable, etc.)

6. Conviene observar desde aquí, para cuando se estudie la estadística inferencial

MASA DE DATOS Y NÚMERO DE VARIABLES

indica los datos correspondientes al primer elemento de la masa de datos.

11.¿Qué medidas de la masa de datos pueden obtenerse cuando se tienen

a) ¿En qué nivel se midió la variable? Justifique su respuesta.

a) ¿En qué nivel se midió la variable? Justifique su respuesta.

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

3.3. En un estudio realizado en 2001 por la Unidad de Recursos Humanos de la

a) ¿En qué nivel se midió la variable? Justifique su respuesta.

3.4. En 2001 el Departamento de Personal midió el cociente intelectual en los

a) ¿En qué nivel se midió la variable? Justifique su respuesta.

3.5. Para estudiar la validez predictiva de un examen de admisión sobre el

Estadística descriptiva en ciencias del comportamiento Adolfo López Suárez

LECCIÓN 4. ORGANIZACIÓN DE DATOS