Está en la página 1de 141

UNIVERSIDAD NACIONAL DE FORMOSA

FACULTAD DE HUMANIDADES

PSICOPEDAGOGÍA

NOTAS DE CÁTEDRA DE PSICOESTADÍSTICA

AÑO 2017

1
Introducción

El presente material tiene como objetivo brindar al alumno de Psicopedagogía, las


herramientas básicas de la Estadística que se ajustan a las necesidades de los estudiantes
y de los futuros profesionales de la educación, los cuales deberán cubrir una demanda
en permanente crecimiento.
Algunas de las razones más inmediatas que justifican la presencia de Psicoestadística
en la carrera Psicopedagogía son: en primer lugar, la existencia de materias en la
carrera que requieren que se conozca Estadística básica, como por ejemplo,
Metodología de la Investigación y Técnicas de Exploración Psicopedagógica I y II . Y
en segundo lugar, quienes se dediquen al ejercicio profesional aplicarán técnicas e
intervención en sus distintos campos de especialización, y esas técnicas están basadas
en la teoría y también en el estado del conocimiento en un momento dado. Esto
último se refiere específicamente al hecho de considerar y asumir que ningún
conocimiento, teoría o resultado de un proceso de investigación, es exhaustivo y
mucho menos posee perpetuidad. Es por ello que muchas investigaciones refutan los
resultados de otras y éstas a su vez son “actualizadas” a partir de una revisión o un
nuevo proceso de intervención o de desarrollo del conocimiento científico. Y es
justamente aquí donde la Estadística juega un rol importante.
Si observamos un caso en que una persona se enfermó luego de tomar un
medicamento, no significa que estamos autorizados a solicitar que se saque de la venta
al público dicho medicamento. Por el contrario, la evidencia a la que nos referimos
es la que se obtiene con procedimientos cuidadosos de observación, registro,
comparación, medición y análisis, en pocas palabras, con investigación. Y justamente
es la Estadística la que se encarga de este proceso, donde se recolectan datos, de
organizan, presentan y analizan para obtener resultados que nos permita tomar
decisiones lógicas.
Asimismo, la Estadística es parte de nuestra formación cultural y general, ya no es un
objeto de estudio limitado a ciertos campos del conocimiento. Prueba de ello es, por

2
ejemplo, que todas las carreras que se dictan en nuestra Universidad tienen alguna
asignatura relacionada con la Estadística.
La Estadística como conocimiento cultural, nos permite ser Ciudadanos
Estadísticamente Cultos, esto significa, tomar decisiones basados en información
proveniente de un proceso de conocimiento científico y no en apreciaciones,
sensaciones o subjetividades.
En todo momento de nuestra vida estamos tomando decisiones, desde elegir una
prenda de vestir en un local comercial, pedir un postre en un restorán, hasta formar
una opinión acerca de una persona de la cual disponemos de datos provenientes de
distintas fuentes, incluso de nuestro propio conocimiento.
El ejercicio de aplicar las etapas del método estadístico nos prepara para pensar de
una manera diferente, efectuar acciones donde las emociones o sensaciones si bien,
no están ausentes, no constituyen el motivo central de nuestras decisiones.
Por todo lo expresado hasta aquí proponemos este material que pretende acercar al
alumno de Psicopedagogía a los objetivos propuestos en el plan de estudios de la
carrera como así también en la propuesta didáctica de la cátedra.
Se revisaron los temas prioritarios y los que ya no lo son, como así también la forma
de abordar dichos contenidos de la manera más significativa posible, usando ejemplos
propios de la carrera como así también de la vida cotidiana, eligiendo las fórmulas y
definiciones de la manera más sencilla de ser entendidas y secuenciar los temas para
evidenciar una continuidad, una relación y sobre todo una integración de los mismos,
para que de esta manera, el estudiante comprenda que ninguna unidad está aislada del
resto.
Esperamos que puedan sacarle el máximo provecho a este texto, como así también,
identificar los errores que puedan existir comentado a los autores, dichas
observaciones, dado que asumimos en todo momento que este material no es
exhaustivo ni completo, en consecuencia la lectura del mismo no implica que sea
suficiente material de estudio, debiendo recurrir en muchas ocasiones a otros libros
de textos para completar el proceso de estudio.

3
Capítulo 1: Recolección, organización y presentación de datos

Etapas de la Estadística

En nuestra materia vamos a conceptualizar a la Estadística como la ciencia que se


encarga de recopilar, organizar, presentar y analizar datos provenientes de una
población o muestra con el objetivo de interpretar los resultados que se desprenden
de este proceso.
Este análisis estadístico comprende varias etapas y en cada una de ellas se fijan
objetivos claros que puedan ser luego comprobados.
Pero veamos los conceptos preliminares para entender mejor y diferencias las
diferentes etapas del método estadístico.

Población y muestra

Se denomina población al conjunto de individuos u objetos en los cuales un


investigador está interesado y que comparten al menos una característica en común.
En cambio, cuando se considera solamente un conjunto de individuos que componen
una parte representativa de la población, se dice que se está trabajando con una
muestra.
Una población puede ser finita o infinita. Una población finita es aquella que puede
ser físicamente listada.
Una población puede ser definida como los alumnos regulares de la Facultad de
Humanidades y, en ese caso, pueden ser listados e individualizados todos los
elementos que constituyen esa población.
Una población puede estar definida como las hectáreas sembradas con soja en un
campo experimental, las temperaturas diarias mínimas durante un año en una cierta
localidad, los niños con problemas visuales en un determinado radio escolar, etc.
Todos ellos son ejemplos de poblaciones finitas.

4
Pero, en la investigación biológica o epidemiológica, la mayoría de las poblaciones
con las cuales se trabaja son consideradas infinitas a causa de la imposibilidad física de
listar todos sus elementos. Así, si se considera la población de un determinado insecto
que ataca a un cierto cultivo o la población formada por las personas infectadas con
el virus de la hepatitis A o la población constituida por las vacas de una cierta raza
productora de leche, etc., todos ellos son ejemplos de poblaciones infinitas y, por lo
tanto, hipotéticas.
Luego, una población infinita es aquella que, en la práctica, no puede ser físicamente
listada.
Supongamos que el objetivo de una investigación consiste en estudiar la presión
arterial de niños varones de edades entre 5 y 10 años. Para ello se toma una muestra
de 30 niños y a cada uno se le mide tal característica. Tendremos así un registro
con 30 datos.
Una serie de datos estadísticos es un conjunto de mediciones efectuadas a un cierto
número de individuos, objetos, etc.
Esos individuos u objetos podrían ser de origen muy variado y depende del tipo de
estudio que se esté realizando.
Estos individuos a menudo son llamados unidades de observación, de análisis
estadísticas o experimentales.
En el ejemplo citado, cada niño es una unidad de observación. En cambio, si
quisiéramos estudiar el gasto anual promedio de las escuelas de Formosa, cada escuela
sería una unidad de observación.
Si un Ingeniero forestal desea estudiar el crecimiento de una especie de lapacho y
toma para ello una muestra de diez ejemplares, cada árbol elegido sería una unidad
de observación.
Como se puede apreciar, entonces, cada unidad de observación, de análisis o
simplemente cada individuo no tiene que ser siempre una persona.
En algunos estudios es necesario elegir cuidadosamente cada sujeto o unidad de
análisis, porque se desea controlar ciertos factores y poder así comparar el efecto de

5
éstos con una respuesta que viene dada por la interacción entre los factores y el sujeto.
Estos estudios se llaman experimentales y existe una parte de la estadística dedicada
a los Diseños de Experimentos.
En los diseños de experimentos, cada unidad se denomina unidad experimental, pero
el significado es prácticamente el mismo comparado con la unidad de observación.
Tenemos que pensar que es esa unidad que nos da el dato que necesitamos, que puede
ser una valor de peso, talla, temperatura, diámetro, o bien el color, la raza, la especie,
etc.

Estadística descriptiva y Estadística inferencial

Si el objetivo del análisis estadístico es simplemente explorar, describir o caracterizar


un conjunto de datos, sin importar si dicho conjunto constituye una población o una
muestra, este análisis solo requiere de herramientas provistas por la Estadística
Descriptiva. Ahora bien, si el investigador, quiere estudiar las características de una
población pero por imposibilidad física o económica solo puede contar con una
muestra (como sucede casi siempre), necesitará de estrategias de análisis más
avanzadas las cuales forman parte de la Estadística Inferencial. En concepto clave de
esta etapa de la Estadística es el de probabilidad, el cual lo estaremos estudiando en
capítulos posteriores.

Datos, variables y escalas de medición

Una unidad de observación o unidad experimental es aquella sobre la cual se efectúan


mediciones o se intenta clasificar en categorías.
Las unidades de observación pueden ser personas o grupos de personas como familias,
viviendas, etc. También pueden ser objetos tales como células sanguíneas, plantas,
animales, tornillos, etc.

6
En el proceso de observación se registra, para cada unidad experimental alguna
característica y esta observación constituye un dato.
Por ejemplo, si el objetivo de una investigación consiste en realizar un estudio sobre
ingresos familiares, la unidad de observación podría ser la familia, entendiéndose por
ella a un grupo de personas que habitan juntas y comparten la comida.
El ingreso familiar medido sobre cada unidad de observación (familia), es un dato.
El conjunto de datos obtenidos de cada unidad de observación constituirá la base para
el análisis estadístico del ingreso familiar.
Una variable es cualquier característica que varía de una unidad experimental a otra
en la población o en la muestra.
Las variables pueden clasificarse en dos grandes grupos: variables cualitativas o
categóricas y variables cuantitativas o numéricas.
Las personas pueden ser clasificadas de acuerdo al color de sus cabellos como rubios,
morochas o pelirrojas. Las plantas pueden ser clasificadas en hierbas, arbustos,
árboles, etc. Las rocas pueden ser clasificadas en sedimentarlas, ígneas o
metamórficas. En cada uno de estos ejemplos, los miembros de la población en
estudio (personas, plantas, rocas) son clasificadas en categorías.
Los ejemplos planteados son ejemplos de variables categóricas.
Las variables categóricas son aquellas que están definidas por las clases o categorías
que las componen.
Las categorías pueden ser naturales como al definir la variable sexo o arbitrarias como
la clasificación de alturas de plantas en bajas, medianas y altas.
Las variables categóricas también reciben el nombre de variables cualitativas.
La clasificación más simple para este tipo de variable es aquella que tiene sólo dos
categorías. La caracterización se debe a la presencia o ausencia de una cualidad dada.
Por ejemplo, una persona puede o no estar empleada, una planta puede o no tener
flores, etc.
Las variables generadas por la forma presencia- ausencia de una categoría, se llaman
dicotómicas o binarias.

7
Si el objetivo de una investigación en particular consiste en estudiar la relación entre
el sexo y el nivel de ocupación de personas residentes en una cierta comunidad, ambas
variables de interés son variables categóricas.
Las categorías de las variables de interés para el investigador podrían ser:

Sexo: Varón, Mujer.


Nivel de ocupación: Obrero, Empleado, Profesional, Comerciante,
Industrial, Otros.

Otro tipo de variables son las variables numéricas.


Las variables numéricas son aquellas que, como su nombre lo Indica, se expresan por
un número.
Se debe distinguir aquí entre un número que se obtiene simplemente por conteo y un
número que resulta de efectuar mediciones. Así, se puede efectuar una nueva
clasificación en variables numéricas discretas y continuas.
Las variables que surgen como conteos o por asignación de ciertos códigos numéricos
a las categorías de las variables cualitativas se denominan variables discretas.
Algunos ejemplos de variables discretas son: cantidad de árboles frutales atacados por
un gusano en cada parcela, cantidad de vacas vacunadas contra una cierta enfermedad
por establecimiento rural, espigas por planta, cantidad de alumnos repitentes por
colegio, cantidad de personas por vivienda, etc.
Las variables discretas sólo toman un número finito de valores, generalmente valores
enteros.
Las variables que surgen de mediciones efectuadas sobre cada unidad experimental
(personas, animales, etc.), se denominan variables continuas.
Las cantidades tales como el coeficiente intelectual, peso de materiales o
temperaturas medias mensuales son ejemplos de variables continuas.
Una variable continua puede tomar infinitos valores en un rango dado.

8
Supongamos, por ejemplo, que un odontólogo plantea como objetivo de su
investigación determinar la eficiencia de un programa de salud.
Le interesa particularmente estudiar, en una determinada zona escolar, la relación
entre la edad de los niños y la cantidad de piezas dentarias obturadas.
La edad de los niños puede ser expresada en años, meses, días, etc. por lo cual es un
ejemplo típico de variable continua.
En cambio, la variable cantidad de piezas obturadas surge de realizar un conteo en la
boca de cada uno de los niños y sólo puede tomar valores enteros. Esta es, luego, una
variable discreta.

Escalas de medición

Una medición consiste en el establecimiento de números o códigos a las observaciones


mediante el empleo de una escala apropiada.
Una escala se puede definir como un instrumento de medición.
Las escalas de medición se diferencian por propiedades de orden y de distancia.
S.S. Stevens (1946) desarrolló una clasificación para las escalas de medición en:
nominal, ordinal, de intervalo y de razón.
Es importante destacar que ésta no es la única clasificación que existe, pero es la que
adoptaremos en este curso.
Escala nominal: Es aquella en la que no se hace ningún supuesto respecto de las
relaciones que existen entre los valores de las variables. Cada valor se asigna a una
categoría diferente, la que se define mediante un nombre.
Por ejemplo, el lugar de nacimiento de una persona es una variable medida en escala
nominal. Aunque las ciudades pueden ser ordenadas según su tamaño, densidad de
población, grado de contaminación del aire, etc., en general, la variable, "lugar de
nacimiento" no tiene un orden prestablecido.
Cuando los valores de las variables se asignan a categorías nomina- les, las propiedades
numéricas tales como tamaño relativos, suma, multiplicación, etc., no pueden ser

9
aplicadas. Es por ello que el tratamiento estadístico, que supone orden o distancia
numérica entre los valores de la variable considerada, no produce una información
útil sobre las variables nominales.
Otros ejemplos de variables nominales son: sexo, tipo de religión, establecimiento
escolar, medicina que le fue administrada, etc.
Escala ordinal: Es aquella que surge al ordenar todas las categorías de las variables
de acuerdo a algún criterio.
Por ejemplo, clasificar a las personas de acuerdo a su máximo nivel de instrucción
alcanzado en: primario, secundario, universitario, etc., constituye un orden en la
clasificación. El nivel socioeconómico puede ordenarse como alto, medio y bajo. Los
empleados pueden clasificarse en obreros, supervisores, gerentes, etc.
En estos casos lo único que sabemos es que el nivel de instrucción secundario es
superior al primario y que el universitario es superior al primario y al secundario.
Que el nivel socioeconómico alto implica un ingreso mayor que el nivel bajo y que
un gerente tiene mayor jerarquía laboral que un obrero.
No obstante, en ningún caso sabemos con certeza cuanto "mayor" es una categoría
de la variable respecto a otra pues no existe una medición de distancia. El orden es
simplemente una propiedad matemática aplicable a este tipo de escala de medición y
por lo tanto el uso de valores numéricos no implica que todas las propiedades de los
números puedan aquí ser consideradas.
Un caso especial surge cuando en la escala de orden existe cierto acuerdo respecto a
la distancia que separa una categoría de otra. Por ejemplo, al considerar el grado de
conformidad de un individuo respecto a alguna situación en particular y la variable de
respuesta se mide como: "muy conforme", "conforme", "indiferente",
"disconforme", "muy disconforme", algunos consideran a esta escala de medición
como ordinal y otros como intervalar, dado el punto cero convencional (indiferente).
Escala de intervalo: Es aquella que tiene la propiedad de asignar una medición de
distancia entre los valores de la variable. Entonces, cuando se dice que un objeto es
mayor que otro, se puede especificar cuantas unidades de diferencia hay entre ambos

10
o por cuantas unidades un objeto es mayor que el otro. Por ejemplo, con la medición
de intervalo es posible decir no sólo que Pedro gana más que Juan sino también se
puede decir que Pedro gana 10.000 pesos más que Juan.
Una característica de la escala de intervalo es que el punto de origen o punto cero en
la escala de medición es un punto de acuerdo o punto convencional. Además la razón
entre dos intervalos (distancia) es independiente de las unidades de medición.
Esto quiere decir que si bien Pedro puede ganar el doble que Juan ello no implica
automáticamente que es el doble de rico. Intervienen muchas otras variables como el
número de miembros de la familia, pago de alquiler o vivienda propia, etc.
Otras variables que se pueden medir con escala de intervalo son: altura, temperatura,
tiempo, riqueza e inteligencia. En todos estos casos es posible hacer comparaciones
de distancia entre mediciones pero no entre sus magnitudes proporcionales.
Vemos que en todos los ejemplos mencionados el punto cero o punto de origen, es
convencional. Un termómetro, por ejemplo, mide la tempera
tura en grados que son del mismo tamaño en cualquier punto de la escala. La
diferencia entre 20° C y 21° C es la misma que entre 5° C y 6° C. Sin embargo en
esta escala de intervalo el punto de origen o punto cero es en realidad un punto de
acuerdo.
Cuando se dice que una montaña mide 100m simplemente se indica que ella se
encuentra 100m por encima del nivel del mar o punto de origen de esta escala.
En síntesis, la escala de medida de intervalo permite estudiar diferencias entre valores
de la variable, pero no respecto de sus magnitudes proporcionales.
Escala de razón: Es aquella que presenta todas las propiedades de orden y distancia
de una escala de intervalo adicionando el punto "O" o punto de origen. Peso, estatura
y medidas de distancia, que tienen un cero natural y que son medibles con escalas
racionales, son ejemplos de este tipo de escala.
En las ciencias del comportamiento, pocas situaciones satisfacen los requerimientos
de las escalas racionales. En administración y economía, en cambio, hay ejemplos:
valores monetarios, población, tasas de recuperación, etc.

11
En una escala de razón, al igual que en una escala de intervalo, las unidades de medidas
son equidistantes unas de otras con la única diferencia que, en las escalas de razón,
existe un punto cero correctamente definido.
En cualquier distancia física entre objetos, medida en metros o centímetros, existe
una distancia cero definida como la total ausencia de distancia entre ellos. La
existencia de un punto cero definido implica que se pueden efectuar comparaciones
proporcionales.
Debido a que la escala de razón satisface todas las propiedades de los números reales,
cualquier operación matemática apropiada para números reales puede ser aplicada a
una escala de este tipo.
Por último, la distinción entre nominal, ordinal, de intervalo y de razón tiene más
importancia que la mera información académica. El tipo de escala de medición que se
utiliza al medir una variable condiciona el tratamiento estadístico que se efectuará a
los datos.

Organización de datos en tablas de distribución de frecuencias

Cuando se trabajan con datos cualitativos, existen categorías que se repiten varias
veces para un mismo conjunto de datos. Lo mismo puede pasar para las variables
cuantitativas, habrá valores que aparecerán más de una vez en la distribución.
La cantidad de veces que se repite una categoría o un valor de la variable se denomina
frecuencia absoluta.
Una tabla de distribución de frecuencia es aquella que asigna a cada categórica o valor
de la variable, el número de veces que se repite, es decir, su frecuencia absoluta.
Una tabla de distribución de frecuencias puede ser simple o con intervalos de clase.
Una tabla simple se utiliza para variables cualitativas o bien cuantitativas discretas. La
tabla con intervalos se emplea para variables continuas o discretas de gran recorrido.

12
Organización de datos categóricos

Cuando se tiene una gran cantidad de datos, el primer paso consiste en ordenarlos en
una tabla que consta de dos columnas, la primera de ellas conteniendo la identificación
de la unidad de observación y la segunda el dato correspondiente a dicha unidad.
Por ejemplo, si en una muestra de alumnos hacemos una encuesta acerca de la opinión
de los mismos respecto a un curso de RCP (Reanimación Cardio Pulmonar) realizado
en la escuela, las opciones serán, Excelente, Muy Bueno, Bueno, Regular, Malo, Muy
Malo y luego de realizar el conteo podemos confeccionar la siguiente tabla:

Opinión Frecuencia
Excelente 27
Muy Bueno 35
Bueno 15
Regular 3
Malo 2
Muy Malo 2
TOTAL 84

Organización de datos cuantitativos

Para ordenar datos de una variable cuantitativa se debe observar primeramente si ésta
es discreta o continua. Si es discreta, los datos se ordenan de una tabla simple,
contando las veces que se repite cada valor teniendo así la frecuencia absoluta (fi). A
partir de esta frecuencia se generan otras columnas de la tabla que contienen
información adicional.
Los siguientes valores corresponden a la cantidad de frutos por planta de una cierta
especie.
3 3 5 4 3 6 7 8 7 7
5 6 5 3 3 4 5 6 5 5

Ordenamos los valores y a continuación se coloca las correspondientes frecuencias


absolutas.

13
X fi Fa fr fra
3 5 5 0,25 0,25
4 2 7 0,1 0,35
5 6 13 0,3 0,65
6 3 16 0,15 0,8
7 3 19 0,15 0,95
8 1 20 0,05 1

Las frecuencias acumuladas se obtienen sumando frecuencias absolutas para cada valor
de la variable. Aquí por ejemplo se puede interpretar que hay 13 plantas que tienen
5 frutos o menos.
La frecuencia relativa correspondiente a cada frecuencia absoluta se obtiene
dividiendo esta última por n, es decir, el total de observaciones.
𝑓𝑖
𝑓𝑟𝑖 =
𝑛
Si se desea interpretar esta frecuencia como porcentaje, solo se debe multiplicar la
expresión anterior por 100.
Cuando necesitemos ordenar datos de una variable continua, debemos hacerlo en una
tabla de frecuencias con intervalos de clase. Esto es así debido a que este tipo de
variable puede tomar infinitos valores en un intervalo cualquiera, por lo tanto, una
tabla simple podría llegar a tener un gran número de filas, con lo cual, la utilidad de
la tabla, que es ordenar los datos para una presentación óptima, no se estaría
cumpliendo.
Para confeccionar una tabla con intervalo debemos primeramente hallar en rango (R)
de la variable, es decir la diferencia entre los valores máximo (Xmáx) y mínimo (Xmín)
que ésta asume, luego se divide este rango por la cantidad de intervalos elegida que
puede ser entre 5 y 15. Redondeando convenientemente ese cociente se lo toma
como amplitud del intervalo (h).
De esta forma cada intervalo tendrá un límite inferior (Li) y uno superior (Ls) y se
deberá optar por tomar un intervalo semi cerrado a la derecha o semi cerrado a la
izquierda, los que respectivamente se simbolizan [Li – Ls) y (Li – Ls].

14
Veamos un ejemplo para afianzar este procedimiento.
Los siguientes datos corresponden a la variable perímetro cefálico de niños recién
nacidos. Las medidas están en cm.
34,8 34,0 34,1 34,2 34,4 33,0 35,0 35,9 36,2 36,2
34,8 34,0 34,1 34,5 34,9 33,0 35,0 35,5 36,5 37,2
34,0 32,0 32,7 33,5 33,7 35,0 33,0 34,0 34,4 35,1
34,0 32,0 32,7 32,9 33,0 34,5 36,0 36,7 37,2 38,0
35,0 35,0 35,8 35,8 36,2 34,9 33,0 33,5 33,7 33,8

Vamos a construir una tabla con 7 intervalos de clase.


Para ello comenzamos con hallar el rango:
R = 38 – 32 = 6cm
Luego, la amplitud
6
ℎ= = 0,85714 ≈ 0,9
7
Elegimos intervalos cerrados a la derecha y el Li del primer intervalo será Xmín.
Li = 32
Por lo tanto el primer intervalo será [ 32 – 32,9), el segundo [32,9 – 33,8) y así
sucesivamente.
La tabla con intervalos queda entonces de la siguiente manera

Clase (cm) fi fa fr fra


32 - 32,9 5 5 0,1 0,1
32,9 - 33,8 10 15 0,2 0,3
33,8 - 34,7 12 27 0,24 0,54
34,7 - 35,6 11 38 0,22 0,76
35,6 - 36,5 8 46 0,16 0,92
36,5 - 37,4 3 49 0,06 0,98
37,4 - 38,3 1 50 0,02 1
50 1

La representación gráfica de esta tabla es el siguiente histograma de frecuencias


absolutas con el polígono correspondiente, el cual se logra uniendo los puntos medios

15
de cada intervalo incluyendo dos intervalos de frecuencia cero que están situados
después del último y antes del primero.

12

10
frecuencia absoluta

0
31,10 32,00 32,90 33,80 34,70 35,60 36,50 37,40 38,30 39,20
PC (cm)

En el eje de las ordenadas también se pueden representar la frecuencia acumulada, la


relativa y la relativa acumulada. En el caso de la fa, al histograma se le asocia una curva
llamada ojiva y que se obtiene uniendo todos los límites inferiores y el último límite
superior.

50

40
frec. abs. acumulada

30

20

10

0
31,10 32,00 32,90 33,80 34,70 35,60 36,50 37,40 38,30 39,20
PC (cm)

Esta ojiva nos permite también representar todas las fractilas. Por ejemplo si
queremos calcular el P60 debemos elegir la frecuencia relativa 0,60 y luego, desde allí,

16
trazar una recta horizontal que intersecte la curva. La abscisa de ese punto de
intersección es el P60.
1,00

0,80
frec. rel. acumulada

0,60

0,40

0,20

P60
0,00
31,10 32,00 32,90 33,80 34,70 35,60 36,50 37,40 38,30 39,20
PC (cm)

17
Presentación de datos
La afirmación “una imagen vale más que mil palabras” se puede aplicar al
ámbito de la estadística descriptiva diciendo que “un gráfico bien elaborado vale más
que mil tablas de frecuencias”.
Porque valoramos más fácilmente una idea por medio de un gráfico que de una
exposición con cifras. Descubriremos en los gráficos, un medio eficaz y simplificado
de comunicación, que nos evita esfuerzos de memoria e imaginación, y facilita la
reflexión y la síntesis.
Una vez efectuado el análisis estadístico, un gráfico será la forma de expresar
el resultado, de manera que el fenómeno en estudio pueda ser apreciado en forma
rápida y completa.
Aunque el empleo de gráficos pueda no ser suficiente para realizar un análisis
completo, nos permite captar a primera vista el conjunto de un fenómeno, deducir
sus peculiaridades y orientarnos en investigaciones más profundas.
El objetivo de este trabajo es mostrar los criterios y normas mínimas que
deben verificarse para construir y presentar adecuadamente los gráficos en el ámbito
de la estadística.
Debemos tener cuidado con la lectura de un gráfico, ya que parece sencilla
y al alcance de todos, no obstante, es necesario ser prudente al confeccionar o
interpretar gráficos, puesto que una misma información se puede representar de
formas muy diversas, y no todas ellas son pertinentes, correctas o válidas, lo cuál
indica que hace falta un cierto aprendizaje.
Este trabajo garantiza el aprendizaje necesario para alertar al lector no
familiarizado con los gráficos sobre situaciones tendenciosas que facilitan las malas
interpretaciones.
Sin duda alguna, nos adentraremos por este mundo de gráficos con facilidad,
adquiriendo los conocimientos necesarios para distinguir las diferentes categorías que
existen y los medios para una elección adecuada sobre la forma de representación
de los datos, teniendo en cuenta la naturaleza del fenómeno en estudio.

Presentación estadística de datos

Necesidad

Los datos estadísticos deben ser presentados en forma efectiva, tanto como
una ayuda para el análisis como para comunicar los resultados de éste. Sin una
presentación efectiva, los datos estadísticos pierden mucho de su valor y de su
impacto.
En el análisis estadístico, la representación gráfica de los datos precede a todo
estudio, ya que mediante ella, el estadístico se forma opinión sobre el procedimiento
analítico más conveniente para encarar el estudio.

18
Importancia
Los gráficos estadísticos son medios de análisis y de estudio, y constituyen un
medio indispensable para representar esquemáticamente la realidad y proporcionar
así una base sólida de razonamiento y preparación de decisiones.
La importancia fundamental reside en que la representación gráfica de un
fenómeno estadístico permite apreciar a primera vista, el conjunto de datos o
relaciones que constituyen el motivo de estudio, permitiendo formar juicio sobre el
desarrollo y relaciones de los atributos o variables que intervienen; un gráfico
proporciona esa apreciación integral del fenómeno, que difícilmente se obtiene
cuando solamente disponemos de cuadros estadísticos que, en general, son
colecciones complejas y largas de cifras.
El estadístico necesita disponer de diversas formas de representación
gráfica, para elegir aquélla que más convenga a la naturaleza del problema.
Métodos para la presentación de datos
Representación escrita o párrafos de texto
Descripción
Este método para exponer los datos estadísticos consiste en el uso de intercalar cifras
en párrafos de texto.
Ventajas

Es posible dirigir la atención hacia determinadas cifras, haciéndolas resaltar.


Permite llamar la atención sobre las comparaciones de mayor importancia para
el investigador.
Facilita la posibilidad de obtener información adicional y detallada de los datos.
Desventajas
La combinación de cifras y texto, no es un sistema muy eficaz, ya que es
necesario leer, todo el párrafo antes de que se pueda comprender el significado de
todo el conjunto de cifras. Por lo general, al expresar los datos de esta manera no
se comprenden fácilmente y resulta difícil aislar las cifras individuales.
Al no comprenderse fácilmente, pierden eficacia al llamar la atención del
lector.
Ejemplo de representación escrita
En 1991, con una población que rozaba los 8 millones de habitantes, en el Gran
Buenos Aires eran 3 millones las personas que no tenían cobertura médica. Equivalían al
38,5% de la población.
Ahora, en cambio, el Censo marca que sobre 8,7 millones de habitantes, la gente sin

19
cobertura suma un poco más de 4,5 millones, lo que representa el 52%.
Así, en 10 años, la gente del conurbano sin protección de una obra social, mutual o
prepaga aumentó en 1,5 millón personas más. Esta es una de las razones por la que más gente
se atiende en los hospitales públicos que registran récords de consultas e internaciones.
Los más afectados por la pérdida de cobertura médica en el conurbano son los menores
de 14 años: casi el 60% no tiene cobertura médica. Pero en Moreno o en Florencio Varela
bordea el 70%.
El aumento de la gente sin planes médicos es un reflejo del empobrecimiento de la clase
media, del fuerte incremento del desempleo y de la caída de una porción de la población en la
indigencia.

Representación semitabular

Este método para exponer los datos estadísticos consiste en el uso de texto y
columnas de datos numéricos tabulados, de manera que las cifras estudiadas se
comparen con mayor facilidad.

Ventajas

Su uso es superior a la representación escrita porque resalta las cifras, lo que


no sucedería si estuvieran intercaladas en una o dos frases en el propio texto, como
es el caso de párrafos de texto.

Desventajas

Una representación semitabular es poco atractiva comparada con una


representación tabular, que es más breve y fácil de leer.

Ejemplos de representación semitabular

Cuando en un estudio se van a usar solamente unas cuantas cifras, puede


dividirse el texto, enumerándose los datos como vemos en el siguiente ejemplo (1)

a) El patrón debe instruir a su aprendiz sobre las varias operaciones del oficio para
producir finalmente un trabajador competente”. Durante los dos años de
aprendizaje debe asistir el aprendiz a los cursos de higiene y materias afines en la
universidad y obtener un certificado. La escala de jornales de un aprendiz, por una
semana de trabajo, es :
Después de 6 meses en la escuela........................ …U$S 7.50
Después de 12 meses ..........................................U$S 10.00
Después de 18 meses ..........................................U$S 12.00
Monthly Labor Review, agosto, 1935, p. 409.”regulation of Beauty Shops under Quebec Labor
Laws”

20
Representación tabular

Descripción
Una tabla estadística es un método de presentar y ordenar los datos que
han sido subdivididos por uno o más sistemas de clasificación.
Si se espera llevar la atención del lector, de la exposición de un razonamiento
hacia un cuadro, es esencial que éste no sea muy complicado, sino más bien simple
y fácil de comprender, de manera que su lectura sea amena, para evitar que los
lectores se salteen los cuadros, que es algo muy común.
Ventajas

El cuadro es claro y fácil de leer. Este método para exponer los datos
estadísticos suele ser superior al uso del texto, ya que un cuadro con su título
debe explicarse por sí mismo, aún cuando puede ir acompañado frecuentemente
de un párrafo que facilite la interpretación o que llame la atención sobre las cifras
importantes.
Se ve claramente que el cuadro es mucho más breve que el texto, puesto que
los encabezados de las columnas y el título de cada renglón elimina la necesidad de
repetir las explicaciones, puesto que las cifras aparecen sin texto, la presentación es
más concisa.
Permite presentar varios grupos de datos en un mismo cuadro. Se manejan
valores exactos.

Desventajas

Los cuadros son poco atractivos comparados con las gráficas y por ende poco
eficaces para llamar la atención del lector. Es muy probable que nos salteemos un
cuadro, no así una gráfica.
Un cuadro es más difícil de comprender que una gráfica, ya que no nos permite
tener una idea rápida de la situación general, sino de los detalles de la misma.
Pueden llegar a ser muy extensos y ocupar varias páginas.

Partes componentes de un cuadro

Introducción

Un cuadro deberá tener por lo menos cuatro partes esenciales: título,


columna matriz, encabezados de las columnas y cuerpo.
Si las cifras del cuadro no son originales, se incluye también una nota de la
fuente, acompañada a veces de una nota preliminar, pero generalmente debajo del
cuadro y de las notas al pie del mismo, si las hay.
21
Representación gráfica de las partes de un cuadro:

Título

Encabezado Encabezado principal


del Talón (Clasificación B)
(Clasificación Rótulo de la columna Rótulo de la columna (Clase B2)
A) (Clase B1)
Rótulo de la Celda Celda
Columna
matriz

fila (total de la
Clasificación
A)
Rótulo de la Celda Celda
fila (Clase A1)
Rótulo de la Celda Celda
fila (Clase A2)
Rótulo de la Celda celda
fila (Clase A3)
Notas al pie de la tabla
Notas sobre fuente u origen

Ejemplo de representación tabular con cifras porcentuales


Alumnos egresados de Universidades Nacionales Distribución porcentual según
rama de estudio Total del país año 1995

RAMA DE ESTUDIOS PORCENTAJE


Ciencias Básicas y Tecnológicas 28.4
Ciencias Sociales 37.4
Ciencias Humanas 12.2
Ciencias Médicas 22.0
Total Universidades Nacionales 100

Descripción de cada una de las partes componentes de un cuadro

a ) Número de la tabla : Nos permite citar fácilmente una tabla. Podemos numerarlas
de acuerdo a su orden de aparición en un informe. Si existe una sola tabla en el
informe, se omite su número.

b ) Título : Indica el contenido de la tabla. Usualmente se lo coloca en la parte


22
superior del cuadro. Debemos redactarlo con claridad y expresar concisamente los
datos que se presentan.
Debemos responder al menos: ¿Qué? ¿Dónde? ¿Cuándo? y ¿Cómo están clasificados
los datos?. Se deben evitar los extremos: una descripción demasiado elaborada o una
extrema brevedad que no proporciona suficiente información acerca del contenido
de la tabla. Primero se mencionan los puntos más importantes, colocando al final
cualquier explicación sobre la manera como hemos dispuesto las partidas y el período
de tiempo que comprende. Cuando un título requiere el uso de varios renglones,
empleamos un arreglo de pirámide invertida. Si el título es excepcionalmente largo,
puede ser conveniente colocar un título corto y sugestivo encima del título principal
o incluso sustituir el título completo por el título corto.

c ) Notas en el encabezado y al pie de la tabla: Una nota en el encabezado: Se coloca


cerca del título y con un tipo de letra más pequeño . No siempre son necesarias.
Proporciona información relativa a la tabla en su totalidad o respecto a una parte
importante de ésta o información adicional al título, el cuál se resumió para hacerlo
breve. Puede explicar que los datos de la tabla están basados en una muestra, puedo
calificar lo que se establece en el título o para indicar las unidades en las cuáles se
proporcionan los datos de la tabla.
Una nota al pie se usa muy a menudo para explicar las cifras individuales de una
columna o de un renglón de cifras, en particular en una tabla. Las notas relativas a las
cifras deben marcarse con una letra (a, b ,c ,d), o con un símbolo evitando de
preferencia, usar un número para ello.

d ) Nota relativa a la fuente de información: Puede ponerse abajo del título o de las
notas al pie. Los datos expuestos en un cuadro no siempre son material que ha
recopilado el investigador. Se habrán tomado de una o más fuentes de informes
publicadas o no. La nota sobre una fuente debe ser completa, dando autor, título,
volumen, página, editor y fecha. Tal información da idea al lector de la confianza que
merecen los datos y le permite consultar la fuente original para comprobar las cifras
citadas o para obtener información adicional. Cuando los datos en una tabla resulta
obvia, se omite la nota sobre la fuente.
A veces pueden tomarse datos para un cuadro de dos o más fuentes diferentes.
Cuando se hace esto, debe tenerse cuidado de ver que los datos sean comparables.
Cuando se encuentran errores evidentes en una fuente, se debe llamar la atención
sobre ellos, por medio de una nota que aclare donde se encuentra el error.

e ) Cuerpo de la tabla y Celda: Contiene los datos estadísticos presentados. Cada


registro se presenta en una celda, que es la unidad básica de presentación en la tabla.
Una celda consiste en la intersección de una columna y una hilera dadas, el significado
de los datos de esta celda está indicado por los rótulos combinados de la columna e
hilera que se interceptan. Es importante que en cada celda se registre algo. Si el
registro para una celda es cero, este cero debe ser anotado en la celda. Si la

23
información para una celda no se encuentra disponible, se registran en la celda las
letras N.D. (no disponible) o se usa una nota al pie de la tabla para aclarar la falta de
información.
Nunca debemos dejar una celda en blanco, porque no se sabe si el registro debería ser
cero, N.D. o algún número que se omitió inadvertidamente.
En algunos casos, no se acostumbra a poner cero cuando se encuentra que no han
existido casos o cuando el valor del partido es cero, se indica el hecho por medio de
puntos suspensivos(...) o pequeños guiones (--).

f ) Encabezado Principal : Puede establecer las unidades en las cuáles se expresan los
datos, por ejemplo, millones de dólares.

g ) Encabezado del Talón : Puede establecer las bases en las cuáles se clasifican los
datos, por ejemplo, clases económicas.

h ) Rótulos de las columnas y filas : Indican los nombres de las variables que se
presentan en la tabla, por ejemplo, la clase económica y el valor que representa cada
una de las clases, por ejemplo en millones de dólares. Todos los rótulos deben ser
legibles.

i ) Talón : Es la parte del cuadro que contiene las distintas clases que se ubican en
cada fila. Por ejemplo, podemos tener las clases de materiales en bruto,
productos alimenticios sin elaborar y elaborados, semimanufacturas y productos
acabados.
Ejemplo de cuadro
DOCENTES DE LA UNIVERSIDAD NACIONAL DE FORMOSA SEGÚN
FACULTAD Y DEDICACIÓN. AÑO 1998
Docentes
Facultad Total Dedicación Dedicación Dedicación
Exclusiva Semiexclusiva Simple
Total 801 79 217 505
F.A.E.N. 157 27 59 71
HUMANIDADES 314 18 72 224
RECURSOS NATURALES 186 21 44 121
CIENCIAS DE LA SALUD 144 13 42 89
Fuente: INDEC

Tipos de información
Los cuadros pueden dividirse en una sección de números absolutos que
indican cantidades y otra sección con porcientos o con número en porcentaje.
Porcientos: Si usamos porcientos, debemos indicar claramente en la columna
matriz o en el encabezado con qué cifras se relacionan los porcientos. Evitemos
colocar simplemente “porciento” y aclaremos “porciento del total”. Si un total suma
menos de 99.8 o más de 100.2, es conveniente comprobar los cálculos por si hay
24
errores.
El dato en porcentaje facilita las comparaciones de manera que estudiemos
adecuadamente las relaciones mutuas entre las variables. Pero a su vez, no muestra
en sí mismo la magnitud de la base sobre la cuál fueron calculadas las razones. Por lo
tanto, es necesario incluir los datos absolutos que indican la magnitud de la base.
Se pueden calcular tres tipos de porcentajes:

a) Horizontales: Se calculan para cada fila, dividiendo el valor de cada celda respecto
al valor de la columna del total. Suman 100 en dicha columna.
b) Verticales: Se calculan para cada columna, dividiendo el valor de cada celda
respecto a la fila de total. Suman 100 en dicha fila.
c) Diagonales: Se calculan dividiendo el valor de cada celda por el valor del total
general. Suman 100 en este total.
Representación gráfica

Descripción

Hemos visto que una tabla estadística resume los datos que disponemos de
una población, de forma que ésta se puede analizar de una manera más sistemática y
resumida. Para darnos cuenta de un sólo vistazo de las características de la población
resulta aún más esclarecedor el uso de gráficos y diagramas, cuya construcción
abordamos en esta sección.
La representación gráfica es un complemento importante de la presentación
tabular.
En las gráficas, los datos estadísticos se presentan en términos de
magnitudes interpretadas visualmente.
Los hechos y las relaciones esenciales que son difíciles de reconocer en
masas de datos estadísticos, se observan con toda claridad en la gráfica.

Número de gráfico
Título
Nota en el encabezado

25
20
18
16
14
12
10
Escala Y 8
6
4
2
0

Escala X
Marcas
Tasa de subocupación Tasa de desocupación

Nota al pie
Nota sobre la fuente

Ventajas

Las gráficas son más eficaces para llamar la atención que cualquier otro
sistema. Es menos probable que nos salteemos una gráfica que un cuadro.
Una gráfica sencilla, atractiva y bien trazada, que represente un número
limitado de datos, es más fácil de comprender que un cuadro. La eficacia de una
gráfica como artificio para representar una cantidad limitada de datos, la convierte
en el instrumento estadístico de mayor utilidad.
Desventajas

Las gráficas no pueden representar tantos grupos de datos como un cuadro.


Sólo presenta a la vez una cantidad limitada de información.
En una gráfica sólo se pueden presentar valores aproximados, mientras que el
cuadro puede darnos valores exactos.
Las gráficas son útiles para dar una rápida idea de la situación general, pero no
de los detalles.
Las gráficas requieren más tiempo para hacerse, ya que cada una es un dibujo
original. Esta desventaja se compensa con la mayor eficacia de la gráfica en
comparación con el cuadro.

Partes componentes de una gráfica

Debemos usar la imaginación para construir una gráfica apropiada, siendo muy
importante la efectividad con la cual se presentan los datos, de manera que permitan
al usuario observar rápidamente los efectos más significativos de una situación.
26
a) Número de la Gráfica: Nos permite citar fácilmente una gráfica. Se las puede
numerar de acuerdo a su orden de aparición dentro de un informe.

b) Títulos y subtítulos: Toda gráfica o cuadro deberá tener un título que exprese
claramente lo que la gráfica se propone mostrar. El título debe colocarse ya sea arriba
o debajo de la gráfica, usualmente se lo coloca debajo. Algunas veces, el título
simplemente identifica la serie trazada, mientras que un subtítulo resume las
características más importantes presentadas en la gráfica.
Si la gráfica se usa fuera de la organización, se debe especificar la serie trazada, el
nombre de la cía. y el período de tiempo cubierto.
Si la gráfica se usa dentro de la organización, como un reporte por ejemplo, el
título simplemente puede resumir los aspectos más significativos revelados por la
presentación gráfica.
c) Notas en el encabezado y nota al pie: Se coloca cerca del título y con un tipo de
letra más pequeño. No siempre son necesarias. Proporciona información relativa a la
gráfica en su totalidad o respecto a una parte importante de ésta o información
adicional al título, el cuál se resumió para hacerlo breve. Puede indicar las unidades
en las cuáles se proporcionan los datos de la gráfica. Se usa muy a menudo para
proporcionar información adicional a la gráfica.
d) Ejes o escalas: Si queremos presentar datos estadísticos, debemos situar los puntos
con respecto a un par de líneas que se cruzan, que tienen el nombre de ejes.
e) Nombre de la escala: El nombre de la escala Y debe establecer las unidades en las
cuales se expresan los datos, por ejemplo, millones de dólares.
Si la gráfica es ancha, a menudo resulta útil repetir el nombre de la escala Y a la
derecha. El nombre de la escala X debe establecer el tiempo, dividido según sea
necesario en horas, días, meses u años. Se obtiene una ventaja para el usuario si se
muestran las escalas de una gráfica de barras horizontales, tanto en la parte inferior
como en la parte superior de la superficie de trazo. Si se usan dos escalas diferentes,
como en las gráficas semilogarítmicas, los nombres de las escalas deben identificar la
serie que está trazada, según cada una de las escalas.
Cómo elegir las Escalas: Las escalas X e Y deben elegirse de tal forma que la
altura y amplitud de la gráfica estén proporcionadas.
Debe ejercerse un criterio adecuado para decidir las proporciones adecuadas
de ancho y largo.
Cuando una gráfica forma parte de un reporte escrito, sus proporciones se
verán influidas por la distribución general de las páginas.
Si tenemos interés en una comparación de magnitudes absolutas, la escala de
cantidades no debe ser interrumpida. Sólo si necesitamos enfatizar cambios o
fluctuaciones en una serie podemos interrumpir la escala de cantidades; indicando
claramente la interrupción para alertar al lector.

27
f) Marcas: Podemos usar líneas cortas sobre el eje en lugar de o sobre algunas o todas
las líneas reticulares.

g) Rótulos : Para facilitar la lectura, todos los rótulos de una gráfica, incluyendo las
escalas y sus valores, los símbolos, los rótulos de las curvas y cualquier otra palabra
o cifra, debe colocarse horizontalmente, si es posible. Todos los rótulos deben ser
legibles. Para evitar la monotonía y destacar las características importantes debemos
usar distintos tipos de letras.
A veces, la falta de espacio puede obligarnos a colocar el rótulo de la escala vertical
en posición vertical. Como en el siguiente ejemplo:

h) Líneas reticulares o rayado horizontal: Facilitan la lectura de una gráfica.


Debemos usarlas con el espaciamiento adecuado para que no se oscurezcan las
curvas o barras trazadas y usaremos un trazo más ligero que el de las curvas.

i) Nota de la Fuente u Origen: Como en el caso de un cuadro, debemos colocar en


cada gráfica una referencia de la fuente, indicando el autor, título, volumen, página,
editor y fecha de la publicación de donde se tomaron los datos.
Puede ponerse abajo del título o de las notas al pie. Puede omitirse en el caso que sea
obvio, por ej. en los reportes internos de una compañía. Cuando el origen no es tan
obvio, es bueno señalar la referencia completa del origen de los datos , de manera
que el lector pueda referirse a la fuente si es necesario.

j) Ribetes o marcos : Las gráficas pueden enmarcarse en un ribete o marco para


mejorar sus apariencia. Dependerá del uso al cual se destina la gráfica para
determinar hasta qué grado es conveniente adornar una gráfica.
Tipos de gráficos
Gráficos de barras
Se utiliza para comparar datos clasificados cualitativa o geográficamente.
Barras simples
Una gráfica de barras es fácil de construir y podemos interpretarla fácilmente.
El tipo de barra más básico o simple es en el que se usan barras individuales,
sin segmentar, medidas en una dirección a lo largo de su eje horizontal o vertical.
En el gráfico de barras a bsolutas podemos representar el número o
porcentaje de elementos que presenta una modalidad dada.

Gráficos de barras verticales


Un gráfico de barras verticales o de columnas muestra los cambios que han
sufrido los datos en el transcurso de determinado período de tiempo, y permite
28
ilustrar las comparaciones entre elementos.
Se emplea para representar datos clasificados cuantitativamente o
cronológicamente.
Las barras verticales son usadas principalmente para la representación, el
análisis y la interpretación de datos de series de tiempo. El tiempo se traza a lo largo
del eje horizontal de la gráfica, mientras que la magnitud se traza a lo largo del eje
vertical, con el objeto de resaltar la variación que se ha producido en el transcurso
del tiempo.
Ejemplo de un gráfico de barras simples verticales

Población de 10 años y más según departamento.


Formosa, año 2010.

250.000

200.000

150.000

100.000

50.000

Gráficos de barras simples horizontales


En una gráfica de barras horizontales, el talón que contiene los títulos de
las barras debe diseñarse tan estrecho como sea posible, de manera que quede un
espacio adecuado para las barras. Debemos usar el sentido común para decidir sobre
las proporciones adecuadas de las barras. Es común dejar un espacio entre las barras
individuales para hacer más legible la gráfica, existen ocasiones en que las barras se
unen para acentuar las diferencias en magnitudes.
El gráfico de barras horizontales no es más que un gráfico en columnas en el
que se han permutado abscisas y ordenadas: el valor del carácter se indica en
ordenadas y la frecuencia en abscisas.

Se usa en dos casos:

29
a) Cuando la dispersión de las observaciones es importante, es más cómodo, por
cuestiones de espacio, recurrir al gráfico de barras vertical que resulta entonces
“estirado hacia arriba”

b) Cuando se compara la distribución de frecuencias del mismo valor de un


carácter en dos poblaciones: por ejemplo la frecuencia de una misma edad en una
población masculina y en una femenina.

Cuando las barras son verticales, los títulos para identificarlas o cualquier material
explicativo es más difícil de incluir que cuando son horizontales.

Casos de SIDA según principales provincias año 1998 en cifras absolutas

San Juan

Salta

Entre Ríos

Corrientes

Mendoza

Córdoba

Santa Fe

Capital

Buenos Aires

0 1000 2000 3000 4000 5000

Gráfica de barras subdivididas o segmentadas


Cada barra se segmenta en sus partes componentes.
La figura siguiente es una gráfica de barras segmentadas, muestra las ventas de
los principales departamentos de una compañía durante el mes de junio de 1.972,
subdivididas por ventas a crédito y al contado.
Observamos que, la barra superior muestra las ventas totales en el
departamento de ropa para mujer. Ese total consiste de dos componentes: las ventas
a crédito con un valor de $275.000 y las ventas al contado con un valor de $150.000,
que conjuntamente hacen el total de $425.000.

30
Esta gráfica permite una comparación visual de la magnitud relativa de ventas
a crédito y al contado dentro de cada departamento. Como los componentes de
“contado” en cada barra no comienzan todas en el mismo punto a lo largo de la escala
horizontal, es más difícil comparar las ventas de contado que las ventas a crédito.
450000

400000

350000

300000

250000
Crédito
200000
Contado
150000

100000

50000

0
Ropa hecha para Telas, linos, línea Mercancía
mujeres doméstica

Gráfica de barras agrupadas


Si solamente fueran importantes las comparaciones entre las ventas al contado u a
crédito dentro de un departamento y entre éstos, podría construirse una gráfica de
barras agrupadas, como podemos observar en la gráfica que sigue.

300000

250000

200000

150000 Contado
Crédito
100000

50000

0
Ropa hecha para Telas, linos, línea Mercancía
mujeres doméstica

31
Esta gráfica presenta los mismos datos de la figura anteriormente presentada,
excepto que los dos tipos de ventas se muestran separadamente para facilitar la
comparación de ventas por tipo, dentro y entre departamentos.
De esta manera, se soluciona el inconveniente que tenían las barras
segmentadas para comparar las ventas de contado con las de crédito ya que “contado”
no comenzaba en cada barra en el mismo punto.
Una desventaja de las barras agrupadas es que no nos permiten comparar las
ventas totales por departamento en una forma fácil, como las barras segmentadas.
Barras agrupadas verticales
La gráfica de barras agrupadas es de gran utilidad cuando deseamos comparar
varias poblaciones entre sí.
Si los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las
frecuencias relativas, ya que en otro caso podrían resultar engañosas.
Gráfica de barras bidireccionales
La usamos cuando tenemos que graficar cantidades positivas (ganancias) y
negativas (pérdidas) o cambios en porcentaje de un período a otro. En lo posible
debemos colocar las barras en orden descendente, ya que nos facilita el análisis de la
gráfica.
Balances trimestrales

300000

250000

200000

150000

100000

50000

0
1er Trimestre 2do Trimestre 3er Trimestre 4to Trimestre
-50000

Graficas lineales o curvas

Para representar gráficamente una serie cronológica puede usarse una gráfica
de barras o una curva.
Una gráfica de barras presentará los datos de series de tiempo con efectividad
si el número de períodos de tiempo trazados no es demasiado grande, pero si la
serie abarca muchos años, por lo general no es adecuada la gráfica de barras, siendo
más efectiva, una curva. Es decir que es conveniente cuando existen muchas
barras que complican la gráfica, reemplazarlas por una curva.
32
Esto se logra, reemplazando la altura de las barras por sus puntos
correspondientes en los ejes y uniendo los puntos por medio de segmentos.
Una curva facilita el estudio de la variación general que experimenta la serie
de datos, mientras que una gráfica de barras permite comparar determinados años
con mayor facilidad.
Dibujo de una curva o diagrama lineal simple
Si queremos presentar datos estadísticos bajo la forma de curvas, debemos
situar los puntos con respecto a un par de líneas que se cruzan, que tienen el nombre
de ejes.
Al situar dos variables sobre los ejes, cada una de ellas corresponde a uno de
los ejes. Es costumbre poner los valores de la variable independiente en el eje de
las X y los valores de la variable dependiente en el eje de las Y.

Temperaturas máximas mensuales en Formosa.


Año 2012
50
45
40
35
30
25
20
15
10
5
0

Diagrama de Curvas Múltiples

Se utilizan cuando se desea representar la variación cronológica de dos o más


magnitudes, lo cual permitirá realizar comparaciones entre sí a lo largo del tiempo.

33
Ventas mensuales en miles de pesos durante 2012

200
180
160
140
120
Contado
100
Crédito
80
60
40

Diagramas de sectores circulares

Se divide un círculo en tantas porciones como clases o categorías existan, de


modo que a cada clase le corresponde un arco de círculo proporcional a su
frecuencia absoluta o relativa.
El arco de cada porción se calcula usando la regla de tres:

Frecuencia total (n) 360°

Frecuencia absoluta i-ésima (fi) X = fi * 360°/n


Representan de forma significativa las comparaciones de varias medidas simultáneas
en el tiempo y su importancia relativa, es decir los tantos por ciento que
representan respecto al conjunto.
Muestran el tamaño proporcional de los elementos que conforman una serie
de datos en función de la suma de elementos. Siempre mostrará una única serie de
datos, y resulta de utilidad cuando se desea destacar un elemento significativo.
Para hacer más visibles los sectores pequeños, podemos agruparlos como un
solo elemento del gráfico circular y, después, descomponer dicho elemento en un
gráfico circular o de barras más pequeños situado junto al gráfico principal

34
Ej: Gráfico Circular combinado con subgráfico circular

Distribución porcentual de casos de SIDAsegún factores de riesgo


Homosexuales
Drogadictos intravenosos
Perinatales
Otros
33% 10%
6% 3% Heterosexuales
6% Desconocidos

2% 1% Transfusiones

45%

Tendenciosidad en las representaciones gráficas

Las representaciones gráficas pueden utilizarse de manera tendenciosa para


inducir impresiones engañosas e interesadas. Existen varios métodos para producir
este tipo de efectos en los gráficos. Dos de los más usados son:
a) Un método consiste en recortar el eje de las ordenadas ( y por lo tanto las
barras o figuras que se haya utilizado), eliminando los menores valores de
frecuencias, con la excusa de que no hay ninguna observación que las adopte. Esto
tiene como consecuencia que pequeñas diferencias parezcan mayores.
b) Un segundo tipo de distorsión se produce cuando se usan figuras
representativas de aquello que se está midiendo. Estas figuras suelen hacerse
proporcionando sus alturas a las frecuencias correspondientes. Sin embargo, un
incremento en la altura conlleva a un incremento del ancho. Como consecuencia de
ello, la superficie de las figuras no guarda relación con las frecuencias observadas,
dando la impresión de que la diferencia es mayor que la realmente registrada.
Los siguientes gráficos muestran la misma información, pero en el segundo
de ellos se modificó la escala del eje de las ordenadas produciendo así una diferencia
aparentemente mayor.
35
60 Homicidios por robo 52 Homicidios por robo
50 50
40
48
30
46
20
10 44

0 42
2002 2003 2002 2003

El siguiente gráfico es un pictograma, y consiste en realizar figuras


representativas de aquello que se está midiendo. Aquí vemos que el pino representa
la cantidad de hectáreas sembradas con ese ejemplar, si bien en agosto la frecuencia
es mayor, el tamaño del pino no solo aumenta en altura sino también en área, y por
lo tanto pareciera que la diferencia es mayor que la existente.

120
Superficie sembrada en miles
de hectáreas
100

80

60

40

20

0
Enero Agosto

36
Medidas de resumen

En las unidades anteriores se ha visto que después de recolectar un conjunto de


datos, ellos pueden ser organizados y resumidos a los fines de un análisis posterior.

Avanzaremos ahora un poco más en este proceso de resumen de información. Para


ello, enfocaremos los temas a partir del análisis exploratorio de datos tratando de
encontrar anomalías en las distribuciones y determinando modelos o patrones de
comportamiento de los mismos.

Es bien conocido que existe una tendencia generalizada a sintetizar situaciones de


la vida cotidiana. Por ejemplo, cuando una persona lee un libro interesante y desea
comentarlo a algún amigo, no le cuenta el contenido del mismo capítulo por
capítulo, sino que efectúa una síntesis resaltando ciertos aspectos típicos que
destacan la temática en cuestión.

De la misma manera, en estadística, se trabaja con ciertas medidas que caracterizan


a una población o a una muestra denominadas medidas de posición, de dispersión
y de forma.

El objetivo de esta unidad y la siguiente es interiorizar a los alumnos acerca de las


medidas de posición y variabilidad más utilizadas y en qué casos se emplea cada una
de ellas.

Capítulo 2: Medidas de posición

Nos indican la “posición” que ocupa la distribución sobre el eje de las abscisas.
También se las denominan de tendencia central porque muchas de ellas tienden a
ubicarse en el centro de la distribución.
Supongamos que un investigador en nutrición registra el peso de niños de un año
de edad. Lo primero que se le ocurrirá es tener una idea acerca de si el peso de los
niños se ubica alrededor de 6 Kg. o de 10 Kg. Necesita resumir de alguna forma

37
sus datos y calcular alguna medida representativa sencilla que le permita establecer
si los niños de su estudio se posicionan en la categoría de desnutridos (alrededor
de 6 kilos) o si, por el contrario, están bastante cercanos a la normalidad (alrededor
de 10 kilos).

Se conocen varias medidas que cumplen con el requisito de posicionar a un


conjunto de datos y veremos a continuación las tres más comúnmente utilizadas:
moda, mediana y media aritmética.

Luego tenemos las medidas de posición no centrales o de orden, también llamadas


fractilas.

Media aritmética

Moda

Medidas Mediana

De Cuartiles Medidas

Posición Deciles Fractilas De

Percentiles Orden

El cálculo de estas medidas difiere de acuerdo al tipo de variables con que se trabaja y presenta
pequeñas modificaciones según se disponga de datos agrupados o no.

Medidas de posición central

Media aritmética

La media aritmética de un conjunto de observaciones es una medida de posición


que se conoce comúnmente como promedio.

38
La media aritmética se define como la suma de todos los valores de la variable que
toma la característica en estudio dividida por el número total de unidades
experimentales observadas.

𝑥1 +𝑥2 + ……+𝑥𝑛 ∑𝑛
𝑖=1 𝑥𝑖
En símbolos: 𝑥̅ = =
𝑛 𝑛

Es decir la media aritmética simple es la sumatoria de los valores de la variable xi


(variando de i de 1 a n); dividido el total de observaciones.

Este símbolo extraño que aparece por primera vez en nuestro texto corresponde a
la letra griega sigma mayúscula (∑) y simplemente significa la suma de las
observaciones indicadas.

La igualdad i = 1 indica que los valores (datos) deben ser sumados empezando por
el primero y terminando por el enésimo como nos indica la igualdad i = n escrita
encima del signo.

El subíndice i en la expresión xi indica los distintos valores que va tomando la


variable en estudio. Por ejemplo, si se han observado 3 unidades experimentales,
la variable medida puede tomar únicamente 3 valores que se indican por x 1, x2 y
x3.

En este caso, el subíndice i = 1, 2, 3.

En general, el símbolo xi denota la observación correspondiente a la i-ésima unidad


experimental de la población o de la muestra que se está estudiando.

Supongamos que un docente ha registrado las tallas de 8 alumnos obteniendo:

156 - 151 - 151 - 154 - 159 - 156 - 150 - 155 cm

39
156 + 151 + 151 + 154 + 159 + 156 + 150 + 155
𝑥̅ = = 154 𝑐𝑚
8

En promedio los 8 alumnos tienen una talla de 154 cm

Ahora bien, tomemos otro ejemplo: luego de efectuar el trabajo de recolección de


datos, el listado de las familias con su correspondiente número de hijos resultó ser
el siguiente:

Tabla N° 1: Números de hijos por familia

Familia N° Número de hijos


1 2
2 4
3 4
4 3
5 4
6 3
7 3
8 3
9 6
10 3

Con esta información, se puede construir una tabla de frecuencias de la siguiente


manera:

40
Tabla N° 2: Número de hijos por familia

Número de hijos (xi) Frecuencia (fi)

2 1
3 5
4 3
6 1

Total 10

La fórmula apropiada para calcular la media aritmética en el caso de variables


discretas agrupadas en una tabla de frecuencias es:

∑𝑛𝑖=1 𝑥𝑖 𝑓𝑖
𝑥̅ =
𝑛

donde xi representa los distintos valores que toma la variable y fi su correspondiente


frecuencia absoluta.

Este promedio se conoce con el nombre de media aritmética ponderada.

Entonces para nuestro caso sería:

2.1 + 3.5 + 4.3 + 6.1


𝑥̅ = = 3,5
10

En el caso de datos numéricos continuos agrupados en intervalos de clase, el cálculo


de la media aritmética es similar al caso anterior, es decir:

∑𝑘
𝑖=1 𝑥𝑖 𝑓𝑖
𝑥̅ = Siendo k, la cantidad de intervalos
𝑛

41
Ahora bien, ¿qué valor tomará xi en la fórmula de cálculo de la media aritmética?

Como ya fue expresado oportunamente, cuando se agrupan datos continuos en


intervalos de clase, se pierde la información original.

Luego, para solucionar este problema, xi se calcula como el promedio entre los
extremos de cada intervalo, es decir, xi representa el punto medio del intervalo de
clase.

Entonces hallamos:

𝐿𝑖 + 𝐿𝑠
𝑥𝑖 =
2
Calcularemos la media aritmética tomando un ejemplo de la longitud de tornillos.

En la tabla de frecuencias agregaremos ahora dos columnas. Una simbolizada por


xi que contiene los puntos medios de los intervalos de clase y la otra que expresa
el producto de cada uno de ellos por su correspondiente frecuencia absoluta.

Tabla N° 3: distancia (en cuadras, 100 metros) desde la residencia de


los alumnos a la universidad

Intervalos
de clase Punto medio frecuencia xi.fi
6 - 7 6,5 11 71,5
7 - 8 7,5 9 67,5
8 - 9 8,5 14 119,0
9 - 10 9,5 11 104,5
10 - 11 10,5 22 231,0
11 - 12 11,5 14 161,0
12 - 13 12,5 7 87,5
13 - 14 13,5 5 67,5
14 - 15 14,5 4 58,0
15 - 16 15,5 3 46,5
Total 100 1014,0

42
Luego
∑𝑘𝑖=1 𝑥𝑖 𝑓𝑖 1014
𝑥̅ = = = 10,14
𝑛 100

Este resultado indica que el promedio de distancia que existe entre el lugar de
residencia de los alumnos y la universidad es de 10,14 cuadras (por 100 m).

Si hubiésemos calculado este promedio tomando los 100 datos originales, el


mismo sería x̅ = 10,169 . La diferencia se debe a que cuando se agrupan los datos
en intervalos de clase, se pierde precisión en el cálculo de las medidas descriptivas.

Representando a la media aritmética en el histograma de frecuencias


correspondiente también se puede observar cómo esta medida posiciona la
distribución.

Gráfico: distancia (en cuadras, 100 metros) desde la


residencia de los alumnos a la universidad

fi

𝐱̅ Distancia, en cuadras (100 mts)

43
El valor de la media aritmética se encuentra a la izquierda de la distribución
denotando esta situación una asimetría hacia la derecha a causa de que los últimos
intervalos presentan frecuencias menores.

Características de la media aritmética

 Es un valor comprendido entre el mínimo y el máximo valor de la variable


en estudio.
 Pose la misma unidad de medida que la variable considerada.
 En su cálculo intervienen todos los valores de la variable estudiada. Esto se
presenta como una ventaja ya que permite el tratamiento algebraico de la
misma.
 Otra de la ventaja es que resulta de fácil cálculo e interpretación.
 No se puede calcular cuando los datos están agrupados en una tabla de
distribución de frecuencias con intervalos abiertos.
 Se ve afectada o arrastrada por los valores extremos, lo que la hace poco
significativa cuando estos existen. Por tanto no se aconseja su cálculo en
estos casos.

Propiedades de la media aritmética

Las propiedades más importantes son

 La suma de los desvío de cada valor de la variable con respecto a la media


aritmética es siempre igual a cero.
En símbolo: ∑ni=1(xi − x̅) = 0
 La suma de los cuadrados de los desvíos con respecto a la media aritmética,
da un mínimo.

44
En símbolos: ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 = valor mínimo
 Media aritmética de una constante. Esta propiedad nos dice que si una serie
de datos está formada por la repetición de un mismo dato, la media
aritmética es ese dato constante.
∑𝑐 𝑛.𝑐
En símbolos: = =𝑐
𝑛 𝑛

 La media aritmética del producto de una constante por una variable es igual
al producto de la constante por la media de la variable.
Para 5, 7, 9, 11 y 13; la media aritmética es 9. Multipliquemos cada número
por la constante 5. Obtenemos: 25, 35, 45, 55 y 65. La media aritmética
de estos números es 45. Pero 45 es el producto de la constante por la media
aritmética original: 5x9 = 45.
∑ 𝑥.𝑐 𝑐∑𝑥 ∑𝑥
En símbolos: = = 𝑐. = 𝑐. x̅
𝑛 𝑛 𝑛

 La media aritmética de la suma o resta de una constante y una variable es la


media de la variable más o menos la constante.
Media aritmética de la suma o resta de una constante y una variable. Ya
vimos que para 5, 7, 9, 11 y 13; la media aritmética es 9. Sumémosle la
constante 5 a cada dato. Obtenemos: 10, 12, 14, 16 y 18. La media de estos
datos es 14. Pero 14 es 9 + 5. Lo que es lo mismo: la media aritmética
original + la constante. Si en vez de sumar restamos, obtenemos:
0, 2, 4, 6 y 8. Siendo x̅ = 4. Pero 4 es 9 – 5. Lo que es lo mismo: la media
aritmética original – la constante.
∑ 𝑥±𝑐 ∑𝑥 𝑛𝑐 ∑𝑥
En símbolos: = ± = ± 𝑐 = x̅ ± c
𝑛 𝑛 𝑛 𝑛

Moda o modo

La moda es aquel valor de la variable que ocurre con mayor frecuencia.

Es una medida de posición central frecuentemente usada debido a su fácil


interpretación práctica.

45
Sin embargo si sucede que dos o más valores de la variable tienen la misma
frecuencia absoluta más alta o que no haya un valor único que parezca con mayor
con mayor frecuencia, se dice que estamos en presencia de una distribución bi o
polimodal. Y en el segundo caso, que no existe el modo o que la distribución carece
de modo, se dice que es amodal.

Si tenemos datos sin agrupar, en serie simple, bastará con identificar cuál es el valor
de la variable que más se repite.

Ejemplo: Determine la moda de los datos que se muestran a continuación: Se


refieren a la estatura de un grupo de jóvenes; 1.60, 1.65, 1.70, 1.71, 1.70, 1.70,
1.70, 1.93, 1.87, 1.85

Mo = 1.70m

En el caso de pocos datos provenientes de una variable discreta, una vez agrupados
es posible determinar inmediatamente el valor modal. Bastara con identificar el
valor de la variable al que corresponde la mayor frecuencia.

Ejemplo para variable cualitativa:

Tabla N° 4: En una supuesta investigación estadística se han recogido los siguientes


datos acerca de las preferencias televisivas de los jóvenes:
Prefieren: Nº de Jóvenes

Películas 9.000

Informativos Culturales 15.000

Musicales 10.000

Teleseries 38.000

Deportivos 21.000

Otro tipo 7.000

46
¿Cuál sería la moda? Mo= ¿?

Tabla N° 5: Personal clasificado por años de antigüedad

Años de
Antigüedad Frecuencia

3 25
6 40
8 52
10 39
13 10
15 6

Total 172

¿Cuál sería la moda? Mo= ¿?

En ambos casos, mirando las tablas directamente podemos determinar el modo o


valor modal fijándonos cual es la máxima frecuencia absoluta y luego a que valor
de la variable le corresponde.

Para el segundo caso: esta medida de tendencia central está indicando que lo más
frecuente es que el personal tenga 8 años de antigüedad.

Cálculo de la moda con datos agrupados por intervalos de clases

En el caso de una distribución de frecuencias con datos agrupados, si hiciéramos


una gráfica o curva de frecuencias, la moda sería el valor (o valores) de la variable
correspondiente al máximo (o máximos) de la curva.

La moda se puede calcular aplicando la siguiente fórmula:

47
d1
M o  Li  ( )h
d1  d 2

donde:

Li: límite inferior de la clase que contiene a la moda. (Clase Modal)

d1: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase


contigua inferior.

d2: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase


contigua superior.

h: Amplitud del intervalo de la clase.

Ejemplo: Determinemos la moda de la siguiente distribución de frecuencias:

Clase Frecuencia
10 – 20 11
20 – 30 14
30 – 40 21
40 – 50 30
50 – 60 18
60 – 70 15
70 – 80 7
80 – 90 3
119

9
Mo  40   10  4,28
9  12

48
Determinación gráfica

1. Se confecciona el histograma con la barra de mayor frecuencia y las


adyacentes.
2. Se trazan las dos diagonales en el interior de la barra del intervalo modal,
partiendo de los vértices de la barra hasta los vértices de las adyacentes.
3. Se traza luego una línea perpendicular desde la intersección de las dos
diagonales hasta el eje de las x, (escala horizontal). El punto donde se corta
será el valor de la variable al que le corresponde la máxima frecuencia, o
sea el modo.

1
3
1 d1
2
1
0 d2
9
8
frecuencia

7
5
4
3
1
0 Mo
- 1,0 6,0 11,0 16,0 21,0 26,0 31,0 36,0
4,0 0 0 0 0 0 0 0 0
Mediana
La mediana de un conjunto de observaciones es un valor de la variable que divide
a este conjunto (ordenado de menor a mayor) en dos subconjuntos que contienen
la misma cantidad de datos.

49
De esta manera, las observaciones en una mitad son menores o iguales al valor
mediano y las observaciones en la otra mitad son mayores o iguales al valor
mediano.

De acuerdo a esta definición, la mediana no puede calcularse en el caso en que se


trabaje con variables categóricas medidas en escala nominal.

Para encontrar la mediana de un conjunto de datos conviene ordenarlos de menor


a mayor.

Si se tiene un número impar de datos, la mediana es el valor que está justo en el


medio. En cambio, si se tiene un número par de datos, existen dos valores centrales
que pueden ser medianos; generalmente se calcula a la misma como el promedio
entre estos dos valores centrales.

Supongamos por ejemplo, que la variable en estudio es la cantidad de fotocopias


sacadas por día en la fotocopiadora de la cooperadora escolar. Se analizaron 5 días
con los siguientes resultados:

28 30 25 35 42

Si se los ordena de menor a mayor, se obtiene la siguiente secuencia:

25 28 30 35 42

En consecuencia:

Me = 30 fotocopias

Ahora bien, si se considera un 6° día con 29 fotocopias y se quisiera calcular la


mediana, la secuencia ordenada de los datos sería:

25 28 29 30 35 42

50
Y la mediana un valor de la variable ubicado entre el tercer y cuarto lugar. Por
convención se toma el promedio entre estos dos valores centrales siendo la
mediana:

En primer lugar consideraremos las variables de tipo discreto.

Tmabien podemos definir a la mediana como aquel valor de la variable que cumple
con la condición de superar a no más de la mitad de las observaciones y ser superado
por no más de la mitad de las observaciones.

Las reglas para calcular la mediana pueden resumirse como sigue:

a) Cuando una serie es simple y la cantidad de observaciones es un mero


impar. Es decir: x= x1, x2, x3, ….., xn
Se ordenan las obervaciones de menor a mayor y luego locarlizar la
𝑛+1
observación central que sera aquella que ocupe el lugar
2
b) cuando la serie es simple y la cantidad de observaciones es par. En ese caso
𝑛 𝑛
existe dos valores centrales; los que ocupan la posición 𝑦 + 1. Por
2 2
convención se adopta el promedio simple de ambos como única mediana de
la serie. Realicemos:
𝑥(𝑛) + 𝑥(𝑛)+1
2 2
𝑀𝑒 =
2

Para serie agrupadas, con variable discreta:

Se calculan las frecuencias acumuladas correspondientes a cada valor de la variable.


A continuación se calcula el orden de localización de la mediana efectuando el
𝑛
cociente (indicador de la mediana), donde 𝑛 es el total de datos.
2

Dentro de la columna correspondiente a las frecuencias acumuladas se busca la


𝑛
mayor frecuencia que no supera a y se la simboliza con Fj-1. La frecuencia que le
2
sucede en orden será Fj.

51
𝑛
Supongamos que 𝐹𝑗−1 < < 𝐹𝑗
2

Por ejemplo: Duración de la carrera universitaria por parte de los alumnos

Años de Cantidad de Fa
duración egresados
4 2 2
𝑛 350
5 55 57 = = 175
2 2
6 103 160
𝑛
7 95 255 Como 160 < < 255
2
8 62 317
9 20 337 Entonces 𝑴𝒆 = 𝟔
10 13 350
350

Distribución de variable continua

Es decir la distribución se presenta por intervalos de clase.

Los pasos para obtener la mediana son:

Se agrega la columna de las frecuencias acumuladas (Fa).


𝑛
Se obtiene el punto medio de la distribución (el indicador)
2

Ubicar en la columna de Fa (frecuencia acumuladas), los valores entre las cuales se


𝑛
encuentra
2

Determinado el intervalo en el cual cae la mediana, sabemos que el valor será, el


límite inferior (Li) de ese intervalo mas una cierta cantidad x, o sea:

𝑴𝒆 = 𝒍𝒊 + 𝒙 **

Tomemos un ejemplo

52
Tabla N° : tiempo (en hs) que dedican los alumnos para preparar un examen
parcial

Tiempo (en hs.) alumnos Fa


3- 5 8 8
5- 7 9 17
7- 9 15 32
9 - 11 18 50
11 - 13 2 52
Total 52

𝑛
En este caso =26.
2

𝑛
Entonces 17 < < 32.
2

Por lo tanto entre 17 y 32 existe una diferencia de 32 – 17 = 15 lo cual se encuentra


contenido en la amplitud del intervalo que en este caso es h=2. Que amplitud le
correspondería para una deferencia entre el indicador hallado 26 y 32, es decir 32-
26=6. Entonces lo que debemos realizar es una interpolación:

𝑝𝑎𝑟𝑎 15 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 → 2 𝑑𝑒 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑

6𝑥2
𝑝𝑎𝑟 6 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 → 𝑥 = = 0,8
15
Utilizamos la formula **

Entonces Me = li + x. Por lo tanto para nuestro caso, seria:

Me = li + x
6.2
Y Me = 7 + 0,8 = 7 + . = 7,8
15

Entonces para hallar la mediana para estos casos emplearemos esta fórmula:

53
𝐧
− 𝐅𝐚−𝟏
𝐌𝐞 = 𝐥𝐢 + 𝟐 .𝐡
𝐟𝐢

Donde:

li = limite inferior del intervalo donde cae la mediana


𝑛
= 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑖𝑣𝑖𝑑𝑜 2
2
𝐹𝑎−1
= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎𝑠 ℎ𝑎𝑠𝑡𝑎 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

𝑓𝑖
= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

ℎ = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑜𝑛𝑑𝑒 𝑐𝑎𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎.

Determinación Gráfica de la Mediana

1. Se confecciona la Ojiva utilizando la frecuencia acumulada.


2. Se ubica y marca el punto n/2 sobre el eje de las ordenada (vertical) donde
se encuentran las frecuencias acumuladas
3. Se traza un segmento, paralelo al eje de las abscisas (horizontal), desde n/2
hasta que dicho segmento intercepte con la ojiva. La intersección del
segmento trazado con la ojiva genera un punto.
4. Se traza luego una línea perpendicular desde dicha intersección hasta el eje
de las x, (escala horizontal). El punto donde se corta será el valor de la
variable que divide a la distribución en dos subconjunto de igual cantidad
de datos, o sea la mediana.

54
5
4
4
3
3
frec. abs.

2
n/2
2
1
1
5
0
- 1,0 6,0 11, Me16, 21, 26, 31, 36,

Medidas de posición no centrales

Si bien los promedios son las medidas de posición más comunes, existen otras
cantidades que proporcionan información adicional acerca de las características de
un conjunto de datos. Por ejemplo, la persona encargada de conseguir personal
para una empresa entre los alumnos del último año de una carrera, sino que ella
puede estar interesada en saber cuáles de los alumnos tienen una calificación
superior a la calificación del 90% de los alumnos de la promoción. En esta situación
las medidas de posición no son de utilidad, sino que requiere definir otras
características de posición y que reciben el nombre general de medidas de posición
no central.

Son también parámetros de posición. El concepto de cada una de ellos responde a


un razonamiento similar al de la mediana.

55
En la mediana buscábamos el valor de la variable que separa la distribución en dos
partes de igual número de elementos. En cambio veremos que también existen
valores de las variables que dividen en mas subgrupos de igual número de
elementos o datos.

Cuartiles

Si se localiza en el conjunto de datos ordenados los valores de la variable que lo


dividen en cuatro intervalos o subconjuntos con el mismo número de
observaciones, habremos encontrado los cuartiles primero, segundo y tercero.

X1 Q1 Q2 Q3 Xn

25% 25% 25% 25%

Primer cuartil Q1: Es aquél valor de la variable que resulta ser mayor o igual que
el 25% de los datos y menor que el 75% restante.

Para calcular Q1 se procede de diferente modo si los datos están agrupados en


clases o no. Para datos sin agrupar o con agrupamiento discreto, consideraremos
n
el conjunto original de datos ordenados, luego hallamos el cual nos indicara el
4
lugar u orden donde se encuentra dicho valor de la variable que se encuentra en la
posición que figura en el gráfico.

Recordemos que para datos discretos agrupados se procede de la misma manera


que se realiza para la mediana, es decir, buscamos el indicador (n/4) en la
frecuencia acumulada para determinar el cuartil 1.

56
Segundo cuartil, Q2: Coincide con la mediana. Deja el 50% de los valores por
debajo y por encima. Para calcular se procede de la misma manera que la mediana.

Tercer cuartil, Q3: Valor de la variable que deja por debajo el 75% de los datos
y por encima el 25% de los datos.

Para calcular Q3 se procede de diferente modo si los datos están agrupados en clases
o no. Para datos sin agrupar o con agrupamiento discreto, consideraremos el
3𝑛
conjunto original de datos ordenados, luego hallamos el cual nos indicara el
4
lugar u orden donde se encuentra dicho valor de la variable que se encuentra en la
posición que figura en el gráfico.

De la misma manera, para datos discretos agrupados se procede de la misma


manera que los demás cuartiles, es decir, buscamos el indicador (3n/4) en la
frecuencia acumulada para determinar el cuartil 3.

Por ejemplo: Los siguientes datos muestran el número de despedidos que se han
producido en 15 empresas del sector del automóvil durante el año 2010:

33 56 91 64 55 60 2 42 32 26 63 40 25 34 84

Hallamos los cuartiles.

Lo primero que debemos hacer es ordenar los datos de menor a mayor:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

2 25 26 32 33 34 40 42 55 56 60 63 64 84 91

57
Se trata de un número impar de datos, luego el cuartil 2, la mediana, es el valor
𝑛+1 15+1
central que ocupa la posición , en nuestro caso = 8 , es decir, el dato
2 2
42.

Para el primer y el tercer cuartil, tenemos que n =15. Por tanto, el primer cuartil
𝑛 15
Q1, realizamos el cociente . En nuestro caso ≅ 4 ; luego Q1= 32.
4 4

3𝑛
Para Q3 seguimos el mismo procedimiento, utilizamos el indicador . Para
4
3.15
nuestro ejemplo ≅ 11, por lo tanto Q3= 60.
4

Para datos agrupados por intervalos de clases

El mecanismo para calcular los cuartiles es el mismo para el cálculo de la mediana


en una distribución se presenta por intervalos de clase.

Los pasos para obtener la mediana son:

Se obtiene el indicador para el cuartil que se desea hallar en la distribución, es decir


𝑛 3𝑛
𝑜
4 4

Ubicar en la columna de Fa (frecuencia acumuladas), los valores entre las cuales se


𝑛 3𝑛
encuentra 𝑜
4 4

Determinado el intervalo en el cual cae el Q1 o Q3, sabemos que el valor será, el


límite inferior (Li) de ese intervalo mas una cierta cantidad x, o sea:

𝑸𝟏 = 𝒍𝒊 + 𝒙 𝒐 𝑸𝟐 = 𝒍𝒊 + 𝒙

Por lo tanto se procede de la misma manera que la mediana. Entonces para hallar
los cuartiles para estos casos emplearemos esta fórmula:

𝐧 𝟑𝐧
−𝐅𝐚−𝟏 −𝐅𝐚−𝟏
𝟒 𝟒
𝐐𝟏 = 𝐥𝐢 + .𝐡 𝐐𝟑 = 𝐥𝐢 + .𝐡 **
𝐟𝐢 𝐟𝐢

58
Donde:

li = limite inferior del intervalo donde cae el cuartil

𝑛 3𝑛
𝑜 = 𝑖𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟 𝑑𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙
4 4

𝐹𝑎−1
= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎𝑠 ℎ𝑎𝑠𝑡𝑎 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙

𝑓𝑖
= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙

ℎ = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑜𝑛𝑑𝑒 𝑐𝑎𝑒 𝑒𝑙 𝑐𝑢𝑎𝑟𝑡𝑖𝑙.

Tomemos el mismo ejemplo: vamos hallar Q3

Tabla N° : tiempo (en hs) que dedican los alumnos para preparar un examen
parcial

Tiempo (en hs.) alumnos Fa


3- 5 8 8
5- 7 9 17
7- 9 15 32
9 - 11 18 50
11 - 13 2 52
Total 52

3𝑛
En este caso =39
4

3𝑛
Entonces 32 < < 50.
4

Por lo tanto entre la mediana se encuentra en el intervalo 9 - 11

59
Utilizamos la formula **

𝟑𝟗 − 𝟑𝟐
𝐐𝟑 = 𝟗 + . 𝟐 = 𝟗 + 𝟎, 𝟕𝟖 = 𝟗, 𝟕𝟖
𝟏𝟖

Este resultado se interpreta que el 75% de los alumnos preparan un examen parcial
en 9,78 hs o menos y el 25% de los alumnos lo hacen en 9,78 hs o mas.

Determinación Gráfica de los Cuartiles

1. Se confecciona la Ojiva utilizando la frecuencia acumulada.


2. Se ubica y marca el punto n/4 o 3n/4 sobre el eje de las ordenada (vertical)
donde se encuentran las frecuencias acumuladas
3. Se traza un segmento, paralelo al eje de las abscisas (horizontal), desde n/4
o 3n/4 hasta que dicho segmento intercepte con la ojiva. La intersección
del segmento trazado con la ojiva genera un punto.
4. Se traza luego una línea perpendicular desde dicha intersección hasta el eje
de las x, (escala horizontal). El punto donde se corta será el valor de la
variable que divide a la distribución en dos subconjunto, o sea el Q1 o Q3.

60
5
4
n/4
4
3
3
frec. abs.

2
n/2
2
1
1 3n/4

5
0
- 1,0 6,0 Q1 11, Me16, 21,
Q3 26, 31, 36,

Deciles

Si se localiza en el conjunto de datos ordenados los valores de la variable que lo


dividen en diez intervalos o subconjuntos con el mismo número de observaciones,
habremos encontrado el decil primero D1, segundo D2 ………… noveno D9.

Estos valores e la variable que dividen a la distribución en diez partes iguales, por
lo tanto los deciles son nueve, D1 deja al 10% antes, D2 al 20% y así sucesivamente
hasta D9 que deja al 90% antes y al 10% después de él.

10% 10% 10% 10 % 10%

X1 D1 D2 D3 D5 D9

61
El procedimiento para obtener cada uno de los deciles, es el mismo para los
cuartiles para datos donde la distribución se encuentre en serie simple y para datos
agrupados cuyas variables son discretas.

Tengamos en cuenta que en este caso los indicadores para los deciles son:

𝑘.𝑛
𝐷𝑘 → donde k es el número de decil.
10

Para datos agrupados por intervalos de clases

El mecanismo para calcular los deciles es el mismo para el cálculo de los cuartiles
en una distribución se presenta por intervalos de clase.

Los pasos para obtener un decil son:

Se obtiene el indicador para el decil que se desea hallar en la distribución, es decir


𝑘.𝑛
4

Ubicar en la columna de Fa (frecuencia acumulada), los valores entre las cuales se


𝑘.𝑛
encuentra
4

Determinado el intervalo en el cual cae el Dk, sabemos que el valor será, el límite
inferior (Li) de ese intervalo mas una cierta cantidad x, o sea:

𝑫𝒌 = 𝒍𝒊 + 𝒙

Por lo tanto se procede de la misma manera que los cuartiles. Entonces para hallar
los cuartiles para estos casos emplearemos esta fórmula:

𝐤.𝐧
−𝐅𝐚−𝟏
𝟏𝟎
𝐃𝐤 = 𝐥𝐢 + .𝐡 **
𝐟𝐢

Donde:

li = limite inferior del intervalo donde cae el cuartil

62
𝑘. 𝑛
= 𝑖𝑛𝑑𝑖𝑐𝑎𝑑𝑜𝑟 𝑑𝑒𝑙 𝑑𝑒𝑐𝑖𝑙 𝑘
4

𝐹𝑎−1
= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎𝑠 ℎ𝑎𝑠𝑡𝑎 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑚𝑒𝑑𝑖𝑎𝑡𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑑𝑒𝑐𝑖𝑙

𝑓𝑖
= 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑒𝑙 𝑑𝑒𝑐𝑖𝑙

ℎ = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑜𝑛𝑑𝑒 𝑐𝑎𝑒 𝑒𝑙 𝑑𝑒𝑐𝑖𝑙

Tomemos el mismo ejemplo: vamos hallar D4

Tabla N° : tiempo (en hs) que dedican los alumnos para preparar un examen
parcial

Tiempo (en hs.) alumnos Fa


3- 5 8 8
5- 7 9 17
7- 9 15 32
9 - 11 18 50
11 - 13 2 52
Total 52

4𝑛
En este caso ≅ 21
10

4𝑛
Entonces 17 < < 32.
10

Por lo tanto entre el decil 4 se encuentra en el intervalo 7 - 9

Utilizamos la formula **

63
𝟐𝟏 − 𝟏𝟕
𝐃𝟒 = 𝟕 + . 𝟐 = 𝟕 + 𝟎, 𝟖𝟗 = 𝟕, 𝟖𝟗
𝟗

Este resultado se interpreta que el 40% de los alumnos preparan un examen parcial
en 7,89 hs o menos y el 60% de los alumnos lo hacen en 7,89 hs o más

Determinación Gráfica de los deciles: se procede de la misma manera que


los cuartiles.

Percentiles

Son valores de la variable que dividen a la distribución en cien partes iguales, por
lo tanto los percentiles son 99.

En realidad tanto cuartiles como deciles se calculan con el correspondiente


percentil.

D1= P10 D9 = P90 Q1 = P25 Q2 = D2 = P50 = Me .

Los percentiles permiten el estudio, aún mas detallado de la distribución, y que el


analisis se hace por tramos de 1%.

Para calcular cualquiera de ellos se utiliza por lo tanto el mismo procedimiento que
el descrito en el cálculo de la Mediana, los cuartiles y deciles.

Para encontrar la ubicación (indicador) de los percentiles, hacemos los siguientes


cálculos para datos en series simples y agrupados pero con variables discretas:

𝑘.𝑛
𝑃𝑘 → donde k es el número de percentil. Es decir k = 1; 2;……….99.
100

64
Para datos agrupados por intervalos de clases

El mecanismo para calcular los percentiles es el mismo para el cálculo de los


cuartiles o deciles en una distribución se presenta por intervalos de clase.

Los pasos para obtener un percentil k son:

Se obtiene el indicador para el percentil que se desea hallar en la distribución, es


𝑘.𝑛
decir
100

Ubicar en la columna de Fa (frecuencias acumuladas), los valores entre las cuales se


𝑘.𝑛
encuentra
100

Determinado el intervalo en el cual cae el Pk, sabemos que el valor será, el límite
inferior (Li) de ese intervalo mas una cierta cantidad x, o sea:

𝑷𝒌 = 𝒍𝒊 + 𝒙

Por lo tanto se procede de la misma manera que los cuartiles o deciles. Entonces
para hallar un percentil k para estos casos emplearemos esta fórmula:

𝐤. 𝐧
− 𝐅𝐚−𝟏
𝐏𝐤 = 𝐥𝐢 + 𝟏𝟎𝟎 .𝐡 𝐝𝐨𝐧𝐝𝐞 𝐤 = 𝟏; 𝟐; … … ; 𝟗𝟗.
𝐟𝐢

Determinación Gráfica de los percentiles: se procede de la misma manera


que los cuartiles.

Medidas de forma

Medida de asimetría

Diremos que una distribución es simétrica cuando su mediana, su moda y su media


aritmética coinciden.

65
Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas
o relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha
diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de


ellas es el Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe


asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

Medida de apuntamiento o curtosis

La curtosis nos informa sobre la agudeza de la curva. Es decir si la forma de la curva


es muy elevada recibe el nombre de Leptocurtica (curva roja), si es aplanada se
llama Platicurtica (curva azul) y si es una perfecta campana de Gauss es Mesocurtica
(línea verde).

66
Una forma de calcular la medida de curtosis y es fácil de usar es en términos del
rango y los percentiles 90 y 10. La simbolizamos con la letra K y es:
R
K =
(P90 - P10)

Si el resultado obtenido en K es > a 0,263 la distribución es platicúrtica,


Si es < que 0,263 es leptocúrtica.
Si es = a 0,263 es mesocúrtica.
Los valores de asimetría y curtosis son muy pocos usados.

67
Capítulo 3: Medidas de dispersión
Intuitivamente, podemos darnos cuenta de que una medida de posición es más
representativa del total de observaciones si la variabilidad del conjunto es pequeña.
Trataremos de pensar en este sentido por medio de un ejemplo.
Si las estaturas correspondientes a tres personas son 1,71; 1,72 y 1,73 m., su media
es 1,72 m. Pero, si las alturas de las tres personas hubiesen sido 1,66; 1,72 y 1,78
m., la altura media también hubiera sido 1,72 m.
Se puede observar que 1,72 m. describe mejor al primer conjunto de datos pues las
tres alturas de este conjunto son más parecidas entre sí y, a su vez, más parecidas al
promedio que cuando se observa al segundo conjunto.
Aclararemos este concepto representando gráficamente los datos sobre una línea
recta:

1,60 1,62 1,64 1,66 1,68 1,70 1,72 1,74 1,76 1,78 1,80

Para poder determinar si los datos del primer grupo son más parecidos entre sí que
los del segundo, deberíamos tomar un punto de referencia y medir las diferencias
entre cada valor observado y el punto de referencia establecido.
Generalmente, el punto de referencia elegido corresponde a una medida de posición
adecuada. Si, por ejemplo, tomamos a la media aritmética como referencia,
tendremos:
Primera muestra D3 = x3 - x = 1,78 - 1,72 = 0,06
x = 1,72 m.
D1 = x1 - x = 1,71 - 1,72 = - 0,01
D2 = x2 - x = 1,72 - 1,72 = 0,00
D3 = x3 - x = 1,73 - 1,72 = 0,01
Segunda muestra
x = 1,72 m.
D1 = x1 - x = 1,66 - 1,72 = - 0,06
D2 = x2 - x = 1,72 - 1,72 = 0,00

68
Para poder comparar las dispersiones de ambas muestras deberíamos establecer una
medida que las resuma y esa medida podría ser el promedio de estas diferencias dentro
de cada grupo.
Cada valor D es un desvío con respecto a la media y como hemos visto en la unidad
anterior, la suma de estos desvíos es siempre cero. En símbolos
𝑛

∑(𝑥𝑖 − 𝑥̅ ) = 0
𝑖=1
En general, disponiendo de un punto de referencia podemos juzgar si una respuesta es
extrema o no a partir de la diferencia entre el punto respuesta y el punto de referencia.
Cuando el punto-respuesta corresponde al valor observado de una variable y el punto de
referencia a una medida de posición, tomamos la desviación como sinónimo de
diferencia.
Debido a la propiedad enunciada con respecto a la media aritmética nos damos cuenta
que el simple promedio de las desviaciones no nos sirve para determinar la variabilidad
de un conjunto de datos; por ello será necesario recurrir a otros indicadores que actúen
como medidas resúmenes.
Estos indicadores se conocen con el nombre de medidas de dispersión.
A continuación, veremos algunos de los más utilizados y estudiaremos sus ventajas y
desventajas.

Rango
Se denomina rango de un conjunto de observaciones a la diferencia entre el mayor y el
menor valor de la variable.
Recordemos que ya hemos hablado del rango y lo hemos utilizado en la unidad 1 para
calcular los intervalos de clase.
Definiendo ahora el rango como una medida de dispersión, debemos destacar que el
mismo es completamente dependiente de los dos valores extremos que toma la variable.
Por ejemplo, si dos familias tienen 1 y 4 hijos, respectivamente, el rango es:
69
rango = R = 4 - 1 = 3 hijos
Ahora bien, si se agrega otra familia, el rango será el mismo si ésta tiene 1, 2, 3 ó 4 hijos,
pero será mayor si tiene 0 ó más de 4 hijos.
En el ejemplo de la estatura de tres individuos, observamos que el rango para la primera
muestra es:
R - 1,7 3 - 1,7 1 = 0,0 2
y, en el caso de la segunda muestra:
R = 1,78 - 1,66 = 0,12
Ahora sí tenemos una evidencia de que el segundo conjunto presenta una variabilidad
mayor que el primero.
La utilización del rango como medida de dispersión presenta el problema que se
incrementa con la cantidad de observaciones, porque existe una mayor posibilidad de que
los datos se encuentren más dispersos.
Idealmente, una medida de dispersión debería ser independiente del número de
mediciones para reflejar realmente la mayor o menor variabilidad de los datos.
El rango es una medida de dispersión satisfactoria únicamente cuando la muestra es
pequeña, prácticamente menor a 10 observaciones.
Esta medida es muy utilizada en los estudios de control de procesos productivos para la
confección de gráficos de control dado que, en estos casos, los procesos son generalmente
evaluados por muestras frecuentes y de reducido tamaño.
Supóngase que se han registrado los pesos de 5 niños al nacer y ellos fueron:

Pesos Desviación Desviación absoluta


2,800 0,500 0,500
3,600 0,300 0,300
3,700 0,400 0,400
2,500 0,800 0,800
3,900 0,600 0,600
16,500 0,00

La media aritmética es: 3,300 kg

70
En la segunda columna está calculada la desviación entre el peso de nacimiento de cada
niño y su promedio.
Nuevamente vemos que, por la propiedad enunciada de la media aritmética, la suma de
las desviaciones es 0.
Consideremos ahora el valor absoluto de la desviación (tercera columna), es decir el valor
numérico de la diferencia pero sin tener en cuenta el signo de la misma.
El promedio de estos números proporciona también una medida de variabilidad.
En el ejemplo planteado: DM = 0,52kg.
Podemos decir, entonces, que la desviación media mide el promedio de las diferencias
entre los valores observados respecto a la media del grupo, sin tener en cuenta el signo
de la desviación.
A diferencia del rango, la desviación media toma en cuenta todas las observaciones en
una distribución.
Generalizando:
Si simbolizamos con x1, x2, ..., xn las distintas observaciones de la variable, la DM será:

∑𝑛𝑖=1 |𝑥𝑖 − 𝑥̅ |
𝐷𝑀 =
𝑛

Desviación mediana

Es interesante destacar aquí que, en la fórmula precedente podemos reemplazar a la


media aritmética por la mediana. Obtendremos así la desviación mediana cuya fórmula
de cálculo será, entonces, la siguiente:
Desviación mediana:

∑𝑛𝑖=1 |𝑥𝑖 − 𝑥̃|


𝐷𝑀𝑒𝑑 =
𝑛

71
Las desviaciones son definidas, ahora, como diferencias entre las observaciones y la
mediana.
Podemos enunciar una propiedad muy importante de la desviación mediana:
La suma de los valores absolutos de las desviaciones es mínima cuando las mismas se
calculan tomando como punto de referencia la mediana.
Para corroborar esta propiedad, calcularemos ahora la desviación mediana en el ejemplo
de los pesos de los niños al nacer.

En primer lugar vemos que la suma de las desviaciones respecto de la mediana no es cero,
comprobando así la propiedad de la media aritmética anteriormente enunciada.
Calculamos ahora la desviación mediana:

2,300
𝐷𝑚𝑒𝑑 = = 0,46
5

Luego, DMe < DM

La utilización de la desviación media o de la desviación mediana depende de la naturaleza


de los datos que intervienen en el estudio.

Varianza

Vimos que la manera más adecuada de estudiar la mayor o menor dispersión de los datos
alrededor de un cierto valor de referencia es utilizar la desviación de cada uno de los
valores individuales con respecto al valor de referencia establecido.
Volvemos ahora a considerar las desviaciones con respecto a la media aritmética de un
conjunto de datos.
En una primera instancia utilizamos los valores absolutos de las desviaciones para evitar
que su suma sea cero.

72
Ahora, mediante otro artificio matemático, elevaremos cada desviación al cuadrado.
Obtendremos así, promediando estas desviaciones elevadas al cuadrado, una nueva
medida de dispersión ampliamente conocida y que se denomina varianza.
La varianza es la suma de las desviaciones con respecto a la media aritmética elevadas al
cuadrado dividida por el número de observaciones.
En símbolos, tenemos:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑉(𝑥) =
𝑛

Ésta es la fórmula teórica de la varianza. Sin embargo, en la práctica será conveniente,


por razones de rapidez en el cálculo, utilizar una expresión alternativa.

∑𝑛𝑖=1 𝑥𝑖2
𝑉(𝑥) = − 𝑥̅ 2
𝑛

Ésta expresión se llama fórmula de trabajo de la varianza.


Si calculamos la varianza para el caso de los pesos de niños, tendremos V(x) = 0,3kg2.
Vemos que, al usar este artificio matemático de elevar las desviaciones al cuadrado, nos
ha quedado alterada la unidad de medida.
Para evitar este inconveniente se emplea como medida de dispersión la raíz cuadrada de
la varianza, la que se conoce con el nombre de desviación estándar.
De acuerdo a lo establecido, podemos elaborar la siguiente definición:
La desviación estándar es la raíz cuadrada positiva de la varianza. Es decir:

𝐷𝐸 = √𝑉(𝑥)

En el ejemplo de los pesos al nacer, tendremos:

73
𝐷𝐸 = √0,30 = 0,55𝑘𝑔

Como conclusión al problema planteado, podemos decir que el peso promedio de niños
al nacer, de acuerdo a la muestra considerada, es de 3,300 Kg. con una variabilidad de
aproximadamente medio kilogramo.
Más adelante veremos el papel fundamental que juega la desviación estándar en la
estadística inferencial.

Propiedades de la varianza
La varianza de una variable cumple con ciertas propiedades que nos pueden ayudar a
simplificar muchos cálculos y deducir conclusiones sobre los datos.
a) Por la forma en que se define a la varianza, ésta no puede ser nunca negativa, en
símbolos:
𝑉(𝑥) ≥ 0
b) La varianza de una constante es cero. Esto se desprende del papel que cumple la
varianza al tratarse de una medida de una variabilidad. Una constante no tiene
variabilidad.

𝑉(𝑎) = 0
c) Si la varianza de una variable es V(x) y luego, a cada valor de dicha variable, le
sumamos una constante a, la nueva varianza será la misma. Esto también es válido
si a los valores de la variable le restamos una constante. En símbolos:

𝑉(𝑥 ± 𝑎) = 𝑉(𝑥)

d) Si la varianza de una variable es V(x) y luego, a cada valor de la variable lo


multiplicamos por una constante a, la nueva varianza será la anterior multiplicada
por el cuadrado de la constante. Esto es:
74
𝑉(𝑥 ∙ 𝑎) = 𝑎2 ∙ 𝑉(𝑥)

e) Si la varianza de una variable es V(x) y luego, a cada valor de la variable lo


dividimos por una constante a, distinta de cero, la nueva varianza será la anterior
dividida por el cuadrado de la constante. Esto es:
𝑉(𝑥: 𝑎) = 𝑉(𝑥): 𝑎2

Coeficiente de variación

El coeficiente de variación expresa la desviación estándar como un porcentaje de la media


aritmética. En símbolos:

𝐷𝐸
𝐶𝑉 = ∙ 100
𝑥̅
El coeficiente de variación es una medida de dispersión relativa y, dado que surge como
el cociente entre dos cantidades expresadas en la misma unidad de medida, es
independiente de ella.
El coeficiente de variación se utiliza para comparar la homogeneidad de dos series de
datos aun cuando estén expresadas en distintas unidades de medida. También se utiliza
cuando los grupos a comparar, a pesar de tener la misma unidad de medida, tienen media
muy diferentes, como ser el caso de peso de niños recién nacidos y pesos de adultos, en
este caso, ambas distribuciones corresponden a variables medidas en kg, pero al
compararlas con varianzas o desvíos estándares, éstas medidas serán siempre mayores en
el conjunto de adultos, pero esto no significa que tengan mayor variabilidad.
Se debe hacer notar aquí que a medida que el coeficiente de variación disminuye, se
observa una mayor homogeneidad en los datos o, lo que es lo mismo, los datos están más
concentrados alrededor del promedio.
Calculando, a modo de ejemplo, el coeficiente de variación en el caso de los pesos de
niños al nacer, se tiene CV = 16,67%.

75
Diagrama de cajas y brazos (Box-plot)

La elaboración de un gráfico boxplot se inicia con el denominado gráfico de valores letras


o gráfico de las 5 letras.
El resumen de las 5 letras fue propuesto por Tukey (1977) y se elabora en base a:
- La mediana
- Los cuartiles
- Los límites superior e inferior.
Estos valores pueden volcarse gráficamente en un diagrama que recibe el nombre de
diagrama de caja o boxplot.

0,005
Máx

0,004

0,004 Q3

Media
Mediana
0,003
Q1

Mín
0,003

Además, en un gráfico boxplot pueden detectarse valores que se apartan del núcleo
central de una distribución, es decir, los valores atípicos.
Para ello se calcula primero el recorrido intercuartílico. Luego fijamos un salto: 1,5
veces el valor del recorrido intercuartílico.
Así fijamos los límites que estarán a Q1 - 1,5 RIC y Q3 + 1,5 RIC
Los valores de la variable que se encuentran entre:
76
Q3 y Q3 + 1,5 RIC así como los que se encuentran entre Q1 y Q1 - 1,5 RIC se
denominan valores adyacentes.
También suelen determinarse límites más lejanos haciendo
Q1 - 3RIC y Q3 + 3RIC
Los valores que se encuentran fuera de los límites fijados son los valores atípicos o
también llamados outliers.
A partir de un boxplot se puede obtener con suma facilidad una serie de índices
descriptivos de la muestra, mediante una inspección visual o cálculos muy simples:
- Rango: diferencia entre ambos extremos de las patillas de un boxplot.
- RI: altura de las cajas.
- Mediana: como indicador resistente de agrupación o tendencia central.
Simetría: comparando la posición de la mediana con respecto a los cuartiles o
comparando las respectivas longitudes de los brazos.
Sin embargo, una desventaja del boxplot es que no contempla las distribuciones que no
sean unimodales.
La principal ventaja que presenta es que puede utilizarse con fines comparativos de varias
distribuciones o de varios subgrupos en una muestra.
Para ello se sitúan los diversos gráficos en paralelo y esto permite observar sus diferencias
en localización y dispersión e incluso la simetría estudiando las longitudes de los brazos.

77
Capítulo 4: Relación entre variables: análisis de regresión y correlación

En las unidades anteriores hemos aplicado metodología estadísticas para analizar la


información de una variable desde una o más muestras utilizando las herramientas que
nos brinda la estadística descriptiva. Es nuestro objetivo en esta unidad abocarnos a
estudiar y analizar qué pasa cuando tenemos dos variables y deseamos efectuar inferencias
acerca de los cambios que se producen en una de ellas cuando cambia la otra.
Es común que las personas tomen decisiones personales y profesionales basadas en
predicciones de sucesos futuros. Para hacer estos pronósticos, se basan en la relación
intuitiva y calculada entre lo que ya se sabe y lo que se debe estimar. Si los responsables
de la toma de decisiones pueden determinar cómo lo conocido se relaciona con un evento
futuro, pueden ayudar considerablemente al proceso de toma de decisiones.
Cualquier método estadístico que busque establecer una ecuación que permita estimar el
valor desconocido de una variable a partir del valor conocido de una o más variables, se
denomina análisis de regresión.
Los análisis de regresión y correlación mostrarán como determinar la naturaleza y la
fuerza de una relación entre dos variables.
El término regresión fue utilizado por primera vez por el genetista y estadístico inglés
Francis Galton (1822-1911) en 1877 Galton efectúo un estudio que demostró que la
altura d los hijos de padres altos tendía a retroceder, o “regresar”, hacia la talla media de
la población. Regresión fue el nombre que le dio al proceso general de predecir una
variable,(la talla de los niños) a partir de otra (la talla de los padres).
Hoy en día, esta tendencia de miembros de cualquier población que están en una posición
extrema (arriba o debajo de la media poblacional) en un momento, y luego en una
posición menos extrema en otro momento, (ya sea por sí o por medio de sus
descendientes), se llama efecto de regresión.
El análisis de regresión se desarrolla una ecuación de estimación, es decir, una fórmula
matemática que relaciona las variables conocidas con las desconocidas. Para describir la

78
forma de la relación que liga dos variables (x, llamada independiene; y llamada
dependiente) se utiliza los llamados modelos de regresión. Esta se utiliza para predecir:
se desarrolla un modelo que utiliza la variable independiente x, para obtener una mejor
predicción de la otra variable dependiente y.
Luego de obtener el patrón de dicha relación, se aplica el análisis de correlación para
determinar el grado de relación que hay entre las variables. Es decir, en contraste con el
de regresión, se utiliza para medir la fuerza de la asociación entre las variables. Por
ejemplo: peso – estatura. Esta fuerza de correlación se mide a través de un indicador del
grado de intensidad de la relación de la relación entre las dos variables que es
independiente de sus escalas de medición, llamado coeficiente de correlación lineal o
coeficiente de correlación de Pearson.

Regresión lineal simple

“Una técnica estadística que establece una ecuación para estimar el valor desconocido de
una variable, a partir del valor conocido de otra variable, (en vez de valores de muchas
otras variables) se denomina análisis de regresión simple.”
Por lo tanto el análisis de regresión lineal simple, es el proceso general de predecir una
variable (Y) a partir de otra (X).
Las relaciones entre las variables pueden ser directas o también inversas.
 Relación directa: la pendiente de esta línea es positiva, porque la variable Y
crece a medida que la variable X también lo hace.

79
 Relación inversa: La pendiente de esta línea es negativa, porque a medida que
aumenta el valor de la variable Y, el valor de la variable X disminuye.

Variable independiente (x)


En el análisis de regresión una variable cuyo valor se suponga conocido y que se utilice
para explicar o predecir el valor de otra variable de interés se llama variable
independiente; se simboliza con la letra X.

80
Otros nombres alternativos para la variable independiente (X), son variable explicatoria,
variable predictora y en ocasiones variable regresora.

Variable dependiente (y)


En el análisis de regresión una variable cuyo valor se suponga desconocido y que se
explique o prediga con ayuda de otra se llama variable dependiente y se simboliza con la
letra Y.
La variable dependiente, al igual que la variable independiente es llamada de diferentes
maneras algunas de ellas son: variable explicada o variable pronosticada.

Diagramas de dispersión

Un diagrama de dispersión es una ilustración gráfica que se usa en el análisis de regresión.


Consta de una dispersión de puntos tal que cada punto representa un valor de la variable
independiente (medido a lo largo del eje horizontal), y un valor asociado de la variable
dependiente (medido a lo largo del eje vertical).
El diagrama de dispersión, también llamado nube de puntos, brinda dos tipos de
información, visualmente se pueden determinar los patrones que indican como las
variables están relacionadas (lineal o mediante una curva) y por otro lado si existe una
relación entre ellas visualizando la clase de línea o ecuación de estimación que describe a
dicha relación.
A continuación se ilustran algunas relaciones en los diagramas de dispersión:

81
82
Modelo de regresión
La naturaleza de la relación puede adoptar muchas formas, que van desde funciones
matemáticas muy sencillas hasta las más complicadas. La relación más simple consiste en
una línea recta o relación lineal. Observemos:

x
El modelo para recta lineal se representa como y = a + b x . Donde:
a: es la ordenada al origen, o sea, la intersección de la recta con el eje y
b: es la pendiente de la recta
En este modelo, la pendiente b de la recta representa el cambio en y cuando x cambia
una unidad, es decir, representa la cantidad de cambio de y (positivo o negativo) para un
cambio unitario particular en x.
La intersección de la recta en a con el eje y, representa un factor constante que esta
incluido en la ecuación. Representa el valor de y cuando x es igual a cero.
Este modelo estadístico es solo una aproximación a la relación exacta entre las dos
variables.

Estimación del modelo

Una vez confeccionado el diagrama de dispersión y observado que los puntos tienen una
tendencia lineal, se tratará de deducir los parámetros a y b a partir de la distribución de
los datos estadísticos de esa distribución de frecuencia conocida.

83
La técnica que nos permite obtener estos parámetros se denomina AJUSTAMIENTO.
En general, las trayectorias lineales responden a la expresión y = a + b x, es decir que
podemos escribir:
yc= a + b x
y representa a todos y cada uno de los puntos de la recta.
Existen dos métodos para realizar al ajustamiento:
El método libre: en el que, luego de confeccionado el diagrama de dispersión, el
observado analiza el comportamiento de los datos para determinar el tipo de curva que
mejor ajusta a los mismos. Definido el tipo de curva, si por ejemplo esta es una recta se
eligen dos puntos y se la traza.

El inconveniente es que diferentes observadores tendrán diferentes rectas, porque es


difícil de que coincidan a la hora de elegir la recta que mejor muestre el comportamiento
del conjunto de puntos.
El método de los mínimos cuadrados: es el más preciso, permite obtener la mejor
recta de ajuste.

84
Método de mínimos cuadrados
El método que por lo común se utiliza para ajustar una línea a los datos muestrales
indicados en el diagrama de dispersión, se llama método de mínimos cuadrados. La línea
se deriva en forma tal que la suma de los cuadrados de las desviaciones verticales entre la
línea y los puntos individuales de datos se reduce al mínimo.
El método de mínimos cuadrados sirve para determinar la recta que mejor se ajuste a los
datos muestrales, y los supuestos de este método son:
 El error es cero.
 Los datos obtenidos de las muestra son estadísticamente independientes.
 La varianza del error es igual para todos los valores de X.

Una línea de regresión calculada a partir de los datos muestrales, por el método de
mínimos cuadrados se llama línea de regresión estimada o línea de regresión
muestral.
Este método consiste en hacer mínimo la sumatoria de las distancias al
cuadrado, de cada valor observado y el calculado.
Convengamos que entre los valores observados y calculados (yc o yo) hay una diferencia
o distancia. Tengamos en cuenta que es imposible que las observaciones estuvieran todos
alineados. Normalmente eso no se da y debemos buscar aquella recta que deja los
menores residuos posibles.

Y0

d
Yc

85
Este método se conoce como “mínimo cuadrados” dado que se trabaja con los cuadrados
de los residuos y elegir la recta que posea menor suma de estos cuadrados.

∑ 𝑑𝑖 2 = 𝑚í𝑛𝑖𝑚𝑜, 𝑜 𝑠𝑒𝑎: ∑(𝑌0 − 𝑌𝑐 )2 = 𝑚í𝑛𝑖𝑚𝑜

Esto se basa en la segunda propiedad de la media aritmética, también utilizada en la


Varianza. La ventaja es que vamos a obtener una única recta de ajuste cualquiera sea el
observador y va minimizar la suma de los cuadrados de los desvíos, siendo por tanto el
mejor recta de ajuste, por que lleva implícita la idea de minimizar los errores.
Entonces para conocer los parámetros a y b con lo que conoceríamos la recta Yc y como
x e y son conocidos ( son las observaciones).
Por lo tanto tendríamos una ecuación para cada observación, de esta manera:
𝑦1 = 𝑎 + 𝑏 𝑥1
𝑦2 = 𝑎 + 𝑏 𝑥2
𝑦3 = 𝑎 + 𝑏 𝑥3
… … … … … ..
Sumamos miembro a miembro

∑ 𝑦𝑖 = 𝑁𝑎 + 𝑏 ∑ 𝑥𝑖 (1)

Ahora multiplicamos las n ecuaciones por el coeficiente de b


𝑦1 𝑥1 = 𝑎𝑥1 + 𝑏 𝑥1 2
𝑦2 𝑥2 = 𝑎𝑥2 + 𝑏 𝑥2 2
𝑦3 𝑥3 = 𝑎𝑥3 + 𝑏 𝑥3 2
… … … … … ..
𝑦𝑛 𝑥𝑛 = 𝑎𝑥𝑛 + 𝑏 𝑥𝑛 2

Sumamos miembro a miembro

∑ 𝑦𝑖 𝑥𝑖 = 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖 2 (2)

86
Luego con las expresiones (1) y (2) formamos un sistema de ecuaciones, también
∑ 𝑥𝑖
multiplicamos por cada uno de los términos a la expresión (1), sin alterar las
𝑁
ecuaciones:
∑ 𝑥𝑖 ∑ 𝑥𝑖 ∑ 𝑥𝑖 ∑ 𝑥𝑖 (∑ 𝑥𝑖 )2
∑ 𝑦𝑖 = 𝑁𝑎 + 𝑏 ∑ 𝑥𝑖 = ∑ 𝑦𝑖 = 𝑎 ∑ 𝑥𝑖 + 𝑏 (3)
{ 𝑁 𝑁 𝑁 𝑁 𝑁
∑ 𝑦𝑖 𝑥𝑖 = 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖 2 (2)

Restamos (3) de (2)

∑ 𝑦𝑖 𝑥𝑖 = 𝑎 ∑ 𝑥𝑖 + 𝑏 ∑ 𝑥𝑖 2 (2)

∑ 𝑥𝑖 (∑ 𝑥𝑖 )2
∑ 𝑦𝑖 = 𝑎 ∑ 𝑥𝑖 + 𝑏 (3)
𝑁 𝑁
∑ 𝑥𝑖 (∑ 𝑥𝑖 )2
∑ 𝑦𝑖 𝑥𝑖 − ∑ 𝑦𝑖 = 𝑏 ∑ 𝑥𝑖 2 − 𝑏
𝑁 𝑁
Sacando común denominador:
𝑁 ∑ 𝑦𝑖 𝑥𝑖 − ∑ 𝑦𝑖 ∑ 𝑥𝑖 𝑁𝑏 ∑ 𝑥𝑖 2 − 𝑏(∑ 𝑥𝑖 )2
=
𝑁 𝑁
2
2
𝑁 ∑ 𝑦𝑖 𝑥𝑖 − ∑ 𝑦𝑖 ∑ 𝑥𝑖 = 𝑁𝑏 ∑ 𝑥𝑖 − 𝑏 (∑ 𝑥𝑖 )

Despejando b queda determinado el valor de uno de los parámetros de la ecuación que


es la pendiente:
𝑵 ∑ 𝒚𝒊 𝒙𝒊 −∑ 𝒚𝒊 ∑ 𝒙𝒊 ∑ 𝒚𝒊 𝒙𝒊 −𝑵 .𝒙
̅ .𝒚
̅
𝒃= ó 𝒃=
𝑵 ∑ 𝒙𝒊 𝟐 −(∑ 𝒙𝒊 )𝟐 ∑ 𝒙𝒊 𝟐 −𝑵.𝒙
̅𝟐

Para calcular el valor de a (ordenada al origen), que representa el punto en que la recta
corta al eje de las Y, se emplea la siguiente fórmula:
̅ + 𝒃𝒙
𝒂=𝒚 ̅
∑ 𝑥𝑖 ∑ 𝑦𝑖
Donde 𝒙
̅= y 𝒚
̅=
𝑁 𝑁

87
Error estándar de estimación
El siguiente proceso que se necesita en el análisis de la regresión lineal simple es cómo
medir la confiabilidad de la ecuación de estimación que hemos desarrollado.
El error estándar de estimación mide la variabilidad o dispersión de los valores observados
alrededor de la línea de regresión y se representa como Se. Su fórmula es la siguiente:

∑ 𝑦𝑖 2 − 𝑎. ∑ 𝑦𝑖 − 𝑏. ∑ 𝑥𝑖 𝑦𝑖
𝑆𝑒 = √
𝑛−2

Cuanto mayor sea el error estándar de la estimación, más grande será la dispersión (o
esparcimiento) de puntos alrededor de la línea de regresión. Por el contrario, si Se= 0,
se espera que la ecuación de estimación sea un estimador “perfecto” de la variable
dependiente, en este caso todos los puntos caerían directamente sobre la línea de
regresión y no habría puntos dispersos, como se muestra en la siguiente figura:

El error estándar de estimación tiene la misma aplicación que de la desviación estándar


que se vio en los temas anteriores. Esto es, suponiendo que los puntos observados tienen
una distribución normal alrededor de la recta de regresión, podemos esperar que:
 68% de los puntos están dentro de ± 1se
 95.5% de los puntos están dentro de ± 2se
 99.7% de los puntos están dentro de ± 3se

88
El error estándar de la estimación se mide a lo largo del eje “Y”, y no perpendicularmente
desde la recta de regresión.

Correlación simple
Mientras que el análisis de regresión simple establece una ecuación precisa que enlaza dos
variables, el análisis de correlación es la herramienta estadística que podemos usar para
describir el grado o fuerza en el que una variable esta linealmente relacionada con otra.
Dependiendo del tamaño de esta medida cuantitativa se puede decir, que tan
cercanamente se mueven dos variables, y por lo tanto, con cuanta confiabilidad se puede
estimar una variable con ayuda de la otra.
Una técnica estadística que establece un índice que proporciona, en un solo número, una
medida de la fuerza de asociación entre dos variables de interés, se llama análisis de
correlación simple.
El análisis de correlación es la herramienta estadística de que nos valemos para describir
el grado de relación que hay entre dos variables.
A menudo el análisis de correlación simple se utiliza junto con el análisis de regresión
lineal simple para medir la eficacia con que la línea de regresión explica la variación de la
variable dependiente, Y.
Diagramas de dispersión con correlación débil y fuerte.

Existen dos medidas para describir la correlación entre dos variables: el coeficiente de
correlación y el coeficiente de determinación.
89
Coeficiente de correlación
Cuando la correlación es del tipo lineal, el analisis se realiza a través del coeficiente
correlación de Pearson.
El coeficiente de correlación es una de las medidas con que puede describirse la eficacia
con que una variable es explicada por otra, así pues el signo de r indica la dirección de la
relación entre las dos variables X y Y. Se simboliza con la letra r y se calcula de la siguiente
manera:
𝑵 ∑ 𝒚𝒊 𝒙𝒊 − ∑ 𝒚𝒊 . ∑ 𝒙𝒊
𝒓=
√[𝑵 ∑ 𝒙𝒊 𝟐 − (∑ 𝒙𝒊 )𝟐 ]. [𝑵 ∑ 𝒚𝒊 𝟐 − (∑ 𝒚𝒊 )𝟐 ]
El campo de variación de dicho coeficiente es de -1 a 1, es decir: -1< r < 1
El siguiente esquema representa adecuadamente la intensidad y la dirección del
coeficiente de correlación.

Por lo tanto el coeficiente de correlación nos indica tres ideas fundamentales:


 La existencia o no de una relación entre las variables estudiadas
 La dirección de esta relación, si es que existe (ver gráfico)
 El grado o la intensidad de esta relación (ver gráfico)

90
Coeficiente muestral de determinación

La medida más importante de que también ajusta la línea de regresión estimada en los
datos muestrales en los que está basada, es el coeficiente de determinación, este es igual
a la proporción de la variación total de los valores de la variable dependiente, “Y”, que
puede explicarse por medio de la asociación de Y con X medida por la línea de regresión
estimada.
El coeficiente de determinación es la manera primaria de medir el grado, o fuerza, de la
relación que existe entre dos variables, X y Y.
El coeficiente de determinación se representa como r2, y mide exclusivamente la fuerza
de una relación lineal entre dos variables. Indica la proporción de la varianza de y que
queda explicada por conocimiento de x.

𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎
𝑟2 =
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙

El Cálculo del coeficiente de determinación se realiza elevando al cuadrado el coeficiente


de correlación. Y el campo de variación es de 0 a 1, es decir:
0< r < 1

Variación explicada y no explicada

Al encontrarse una relación lineal entre la variable aleatorio y, y la variable x ya no


consideramos la variabilidad de y con respecto a su media y sino que la estudiamos con
respecto a la recta de regresión y = a + b x
Entonces decimos que la variabilidad expresada por las diferenciasy 𝑦𝑖 − 𝑦̅ ya ha sido
explicada por la recta de regresión. Debido a ello, esta variabilidad se denomina variación
explicada.

91
Variación
total

Variación Variación no
explicada explicada

De acuerdo a lo expresado, podemos rescribir el diagrama anterior de la siguiente


manera:
Variación total = Variación no explicada + Variación explicada

(x1,y1)

(𝑦 −y1)
Variación No explicada
(y1-𝑦̅)
(x1,𝑦)
Variación total
𝑦̅ (𝑦-𝑦̅)

Variación explicada

𝑥̅ x1

Coeficiente de correlación de Kendall


Se puede pensar que la correlación positiva o negativa entre dos variables refleja de alguna
manera un grado de concordancia o discordancia respectivamente, en el mismo
sentido que r mide el grado de relación lineal entre las variables. Utilizando esta idea, se
puede decir que:
 Dos pares de observaciones (X,Y), es decir (X1,Y1) y (X2,Y2) son concordantes
si se cumple que:

92
𝑠𝑖 𝑋1 > 𝑋2 → 𝑌1 > 𝑌2
{ 𝑜 (1)
𝑠𝑖 𝑋1 < 𝑋2 → 𝑌1 < 𝑌2
 Dos pares de observaciones (X1,Y1) y (X2,Y2) son discordantes si se cumple
que:
𝑠𝑖 𝑋1 > 𝑋2 → 𝑌1 < 𝑌2
{ 𝑜 (2)
𝑠𝑖 𝑋1 < 𝑋2 → 𝑌1 > 𝑌2

Por ejemplo, si se tiene 4 pares de observaciones de X = IMC e Y = PAD sobre cuatro


pacientes como se muestra en la tabla:
Valores de IMC y PAD en 4 pacientes embarazadas
Pares de Paciente 1 Paciente 2 Paciente 3 Paciente 4
observaciones
X 34,89 22,27 26,49 41,05
Y 90 85 85 87

Entonces de acuerdo a lo definido mediante la Ecuación (1) y (2), los pares de


observaciones de la paciente 1 y de la paciente 2 son discordantes, mientras que los pares
de los pacientes 1 y 3 son concordantes, al igual que para los pacientes 1 y 2.
Comparaciones Pares de observaciones Tipos de pares
1 Paciente 1 y 2 Concordante
2 Paciente 1 y 3 Concordante
3 Paciente 1 y 4 Discordante
4 Paciente 2 y 3 Ni Concordante no
discordante
5 Paciente 2 y 4 Concordante
6 Paciente 3 y 4 Concordante

93
Con esta idea de Kendall define una medida de correlación entre dos variables X e Y
usando la proporción de pares de observaciones discordantes y
concordantes.
Para el cálculo de esta proporción se necesita previamente obtener el número total de
posible comparaciones (N), cuando se tiene disponible un número n de pares (X,Y),
y esto se consigue mediante la siguiente expresión:
𝑛(𝑛 − 1)
𝑁=
2
Es claro que se tiene n=4 observaciones como en el ejemplo, se deben realizar:
4(4−1)
𝑁= =6
2
6 comparaciones para determinar el número de pares discordantes que denotaremos Nd
y el número de pares concordantes que designaremos con Nc.
De manera que los pares discordantes, que denotaremos con Pd y la proporción de pares
concordantes, designada por Pc están dadas por:
𝑁𝑑
𝑃𝑑 =
{ 𝑁
𝑁𝑐
𝑃𝑐 =
𝑁
En el caso de las observaciones del ejemplo las comparaciones posibles darán como
resultados los siguiente: Nd=1 y Nc=4 en consecuencia tenemos
1 4
𝑃𝑑 = 𝑦 𝑃𝑐 =
6 6
Basándose en estas cantidades se define la medida de correlación de Kendall, para datos
medidos por lo menos en escala cualitativa ordinal como:

K = P c - Pd

Luego, para los datos del ejemplo se tiene que:


3
𝑘= = 0,50
6
94
Observemos que:
1. Si X e Y son independientes, lo que implica que no están asociada entonces P c 

Pd y por lo tanto K 0.
2. Si todos los pares son concordantes, es decir siempre que X aumente Y también

aumenta, entonces se verifica que Nc=N y Nd=0 y en por lo tanto K= 1, lo cual


representa perfecta correlación positiva (no necesariamente lineal).
3. Si todos los pares son discordantes, es decir siempre que X aumenta Y disminuye,

se verifica que Nd=N y Nc=0 y en consecuencia K= -1 lo cual indica perfecta


correlación negativa (no necesariamente lineal).
Con esto vemos que K, si bien no mide correlación lineal, mide el grado de asociación
de manera estandarizada y puede usarse aún en el caso de variables medidas en escala
cualitativa ordinal.

95
Capítulo 5: Teoría de la probabilidad

Probabilidad

Existe una multitud de situaciones que, pudiendo concluir con varios resultados
diferentes, no podemos predecir con seguridad cuál se ellos se producirá. ¿Cuántos hijos
tendrá un matrimonio? ¿Cuántos clientes visitarán hoy un determinado comercio?
¿Cuánto tiempo transcurrirá hasta que pase el próximo colectivo? ¿Qué equipo ganará el
próximo campeonato mundial de fútbol?
Estas preguntas tienen en común el hecho de saber que la respuesta es una incertidumbre,
sin embargo, se puede intentar hacer alguna cuantificación de esa incertidumbre. De eso
justamente se ocupa la teoría de la probabilidad, de cuantificar el azar.
Antes que nada, vamos a necesitar definir algunos elementos que posteriormente los
vamos a utilizar para definir el propio concepto de probabilidad.

Experimentos determinísticos y experimentos aleatorios

Existen experimentos que, al repetirse producen siempre el mismo resultado, y otros


que producen resultados diferentes cada vez que se lo lleva a cabo.
Por experimento vamos a entender a una simple acción, una operación que se realiza y
que tiene un resultado determinado. Como ejemplos de experimentos podemos citar el
simple hecho de arrojar una moneda al aire y dejarla caer observando qué lado queda
arriba. Hay que tener en cuenta dónde “finaliza” el experimento, en este caso observar el
lado de la moneda que queda hacia arriba. También podríamos estar interesado en saber
en qué parte del piso cayó la moneda, suponiendo que tenemos pisos cerámicos con dos
colores diferentes. También podríamos observar cuanto tiempo tarda en caer. Todos los
ejemplos son experimentos diferentes, aunque se trate siempre de arrojar una moneda.
Lo importante de todo esto es que, el resultado obtenido es incierto, depende del azar,
esto significa que no sabemos si caerá del lado de cara o del lado de cruz, o si caerá sobre
96
el color blanco o el color negro del piso cerámico, o tardará 1seg ; 2,5seg o 3,1seg en
tocar el suelo.
Para cada uno de estos experimentos tenemos al menos dos resultados posibles, y si bien
podemos conocer cuáles son estos resultados posibles, no podemos predecir con
exactitud cuál de ellos se producirá, aunque como veremos más adelante, seremos
capaces de estimar dicha ocurrencia.
Este tipo de experimentos decimos que son aleatorios y de ellos nos ocuparemos en
esta unidad.
Por otra parte existen experimentos, que como dijimos, siempre producen el mismo
resultado, por ejemplo, si observamos un insecto dentro de un recipiente sin oxígeno y
sin alimentos, sabemos con seguridad que el desenlace es su muerte, y aclaramos que no
es probable sino es seguro que pierda la vida.
Otro caso podría ser observar que ocurre con la moneda del ejemplo anterior, si va a caer
o quedará flotando, este resultado es también una certidumbre, salvo que estemos en
otro planeta donde no existe atracción gravitatoria. Y un último ejemplo podría ser
colocar un recipiente con agua al fuego. Si no hay interrupción del suministro de calor,
el resultado cierto es la ebullición.
A este tipo de experimentos lo llamamos determinísticos.
Volviendo a nuestro experimento de interés, otros casos de experimentos aleatorios
podemos citarlos en la siguiente tabla

EXPERIMENTOS ALEATORIOS RESULTADOS POSIBLES


Arrojar un dado y observar la cantidad de
puntos obtenida { }
Levantarse una mañana y observar el estado {DESPEJADO; CUBIERTO;
del cielo PARCIALMENTE NUBLADO}
Sembrar una semilla y esperar su resultado
{GERMINA ; NO GERMINA}
Preguntar a una mujer cuántos hijos tiene {0 ; 1 ; 2; …….(en teoría esta serie es
infinita)
Medir la estatura de una persona
( 0 ; )
97
Eventos aleatorios y espacio muestral

Como se puede apreciar, cada experimento tiene asociado un conjunto de resultados


posibles. Al conjunto de todos los resultados posibles lo llamaremos espacio muestral
o espacio probabilístico y cada uno de esos resultados es un evento aleatorio.
El conjunto espacio muestral se simboliza con la letra griega omega () y dicho conjunto
puede ser finito o infinito, puede ser numerable o no numerable y puede estar formado
por números o por otros elementos.
En los ejemplos mencionados se tiene que en el caso del dado, los resultados no son las
distintas caras que pueden quedar hacia arriba. Esas caras tienen puntos que representan
números, por eso lo más frecuente es decir que los resultados posibles del experimento
arrojar un dado es 1 al 6.
En el caso de las mediciones (talla, peso, tiempo de espera, etc) no podemos precisar la
cantidad de números posibles. De lo único que podemos estar seguros es que una persona
no puede medir 0 m ni tampoco un número negativo, por eso el paréntesis inicial, y
tampoco podemos determinar el valor más alto de talla, en consecuencia el otro límite
del intervalo es infinito ().
Como ejemplo, se citan algunos experimentos aleatorios y su espacio muestral asociado,
tengan en cuenta la notación correspondiente

EXPERIMENTO: “Arrojar dos monedas”


 = {cara, cara; cara, cruz; cruz, cara; cruz, cruz}

EXPERIMENTO: “Seleccionar un alumno de Psicopedagogía y observar su género”


 = {varón; mujer}

EXPERIMENTO: “Contar las inasistencias de un docente en todo el mes”


 = {0; 1; 2; 3; 4; 5; 6; 7; 8…26}

98
Definición de probabilidad

La probabilidad de un evento A, que se simboliza P(A), es un número comprendido entre


0 y 1 que cuantifica en términos relativos las opciones de verificación de dicho evento. Si
P(A) = 0 entonces diremos que A es un evento imposible y si P(A) = 1, entonces A
será un evento cierto.

Teorías de la probabilidad

Hasta aquí hemos visto el concepto de probabilidad y sus principales elementos. Ahora
veremos las reglas de cálculo de la probabilidad para los distintos eventos que conforman
un espacio muestral. Estas reglas se agrupan en las denominadas teorías o enfoques de la
probabilidad.

Teoría clásica o “a priori”

La probabilidad de que ocurra un evento A, se calcula como la cantidad de casos


favorables a dicho evento, sobre el total de resultados igualmente posibles.
Esta teoría hace mención a una importante condición: que los eventos sean igualmente
posible. Esto quiere decir que todos los resultados del experimento tienen la misma
probabilidad de ocurrencia, como por ejemplo, cada cara de un dado equilibrado.
En símbolos:

𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠


𝑃(𝐴) =
𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑖𝑔𝑢𝑎𝑙𝑚𝑒𝑛𝑡𝑒 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Supongamos, por ejemplo, que la experiencia consiste en extraer una carta de un mazo
de 52 cartas. Esta experiencia consta de 52 resultados posibles. Si se define a un evento
como la extracción de un as, éste tendrá 4 resultados favorables ya que en el mazo hay
4 ases.
Por lo tanto

99
4 1
𝑃(𝑒𝑥𝑡𝑟𝑎𝑒𝑟 𝑢𝑛 𝑎𝑠) = =
52 13
Esta probabilidad de puede expresar como la fracción 1/13, como decimal 0,08 o bien
en porcentaje 8%.

Teoría frecuencial o “a posteriori”

Hay situaciones en las cuales no se puede aplicar la noción de un número definido de


casos igualmente probables.
Por ejemplo, si una moneda no es perfecta, la probabilidad de obtener cara al lanzarla,
no es 1/2, debido a que los dos resultados posibles no son igualmente probables.
En estos casos, se puede aplicar la teoría de probabilidad, conocida con el nombre de
teoría frecuencial de la probabilidad.
Esta teoría expresa que, si se repite un experimento aleatorio un número bastante grande
de veces, la probabilidad de un evento en particular puede asimilarse a la frecuencia
relativa.
En otras palabras, la ley de comportamiento de los fenómenos aleatorios surge de la
distribución de frecuencias con que se presentan.
Este enfoque del cálculo de la probabilidad, a partir del concepto de frecuencia relativa,
es el más ligado a los hechos de la vida cotidiana y a la aplicación práctica de la estadística.
Supongamos que realizamos el experimento de tirar una moneda al aire un número n
muy grande de veces.
Cada resultado individual del experimento será impredecible puesto que la obtención
de cara o cruz depende estrictamente del azar.
Es lógico pensar que, si tiramos la moneda un número "n" de veces, donde n = 100, a
pesar del comportamiento irregular de los resultados individuales, los resultados
promedios o globales mostrarán una sorprendente regularidad.
Al finalizar el experimento, podremos cuantificar la probabilidad del evento que consiste
100
en la caída de la moneda mostrando la faz "cara". Ese valor estará dado por el cociente
entre, la cantidad de veces que la moneda cayó en esa posición y la cantidad "n" de
veces que se la arrojó.
Como ya hemos visto , el número de veces que se presenta un evento es la
frecuencia absoluta f i y la frecuencia relativa fr = fi/n representa la proporción de
veces que se presenta un evento en particular, en las n repeticiones del experimento.
La experiencia indica que la frecuencia relativa tiende a estabilizarse para grandes valores
de n.
Es decir, podemos establecer una ley de comportamiento de los fenómenos aleatorios a
través de muchas repeticiones del experimento.
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
Cantidad de lanzamientos
0,1
0
0 20 40 60 80 100
Cantidad de lanzamientos

Gráfico 1: Proporción de caras en una simulación de 100 lanzamientos de una moneda

La frecuencia relativa h(A) varía ampliamente para valores pequeños de n. Pero, al


aumentar el número n de repeticiones del experimento, la proporción de "caras" se va
estabilizando alrededor de un cierto valor límite o ideal muy próximo a 1/2.
Al repetir muchas veces un mismo experimento en condiciones uniformes, la estabilidad
de las frecuencias relativas se presenta de manera casi permanente.
Podemos asociar un número P(A) a cada evento A surgido por medio de la realización
101
de un experimento aleatorio , de manera tal que la frecuencia relativa de A, fr(A), será
aproximadamente igual a P(A) si se considera una larga serie de repeticiones del
experimento.
Diremos que P(A) es la probabilidad del evento A en el experimento. No debemos
olvidar aquí, que la frecuencia relativa y la probabilidad, al vincularse, establecen una
relación entre una situación de experimentación real (frecuencia realmente observada)
y un modelo conceptual o ideal (frecuencia teórica o esperada).
Por eso, esta asimilación de la probabilidad a las frecuencias relativas sólo es posible ante
experimentos que se puede repetir indefinidamente. Y aun así, siempre cabrá la duda
respecto de la magnitud que debe tener n para que esta aproximación se produzca.
𝑓𝑟(𝐴)
𝑃(𝐴) ≅
𝑛
A continuación se describe un ejemplo donde se aplica la teoría frecuencial.
El departamento de alumnado de una determinada escuela tiene registrado los datos de
los tutores de los alumnos y los clasificó según su ocupación en empleados públicos,
privados o desocupados. Se confeccionó entonces la siguiente tabla:

Tipo de ocupación Frecuencia Frecuencia


absoluta relativa
Empleado público 123 0,506
Empleado privado 102 0,420
Desocupado 18 0,074
Total 243 1

De esta tabla se desprende por ejemplo que la probabilidad de que un alumno tenga su
padre desempleado es:
18
P(Desocupado) = = 0,074
243
Teoría axiomática

A diferencia de la teoría clásica y la frecuencial, la axiomática no provee una regla de

102
cálculo, sino que establece tres axiomas que toda probabilidad debe cumplir.
Un axioma es una proposición o afirmación que es tan evidente que no necesita ser
demostrada.

Axioma 1: La probabilidad de un evento A es siempre no negativa

𝑃(𝐴) ≥ 0

Axioma 2: La probabilidad del espacio muestral es 1

𝑃() = 1

Axioma 3: Si A y B son dos eventos mutuamente excluyentes, entonces la probabilidad de


la unión de estos eventos es igual a la suma de las probabilidades de cada uno de ellos

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)

Dos eventos son mutuamente excluyentes cuando la aparición de uno de ellos


excluye la aparición del otro, en otros términos decimos que no se pueden producir al
mismo tiempo.
Este es el momento de realizar algunas aclaraciones con respecto a las operaciones entre
eventos. Esto se desprende del álgebra de conjuntos, tema que en matemática se
desarrolla en el primer año de la formación superior.
El espacio muestral  es el conjunto universal, el que contiene todos los eventos posibles.
A su vez cada evento puede ser un subconjunto de . Los eventos son elementales si no
se pueden dividir en eventos más simples.
Consideremos el ejemplo de arrojar un dado y lo representaremos gráficamente

5 6
1 2
3 4

103
Cada número es un evento elemental, puesto que no puede estar formado por otros
eventos más sencillos. Por ejemplo un evento A podría ser que salga el número 4,
entonces A = “obtener 4”. También podemos definir el evento B como el hecho de
obtener un número par, entonces B = {2; 4; 6}, aquí vemos que B está formado por
otros eventos más sencillos, entonces B es un evento no elemental o evento compuesto.

Definamos ahora el evento C de la siguiente manera: C = “obtener un número menor


que 5”, entonces C = {1; 2; 3; 4}

Aquí podemos definir algunas operaciones entre conjuntos y en consecuencia, entre


eventos.
La región sombreada está formada por la intersección de B y C, es decir los elementos
que son pares y menores a 5 al mismo tiempo, este nuevo evento formado el resultado
de la operación intersección y que se simboliza con ∩.

104
𝐵 ∩ 𝐶 = {2; 4}

La unión entre B y C está formada por todos los elementos que pertenecen a B, a C o
bien a ambos. La unión se simboliza con ∪.

𝐵 ∪ 𝐶 = {1 ; 2; 3; 4 ; 6}

Cuando dos eventos no tienen intersección se dice que son mutuamente excluyentes o
incompatibles, por ejemplo, el evento D = “obtener un número impar” y el evento B ya
definido son mutuamente excluyentes. Esto se simboliza así

𝐵∩𝐷 =∅

105
Donde ∅ es el símbolo que representa al conjunto vacío.
La probabilidad del tipo P(A∩B) se llama probabilidad conjunta.
El complemento de un evento E, es el conjunto de todos los resultados no favorables a E
y se simboliza ̅
E.
De los axiomas mencionados se desprenden algunas consecuencias.

Consecuencias de los axiomas

(a) La probabilidad de un evento está comprendida entre 0 y 1, siendo 0 la


probabilidad del evento imposible y 1 la probabilidad del evento cierto o seguro.

0 ≤ 𝑃(𝐴) ≤ 1

(b) La probabilidad del complemento de un evento es:

𝑃(𝐴̅) = 1 − 𝑃(𝐴)

(c) La probabilidad de la unión de dos eventos no mutuamente excluyentes es:

𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)

(d) La probabilidad del evento imposible es cero


𝑃(∅) = 0

Actividad

1. Un curso de matemática tiene 50 varones y 30 mujeres. Si se considera el


experimento de seleccionar un estudiante al azar de esta clase, determine:

a) P (de que sea elegido un varón)


b) P (de que sea elegida una mujer)

106
c) P (de que sea elegido un varón o una mujer)
d) Si se simboliza como A: que sea varón y B: que sea mujer ¿son A y B eventos
mutuamente excluyentes?

2. Un investigador médico, analizando 90 historias clínicas de pacientes Infartados,


encontró la siguiente información con respecto al hábito de fuma

Categoría de fumador Cantidad de pacientes


Menos de 10 10
Entre 10 y 20 30
Más de 20 50

Sean los eventos:

A: Paciente, que fuma menos de 10 cigarrillos diarios


B: Paciente que fuma entre 10 y 20 cigarrillos diarios
C: Paciente que fuma más de 20 cigarrillos diarios

calcule:

a) P(A)
b) P(B)
c) P(C)
d) P(A U B)
e) P(A U C)
f) P(B U C)
g) ¿Qué categoría de fumador tiene mayor probabilidad de sufrir un infarto?

107
3. De los 400 empleados de una empresa, 300 cuentan con cobertura médica
integral, 150 intervienen en un plan de participación en las utilidades y 130 participan en
ambos programas.

Si A = “empleados que cuentan con cobertura médica integral” y B = “empleados que


participan en un plan de participación de utilidades”. La representación gráfica de esta
situación, utilizando el diagrama de Venn, es la siguiente

Calcular la probabilidad de que un empleado seleccionado al azar:

a) Participe por lo menos en uno de los programas


b) No participe en ninguno de los programas
c) No participe en las utilidades
d) Tenga cobertura médica pero no participe en las utilidades

Probabilidad condicional

Como la probabilidad está ligada a la incertidumbre sobre los resultados del experimento
aleatorio, el hecho de que ocurra un suceso, puede cambiar la probabilidad de que
ocurran los demás. Un médico que esté realizando un diagnóstico sobre un paciente, sabe
que, a partir de los resultados de su análisis es probable que sea diabético. Pero si además
sabe que el paciente tiene familiares diabéticos, ésta probabilidad puede cambiar, más

108
aún, aumenta.
Si al arrojar un dado queremos saber la probabilidad de haber obtenido la cara dos, ésta
probabilidad aumenta si nos informan que ha salido un número par.
Si tenemos un recipiente con tres bolillas blancas y dos rojas, consideremos el
experimento extraer dos bolillas sin reposición, esto es, sacar primero una, dejarla
afuera, y luego volver a meter la mano para extraer la segunda. En estas condiciones, la
probabilidad del evento “sacar una bolilla roja en la segunda extracción” se ve
condicionada por el evento que haya ocurrido en la primera extracción.
Cuando en un experimento aleatorio queremos calcular la probabilidad de que ocurra un
cierto evento, sabiendo que otro ha ocurrido, decimos que estamos calculando una
probabilidad condicional. En símbolos esto se expresa:

𝑃(𝐴|𝐵)

Esto se lee: probabilidad de que ocurra el evento A , habiendo ocurrido el evento B


La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B se denomina
probabilidad condicional y se define

𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴|𝐵) =
𝑃(𝐵)

Se sabe que el 50% de la población fuma y que el 10% fuma y es hipertensa. ¿Cuál es la
probabilidad de que un fumador sea hipertenso?
A= “es hipertenso”
B= “es fumador”

𝑃(𝐴∩𝐵) 0,10
𝑃(ℎ𝑖𝑝𝑒𝑟𝑡𝑒𝑛𝑠𝑜|𝑒𝑠 𝑓𝑢𝑚𝑎𝑑𝑜𝑟) = 𝑃(𝐴|𝐵) = = = 0,20
𝑃(𝐵) 0,50

109
Por otra parte podemos decir que si la aparición de un evento no condiciona la aparición
de otro, tendremos que

𝑃(𝐴|𝐵) = 𝑃(𝐴)

En este caso diremos que A y B son eventos independientes.


Si A y B son dos eventos independientes, entonces se verifica que

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴). 𝑃(𝐵)

En cambio si no lo son, la probabilidad de esta intersección se calcula así:

𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴). 𝑃(𝐵|𝐴)

Vamos a utilizar estos conceptos para resolver el ejemplo de las bolillas


Sean los eventos
R1= “extraer roja en la primera extracción” R2= “extraer roja en la segunda
extracción”
Calcular la probabilidad de obtener dos bolillas rojas.
Para realizar este cálculo vamos a suponer que el experimento es sin reposición, es decir,
una vez extraída una bolilla, ésta queda afuera.
P(obtener dos rojas) = P(Roja en la primera extracción y Roja en la segunda extracción)
2 1 1
=P(R1 y R2) = P(R1∩R2) = P(R1).P(R2|R1) = ∙ =
5 4 10

Tablas de contingencia

Veamos un ejemplo integrador para comprender en una misma situación, los distintos
tipos de probabilidades.
Se toma una muestra de 30 sujetos los cuales son clasificados según sexo y resultado en
una prueba de aptitud física para desempeñar una tarea.
En la muestra había 10 mujeres, de las cuales 8 resultaron aptas, y en los varones los que
obtuvieron ese resultado fueron 11.

110
Para ordenar estos datos empleados una forma de organización llamada tabla de
contingencia
APTOS NO APTOS TOTAL
VARONES 11 9 20
MUJERES 8 2 10
TOTAL 19 11 30

Considere el experimento elegir un sujeto al azar y calculemos las siguientes


probabilidades

a) Probabilidad de que sea APTO

19
P(APTO) =
30

b) Probabilidad de que sea APTO sabiendo que se ha elegido una mujer


8
𝑃(𝐴𝑃𝑇𝑂∩𝑀𝑈𝐽𝐸𝑅) 30 4
P(APTO|MUJER) = = 10 =
𝑃(𝑀𝑈𝐽𝐸𝑅) 5
30

c) Probabilidad de que sea MUJER o sea APTO

P(MUJER o APTO) = P(MUJER ∪ APTO)


=P(MUJER) + P(APTO) – P(MUJER ∩ APTO)
10 19 8 7
= + − =
30 30 30 10

d) Probabilidad de que sea MUJER y sea APTO

8 4
P(MUJER y APTO) = P(MUJER ∩ APTO) = =
30 15

Algunas consideraciones finales sobre probabilidad

Hemos visto que una manera de asignar probabilidad a un evento consiste en considerar
la proporción de resultados favorables a éste respecto de todos los resultados posibles del
experimento. Esta definición de probabilidad se desprende de la definición clásica de
probabilidad.
También se ha dicho que existen muchas situaciones en las que no se puede aplicar este
111
procedimiento.
Por ejemplo, es dificultoso establecer la probabilidad de que mañana llueva utilizando
este método. Una manera más satisfactoria de relacionar probabilidades al mundo real es
en términos de frecuencia relativa.
Utilizando esta concepción teórica de la probabilidad, hemos establecido que lanzando
una moneda indefinidamente, y después de un cierto número de tiradas, se comprobaría
que el cociente entre el número de veces que salió "cara" y el número total de veces que
fue lanzada, sería muy próximo a cierto número. Y éste, será considerado como la
probabilidad de obtener "cara".
Es decir, la probabilidad de un evento puede ser pensada como la frecuencia relativa con
que éste ocurre, en un número indefinidamente grande de ensayos.
No vamos a omitir que, aproximar la medida de la probabilidad a la frecuencia relativa,
también tiene sus problemas. Por un lado la determinación es hipotética (se habla de tirar
una moneda "indefinidamente").
Y por otra parte, la noción de que la frecuencia relativa se aproxima a un valor constante
en un gran número de ensayos, necesita un estudio cuidadoso.
Sin embargo, al definir la probabilidad como el límite de la frecuencia relativa,
establecemos una relación válida y estrecha con los experimentos reales.
Así, aunque existen otras teorías que definen de distintas maneras la noción de
probabilidad, para los fines de este curso, bastará con atenernos a la definición clásica,
(proporción de resultados favorables respecto de los posibles) y a la que establece la teoría
frecuencial (límite de la frecuencia relativa).
Hasta aquí hemos desarrollado definiciones y propiedades referidas a experimentos
aleatorios y eventos. También hemos comentado las distintas teorías en que se basa el
cálculo de las probabilidades asociadas a ellos.
Ahora bien, cuando asignamos números reales a los resultados de un experimento
aleatorio, surge la definición de variable aleatoria. Este concepto es de fundamental
importancia en la aplicación de la teoría estadística inferencial.

112
Capítulo 6: Variable aleatoria y distribución normal

Variable aleatoria

Para introducir este concepto vamos a utilizar un ejemplo.


Supongamos que nuestro equipo favorito de futbol, digamos, la selección nacional, debe
jugar dos partidos, cada uno de los cuales puede ganar, empatar o perder. Consideremos
el experimento aleatorio “observar ambos partidos y esperar el resultado”. El espacio
muestral resultante es:
 = {GG ; GE ; GP ; EG ; EE; EP ; PG ; PE ; PP}

Los resultados de este experimento aleatorio no son números. Por eso, para poder
cuantificarlos, tendremos que asociar un número a cada uno de estos resultados.
Vamos ahora a asignar a cada uno de los nueve eventos posibles, la cantidad de puntos
obtenida (recuerden que por cada partido ganado se otorgan tres puntos, por el empate,
un punto y ningún punto si se pierde).
Evento Puntos obtenidos
GG 6
GE 4
GP 3
EG 4
EE 2
EP 1
PG 3
PE 1
PP 0
Haciendo esto mismo en un diagrama de Venn

0
GE GP
1
EP 2
EG EE
PG 3
PE 4
GG
6
PP 113
Una variable aleatoria es aquella cuyos valores surgen asignando números, a los resultados
de un experimento aleatorio.
Al estudiar la teoría de probabilidad hemos visto que únicamente se pueden asignar
probabilidades a los resultados de un experimento aleatorio, denominados eventos.
Como los valores que asumen las variables aleatorias surgen de cuantificar eventos, es
lógico pensaren asignar probabilidades a cada uno de los valores que ellas asumen.
Podemos, entonces, asignar una probabilidad a cada evento o resultado posible y,
consecuentemente, a cada valor de la variable aleatorio. Esto se lleva a cabo por medio
de una función de probabilidad.
Una función de probabilidad es aquella que surge al asignar probabilidades a cada uno
de los valores de una variable aleatoria.
Supongamos que los resultados del espacio muestral son igualmente probables y, por ello,
es lógico pensar en asignarle a cada uno la misma probabilidad, o sea 1/9.
A partir de este razonamiento, construimos la siguiente tabla:

Valores de la variable aleatoria


P(x)
X
0 1/9
1 2/9
2 1/9
3 2/9
4 2/9
6 1/9

Nótese que la suma de las probabilidades correspondientes a todos los valores posibles
que toma la variable aleatorio es siempre igual a 1.
Esto se debe a que los valores surgen de la cuantificación de todos los resultados posibles
de un experimento aleatorio y ya hemos visto que:

P() = 1

114
Esta es una regla que se denomina Ley de cierre y la vamos a simbolizar como sigue:

∑ 𝑝(𝑥𝑖 ) = 1

Esto se lee: la sumatoria de las probabilidades de cada uno de los valores de la variable
aleatoria X es igual a 1.
Podemos representar gráficamente la función de probabilidad de una variable aleatoria
discreta por medio de un gráfico a bastones. En este caso, tendremos:

0,25

0,20

0,15

0,10

0,05

0,00
0 1 2 3 4 5 6

Podemos observar que la tabla anterior es muy parecida a la tabla de frecuencias


aprendida en la unidad 1
En la primera columna aparecen los distintos valores que toma la variable
aleatoria X y en la segunda, la correspondiente probabilidad p(x) que puede asimilarse a
la noción de frecuencia relativa.
La variable aleatoria X toma solamente los valores 0, 1 , 2, 3, 4 y 6. De acuerdo
a lo estudiado, X es una variable aleatoria discreta.
Simbolizaremos con x1 los valores particulares que toma la variable
aleatoria X y en este caso se tendrá:

115
x1 = 0, x2 = 1, x3 = 2, x4 = 3, x5 = 4, x6 =6

Sí p(x) es la función que asigna probabilidades a cada valor de la variable aleatoria


X, podemos llamarla función de probabilidad de X y construir la siguiente tabla:

Valores de la variable aleatoria


p(x) P(X)
X
0 1/9 1/9
1 2/9 3/9
2 1/9 4/9
3 2/9 6/9
4 2/9 8/9
6 1/9 9/9
P(X): Función de Probabilidad Acumulada

En la tercera columna de la tabla aparece una nueva función que se denomina


función de distribución de probabilidad. Esta función acumula probabilidades
de una manera semejante a la columna de las frecuencias acumuladas en una tabla de
frecuencias y se simboliza con F(x).
Aprovechando la similitud entre frecuencia relativa y probabilidad,
recordemos además que, cuando teníamos una distribución de frecuencias,
calculábamos la media y la varianza. También podemos hacerlo ahora.
Generalmente, cuando consideramos una variable aleatoria y su
correspondiente función de probabilidad, la media aritmética de esta variable
aleatoria se denomina esperanza matemática.
La esperanza matemática de una variable aleatoria discreta, se calcula como la suma
de cada valor que toma la variable multiplicado por su respectiva probabilidad.

En símbolos:
𝑛

𝐸(𝑋) = ∑ 𝑥𝑖 ∙ 𝑝(𝑥𝑖 )
𝑖=1
116
Prácticamente, la esperanza matemática calcula el valor esperado promedio de una
variable aleatoria el cual está en función de la probabilidad asignada a cada uno de
los valores que toma dicha variable.
La varianza, de una variable aleatoria discreta, se define como la suma de los desvíos de
cada valor que toma la Variable aleatoria con respecto a la esperanza matemática, elevados
al cuadrado y multiplicados por su respectiva probabilidad.
También en esta situación se puede obtener la desviación estándar como la raíz
cuadrada positiva de la varianza.
En símbolos:
𝑛

𝑉(𝑋) = ∑[𝑥𝑖 − 𝐸(𝑋)]2 . 𝑝(𝑥𝑖 )


𝑖=1

A continuación calcularemos la esperanza matemática y la varianza en el ejemplo dado:

Valores de la variable aleatoria


p(x) x.p(X) [x – E(x)]2.p(x)
X
0 1/9 0 64/81
1 2/9 2/9 50/81
2 1/9 2/9 4/81
3 2/9 6/9 2/81
4 2/9 8/9 32/81
6 1/9 6/9 100/81
1 24/9=2,67 28/9=3,11

117
Otra aplicación
Supongamos que la probabilidad de que un automóvil de cierto tipo sea destruido por un
incendio o accidente en un período cualquiera de 12 meses es 0,005, según cálculos
actuariales efectuados por un organismo pertinente.
Una compañía de seguros ofrece al propietario de un vehículo una póliza contra incendio
por el término de 1 año valuando el móvil en 250.000 pesos y cobrándole una prima de
1400 pesos.
¿Cuál es la ganancia esperada de la compañía?
Para resolver este problema debemos definir, en primer lugar, la variable aleatoria y
establecer los distintos valores que ella puede tomar.

Variable aleatoria X = “ganancia de la compañía en un año”

Esta variable puede tomar los valores 1400 pesos si el auto no sufre un incendio y -
248600 pesos si el auto se quema durante el año que cubre la póliza.
La función de probabilidad de X es, entonces:

X p(x)
1400 0,995
-248600 0,005
1

Con esta información podemos calcular la ganancia esperada promedio de la compañía


de seguros.

𝐸(𝑋) = 1400 ∙ 0,995 + (−248600) ∙ 0,005 = 150

La compañía de seguros espera ganar 150 pesos, en promedio, con operaciones de


este tipo.
Actividad:

118
Supongamos que se planifica un estudio de las familias que tienen tres hijos.
Registramos, en consecuencia, el sexo de cada hijo por orden de nacimiento.
Los resultados posibles de este experimento son:
VVV MMM
VVM MVM
VMV MMV
MVV MMM

siendo V = varón y M = mujer.


(Supongamos que todos los resultados posibles tienen la misma probabilidad de
ocurrir).

Si se define la variable aleatoria X = cantidad de hijas mujeres por familia

a) Determine los valores posibles que asume la variable aleatoria X.


b) Calcule la función de probabilidad de X.
c) Calcule la esperanza matemática, la varianza y la desviación estándar de la variable
aleatoria X.

La distribución normal

A partir de ejemplos de la vida cotidiana veremos cómo a menudo utilizamos la


palabra normal.
Cuando nace un bebé, el médico lo lleva a la balanza y observa que pesa 3,500 Kg.
Lo primero que dirá, casi con certeza, es que tiene un peso normal.

Luego, cuando el niño comienza su vida escolar, es probable que alguna


psicopedagoga luego de efectuarle un test informe a la maestra que tiene una inteligencia
normal.

Cuando ya adolescente asista a un colegio secundario y termine el año con 5


amonestaciones, la madre probablemente tratará de justificarlo diciendo que es un chico
normal.

Si al llegar a adulto, se dedica a sembrar papas y dice que ha obtenido un


rendimiento de 10.000 Kg. por Ha. seguramente pensará que eso es lo normal.
119
Ahora bien, ¿qué queremos expresar cuando decimos es normal?
Lo que queremos decir es que a la mayoría de las personas, en situaciones similares
a las del joven del ejemplo, le pasa lo mismo.
Podemos pensar, por ejemplo, que el 95% de los bebés que nacen pesan entre 3
Kg y 4 Kg, que el mismo porcentaje de niños tienen un coeficiente de inteligencia entre
95 y 105, que el 95% de los adolescentes terminan un año escolar con una cantidad de
amonestaciones entre 3 y 7 y que el 95% de las hectáreas sembradas con papas rinden
entre 9.000 y 11.000 Kg.

Pero, como toda regla tiene excepciones, siempre habrá un porcentaje mínimo de
nacimientos prematuros, de niños superdotados, de adolescentes que siempre se
comportan de acuerdo a las normas escolares, o de hectáreas sembradas con papas que
sufrieron una determinada plaga y produjeron mucho menos.

Sin embargo, un análisis estadístico lógico nos llevará a concluir que todas estas
situaciones tienen una baja probabilidad de ocurrir.

Ahora bien, si un médico se tomara el trabajo de pesar, por ejemplo, a 500 niños
recién nacidos, registrar estos valores en una planilla, construir con ellos intervalos de
clase, calcular las frecuencias absolutas en dichos intervalos y luego graficar los datos por
medio de un histograma, es muy probable que obtenga la siguiente distribución:

120
Si trazamos el polígono de frecuencias en forma suavizada, tendremos una curva más
o menos simétrica, es decir, asi:

Esta curva, obtenida empíricamente, se asemeja a una curva teórica unimodal


y perfectamente simétrica que caracteriza a una distribución de probabilidad conocida
como distribución normal, Gaussiana o de Laplace, o también llamada campana de
Gauss. En la unidad 2 estudiamos el concepto de la medida de posición conocida como
Moda y vimos que las distribuciones unimodales se caracterizan por presentar un
valor bien definido de la variable al que le corresponde la mayor frecuencia absoluta.
La distribución normal presenta un valor de mayor frecuencia y, a partir de
él, decae hacia ambos lados con una simetría perfecta. Esta simetría hace que a valores
situados a igual distancia del valor modal por izquierda y por derecha de la
distribución, les corresponda la misma probabilidad. La representación gráfica de esta
distribución es la siguiente:

121
f(x)
Densidad

Variable

Esta figura refleja las situaciones expresadas en el ejemplo inicial. Así, en la primera
situación planteada, podemos pensar que existe una gran cantidad de bebés que tienen
un peso de 3,500 Kg. y a partir de este valor las frecuencias disminuyen a ambos lados
respetando la perfecta simetría de la distribución normal.
Para realizar este gráfico se recurre a una expresión matemática genéricamente
conocida como función densidad. Cada distribución de probabilidad de una variable
aleatoria continua tiene su propia función de densidad, en el caso de la Distribución
Normal, su función está dada por la siguiente expresión:

1 −
1
𝑥−𝜇 2
𝑓 (𝑥 ) = 𝑒 2 ( ) para −∞ < 𝑥 < ∞
𝜎 √2𝜋 𝜎

siendo μ y σ, los dos parámetros que caracterizan a una distribución normal donde:

μ = media aritmética o esperanza


σ = desviación estándar

122
Por ser la distribución perfectamente simétrica, la media μ coincide con la mediana
y la moda. Se encuentra en el punto del eje de abscisas que divide a la distribución en
dos partes iguales y, a su vez, registra el valor de la variable de mayor frecuencia.
La desviación estándar a, medida de variabilidad de la distribución, determina la
mayor o menor dispersión de los datos alrededor de μ.
Cuando σ crece, la curva se achata reflejando esta situación. Por ejemplo, si
consideramos la variable peso de personas, es razonable pensar que el peso de los
niños al nacer presenta una variabilidad mucho menor que el peso de adolescentes de
14 años, ya que a esta edad algunos están desarrollados como un adulto y otros, más
retrasados en su crecimiento, tienen todavía un cuerpo infantil.
Si graficamos la distribución de la variable peso al nacer y a los 14 años, la curva
correspondiente a esta última situación presentará una forma mucho más achatada,
reflejando una mayor dispersión de los pesos alrededor del valor promedio.
Los siguientes gráficos ayudarán a comprender mejor estos conceptos

1 2 3

μ cambia y σ es constante; μ1 < μ2 < μ3

123
Esta situación podría plantearse al estudiar la altura de determinada planta, en tres
estadíos de crecimiento: por ejemplo al mes, a los 3 meses y a los 5 meses. Es
probable que la variabilidad sea muy parecida en los tres momentos de la
experimentación y, en cambio, que el promedio de altura en el primer mes sea
inferior al que registra a los 3 meses y éste, a su vez, inferior a la altura promedio a
los 5 meses.

0,40
1

0,30 2
Densidad

0,20 3

0,10

0,00
-5,00 -2,50 0,00 2,50 5,00
Variable
μ es constante y σ cambia σ1 < σ2 < σ3

Un ejemplo de lo expresado en el gráfico anterior podría ser que σ1 fuera la


desviación estándar de los pesos de niños de 10 años en escuelas privadas de clase
social alta, con similar estado nutricional, σ2 la de los pesos de los niños de 10 años
de escuelas públicas y privadas, de clase social media y alta, con estado nutricional
más variable y σ3 la medida de variabilidad correspondiente al peso de niños de 10
años de escuelas públicas en general, donde se observa una gran variabilidad respecto
del estado nutricional de los alumnos.

124
En síntesis en el primer gráfico que muestra las tres curvas normales se observa que
un cambio en el valor de μ, desplaza toda la distribución normal pero no altera su
forma.
Por el contrario, si analizamos el segundo gráfico vemos que un cambio en el valor
de σ no desplaza la curva sino que altera su forma, haciéndola más estrecha a medida
que disminuye su valor.

Características de la distribución normal

Veremos ahora algunas características que presenta la distribución normal.


Como ya hemos expresado anteriormente al hablar de las curvas de distribución de
densidad de probabilidad, el área total bajo la curva normal es también igual a 1.

P (- ∞ < x < ∞) = 1
A su vez, al ser la curva simétrica con respecto a μ, el 50% de las observaciones se
encuentran por debajo de la media μ y el 50% por encima de ella. O sea:

P (- ∞ < x < μ) = 0,50 y P (μ < x < ∞) = 0,50

La distribución normal es una distribución teórica, ideal, que cumple con ciertas
propiedades, las que surgen de la aplicación de la fórmula matemática que expresa su
función de densidad de probabilidad.
Estas propiedades son:

En el intervalo (μ - σ; μ + σ) se encuentra el 68,2% de las observaciones, o lo que


es lo mismo:
P (μ - σ < x < μ + σ) = 0,682

En el intervalo (μ - 2σ; μ + 2σ) se encuentra el 95,4% de las observaciones, o:

P (μ - 2σ < x < μ + 2σ) = 0,954


125
En el intervalo (μ - 3σ; μ + 3σ) se encuentra el 99,8% de los datos, o:

P (μ - 3σ < x < μ + 3σ) = 0,998

Veremos la aplicación de estas propiedades por medio de un ejemplo. Supongamos


que se está considerando la variable continua "altura de niños" de una determinada
edad escolar en la ciudad de Formosa. Una vez medida la altura de una muestra de
niños y sistematizando la información podríamos haber obtenido los siguientes
valores:
μ = 1,30 m.
y
σ = 0,12 m.

Si la distribución de la variable "altura de niños" es aproximadamente simétrica, se


podrían aplicar las propiedades enunciadas precedentemente obteniendo las
siguientes conclusiones:

1. El 68,2% de los niños medirá entre (1,30 - 0,12) y (1,30 + 0,12) o, lo que es lo
mismo, el 68,2% de estos niños tendrán una altura comprendida en el intervalo
(1,18; 1,42)
2. El 95,4% de los niños tendrán una altura comprendida en el intervalo (1,06; 1,54)
3. El 99,8% de los niños tendrán una altura comprendida en el intervalo (0,94; 1,66)
Gráficamente, tendremos:
3,3 3,3

2,5 2,5
Densidad

Densidad

1,7 1,7

95,4%
0,8 68,2% 0,8

0,0 0,0
0,70 0,94 1,18 1,42 1,66 0,70 1,90 0,94 1,18 1,42 1,66 1,90
Variable Variable

126
3,3

2,5

Densidad
1,7

99,4%
0,8

0,0
0,70 0,94 1,18 1,42 1,66 1,90
Variable

Ahora bien, considerando los distintos valores que pueden tomar los parámetros de
la distribución normal, los correspondientes campos de variación son:

-∞<μ<∞ y 0<σ<∞

y ya podemos pensar que existen infinitas curvas normales distintas, que surgen al
variar los valores de μ y σ en cada situación experimental particular.
Para calcular probabilidades de la distribución normal deberíamos aplicar una
operación matemática llamada integral a la función de densidad, reemplazando los
parámetros μ y σ por los valores de alguna combinación en particular. Pero teniendo
en cuenta la expresión matemática que caracteriza a la función de densidad de una
variable normalmente distribuida, vemos que calcular probabilidades en base a ella,
es un procedimiento muy complicado y prácticamente imposible de efectuar
manualmente.
Como no existe una sola distribución normal sino toda una familia de infinitas
distribuciones normales, cada una correspondiente a una cierta combinación de μ y
σ, fue necesario seleccionar una de todas estas combinaciones para que las
representara.

127
Esta distribución particular se conoce con el nombre de distribución normal
estandarizada y es la que corresponde a la combinación de los parámetros μ = 0 y
σ = 1.
Las probabilidades asociadas a esta distribución normal particular, se encuentran ya
tabuladas.
Pasaremos a estudiar ahora, entonces, la distribución normal estandarizada.

Distribución normal estandarizada

Una distribución normal se denomina estandarizada si su media es 0 y su varianza y,


por lógica, su desviación estándar, son iguales a 1.
Para obtener una variable normal estandarizada se debe realizar una transformación
de la variable normal original X.
Esta transformación da como resultado una nueva variable que llamaremos Z y que
surge al restar a la variable X original su media μ y dividirla por su desviación estándar
σ.
Entonces

𝑋−
𝑍=

y su correspondiente función de densidad de probabilidad es:

1 𝑧2
−2
𝑓(𝑧) = 𝑒
√2𝜋
Como podemos observar, la distribución de probabilidad de una variable
estandarizada Z es simétrica con respecto al valor 0 pues ahora μ = 0.
Al trabajar con una variable normal estandarizada también se cumple que:

P(- 1 < z < 1) = 0,684


P(- 2 < z < 2) = 0,954
P(- 3 < z < 3) = 0,998
128
Gráficamente:
0,4 0,4

0,3 0,3

Densidad
Densidad

0,2
0,2

68,2% 95,4%
0,1
0,1

0,0
0,0 -4,00 -3,00 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00
-4,00 -3,00 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00 Variable
Variable

0,4

0,3
Densidad

0,2
99,4%
0,1

0,0
-4,00 -3,00 -2,00 -1,00 0,00 1,00 2,00 3,00 4,00
Variable

Uso de la tabla de probabilidades normales

La tabla de probabilidades normales está construida considerando una distribución


normal con media μ = 0 y desviación estándar σ = 1, o, lo que es lo mismo, para la
variable que hemos denominado variable normal estandarizada Z. Esta tabla puede
ser usada para obtener probabilidades asociadas con cualquier distribución normal,
siempre que la media y la varianza sean conocidas.
Para entrar a la tabla y buscar las correspondientes probabilidades, debemos
transformar la variable original X y obtener la respectiva variable estandarizado Z.

129
La tabla para calcular probabilidades de una distribución normal estandarizada está
construida considerando probabilidades acumuladas, o sea, siempre debemos buscar
probabilidades del tipo:

P(Z < Z0) = F (Z0)

y se lee probabilidad acumulada hasta Z0, un valor particular de la variable Z.


Éste es un fragmento de la tabla que utilizaremos para calcular probabilidades bajo
una

distribución normal. El cálculo de probabilidades se realiza obteniendo áreas bajo la


curva y entre valores de Z, en el eje de las abscisas.
Veamos un ejemplo:
La variable peso al nacer de niños sigue una distribución normal con media igual a
3,5kg y desvío estándar 0,5kg. Esto se simboliza así: X~N(3,5 ; 0,5).
Calculemos la probabilidad de que un niño pese menos de 2,7 kg, esto es P( X <
2,7).

130
A continuación vamos a estandarizar la variable y luego buscar en la tabla la
probabilidad buscada. Hay que tener en claro que este tipo de distribuciones, la
probabilidad puntual es siempre igual a cero, es decir P(X = a) = 0, para cualquier
valor de a.
2,7 − 3,5
𝑃(𝑥 < 2,7) = 𝑃 (𝑧 < ) = 𝑃(𝑧 < −1,06)
0,5
Debemos buscar el -1,06 en la tabla. La parte entera y el primer decimal lo
buscamos en la primera columna y el segundo decimal lo buscamos en la primera
fila

Parte entera y Probabilidad Segundo


primer decimal buscada decimal

En consecuencia P(el niño pese menos de 2,70kg) = P(x < 2,7) = 0,1685.

131
Capítulo 7: Indicadores

Las medidas de resumen más utilizadas en distintas aéreas, son los llamados índices.
Un índice puede ser cálculo sencillo o complicado, por ejemplo, el índice de costo
de vida no es una fórmula sencilla, mientras que el índice de hacinamiento es
simplemente un cociente entre número de personas y número de habitaciones.
Se pueden describir tres tipos de índices distintos: las razones, las proporciones y las
tasas.

Razón

Una razón es la comparación por cociente entre dos cifras no necesariamente de la


misma naturaleza. Es una medida de la relación entre ellas.
Por ejemplo si hay un hospital con 380 camas y tiene 95 enfermeras, la razón sería:

380
𝑅𝑎𝑧ó𝑛 𝑑𝑒 𝑐𝑎𝑚𝑎𝑠 𝑝𝑜𝑟 𝑒𝑛𝑓𝑒𝑟𝑚𝑒𝑟𝑎 = = 4; Cada enfermera atiende 4
95
camas
La manera correcta de expresar el resultado del cálculo de una razón es señalar el
número de elementos del numerador que existen por cada elemento del
denominador.-
Otro ejemplo si en una población de 2.500 habitantes hay 645 viviendas, cuantos
habitantes hay por vivienda, lo dice la razón
2500
𝑅𝑎𝑧ó𝑛 𝑑𝑒 ℎ𝑎𝑏𝑖𝑡𝑎𝑛𝑡𝑒𝑠 𝑝𝑜𝑟 𝑣𝑖𝑣𝑖𝑒𝑛𝑑𝑎𝑠 = = 4; hay 4 habitantes por
625
vivienda
Otros ejemplos de razón son la densidad de población de una ciudad, que se obtiene
el número de habitantes por la superficie de dicha ciudad. El índice de masculinidad
que es el cociente entre el numero de varones y el número de mujeres, asi por
ejemplo, si en una escuela se ha contabilizado 250 alumnos de los cuales 150 son

132
varones; el índice de masculinidad sería de 1,5; lo cual indicaría que la cantidad de
varones es 1,5 veces la cantidad de mujeres.

Proporción
Es un cociente en el que el numerador está incluido en el denominador.
Los individuos o elementos que figuran en el numerador del cociente deben ser
incluidos también en el denominador.
En el caso de la escuela que tiene 250 alumnos de los cuales 150 son varones; la
proporción de alumnos varones es:
150 𝑣𝑎𝑟𝑜𝑛𝑒𝑠
.100 = 60%;
150 𝑣𝑎𝑟𝑜𝑛𝑒𝑠 𝑦 100𝑚𝑢𝑗𝑒𝑟𝑒𝑠

Por ejemplo, si en una población de 25.000 habitantes se diagnostican 1.500


pacientes con diabetes, la proporción de diabetes en esa población es:
1500
𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑖𝑎𝑏𝑒𝑡𝑒𝑠 = = 0,06; 6 % expresada en porcentaje. Cada
25000
cien habitantes de una población se diagnostican 6 con diabetes.
Si en una comisión de 120 alumnos, cuarenta son varones; la proporción de varones
en esa comisión es:
40
𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑣𝑎𝑟𝑜𝑛𝑒𝑠 = = 0,33; 33% son varones en esa comisión.
120
Cada cien alumnos 33 son varones.
El valor de una proporción puede variar así de 0 a 1, y suele expresarse como un
porcentaje, que varía entre 1 y 100.-
En algunos casos el numerador resulta ser muy pequeño con respecto al
denominador, lo que trae como consecuencia que el cociente sea un numero decimal
con demasiados ceros antes de la primera cifra significativa. Por ejemplo si se calcula
la proporción de alumnos repitentes en escuelas de la provincia, y como resultado del
cociente entre el número de alumnos repitentes y el tamaño de los alumnos de la
provincia se obtiene el valora 0,0009; entonces aun expresado en porcentaje, es
0,09%, esta cifra puede no tener suficiente claridad para ser comprendida. Por tal
133
razón, se recurre a multiplicar el cociente por otros múltiplos de 10 (1000, 10000,
etc.) lo que significa que en promedio, 9 de cada 10000 alumnos repiten el curso en
la provincia.

Ejemplos en el Área de Educación

Porcentaje de alumnos salidos sin pase: es la proporción de alumnos que


durante un ciclo lectivo determinado han salido de la unidad educativa sin haber
pedido un pase para una escuela de destino, sobre el total de matriculados. En este
grupo se incluye a los alumnos que abandonaron sus estudios por cualquier motivo
(incluso fallecimiento) y a los que continúan en otra escuela sin haber realizado el
trámite de pase. Se calcula tomando como numerador los salidos sin pase registrados
en la matrícula final del relevamiento anualde un año determinado respecto al ciclo
lectivo anterior, y como denominador a los matriculados en el mes de abril en el
relevamiento anual del año anterior.
Porcentaje de alumnos promovidos: se calcula considerando a los alumnos
promovidos al final del ciclo lectivo (incluyendo los resultados de los exámenes
complementarios) respecto del total de matriculados al final del año.
Porcentaje de repetidores: es la proporción de los alumnos repetidores en un
año dado (cursan por segunda vez o más el mismo año de estudio o ciclo, por no
haberlo promovido en la primera oportunidad) sobre el total de alumnos
matriculados de ese mismo año.
Porcentaje de sobreedad: es el porcentaje de alumnos que tienen una edad mayor
a la considerada teórica para el año de estudio que cursan respecto del total de
alumnos matriculados.
Promedio de alumnos por sección/división: es el cociente entre el total de
alumnos matriculados y el total de secciones/divisiones.

134
Tasa
El concepto de tasa es similar al de una proporción, con la diferencia de que las tasas
llevan incorporado el concepto de tiempo. Toman todos los casos de un evento por
una causa, pertenecientes a una población total, en un lugar y período determinado.-
Las tasas incorporan el concepto de tiempo y lugar, o sea que numerador y
denominador deben estar referidos, al mismo tiempo y lugar.-
Las tasas representan la fuerza con que se produce un hecho determinado en una
población, y esto es igual a riesgo.- Se pueden hacer pronósticos en base a tasas
calculadas en período inmediatamente anteriores.-
Entonces:
En la definición de tasas, en general, aparecen tres elementos:
 El numerador (a), que consiste en el número de veces que ocurrió un
determinado hecho en un periodo de tiempo dado y en un área determinada.
 El denominador (a+b), que es la población expuesta al riesgo de que le suceda
el fenómeno que aparece en el numerador
 Una constante (k) por la cual se multiplica el cociente (100, 1000, 10000,
etc.) a fin de que la tasa se exprese convenientemente.
𝑎
𝑇𝑎𝑠𝑎 = .𝑘
𝑎+𝑏

Toda tasa es una expresión numérica de un riesgo al que estuvo sometida una
población, Mide un riesgo en términos probabilísticos.-

Indicadores educativos:
Tasa de asistencia a la escuela: es el índice que mide la población de determinado
grupo de edad que asiste a algún establecimiento de educación formal –
independientemente del nivel que curse- sobre el total de población de ese grupo de
edad.
135
Tasa de retención: es el índice que mide una cohorte de alumnos matriculados en
el primer grado/año de estudio de un ciclo o nivel de enseñanza en un año escolar
dado, que alcanzan el último grado/año del ciclo/nivel de enseñanza en el tiempo
ideal que corresponde al nivel. Se calcula tomando como numerador a los
matriculados en 6° o 7º grado (exceptuando los repetidores) en el mes de abril del
último año calendario de la cohorte, y como denominador a los matriculados en 1º
grado (exceptuando los repetidores) en el mes de abril del primer año calendario de
la cohorte.
Tasa de desgranamiento: es el complemento de la tasa de retención, se calcula
restando a 100 el valor de la tasa de retención. Mide el porcentaje de alumnos que
no hicieron el nivel en el tiempo ideal.
Tasa neta de escolarización: es el índice que mide la población de determinado
grupo de edad que asiste al nivel educativo correspondiente a su edad teórica sobre
el total de población de ese grupo de edad.
Tasa neta de escolarización en el nivel primario: es el índice que mide el
numero de niños de 6 a 12 años que asiste al nivel primario sobre la población de ese
mismo grupo de edad.
Tasa neta de escolarización en el nivel medio: es el índice que mide el número
de jóvenes de 13 a 17 años que asiste al nivel medio sobre la población de ese mismo
grupo de edad.
Tasa de promoción: es el índice que mide el número de alumnos admitidos por
primera vez en cada grado en un ciclo lectivo o año calendario dado, respecto de la
matricula total del grado anterior en el ciclo lectivo o año calendario anterior.
Tasa de deserción: es el índice que mide el número de alumnos que abandonan el
sistema entre dos años calendarios dados (porcentaje de alumnos que ni
promocionaron ni repitieron). Se calcula restando a una base de 100 las tasas de
promoción y repetición.

136
Tasa de repetición: es el índice que mide el número de los alumnos repetidores de
un grado en un año dado respecto de la matrícula del mismo grado en el ciclo lectivo
anterior

Indicadores de uso frecuente en salud


Tasas generales: son aquellas cuyo el denominador es el total de la
población

𝑇. 𝑀𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝐺𝑒𝑛𝑒𝑟𝑎𝑙 =
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑒𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑒𝑠 𝑝𝑜𝑟 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑐𝑎𝑢𝑠𝑎𝑠 𝑒𝑛 𝑢𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑝𝑒𝑟𝑖𝑑𝑜 𝑧
. 1000
𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙 𝑒𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑧

𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑛𝑎𝑐𝑖𝑑𝑜𝑠 𝑣𝑖𝑣𝑜𝑠 𝑒𝑛 𝑢𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑝𝑒𝑟𝑖𝑑𝑜 𝑧


𝑇. 𝑁𝑎𝑡𝑎𝑙𝑖𝑑𝑎𝑑 = .𝑘
𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙 𝑎 𝑚𝑖𝑡𝑎𝑑 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑍, 𝑒𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥

Tasas específicas: el denominador contiene un subgrupo de la población.

𝑇. 𝑀𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝐼𝑛𝑓𝑎𝑛𝑡𝑖𝑙 =
𝑑𝑒𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒 𝑛𝑖ñ𝑜𝑠 𝑚𝑒𝑛𝑜𝑟 𝑑𝑒 𝑢𝑛 𝑎ñ𝑜,𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑝𝑒𝑟𝑖𝑑𝑜 𝑧
. 1000
𝑁𝑎𝑐𝑖𝑑𝑜𝑠 𝑉𝑖𝑣𝑜𝑠 𝑑𝑒𝑙 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑧

𝑇. 𝑀𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝑓𝑒𝑡𝑎𝑙
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑒𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑒𝑠 𝑓𝑒𝑡𝑎𝑙𝑒𝑠 𝑒𝑛 𝑢𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑝𝑒𝑟𝑖𝑑𝑜 𝑧
= . 1000
𝑁𝑢𝑚𝑒𝑟𝑜𝑠 𝑑𝑒 𝑛𝑎𝑐𝑖𝑑𝑜𝑠 𝑣𝑖𝑣𝑜𝑠 𝑒𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑧

Tasas de mortalidad: relacionan el total de defunciones de un área geográfica


determinada, en un año determinado, con la población de la misma área geográfica
en igual periodo de tiempo.

137
𝑑𝑒𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑒𝑠 𝑝𝑜𝑟 𝑐𝑎𝑢𝑠𝑎𝑠 𝑚𝑎𝑡𝑒𝑟𝑛𝑎𝑠
𝑇. 𝑀𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝑀𝑎𝑡𝑒𝑟𝑛𝑎 = .𝑘
𝑁𝑎𝑐𝑖𝑑𝑜𝑠 𝑣𝑖𝑣𝑜𝑠

𝑛° 𝑑𝑒𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑒𝑠 𝑝𝑜𝑟 𝑐𝑎𝑛𝑐𝑒𝑟


𝑇. 𝑀𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝑝𝑜𝑟 𝑐á𝑛𝑐𝑒𝑟 = .𝑘
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑇𝑜𝑡𝑎𝑙

Tasas de morbilidad: relacionan los enfermos de un área geográfica determinada,


en un año determinado, con la población de la misma área geográfica en igual periodo
de tiempo.
Por ejemplo tasa de morbilidad por sarampión:
𝑛° 𝑒𝑛𝑓𝑒𝑟𝑚𝑜𝑠 𝑝𝑜𝑟 𝑠𝑎𝑟𝑎𝑚𝑝𝑖ó𝑛
𝑇. 𝑀. 𝑝𝑜𝑟 𝑠𝑎𝑟𝑎𝑚𝑝𝑖ó𝑛 = .𝑘
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑇𝑜𝑡𝑎𝑙
Tasas de morbilidad mas usuales:
Incidencia: que relaciona los casos nuevos de una determinada enfermedad en la
unidad de tiempo, generalmente un año, con la población del mismo lugar y tiempo.
𝑐𝑎𝑠𝑜𝑠 𝑛𝑢𝑒𝑣𝑜𝑠 𝑑𝑒 𝑇𝐵𝐶
𝑇. 𝑖𝑛𝑐𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑇𝐵𝐶 = .𝑘
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑇𝑜𝑡𝑎𝑙

Prevalencia: se obtiene haciendo el total de una determinada enfermedad en un


tiempo determinado, con la población total.

𝑇. 𝑑𝑒 𝑝𝑟𝑒𝑣𝑎𝑙𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑇𝐵𝐶
𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑑𝑒 𝑇𝐵𝐶 𝑒𝑛 𝑝𝑒𝑟𝑖𝑜𝑑𝑜 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑑𝑜
= .𝑘
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑇𝑜𝑡𝑎𝑙

De ataque: se obtiene relacionando el total de un brote localizado, con la población


expuesta al riesgo.

𝑛° 𝑑𝑒 𝑖𝑛𝑡𝑜𝑥𝑖𝑐𝑎𝑑𝑜𝑠 𝑒𝑛 𝑢𝑛𝑎 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑑𝑎 𝑓𝑖𝑒𝑠𝑡𝑎


𝑇. 𝑑𝑒 𝑎𝑡𝑎𝑞𝑢𝑒 = .𝑘
𝑎𝑠𝑖𝑠𝑡𝑒𝑛𝑡𝑒𝑠 𝑎 𝑙𝑎 𝑓𝑖𝑒𝑠𝑡𝑎
138
Utilizada en epidemias o episodios de breve duración.

Tasas de letalidad: relacionan las muertes ocurridas por determinada causas, en un


área geográfica y año determinado, con los enfermos por las mismas causas en igual
área geográfica y periodo de tiempo.
𝑇. 𝑑𝑒 𝑙𝑒𝑡𝑎𝑙𝑖𝑑𝑎𝑑 𝑝𝑜𝑟 𝑠𝑖𝑑𝑎
𝑛° 𝑑𝑒 𝑚𝑢𝑒𝑟𝑡𝑒𝑠 𝑝𝑜𝑟 𝑠𝑖𝑑𝑎, 𝑒𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑡𝑖𝑒𝑚𝑝𝑜 𝑧
= .𝑘
𝑛° 𝑑𝑒 𝑒𝑛𝑓𝑒𝑟𝑚𝑜𝑠 𝑝𝑜𝑟 𝑠𝑖𝑑𝑎, 𝑒𝑛 𝑙𝑢𝑔𝑎𝑟 𝑥 𝑦 𝑡𝑖𝑒𝑚𝑝𝑜 𝑧

139
Bibliografía

 RUBIANO, Inés González de. (2008) “Estadística y Biometría Notas De


Cátedra”
 KOHAN, Nuria Cortada De (1993): “Diseño Estadístico”.EUDEBA.
 BOLOGNA Eduardo (2011): “Estadística en Psicología y Educación”. Editorial
Brujas. Córdoba.
 BOTELLA (2003): “Análisis de datos en psicología”. Madrid
 PEÑA, Daniel. (2001), “Fundamentos de Estadística”. Editorial Alianza. Madrid.

140
141