Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autor
Profesional en Matemáticas y Estadística
Todos los derechos reservados. Ninguna parte de esta publicación puede ser reproducida, almacenada
en sistema alguno de tarjetas perforadas o trasmitida por otro medio – electrónico, mecánico,
fotocopiador, registrador, etcétera sin permiso previo por escrito del autor.
All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or
transmitted in any form by any means, electronic, mechanical, photocopying, recording or otherwise,
without the prior writing permission from author.
Tabla de contenido
ESTADÍSTICA..........................................................................................................................................................4
POBLACIÓN Y MUESTRA........................................................................................................................................5
VARIABLE Y TIPO DE VARIABLE.............................................................................................................................5
Según la medición.............................................................................................................................................5
Variables cualitativas....................................................................................................................................5
Variables cuantitativas.................................................................................................................................5
Según la influencia............................................................................................................................................6
Variables independientes.............................................................................................................................6
Variables dependientes................................................................................................................................6
ESCALAS DE MEDIDAS...........................................................................................................................................6
DISTRIBUCIONES DE FRECUENCIAS.......................................................................................................................7
Tablas y gráficas de frecuencias para variables cuantitativas..........................................................................7
Variables discretas............................................................................................................................................7
Distribución de frecuencias agrupadas........................................................................................................8
Graficas para variables discretas......................................................................................................................9
Gráfico de barras de frecuencias..................................................................................................................9
Polígono de frecuencias.............................................................................................................................10
Ojiva de frecuencias...................................................................................................................................11
Variable continua............................................................................................................................................11
Graficas para variables continúas...................................................................................................................12
Histograma de frecuencias.........................................................................................................................13
Tablas y gráficas de frecuencias para variables cualitativas..........................................................................14
GUÍA DE CLASE N° 1.............................................................................................................................................17
MEDIDAS DE TENDENCIA CENTRAL.....................................................................................................................19
La Media Aritmética (o simplemente Media).................................................................................................19
Media geométrica...........................................................................................................................................21
Media armónica..............................................................................................................................................22
Mediana..........................................................................................................................................................22
Moda...............................................................................................................................................................24
Relación entre las medidas de tendencia central...............................................................................................26
OTRAS MEDIDAS DE POSICIÓN...........................................................................................................................27
Cuartiles..........................................................................................................................................................27
Deciles.............................................................................................................................................................28
Percentiles.......................................................................................................................................................29
La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos,
la cual ayuda en la toma de decisiones o para explicar condiciones o sucesos de algún fenómeno o
estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, estadística es más
que eso, en otras palabras es el vehículo que permite llevar a cabo un proceso relacionado con
una investigación científica.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en
áreas de negocios, investigaciones científicas, educación, entre otras.
Al reseñar las dos áreas de la estadística, se puede resumir como sigue el significado de
estadística:
Una Población es el conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones y se denota: N. Levin & Rubin (1996). Una población finita
es aquella que está formada por un limitado número de elementos o individuos y una población es
infinita cuando no se conoce el número de elementos o individuos, o también se puede considerar
población infinita cuando una población finita es muy grande.
Una variable es una característica que al ser medida en diferentes individuos es susceptible de
adoptar diferentes valores. Las variables se denotan generalmente con letras mayúsculas X, Y, Z,
por ejemplo, X: Estaturas de las personas.
Según la medición
Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad
que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de
dichos atributos. Las variables cualitativas no pueden ser medida por ningún instrumento de
medición, por ejemplo: Color de los ojos. Dentro de ellas podemos distinguir:
• Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos
valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo
entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.
• Variable cualitativa nominal o categórica: En esta variable los valores no pueden ser
sometidos a un criterio de orden, es decir, no sigue ningún orden, como ejemplo: los colores,
género, estado civil.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas, por ejemplo: Estatura de las
personas. Las variables cuantitativas pueden ser:
Según la influencia
Según la influencia que asignemos a unas variables sobre otras, podrán ser:
Variables independientes
Una variable independiente también conocida como la variable manipulada, es aquella cuyo valor
no depende de otra variable. Es aquella característica o propiedad que se supone la causa del
fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador
manipula. Ejemplo: Genero.
Variables dependientes
Son las variables de respuesta que se observan en el estudio y que podría estar influenciadas por
los valores de las variables independientes. Ejemplo: Preferencia de los colores.
La variable dependiente es el factor que es observado y medido para determinar el efecto de la
variable independiente.
ESCALAS DE MEDIDAS
Escalas de medición son una sucesión de medidas que permiten organizar datos en orden
jerárquico. Las escalas de medición pueden ser clasificadas de acuerdo a una degradación de las
características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales.
Según pasa de una escala de otra el atributo o la cualidad aumenta. Las escalas de medición
ofrecen información sobre la clasificación de variables discretas o continuas, también más
conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación determina la
selección de la gráfica adecuada.
Escala nominal: Es aquella en que los números sólo se emplean para diferenciar un lugar, objeto
o persona. Esta escala de medición es exclusivamente cualitativo y sus variables son por lo tanto
cualitativas. Ejemplos de números con esta característica son los que se usan en las camisetas de
los jugadores de fútbol, los que aparecen en el código de barras de un producto, etc. La escala
nominal es la escala de medición más débil.
Escala ordinal: Es aquella en que los números se utilizan para diferenciar en orden de supremacía
de acuerdo con cierto criterio jerárquico. En esta escala las variables no sólo se asignan a grupos
sino que además pueden establecerse relaciones de mayor que, menor que o igual que, entre los
elementos. Ejemplo: Los estratos socioeconómicos.
DISTRIBUCIONES DE FRECUENCIAS
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla
de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el
número de veces que aparece, es decir, su frecuencia. Se puede complementar la frecuencia
absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el
total de datos. La tabla de frecuencias puede representarse gráficamente.
Variables discretas
Ejemplo 1. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
Para la construcción de la tabla de frecuencias la ordenaremos de la siguiente manera:
• La primera columna de la tabla colocamos la variable de estudio ordenada de menor a mayor.
• La segunda columna la llamaremos frecuencia absoluta (𝒇𝒊) y es el recuento de los datos. La
suma de las frecuencias es el número total de observaciones (n).
• La tercera columna la llamaremos frecuencia porcentual o porcentaje (%) y es cada
frecuencia absoluta (𝒇𝒊), dividido en el número total de observaciones (n) multiplicado por cien.
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos
que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente. Cada clase está delimitada por el límite inferior de la clase y el límite superior de
la clase. La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Para la construcción de una tabla de frecuencias con datos agrupados, se aconseja utilizar la
Fórmula de Sturges, para encontrar el número de intervalos y la longitud del intervalo. El número
de intervalos se halla por la siguiente fórmula:
en donde n es el número de datos. La longitud que deben tener los intervalos, se obtiene por la
fórmula:
El primer intervalo, tomamos como límite inferior al dato menor y se hace el conteo del valor que
arrojó la longitud, teniendo en cuenta que el número del límite inferior también se cuenta y así,
obtendremos el límite superior del primer intervalo. Para el siguiente intervalo, se toma el límite
superior anterior más una unidad y nuevamente se hace el conteo de la longitud y así
sucesivamente, hasta completar el número K de intervalos, o cuando en un intervalo contenga al
mayor de los datos.
Ejemplo 2. Suponga que los siguientes datos corresponden a las puntuaciones del examen de
admisión de los aspirantes a una carrera profesional de una universidad. Se toma una muestra de
50 aspirantes y estos son los resultados:
65, 63, 65, 63, 69, 67, 53, 58, 60, 61, 64, 65, 64, 72, 68, 66, 55, 57, 60, 62, 64, 65, 64, 71, 68, 66,
56, 59, 61, 62, 63, 65, 63, 70, 67, 66, 57, 59, 61, 62, 64, 64, 63, 69, 67, 66, 58, 60, 61, 62.
Solución
Fórmula de Sturges:
• Número de intervalos:
intervalos
• Longitud de intervalo:
Una vez determinados los intervalos y la longitud, procedemos a precisar el número de datos (la
frecuencia) que caen dentro de cada intervalo. Para ello existe varios métodos de conteo, uno de
ellos es hacer una marca, ejemplo / por cada dato que encontremos que cae dentro del intervalo,
para otro intervalo se procede de manera similar realizando una marca por cada dato
contabilizado.
Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
La clase es la escala nominal de los intervalos y la marca de clase (𝒙𝒊) es el punto medio de cada
intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
En la guía hemos visto cómo organizar una tabla de frecuencias, de un conjunto de datos que
contiene la información sobre alguna variable. Esas tablas permiten una lectura más rápida que el
listado completo. Ahora veremos cómo presentar esos conjuntos de datos gráficamente. Las
gráficas nos permiten visualizar globalmente cómo se distribuyen las frecuencias entre los distintos
datos. Hay gráficas de distinto tipo; nosotros podemos ver algunas de ellas en tv, revistas,
periódicos, etc. En esta guía aprenderemos a construir y a leer algunas gráficas.
Para ilustrar los diferentes tipos de gráficas tomaremos la tabla de frecuencias (Tabla 2) con la
marca de clase y la frecuencia absoluta y absoluta acumulada.
Para construir una gráfica de barras con estos valores tomamos dos ejes perpendiculares; en el eje
horizontal señalamos los valores de la variable (puntuaciones) y en el eje vertical señalamos los
valores de la frecuencia (número de aspirantes). Como en ambos casos trabajamos con números,
para ubicar los valores en cada eje tenemos que considerar una unidad, aunque las unidades del
eje horizontal pueden ser distintas a las del eje vertical, como se ilustra a continuación:
El gráfico de barras se usa cuando los intervalos están separados entre sí (no existe continuidad
entre los intervalos), como lo ilustra la gráfica anterior.
Polígono de frecuencias
La ojiva es el polígono que se obtiene al unir por segmentos de rectas los puntos situados a una
altura igual a la frecuencia acumulada a partir de la marca de clase como se hizo con el polígono
de frecuencia (véase figura 2). La figura 3 es la ojiva de frecuencia de los datos de la tabla 2.
Variable continua
Para hacer una tabla de frecuencias con variables continua, se procede de manera similar al de las
variables discretas, pero difiere en la construcción de los intervalos. Al primer intervalo se toma el
dato menor (límite inferior) y se suma el valor que arrojó la longitud y así, obtendremos el límite
superior del primer intervalo. Para el siguiente intervalo, se toma el límite superior anterior y se
suma la longitud y así sucesivamente, hasta completar el número de intervalos obtenidos en la
fórmula K, o cuando en un intervalo contenga al mayor de los datos. Hay que tener en cuenta que
el límite inferior de una clase pertenece al intervalo (intervalo cerrado), pero el límite superior no
pertenece al intervalo (intervalo abierto), se cuenta en el siguiente intervalo. Ejemplo [3.1, 3.4) los
números que pertenecen a este intervalo son {3.1, 3.2, 3.3}.
Ejemplo 3. Los siguientes datos corresponden al tiempo que han necesitado 30 clientes de un
banco para llevar a cabo una transacción bancaria:
4.1, 3.1, 0.1, 6.5, 5.0, 2,5, 7.4, 10.0, 3.3, 8.0, 2.0, 0.4, 6.4, 1.1, 9.5, 2.8, 1.2, 1.3, 4.1, 9,5, 4.6, 4.3,
3.6, 5.5, 1.4, 2.8, 1.5, 1.6, 7.3, 7.0.
Solución
Fórmula de Sturges:
• Número de intervalos:
La longitud de 1.65 se aproxima a 1.7, debido a que los datos provienen de una variable continua y
con un solo decimal.
Tabla 3. Tiempo que han necesitado 30 clientes de un banco para llevar a cabo una transacción
bancaria.
Algunas tablas de frecuencias, los intervalos que se han tomado están separados entre sí por una
unidad esto es debido a que los datos son de una variable discreta. A estas tablas, es conveniente
darle una condición de continuidad, para efectos del cálculo de algunos parámetros o para realizar
algunas gráficas. A cada intervalo, al límite inferior se le resta 0.5 y al límite superior se le suma la
misma cantidad 0.5. Haciendo estas operaciones a la tabla 2, toma la forma:
Tabla 4. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊
1 52.5 – 55.5 2
2 55.5 – 58.5 5
3 58.5 – 61.5 9
4 61.5 – 64.5 15
5 64.5 – 67.5 12
6 67.5 – 70.5 5
7 70.5 – 73.5 2
Total 50
Histograma de frecuencias
El histograma de frecuencias es una representación visual de los datos continuos (intervalos sin
interrupción). Los histogramas pueden estar referidos a las frecuencias absolutas, relativas
(porcentajes) y las frecuencias acumuladas.
Otra ilustración del histograma de frecuencias para variables continuas, la podemos observar en la
figura 5, correspondiente a la distribución de los puntajes del examen de admisión de 50 aspirantes
a una carrera profesional en una universidad (véase tabla 4).
La construcción de una tabla de frecuencias para datos cualitativos requiere sólo del conteo del
número de elementos o individuos que caen dentro de cierta clase o tienen determinada
característica. En una tabla de frecuencias para datos cualitativos no se dan intervalos de clase por
carecer éstos de sentido. Como tampoco existe la frecuencia acumulada.
Ejemplo 5. En la tabla que sigue se da el número y sexo de los empleados de una empresa en los
años comprendidos entre 2009 y 2012.
Año
Sexo 2009 2010 2011 2012
Masculino 150 180 200 300
Femenino 50 70 100 100
Total 200 250 300 400
Figura 6. Histograma doble.
Para construir el diagrama circular partimos del hecho de que un círculo tiene un total de 360°.
Luego, mediante una regla de tres simple, repartiremos los 360° en distintos sectores circulares, de
acuerdo con cada porcentaje; tenemos así que para determinar el sector circular correspondiente
al 20% realizamos la conversión:
Esto es, el 20% corresponde a un sector circular de 72° de medida. A continuación, con ayuda de
un transportador, señalaremos el sector circular correspondiente. Igualmente para 50° se tienen
180°, 15% se tienen 54°, 10% se tienen 36° y finalmente para 5% se tienen 18°. La figura 7,
muestra la representación gráfica.
3. Determine el número de intervalos "K" (Fórmula de Sturges) para las siguientes cantidades de
datos:
a. 42
K=1+3.322 log (n)
K=1+3.322 log (42)
K=6.39 ≈6
b.55
K=1+3.322 log (55)
K=6.78 ≈ 7
c.70
K=1+3.322 log (70)
K=7.12 ≈ 7
d. 103
K=1+3.322 log (103)
K=7.68 ≈ 8
e. 200
K=1+3.322 log (200)
K=8.64 ≈ 9
a. (15, 63)
Rango DM-Dm Longitud de Intervalo
63-15 C=Rango
48 N° Intervalos
C= 48
5
C=9.6 ≈ 10
c. (9.18, 20.76)
Rango DM – Dm Longitud de Intervalo
20.76 – 9.18 C= 12
12 7
C=1.71 ≈ 2
154, 158, 162, 148, 163, 153, 159, 180, 165, 168, 156, 148, 162, 157, 153, 158, 147, 165, 166,
175, 172, 172, 167, 160, 155, 147, 156, 161, 159, 178.
T H
14 7,7,8,8,
15 3,3,4,5,6,6,7,8,8,9,9
16 0,1,2,2,3,5,5,6,7,8
17 2,2,5,8
18 0
NO. INTERVALOS
RANGO
DM – Dm
180 – 147 = 33
LONGITUD DE INTERVALO
C= 33
6
C= 5.5 =6
ESTATUR f Fr % F Fr % Xi
A
147 – 152 4 0.13 13 4 0.13 13 150
153 - 158 9 0.3 30 13 0.43 43 156
159 – 164 7 0.23 23 20 0.66 66 162
165 – 170 5 0.16 16 25 0.83 83 168
b. De la tabla de frecuencias que puede decir de los siguientes datos: f 3, % (1), F2 y % (4) acum.
*%(1): El 13% de los estudiantes del curso miden entre 147 – 152 cm
*F2: 13 estudiante de un curso de un colegio tiene un rango de estatura entre 153 – 158 cm
GRAFICA DE BARRAS
ESTATURAS
10
9
8
7
6
N. PERSONAS
5
4
3
2
1
0
147-152 153-158 159-164 165-170 171-176 177-182
POLIGONO
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6,
5, 6, 7, 3, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
CALIFICACIONE fi fr % FI FR %
S
0 1 0.02 2 1 0.02 2
1 1 0.02 2 2 0.04 4
2 2 0.04 4 4 0.08 8
3 3 0.06 6 7 0.14 14
4 6 0.12 12 13 0.26 26
5 11 0.22 22 24 0.48 48
6 12 0.24 24 36 0.72 72
7 7 0.14 14 43 0.86 86
8 4 0.08 8 47 0.94 94
9 2 0.04 4 49 0.98 98
10 1 0.02 2 50 1 100
50
a. De la tabla de frecuencias que puede decir de los siguientes datos: f 2, % (3), F4 y % (5) acum.
f2: De los 50 alumnos de matemáticas solo 1 tuvo una calificación de 1
%(3): El 4% de los 50 alumnos de matemáticas obtuvieron una calificación de 2
14
12
10
NO. DE ALUMNOS
0
0 1 2 3 4NOTAS
5 6 7 8 9 10
POLIGONO
14
12
10
NO. DE ALUMNOS
0
0 1 2 3 4 NOTAS
5 6 7 8 9 10
50
FRECUENCIA ACUMULADA
40
30
20
10
0
NOTAS
0 1 2 3 4 5 6 7 8 9 10
7. Se mide el coeficiente intelectual (CI) de veinticinco estudiantes para determinar el rango que
se encuentran los estudiantes para un posterior rendimiento académico. Los resultados de la
de las puntuaciones son las siguientes:
NO. INTERVALOS
RANGO
DM – Dm
113 – 105 = 8
LONGITUD DE INTERVALO
C= 8
6
HISTOGRAMA
HISTOGRAMA
25
NO. DE ESTUDIANTES
20
15
10
5
0
105-111 112-117
C.I
POLIGONO
POLIGONO
25
NO. DE ESTUDIANTES
20
15
10
5
0
102 108 115 121
C.I
OJIVA
25
20
15
10
5
0
102 108 115 121
MARCA DE CLASE
8. Considérense los siguientes datos, los cuales representan a la distancia recorrida de cierto
animal de su morada en la búsqueda de alimento:
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00
5.60 7.64 8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26
7.90 6.65 7.25 6.26 6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25
7.63 6.73 7.60 8.14 6.91 7.82 6.76 7.75 4.00
60
12
10
8
6
4
2
0
381-473 474-565 566-658 659-751 752-844 844-937 938-1030
DISTANCIA RECORRIDA
POLIGONO
18
16
14
FRECUENCIA ABSOLUTA
12
10
0
381-473 474-565 566-658 659-751 752-844 844-937 938-1030
DISTANCIA RECORRIDA
60
FRECUENCIA ACUMULADA
50
40
30
20
10
0
381 - 473 474 - 565 566 - 658 659 - 751 752 - 844 845 - 937 938 - 1.030
DISTANCIA RECORRIDA
HISTOGRAMA
70
60
FRECUENCIA ACUMULADA
50
40
30
20
10
0
381-473 474-565 566-658 659-751 752-844 844-937 938-1030
DISTANCIA RECORRIDA
Actividad Porcentaje
Profesional 8%
Técnico 10%
Operario 70%
Ayudante 10%
Aseo 2%
10.Los siguientes son los colores de los automóviles de 36 profesores de la universidad. Construya
un gráfico de barras para ilustrar esta situación.
Negro, azul, rojo, rojo, blanco, amarillo, crema, rojo, azul, oro, negro, plateado, verde, verde,
blanco, negro, oro, azul, rojo, gris, gris, verde, blanco, negro, azul, café, naranja, crema, rojo,
negro, plateado, oro, amarillo, blanco, rojo, café.
11.Determine la variable y la escala de medida que corresponde a la medición de cada una de las
siguientes características:
a. Nivel de ruido.
R/ Cuantitativa discreta porque se mide en decibeles
b. La ocupación de una persona en el lugar de trabajo.
R/ Cualitativa
c. Número de habitantes por población.
R/ Cuantitativa discreta porque se mide con números enteros
Media .
Media geométrica.
Media armónica.
Mediana.
Moda.
La media aritmética también llamada promedio de los datos, es el valor obtenido por la suma de
todos sus valores dividida entre el número de sumandos.
Definición formal
Dado un conjunto numérico de datos, , se define su media aritmética para datos no
agrupados como:
Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
también puede calcularse para variables agrupadas en intervalos.
PROPIEDADES
Las principales propiedades de la media aritmética son:
Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en situaciones muy
diversas, tiene también algunos inconvenientes, como son:
La altura media de los pinos como resumen de una población homogénea (arriba) o
heterogénea (abajo).
Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto
menos homogéneos sean los datos, menos información proporciona. Dicho de otro modo,
poblaciones muy distintas en su composición pueden tener la misma media. Por ejemplo, un
jardín con cinco pinos de igual altura, 1,95 m, evidentemente, tendría una altura media de 1,95
m, valor que representa fielmente a esta población homogénea. Sin embargo, en un jardín de
pinos de alturas más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo,
tendría también, como puede comprobarse, una altura media de 1,95 m, valor que no
representa a casi ninguno de sus componentes.
En el cálculo de la media no todos los valores contribuyen de la misma manera. Los valores
altos tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo del salario
Ejemplo 1. Los siguientes datos corresponden a las notas de 5 estudiantes en una prueba: 6.0,
5.4, 3.1, 7.0, 6.1
Como se interpreta esta medida, el promedio de las notas de los cinco estudiantes es de 5.5.
Tabla 1. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes
1 53 – 55 54 2
2 56 – 58 57 5
3 59 – 61 60 9
4 62 – 64 63 15
5 65 – 67 66 12
6 68 – 70 69 5
7 71 – 73 72 2
Total 50
Podemos concluir, que el puntaje promedio de los 50 aspirantes a una carrera en una universidad
fue de 63.2.
Media geométrica
Media armónica
La media armónica resulta poco influida por la existencia de determinados valores mucho más
grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños
que el conjunto.
La media armónica no está definida en el caso de que exista algún valor nulo.
Ejemplo 4. La media armónica de 1, 3 y 9 es:
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez
que éstos están ordenados de menor a mayor. Es decir, es el dato central.
Ejemplo 6. La mediana del número de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1,
1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
Definición formal
Dado un conjunto numérico de datos ordenados, , se define su mediana para datos no
agrupados como:
Tomando el ejemplo anterior del número de hijos de un conjunto de trece familias, cuyos
respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1, 1, ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2,
2, 3, 3, 4, como =13 (un número impar), entonces la mediana es:
,
Como el valor central es 2, entonces concluimos que el 50% de las familias tiene 2 hijos.
Donde,
: Límite (real) inferior de la clase mediana.
: Clase mediana.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase mediana.
: Frecuencia absoluta de la clase mediana.
c: Longitud del intervalo.
Tabla 2. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
Clase 4 62 – 64 15 31
mediana 5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
El 50% de los 50 aspirantes a una carrera en una universidad tiene un puntaje de 63.3.
Propiedades e inconvenientes
Moda
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. En cierto
sentido la definición matemática corresponde con la locución "estar de moda", esto es, ser lo que
más se lleva y se denota .
Ejemplo 5. El número de personas en distintos vehículos en una autopista son: 5, 7, 4, 6, 9, 5, 6,
1, 5, 3 y 7. El número que más se repite es 5, entonces la moda es 5 y se denota: . Podemos
concluir, que el número más frecuente de personas es los vehículos en una autopista es de 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos
se encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen
la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados (tablas de frecuencias) está dada por la siguiente fórmula:
Tabla 3. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊
1 53 – 55 2
2 56 – 58 5
3 59 – 61 9
Clase 4 62 – 64 15
modal 5 65 – 67 12
6 68 – 70 5
7 71 – 73 2
Total 50
En la clase en donde hay la mayor frecuencia absoluta es la clase 4, por ende es la clase modal.
Por tanto,
, , y .
Calculando en la fórmula de la moda se tiene
El puntaje más frecuente de los 50 aspirantes a una carrera en una universidad fue de 63.5
Propiedades
Cálculo sencillo.
Interpretación muy clara.
Al depender sólo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el
parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos,
por ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato robot".
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a
variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende
excesivamente del número de intervalos y de su amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la
moda, no afectan en modo alguno a su valor.
No siempre se sitúa hacia el centro de la distribución.
Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la
misma frecuencia (distribuciones bimodales o multimodales).
La media, mediana y moda se consideran las medidas de posición más importantes por su
sencillez y utilidad. No obstante, no son aplicables a todos los casos.
Caso I. Cuando las tres medidas coinciden, , la gráfica describe una curva normal o
simétrica.
Caso II. Cuando la media es mayor que la mediana, , la gráfica describe una curva
asimétrica o sesgada a la derecha.
Caso III. Cuando la mediana es mayor que la media, , la gráfica describe una curva
asimétrica o sesgada a la izquierda.
Los cuartiles, deciles y percentiles son medidas que se utilizan para determinar los intervalos
dentro de los cuales quedan proporcionalmente repartidos los términos de la distribución.
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en
cuatro partes porcentualmente iguales. determinan los valores correspondientes al
25%, 50% y 75% de los datos. coincide con la mediana.
Para calcular estas tres medidas se procede de manera semejante al cálculo de la mediana.
Los cuartiles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:
.
Donde,
: Límite (real) inferior de la clase cuartil.
: Clase cuartil.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase cuartil.
: Frecuencia absoluta de la clase cuartil. c:
Longitud del intervalo.
Tabla 4. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Si calculamos el primer cuartil , tenemos:
Para calcular estas nueve medidas se procede de manera semejante al cálculo de la mediana.
Los deciles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:
.
Donde,
: Límite (real) inferior de la clase decil.
: Clase decil.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase decil.
: Frecuencia absoluta de la clase decil. c:
Longitud del intervalo.
Tabla 5. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
Percentiles
Los percentiles son los valores de la variable que dividen a un conjunto de datos ordenados en
cien partes porcentualmente iguales. , determinan los valores
correspondientes al 1%, 2%, 3%,…, 17%,…, 50%,…, 98% y 99% de los datos. coincide con la
mediana.
Para calcular estas cien medidas se procede de manera semejante al cálculo de la mediana.
Los percentiles para datos agrupados (tablas de frecuencias) se denota y define de la siguiente
manera:
.
Donde,
: Límite (real) inferior de la clase percentil.
: Clase percentil.
: Frecuencia absoluta acumulada de la case que le antecede a la de la clase percentil.
: Frecuencia absoluta de la clase percentil. c:
Longitud del intervalo.
Tabla 6. Puntuaciones del examen de admisión de 50 aspirantes a una carrera profesional en una
universidad.
Clase Puntajes 𝒇𝒊 𝑭𝒊
1 53 – 55 2 2
2 56 – 58 5 7
3 59 – 61 9 16
4 62 – 64 15 31
5 65 – 67 12 43
6 68 – 70 5 48
7 71 – 73 2 50
Total 50
GUÍA DE TRABAJO Nº 2
2. (a) ¿En qué caso coinciden los valores de la media, mediana y moda?
(b) ¿Qué se entiende por curva (distribución) sesgada a la derecha o sesgada a la izquierda?
Clase Intervalo fi
1 76 – 80 4
2 81 – 85 7
3 86 – 90 10
4 91 – 95 13
5 96 – 100 25
6 101 – 105 29
7 106 – 110 12
8 111 – 115 11
9 116 - 120 9
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96 7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64
8.82 5.64 10.08 3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72 8.26 7.90 6.65 7.25 6.26
6.43 7.71 7.52 6.68 7.98 10.27 7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14 6.91 7.82
6.76 7.75 7.36 8.52 7.23 7.63 6.95 7.78 10.34 6.65 6.86 7.74 6.67 7.12 7.10 4.00
La varianza es una de las medidas más usadas en estadística, ella a su vez da origen a otra
mucho más significativa: la desviación típica o estándar. La varianza es una medida del grado de
concentración de los valores de una sucesión de datos alrededor de su media , mientras más
dispersos estén los valores respecto de la media, mayor será la varianza. Se define como la media
aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Se denota y se
define para datos no agrupados:
y la desviación estándar
Es decir, .
Ejemplo 1. Las siguientes son las estaturas de un equipo de jugadores de basquetbol: 2.20 m,
2.15 m, 1.95 m, 1.75 m y 1.70 m.
La media,
La varianza,
Y la desviación estándar.
• La desviación estándar es una medida de variación de todos los valores con respecto a la
media.
y la desviación estándar
Media,
La varianza,
Desviación estándar,
Ejemplo 2. Los siguientes datos corresponden a los resultados finales de dos grupos que cursaron
estadística el semestre pasado con dos docentes distintos.
Si sólo atendemos al valor de la desviación estándar de los dos grupos debemos aceptar que la
variabilidad de éstos en cuanto a las calificaciones obtenidas es la misma. Sin embargo, al obtener
promedios diferentes y si admitimos que tal diferencia distingue a los grupos, nuestra primera
apreciación debe ser revisada y hacer que esa diferencia quede manifiesta de alguna manera. Una
manera de hacerlo es mediante el cálculo del coeficiente de variación. Así, tenemos:
Grupo 1
Grupo 2
Como sucede con cualquier medida de variabilidad, a mayor valor más variabilidad, en este caso el
grupo 1 presenta una variabilidad relativa mayor que la del grupo 2. Siendo así, el grupo 2 fue
relativamente más homogéneo que el grupo 1 en cuanto su rendimiento en estadística.
Valores estandarizados
Los distintos conjuntos de datos están asociados por lo general a diferentes medias, ya sea porque
son de naturaleza diferente o porque al ser la misma característica medida, sus centros no son los
mismos.
Estadística:
Contabilidad:
Como la nota estandarizada de contabilidad es superior a la de estadística (un valor más cercano
al cero), el estudiante obtuvo un puesto relativamente en contabilidad que en estadística, debido a
que al estar las dos notas por debajo del promedio, en contabilidad está más cercano al promedio
del curso que en el de estadística. Cuando los puntajes se encuentren por encima del promedio, la
posición mejor es aquella que arroje un valor estandarizado más lejano del promedio, o sea, al
estandarizar los valores, el que ocupa una posición mejor es el que se aleja más del cero.
1. Si las puntuaciones de 20 trabajadores nuevos de un test de aptitud son: 31, 39, 40, 43, 45, 50,
52, 58, 59, 60, 70, 71, 72, 78, 80, 85, 87, 90, 9 1 y 99. Halle la varianza y la desviación estándar
para datos no agrupados.
2. A partir de los datos del ejercicio anterior, construya una tabla de frecuencia y con base en ella
obtenga la varianza y la desviación estándar. ¿Hay diferencia entre el valor de la desviación
estándar para datos no agrupados con los datos agrupados? Si hay diferencia explique el
porqué de ésta.
4. Halle la varianza y la desviación estándar para los datos del problema 6, de la guía de trabajo
N° 2.
6. Dos vendedores que mercadean el mismo producto tienen los siguientes registros durante un
periodo:
Vendedor 1 Vendedor 2
Volumen de ventas por mes 30 000 000 35 000 000
Desviación estándar 2 500 000 3 600 000
¿Cuál de los vendedores parece más constante en el volumen de ventas?
8. Una persona tiene una estatura de 175 cm; la estatura promedio de la población es170 cm con
una desviación estándar de 5 cm. Esta misma persona pesa 70 Kg: el peso promedio de la
población es de 68 Kg con una desviación estándar de 5 Kg. ¿En qué caso esta persona ocupa
un puesto relativamente mayor?
TEXTO BÁSICO
Estadística para las ciencias Administrativas, Lincoln, L. Chao. Editorial MC GRAWH HILL.
Tercera edición.
FUENTES DE INTERNET
http://es.wikipedia.org/wiki/Estad%C3%ADstica