Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CartillaS3 Estadistica PDF
CartillaS3 Estadistica PDF
ESTADÍSTICA I
AUTOR: Patricia Castillo Garzón
ÍNDICE
ÍNDICE
Introducción
Recomendaciones académicas
Desarrollo temático
REFERENCIAS
RECOMENDACIONES ACADÉMICAS
Para la mejor comprensión del tema se recomienda que inicialmente haga una lectura rápida y
comprenda en forma general las medidas descriptivas, luego, de manera pausada, siga la lectura
con papel, lápiz y calculadora o ayuda del computador, para que aprenda a utilizar las fórmulas
dadas. No le gaste tiempo a memorizar las fórmulas, trate de comprender su razonamiento, la
forma como la aplica y, sobre todo, la interpretación que le pueda dar al resultado obtenido.
2.1. Datos sin agrupar
Recuerde que el uso de las funciones estadísticas que tienen las calculadoras o que encuentra
Para este tipo de datos la media se calcula sumando todos los valores que toma la variable y
en programas como el Excel le reducen el tiempo que gastaría haciendo cálculos aritméticos.
dividiéndolo sobre el número total de datos (n)
DESARROLLO DE CADA UNA DE LAS UNIDADES TEMÁTICAS Para los datos sin agrupar la fórmula utilizada es:
En muchas ocasiones, se habla en términos del valor promedio; por ejemplo, se dice que hay un En donde ni corresponde a las frecuencias absolutas y Xi al valor de marca de clase o punto
grupo de personas con una edad promedio de 20 años, entonces, se puede pensar que las medio de cada grupo.
personas a las que se refiere son las del grupo anterior, pero cuando se observa el grupo, las
Ejemplo
edades registradas son:
La siguiente tabla es la distribución de frecuencias del tiempo que gasta un grupo de personas
4 5 6 65
en realizar una prueba de aptitud:
El promedio de estos datos es:
Tabla 1. Distribución de datos (tiempo de una prueba)
Li - Ls Xi ni Xi*ni
Intervalos Marca de clase frecuencias
20 - 28 24 5 120
28 - 36 32 10 320
En este ejemplo se puede ver que esta medida no es representativa, ya que su valor no se 36 - 44 40 12 480
parece a ninguno de los datos. ¿Por qué está ocurriendo esto? Si se observa con cuidado vemos 44 - 52 48 7 336
que hay un valor, 60, que se aleja mucho con respecto a los valores de los otros datos, este
valor es conocido como un valor extremo. 52 - 60 56 6 336
Total n =40 1592
Entonces se puede concluir que aunque la media es una medida muy fácil de calcular, se debe
tener cuidado en casos como el anterior en donde están apareciendo los valores extremos, es Fuente: (elaboración propia)
decir, valores demasiado altos o demasiado bajos. La media es una medida que se ve afectada
por valores extremos.
(Recuerde que la marca de clase es el punto medio de cada intervalo. Para obtenerla se suman
2.2. Datos agrupados los límites en cada intervalo y se divide entre dos).
Es claro que la media aritmética es la sumatoria de los valores que toma la variable dividida
entre el número total de datos. Sin embargo, cuando se tiene una tabla de frecuencias o datos
agrupados para efectuar ese proceso se debe recordar que para cada grupo o intervalo la
variable tiene su representación en la marca de clase o punto medio y que la frecuencia
absoluta es el número de datos que pertenecen al respectivo grupo.
Para los datos agrupados en una tabla de frecuencias existe una fórmula, también fácil de
aplicar: El tiempo promedio es de 39.8 minutos.
Hay situaciones en donde cada uno de los valores de la variable tiene un peso o una importancia 3. La mediana
diferente y esto se ve reflejado en el cálculo de la media. Este, que es un caso especial de la
media, se conoce como media ponderada.
Símbolo
La media ponderada se obtiene multiplicando cada valor de la variable por su “peso” o
ponderación correspondiente.
Ejemplo
Un curso se evalúa con un primer parcial que tiene un valor del 20%, un segundo parcial con un 3.1. Datos sin agrupar
valor del 50% y un taller con un valor del 30%. Si un estudiante obtiene una nota de 3,5 en el
primer parcial, 2,8 en el segundo parcial y 4,2 en el taller ¿Cuál es la nota promedio? La mediana es el valor que ocupa la posición central de los datos ordenados; por lo tanto, se
considera que es la medida de tendencia central que divide los datos en dos partes iguales, es
decir, en la siguiente distribución:
La mediana es 15 porque se sitúa en el punto que divide la distribución en dos partes iguales.
Hay el mismo número de casos antes y después de 15.
Para interpretar esta medida se toma en cuenta que cuando se tienen todos los datos se habla
del 100% de la información:
Xi : Valor de la variable
Para el grupo de la izquierda la mediana es el valor máximo del 50% de los datos más
pequeños. Para el grupo de la derecha se convierte en el mínimo del 50% de los datos más
La fórmula se presenta com: grandes.
98, 80, 96, 86, 74, 45, 90, 89, 84, 76, 53, 94
n = 12 (par)
45, 53, 74, 76, 80, 84, 86, 89, 90, 94, 96, 98
Para el total de 12 datos, los dos valores centrales aparecen en la posición sexta y séptima, Fuente: (elaboración propia)
entonces la mediana será:
Para ubicar el valor central:
84 86
Me 85 Calcule las frecuencias absolutas acumuladas.
2
Se calcula el valor n/2
3.2. Datos agrupados
Se compara n/2 con las frecuencias absolutas acumuladas Ni hasta encontrar la menor
Cuando los datos están agrupados, es decir, se presentan en una tabla de frecuencias, la frecuencia acumulada que contiene el valor n/2
mediana es el valor que divide la distribución en dos partes iguales.
La mediana es el valor de la variable en donde está contenido n/2
En el siguiente ejemplo en donde la tabla muestra el número de hijos para un grupo de familias, 21 se compara con las Ni y se encuentra contenido en Ni=27 (menor frecuencia que lo
la variable es discreta: contiene), por lo tanto la mediana es 2.
Compare el valor de n/2 con la frecuencia absoluta acumulada hasta obtener la menor
frecuencia acumulada que lo contiene.
Ejemplo
Los siguientes datos representan los puntajes obtenidos por un grupo de estudiantes en una 4. La moda
prueba de aptitud:
Símbolo
La moda es 7
En algunas distribuciones solo hay una moda, pero en otras puede haber dos o más modas.
1, 4, 4, 4, 2, 5, 5, 8, 6, 3, 5,
Se observa que tanto el cuatro como el cinco aparecen con mayor frecuencia (en tres ocasiones
cada uno). Es decir, hay dos modas y se dice que los datos son bimodales.
Fuente: (elaboración propia)
3 4 5 6 7 8 9
Md = No hay
2 2 3 3 4 4
En donde todos los datos se repiten el mismo número de veces, por lo tanto no hay moda.
La moda es utilizada como una medida de popularidad que refleja la tendencia de una opinión,
ya que se puede calcular tanto para datos cualitativos como cuantitativos.
4.2. Datos agrupados variable continua El intervalo que contiene el mayor número de casos o mayor frecuencia es 40 – 50. Con este
intervalo se aplica la fórmula de la moda:
Cuando se trabaja con datos agrupados, la moda se puede calcular con la siguiente fórmula:
Moda = 44.54
En donde: Se interpreta diciendo que la mayoría de las personas obtienen un puntaje de 44,54 (se deja en
valor decimal, no se aproxima porque la variable es continua).
Li = límite inferior del grupo en donde se ubica la moda
La siguiente tabla muestra la distribución de los puntajes obtenidos por 50 personas como La media es un valor único para una serie de datos.
calificación en una prueba de razonamiento: Es una medida que tiene mucha utilidad en la comparación de dos o más grupos.
La media es una medida que se ve afectada por valores extremos, es decir, cuando se Moda = 2 y 3; los datos son bimodales
encuentran valores muy grandes o muy pequeños con respecto a la serie de datos. En esos
casos la media no es la medida de tendencia central apropiada para representar la serie de La mayoría de los empleados gastan 2 o 3 minutos en atender los clientes
datos.
n
La mediana es una medida de tendencia central que no se ve afectada por los valores extremos
(altos o bajos). Entonces:
La moda se puede calcular tanto para variables cualitativas como para variables cuantitativas.
Desventajas de la moda
El tiempo promedio de atención es de 2 minutos por cliente.
En muchas ocasiones no hay moda porque ningún valor aparece más de una vez.
Para calcular la mediana primero se ordenan los datos de menor a mayor:
En algunas series de datos hay más de una moda, es decir, la moda no es un valor único.
1 1 2 2 2 3 3 3 4
Calcular e interpretar el ahorro promedio de los clientes en cada una de las dos filiales. Tabla 6. Distribución de datos agrupados en fondos de ahorros
Calcular e interpretar el ahorro promedio de los clientes en las dos filiales en conjunto.
Solución:
a)
REFERENCIAS
En fondos el ahorro promedio es de $34.200 por cliente. Lind, D., Marchal, W. y Wathen, S. (2012). Estadística aplicada a los negocios y la
economía. México: Mc Graw Hill.
c) Para calcular el ahorro promedio de las dos filiales en conjunto se tiene en cuenta que:
Martinez, C. (2002). Estadística y Muestreo. Bogotá: ECOE Ediciones.
Newbold, P. (2008). Estadística para los negocios y la economía. México: Editorial
Prentice Hall.
Triola, M. (2013). Estadística. México: Pearson.