Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejemplo:
En una caja de estampas del mundial Rusia 2018 vienen 500 de ellas.
20 amigos decidieron comprar el álbum “Panini” que en total se llena con 669 estampas,
que incluyen estampas especiales, los estadios de futbol, las insignias de los 32 equipos, los
equipos completos con sus jugadores y al final estampas legendarias.
Los resultados de los 20 amigos que compraron el álbum y que fueron útiles y repetidas son
las siguientes:
Coleccionista Útiles Repetidas Coleccionista Útiles Repetidas
1 322 178 11 377 123
2 341 159 12 305 195
3 298 202 13 401 99
4 357 143 14 388 112
5 401 99 15 357 143
6 317 183 16 359 141
7 392 108 17 319 181
8 366 134 18 399 101
9 290 210 19 353 147
10 407 93 20 278 222
B. LA MEDIANA
La mediana es el dato que ocupa la posición central en la muestra ordenada de menor a
mayor.
¿Cómo calculamos la mediana de una muestra de n observaciones?
1. Ordenamos los datos de menor a mayor.
2. La mediana es el dato que ocupa la posición n+1 en la lista ordenada
2
Si el número de datos es impar, la mediana es el dato que ocupa la posición central.
Si el número de datos es par, la mediana es el promedio de los dos datos centrales.
Ejemplo:
n impar
X1 = 10 X2= 14 X3= 12 X4= 18 X5= 11
10 11 12 14 18
Ejercicio:
1. Con los datos de la compra de estampas de Panini, realice la mediana, tanto para
las estampas útiles, como para las repetidas.
2. Haga la comparación entre media y mediana y saque al menos dos conclusiones de
ello.
Media Mediana
Ventajas Usa toda la información que Representa el centro de la distribución
proveen los datos. (en sentido claramente definido).
Es de manejo algebraico Robusta la presencia de outliers
simple Útil para datos ordinales
Desventajas Muy sensible a la presencia Usa muy poca información de los datos.
de datos outliers.
2
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
C. LA MODA
La moda es una medida de tendencia central que indica el valor que más se repite en un
grupo de números. En un mismo estudio puede haber más de una moda, esto ocurre
cuando dos (bimodal) o más números (multimodal) se repiten la misma cantidad de veces
siendo este es el máximo número de veces del conjunto. También puede darse el caso a la
inversa y que en una muestra no haya moda por la ausencia de repetición de los datos, a
esto se le llama muestra amodal.
Basándonos en la premisa de que la moda equivale al valor más repetido en una muestra,
y observando esta correlación de números: 4,3,2,7,7,7,9,5,9,9,1,9, podemos afirmar que la
moda es 9.
En el siguiente ejemplo encontramos una muestra bimodal, ya que los número 6 y 9 tienen
las frecuencias más altas y se repiten las mismas veces: 9,3,4,6,7,8,6,9,0,7,6,9,1,6,9.
Por último en el siguiente estudio tenemos una muestra amodal, puesto que las cifras no
se repiten con una frecuencia mayor que los otros datos: 2,3,7,9,8,5,0.
Ejercicio:
¿Cuál es la moda en el ejercicio de hipotético del álbum Panini, para estampas útiles y
repetidas?
2. MEDIDAS DE DIPERSIÓN
A. DESVIACIÓN ESTÁNDAR
Para conocer con detalle un conjunto de datos, no solo basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que presentan los
datos en su distribución respecto de la media aritmética de dicha distribución, con objeto
de tener una visión de los mismos más acorde con la realidad al momento de describirlos e
interpretarlos para la toma de decisiones.
3
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
El abuelo de una familia quiso saber cuál es el promedio de las edades de sus 14 nietos (xi).
Los datos son los siguientes:
X1 2 X8 16
X2 14 X9 7
X3 8 X10 9
X4 3 X11 4
X5 1 X12 5
X6 9 X13 13
X7 11
Media ( )= 2 + 14 + 8 + 3 + 1 + 9 + 11 + 16 + 7 + 9 + 4 + 5 + 13
14
= 102 / 14 = 7.3 años.
S=
S= 1 [(7.3-2)²+(7.3-14)²+(7.3-8)²+(7.3-3)²+(7.3-1)²+(7.3-9)²+(7.3-11)²+(7.3-16)²+(7.3-7)²+(7.3-9)²+(7.3-4)²+(7.3-5)²+(7.3-13)²]
14 - 1
S= 1 [(28.09)+(44.89)+(0.49)+(18.49)+(39.69)+(2.89)+(13.69)+(75.69)+(0.09)+(2.89)+(10.89)+(5.29)+(32.49)
13
Ahora, con el ejercicio del álbum del mundial Rusia 2018, determine la desviación estándar.
4
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
Su fórmula es:
Desarrollaremos un ejemplo:
6 niños desean saber el promedio de dinero que tienen en sus bolsas, pero le solicitan a
usted que realice el
análisis y que
determine la varianza
y la desviación
estándar. Ellos
seguramente no
comprenderán qué
significa cada dato de
dispersión, pero usted
se los podrá explicar después de sacar sus propias conclusiones.
En el recuadro de la izquierda se muestran los datos (en quetzales) que cada uno de los
niños posee. En el recuadro de la derecha, la fórmula de varianza.
5
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
Ahora, resta n – 1. Recuerda que n siempre será el total de datos, para nuestro ejemplo
son 6.
S= S²
6
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
Ahora, intenta realizar la práctica del ejercicio del Panini del mundial 2018, determinando
su desviación estándar y su varianza.
CV = 5.76 * 100
14
CV = 41.14%
7
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
14
Muy pocas veces la población objetivo se desconoce y para ello se utiliza la siguiente
fórmula:
Donde:
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de
proporción)
8
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
Donde:
N = Tamaño de la población.
Z = Nivel de confianza.
p = Probabilidad de éxito o proporción esperada.
q = Probabilidad de fracaso.
d = Precisión (error máximo admisible en términos de proporción)
Para un caso hipotético, se desea determinar el número de muestras que se debe levantar,
respecto a la intención de voto para alcalde de Poptún, sabiendo que la población apta para
votar es de 35,000 votantes. El nivel de confianza lo deseamos al 95%. Se espera una
probabilidad de éxito del 95% y una probabilidad de fracaso del 5%. El error máximo
permisible estimado es del 20%
n = 35000 * 95 * 95 * 5
(20)² (35000-1) + (95)² * 95 * 5
Los muestreos se aplican cuando la población (N) es demasiado extensa (grande) y se infiere
en esa población extrayendo muestras (n), dependiendo el tipo de población, la forma de
cómo se desea y el tipo de investigación, así se utiliza un tipo de muestreo.
La regla de cualquier muestreo es que todos los miembros de una población sean sujetos y
tengas las mismas probabilidades para ser electos dentro del muestreo.
Este método tiene poca o nula utilidad cuando la población a la que deseamos inferir es
demasiado grande.
Número de inicio:
El investigador selecciona un número entero que debe ser menor al número total de
individuos en la población. Este número entero corresponderá al primer sujeto.
Intervalo:
El investigador elige otro número entero que servirá como la diferencia constante entre dos
números consecutivos en la progresión.
El número entero se selecciona típicamente de modo que el investigador obtenga el tamaño
de la muestra correcto.
10
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
Por ejemplo, el investigador tiene una población total de 100 individuos y necesita 12
sujetos. Primero elige su número de partida, 5.
Luego, el investigador elige su intervalo, 8. Los miembros de su muestra serán los individuos
5, 13, 21, 29, 37, 45, 53, 61, 69, 77, 85, 93.
11
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
12
DOCUMENTO ADAPTADO Y RECOPILADO POR: ING. CARLOS AUGUSTO RODAS CASTELLANOS
13