Documentos de Académico
Documentos de Profesional
Documentos de Cultura
menos datos.
Ejemplo.
UE: Curso semestral que se dict en el periodo acadmico 1997 I, en la EAPE de la FCM de la
UNMSM.
Conjunto de unidades de Observacin: Todos los cursos semestrales, dictados en el Periodo
Acadmico 1997 - I
Variable: Porcentaje de avance del curso(X).
Tipo de variable: cuantitativa continua.
Conjunto de datos: Constituyen los datos poblacionales
{ 45 40 50 50 55 45 40 48 48 45 50 48 50 40 45 48 48 45}
Cmo estos datos, son datos poblacionales y N < 30, entonces las frmulas a utilizar para hallar los
indicadores son los siguientes:
18
x
i1
i
( Observacin: el smbolo porcentaje es la unidad de la variable)
46.6%
18
2. Mediana.
- Ordenamos los datos de menor a mayor
40 40 40 45 45 45 45 45 48 48 48 48 48 50 50 50 50 55
- Cmo el nmero de datos es par, entonces el valor de la mediana estar dado por la
semisuma de los datos centrales.
Luego. Me = 48%
3. Moda.
Existen varias modas, porque varios de los datos diferentes se repiten, por lo tanto no tiene
sentido considerar este indicador.
Indicadores de dispersin.
xi xi
1. Longitud de recorrido.
LoR = 55 - 40 = 15% 40 6.6
40 6.6
2. Desviacin Media. 40 6.6
45 1.6
18 45 1.6
x i
= 3.15
45 1.6
%
DeM i 1
45 1.6
18 45 1.6
48 1.4
48 1.4
48 1.4
Interpretacin.
48 1.4
Observando la columna de las desviaciones, xi , tenemos que 10
48 1.4
datos se alejan de la media en menos 50 3.4 de 3.15 o lo que es equivalente a que
50 3.4 LIC. MARA A. ZACARAS DAZ 37
50 3.4
50 3.4
u = 46.6 % 55 8.4 10 datos
56.8
el 55% de los datos se aleja de la media en menos de 3.15 lo que podramos interpretar como que los
datos no estn muy dispersos.
3. Varianza.
x X
N
i1
i
(a)
X 2
N N
x i
2
2 X xi
N X
X 2 i1 i 1
N N N
x 2
i
(b)
X X
2 2
Por lo tanto, el valor de la varianza puede ser obtenido a partir de las frmulas (a) o (b).
Para el ejemplo utilizaremos las dos frmulas.
Clculos segn (a) Clculos segn (b)
xi ( xi ) ( xi ) 2 xi xi2
40 -6.6 43.56 40 1600
40 -6.6 43.56 40 1600
40 -6.6 43.56 40 1600
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
45 -1.6 2.56 45 2025
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
48 1.4 1.96 48 2304
50 3.4 11.56 50 2500
50 3.4 11.56 50 2500
50 3.4 11.56 50 2500
50 3.4 11.56 50 2500
55 8.4 70.56 55 3025
840 270.08 840 39470
270.08 39470
X2 15.004 % 2 X2 (46.6) 2 21.217 % 2
18 18
El valor de la varianza calculada a partir de la frmula (b) proporciona un valor aproximado de ella.
4. Desviacin estndar.
X 3.874 % X 4.6 %
5. Coeficiente de Variacin.
CoV = 0.083
Nota. Si tuviera que compararse dos o ms conjuntos de datos, puede hacerse en trminos de los
indicadores de dispersin absoluta (si los conjuntos de datos estn expresados en las mismas
unidades)
CUADRO RESUMEN
Interpretacin.
El CoV = 0.099 nos dice que la dispersin de los datos es baja, ahora observamos los indicadores de
tendencia central, como no existe mucha diferencia entre el valor de la media y el valor de la
mediana, se elige la media aritmtica como indicador de tendencia central, luego concluimos que la
LIC. MARA A. ZACARAS DAZ 39
mayora de los datos estn en torno a la meda, es decir, en la mayora de los cursos el avance del
Silabo est en torno al 46.6 % a mitad del periodo acadmico, es decir hay un ligero atraso.
Ejemplo
La profesora del curso de estadstica I, grupo 4 Sem. 2003 I, de la EAP de Estadstica, FCM,
generalmente, al finalizar el semestre obtiene el porcentaje de asistencia de cada uno de sus
alumnos, para posteriormente ver si hubo o no relacin con la nota que obtuvieron. Los datos se dan
a continuacin:
0.48 0.35 0.42 0 0.26 0.13 0.06 0.16 0.84 0.55 0.74 0.26
0.1 0.71 0.74 0.74 0.45 0.39 0.81 0.68 0.06 0.19 0.23 0.71
0.61 0.1 0.32 0.61 0.71 0.55 0.65 0.65 0.77 0.74 0.61 0.55
Cmo estos datos, son datos poblacionales y N > 30, entonces las frmulas a utilizar para hallar los
indicadores son los siguientes:
' Xi fi
X i 1 X 'i
0.6 - 0.19 0.125 6
0.19 - 0.32 0.255 4
0.32 - 0.45 0.385 4
0.45 - 0.58 0.515 5
0.58 - 0.71 0.645 6
0.71 - 0.84 0.775 10
X
m
1 2 2
f
X
N
X i fi 2
1
N
Xi fi
2 i 1
i i
2
i 1 0 X
N
' Xi fi Xif i X i f 2i
X i 1 X 'i
0.7 - 0.19 0.125 6 0.75 0.09375
0.20 - 0.32 0.255 4 1.02 0.2601
0.33 - 0.45 0.385 4 1.54 0.5929
0.46 - 0.58 0.515 5 2.575 1.326125
0.59 - 0.71 0.645 6 3.87 2.49615
0.71 - 0.84 0.775 10 7.75 6.00625
35 17.505 10.775275
2. Clculo de la mediana.
Procedimiento.
a. Se construye la tabla de frecuencias acumuladas ( absolutas o relativas)
'
X i 1 X i
' Fi
0.6 - 0.19 6
0.19 - 0.32 10
0.32 - 0.45 14
0.45 - 0.58 19
0.58 - 0.71 25
0.71 - 0.84 35
b. Se halla N/2 = 17.5
c. Se busca en la tabla de frecuencias construida, la menor frecuencia absoluta acumulada
que supere a N/2, para el ejemplo es:
F4 = 19 > 17.5, a esta cuarta frecuencia acumulada le corresponde el cuarto intervalo,
es decir [ 0.45 - 0.58), en este intervalo se encontrara el valor de la mediana.
0.5N F3
Utilizando la frmula, Me X 3 A4
`
d. , obtenemos el valor de la mediana,
F4 F3
Me = 0.45 + 0.13( 17.5 14)/ (19 14) = 0.541 %
3. Clculo de la moda.
El comportamiento de la variable nos muestra la presencia de dos valores ms frecuentes es decir
dos Modas.
Mo1 = 0.125 % Mo2 = 0.775%
Interpretacin.
Del anlisis hecho al problema anterior concluimos, que no basta contar con los indicadores, siempre
es conveniente complementar el anlisis con la representacin grfica de la distribucin de los datos
o comportamiento de la variable.
donde Y = k + X, entonces:
La media aritmtica de Y es : Y X k y la varianza es Y X
2 2
donde Y = k ( X) entonces:
La media aritmtica de Y es : Y k X , y la varianza es: Y k X
2 2 2
Ejemplo
Se tiene informacin respecto al peso de los alumnos ingresantes a la facultad de Medicina de la
Universidad AAA.
Posteriormente se supo que la balanza estaba malograda y que daba en exceso un peso adicional de
3 kg. Al obtener los indicadores correctos, las autoridades concluyeron que el peso de las alumnas es
muy bajo. Es cierto lo que dicen las autoridades?
Solucin.
Sea la variable X: peso de la alumna.
Donde X = 45 kg. y X = 9 kg2
2
Y X 3 = 45 - 3 = 42 kg.
Y2 X2 = 9 Y 3 kg
Solucin.
Sea la variable X : Peso de la alumna
Donde: X = 42 kg. y X = 9 kg2
2
Sea la variable Y : Peso incrementado de la alumna, que est definido como: Y = 1.1X
Por propiedades de la media y la varianza, tenemos que:
Y k X = 1.1 (42) 46.2 kg.
C0V = 0.1154
Si bien las alumnas han incrementado su peso pero la variabilidad de los pesos tambin se a
incrementado, ya que el CoV = 0.11 > 0.071
N 1 12 N 2 22 . . .N k k2 N ( ) 2 N k ( k ) 2 ... N k ( k )2
2 1 1
N N
Intra var ianza Inter var ianza
Esta propiedad nos dice que la variabilidad total de los datos, es decir, X puede deberse tanto a la
2
variabilidad dentro de cada grupo, intravarianza, como a la variabilidad entre los diferentes grupos,
intervarianza.
Ejemplo.
La siguiente tabla contiene la media aritmtica y desviacin estndar del promedio ponderado de los
alumnos por Escuelas Acadmicos Profesionales de la Facultad de Ciencias Matemticas, del periodo
acadmico 2002 I que cursaron. (No incluye a los ingresantes 2002).
Solucin.
Unidad Estadstica: El alumno de la FCM que cursaron el periodo acadmico 2002 I (No incluye
ingresantes)
Conjunto de UE: Todos los alumnos de la FCM que cursaron el periodo acadmico 2002 I.
Constituyen la poblacin.
Sea la variable X: Promedio Ponderado.
Tipo de variable: Cuantitativa continua.
Conjunto de datos: Vienen a ser datos poblacionales.
a. Hallamos la media aritmtica del Promedio Ponderado de todos los alumnos de la facultad.
La varianza se expresa en unidades que son el cuadrado de la unidad de la variable, que no tiene
significado real, por ello es preferible utilizar otra medida de dispersin y esta es la desviacin tpica o
estndar que se define como la raz cuadrada positiva de la varianza.
2
Ejemplo.
El siguiente cuadro estadstico y grfica muestran
Porcentaje Cursos
de avance
40 - 43 3
43 - 46 5
46 - 49 5
49 - 52 4
52 - 55 1
Total 18
Que, la distribucin de los datos es casi simtrica, por lo tanto, podemos aplicar las propiedades de la
desviacin estndar.
En este caso la variable es: Porcentaje de avance de los cursos, donde = 46.6 % y = 4.61 %
Podemos observar que no hay ningn curso cuyo avance sea calificado como muy bajo o muy alto, y
en cuanto al porcentaje de cursos dentro de cada categora, difiere en cuanto a lo establecido, debido
a que el polgono es casi simtrico no es simtrico y porque son pocos los datos.
Los datos de una variable pueden tomar varias apariencias numricas, dependiendo de la unidad en
la cual es medida. Por ejemplo si se registra el ingreso de los trabajadores en soles o dlares, lo que
da lugar a que, la media aritmtica y la varianza con cada una de las unidades sea diferente, pero si se
da en su forma estandarizada, las medias y las varianzas sern iguales en una u otra unidad.
Una variable estandarizada se denota con Z y su definicin es:
X X
Z
X
Donde: X es la media y X es la desviacin estndar de X
xi X
Esta definicin indica que un dato, zi , mide, en cunto, un dato xi se aleja de su media en
X
trminos de su desviacin estndar.
Ejemplo
La nota media y la varianza del primer examen parcial del curso de clculo I de un grupo de
estudiantes es:
X = 10 puntos X2 = 4 puntos2
Donde X: Nota de clculo I.
En unidades estndar:
x X 11 10
z 0.5
X 2
Ejemplo.
La siguiente tabla muestra informacin estadstica, respecto a las notas del primer examen parcial
del curso de Estadstica, de todos los alumnos del curso, los cuales estn divididos en dos grupos
LIC. MARA A. ZACARAS DAZ 46
Grupo Nota media Varianza
1 13 9
2 13 4
El alumno Juan obtuvo 12 puntos y pertenece al grupo 1, y la alumna Rosa tambin obtuvo 12
puntos y pertenece al grupo 2. Quin esta en mejor posicin?
Rpta.
Nota estandarizada de Juan: z J = (12 - 13) / 3 = - 0.33
Comparando estas notas estandarizadas, que la nota de Rosa es menor que la nota de Juan, entonces
Juan esta en mejor posicin.
PARMETRO.
A las medidas resumen obtenidas a partir de todos los datos poblacionales se les llama parmetros,
es el caso de las medidas resumen obtenidas para los problemas dados lneas arriba.
ESTADGRAFO.
A las medidas resumen obtenidas a partir de los datos muestrales se les llama estadgrafos.
ESTADSTICA.
Definicin: Estadstica es la ciencia que proporciona mtodos por medio de los cuales podemos
recolectar, clasificar, presentar, resumir y analizar datos numricos relativos a un conjunto de
individuos u objetos, tambin nos permite extraer conclusiones vlidas y efectuar decisiones lgicas
basadas en dichos anlisis.
A. Estadstica Descriptiva.
Esta relacionada con la recoleccin, tabulacin, presentacin de datos y el clculo de medidas
resumen que permiten obtener informacin estadstica, a partir de sta se obtendr conclusiones sea
a nivel de la poblacin o la muestra. Se ha aplicado estadstica descriptiva.
B. Estadstica Inferencial
Relacionada con el proceso de generalizar conclusiones respecto de la poblacin total, s la
informacin con la que se cuenta ha sido obtenida de una parte o muestra de la poblacin. Esta
generalizacin podr hacerse, s el tamao de muestra y la seleccin de los individuos integrantes de
la muestra han sido seleccionados utilizando mtodos estadsticos.
Ejemplo.
1. El propietario de una fabrica de corbatas, desde hace 2 aos cuenta con 50 trabajadores.
Posee informacin respecto de la produccin diaria de ellos, esta algo satisfecho, sin embargo
LIC. MARA A. ZACARAS DAZ 47
cree que s introduce algunas modificaciones, la produccin podra mejorar. Es as que divide el
grupo de trabajadores en dos, en el saln A ubica a 25 trabajadores, quienes trabajan en las
mismas condiciones de siempre, en el saln B ubica a los otros 25 trabajadores, en este
ambiente establece nuevas condiciones de trabajo: Msica de ambiente, alfombra y mejor
iluminacin. Al da siguiente, despus de un mes de esta modificacin, registro la produccin de
cada trabajador y los resultados son los siguientes:
Saln A Saln B
12 21 13 16 18 36 41 40 44 47
24 32 16 18 20 45 45 44 42 48
28 25 33 26 30 46 48 49 50 49
26 29 35 45 59 51 51 53 54 54
32 31 30 40 30 56 52 55 52 59
Saln A Saln B
12 21 13 16 18 36 41 40 44 47
24 32 16 18 20 45 45 44 42 48
Solucin.
Considerando los datos poblacionales
1.c. Al propietario le dira, que del anlisis anterior, vemos que la produccin de corbatas de los
trabajadores del saln B es ms pareja, adems la produccin promedio de este grupo de
trabajadores es mucho mayor que los trabajadores del grupo A, por lo que concluimos que las
condiciones de ambiente han influido en la produccin y se debe implementar las mismas
condiciones en el saln A.
1.d. Las medidas resumen que se ha obtenido se llaman parmetros, porque se han calculado a
partir de todos los datos poblacionales.
2.a. La produccin de la muestra de los trabajadores del saln B es ms pareja y oscila entre 36 y 48
corbatas, mientras que la produccin de la muestra de los trabajadores del saln A es ms
dispersa y oscila entre 12 y 32 corbatas, a partir de estas cantidades podemos deducir que la
muestra de trabajadores del saln B produce ms que la muestra de trabajadores del saln A.
El coeficiente de variacin indica que la muestra de datos de la produccin del saln A estn
dispersos, en cambio la muestra de datos de la produccin de los trabajadores del saln B estn
poco dispersos, y el indicador de tendencia central, despus de observar la muestra de datos
originales de la produccin del saln A, vemos que no hay datos extremos, entonces la media
es el indicador de tendencia central adecuado, es decir la produccin media de los
trabajadores de la muestra es de 19 corbatas, y la de los trabajadores de la muestra del saln
LIC. MARA A. ZACARAS DAZ 49
B es de 43.2 corbatas, por lo que concluimos que los trabajadores de la muestra del saln B
producen mucho ms que los trabajadores de la muestra del saln A.
2.c. Que a nivel de muestras los trabajadores del saln B producen mucho ms que los del saln A.
2.d. Las medidas resumen obtenidas tienen el nombre de Estadgrafos.
2.e. Las medidas resumen obtenidas estn en situacin de incertidumbre, ya que se han obtenido a
partir de una parte de la poblacin.
2.f. Se utiliz estadstica descriptiva, para utilizar la estadstica inferencial se debe hacer uso de
probabilidades, dado que las medidas resumen estn en situacin de incertidumbre.
Ejemplo.
En los siguientes enunciados identifique si en su contenido se encuentra, un estadgrafo, un
parmetro o un dato e indique el nombre, justifique su respuesta. Asimismo diga si se esta utilizando
Estadstica descriptiva o inferencial. Interprete la informacin que proporciona cada enunciado.
a. De los 7 mil 108 docentes que obtuvieron nota aprobatoria en el ltimo examen de la Carrera
Pblica Magisterial (2012), 3 mil 122, es decir el 44%, recibi antes capacitacin por parte del
Ministerio de Educacin, lo que evidencia que las clases de actualizacin, que se imparten de
manera gratuita, han permitido una mejora en el conocimiento de los maestros y la ms alta
nota fue de 19 puntos.
b. Siete de cada diez mujeres no denuncia el maltrato que recibe de su pareja debido a que
siente vergenza, miedo a ms agresin, temor al divorcio, culpa, o no sabe a dnde ir,
inform el director del Instituto Guestalt de Lima, Manuel Saravia Oliver, quien indic que "la
violencia familiar es un grave problema de salud pblica".
Solucin a
Subpoblacin constituida por 7108 docentes que aprobaron el ltimo examen de la Carrera
Pblica Magisterial.
U.E: profesor que aprob el ltimo examen de la carrera pblica magisterial.
Variable. X: Recibi o no recibi Capacitacin antes del examen por parte del Ministerio de
educacin.
Datos: {1, 0, 0, 0, , 1, 0, 0, 0} son 7108 datos donde: 0 = No recibi capacitacin y 1 = si
recibi capacitacin.
Informacin obtenida.
Capacitacin Profesores
Si 3122
No 3986
Solucin b
Suponemos que el Instituto Guestalt ha llevado a cabo una encuesta por muestreo y no un censo
porque la poblacin constituida por mujeres peruanas que tienen pareja es muy grande. La muestra
es de tamao n.
U.E es la mujer peruana que tiene pareja.
De la muestra de tamao n de mujeres que tienen pareja, se considera a la submuestra de mujeres
de tamao n1 que son maltratadas y en estas se mide la variable, X: Si denuncia o no denuncia el
maltrato que recibe de su pareja.
Datos, {1, 0, 1, 0, 0, 0} donde 0= No denuncia que recibe maltrato de su pareja, 1= si denuncia que
recibe maltrato.
Informacin obtenida.
Denuncia de Porcentaje de
Maltrato Mujeres
Si 30
No 70