Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Materia Estadistica
Materia Estadistica
ESTADSTICA DESCRIPTIVA.
El proceso seguido en el estudio estadstico de una cierta caracterstica o variable, puede subdividirse
en tres pasos sucesivos:
* Recogida de datos: Planteado el test o encuesta oportuna y recogidos los datos que correspondan,
el primer anlisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o
Cuantitativa; Discreta o Continua). Esto condicionar en gran medida su posterior tratamiento.
Variable: las variables son caractersticas que se distinguen por la variabilidad con que se
manifiestan en los diversos individuos.
Las variables cualitativas (CL) o atributos se miden por escalas nominales u ordinales segn
corresponda. Cuando slo tienen dos modalidades se llaman dicotmicas. Ejemplos: cara-cruz,
varn-hembra, vivo-muerto.
Escalas nominales: se da un nombre a cada una de las modalidades, se asignan los
individuos a ellas y se cuentan los individuos de cada modalidad (frecuencia). El orden
en que se designan las modalidades es indiferente, por ejemplo alto y bajo o bajo y alto.
Escalas ordinales: son escalas nominales en las que diversa modalidades guardan entre
s una relacin de orden o jerarqua, que debe ser respetada, un ejemplo clsico son las
notas acadmicas tradicionales: sobresaliente-notable-aprobado-reprobado.
Las variables cuantitativas (CT) se miden por escalas de intervalo o de razn, segn su naturaleza.
Pueden ser continuas o discretas.
Una variable CT es continua cuando puede tomar cualquier valor en su zona de
variabilidad. Son continuas la talla, el peso, la tensin arterial, el contenido de un frasco,
etc. (pueden ser valores decimales)
Las variables CT discretas no pueden adoptar cualquier valor, sino solamente ciertos
valores. Una familia puede tener 0, 1, 2, 3 hijos, pero no 3,1416 hijos. El n de pacientes
que ingresa en un hospital, etc. (deben ser nmeros enteros)
pg. 1
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
TEMA 3: POBLACION - MUESTRA
Bajo el trmino Estadstica Descriptiva se engloban las tcnicas que nos permitirn realizar un
anlisis elemental de las observaciones experimentales observadas.
Tabular los datos, consiste en presentar los datos estadsticos en forma de tablas o cuadros.
Situados en una tabla los valores de la variable (desde el mnimo al mximo) o los intervalos que
los contienen, procedemos a contar las veces que se repiten.
*Frecuencias Acumuladas ,
, % :
Para un cierto valor de la variable, la frecuencia acumulada se obtiene sumando las
frecuencias anteriores.
Ejemplo:
Tabla1: Severidad de accidentes en temporeros del arndanos
durante enero 2012.
% %
Tipos de
accidentes
leve 80 80 0,400 0,400 40% 40%
medio 95 175 0,475 0,875 47,5% 87,5%
grave 25 200 0,125 1 12,5% 100%
pg. 2
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
Aparte de las frecuencias descritas con anterioridad, se debe calcular otros valores como: rango,
nmero de clase y amplitud de la misma, pudiendo seguir el siguiente orden:
a. Rango : corresponde a la diferencia entre el menor y el mayor valor tabulado.
b. Nmero de intervalos o clases : se calcula en funcin del tamao de la muestra (N), en
general son entre 4 y 20. Matemticamente la mejor eleccin esta dada por = 1 + 3,32
= 1 + 1,44 .
c. Amplitud de las clases: corresponde a la extensin general que poseen los intervalos, se calcula
mediante = , se no es nmero entero, se redondea al nmero entero superior.
d. Construir el esquema de la tabla, poniendo columnas de
clases intervalos tabulados
marca de clase (valor medio de cada intervalo)
frecuencia absoluta ( )
Frecuencia Acumulada ()
Frecuencia relativa ( )
Frecuencia relativa Acumulada ( )
Frecuencia relativa porcentual ( %)
Frecuencia porcentual Acumulada ( %)
Ejemplo:
Tabla 2: Edades en una comunidad hippie Santiago 2008.
Intervalos % %
10,17 13,5 6 6 0,09 0,09 8,57 8,57
17,23 20 6 12 0,09 0,17 8,57 17,14
23,30 26,5 8 20 0,11 0,29 11,43 28,57
30,37 33,5 11 31 0,16 0,44 15,71 44,28
37,44 40,5 11 42 0,16 0,60 15,71 60,00
44,51 47,5 11 53 0,16 0,76 15,71 75,71
51,58 54,5 9 62 0,13 0,89 12,86 88,57
58,65& 61,5 8 70 0,11 1,00 11,43 100,00
Los grficos son una simplificacin y un complemento de una tabla estadstica. Son ms sencillos,
ms llamativos y a menudo ms inteligibles, aunque se pierde informacin. Deben tener un ttulo que
tenga relacin a la informacin mostrada y alguna nota explicativa si es que fuese necesario.
pg. 3
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
b. Histogramas: es propio de variables CT continuas agrupadas en
clases.
* Construccin: Sobre el eje horizontal marcamos los distintos
intervalos, las barras estn unas al lado de otras sin separacin, a
no ser que alguna clase tenga una frecuencia de 0. Cada barra
empieza en el lmite real inferior de la clase que representa y
termina en el lmite superior, que a su vez es el comienzo de la
clase siguiente.
c. Polgonos de frecuencias: Representativo de las variables agrupadas
en intervalos
* Construccin: se obtiene uniendo los puntos medios de los techos
de un hipottico histograma. La lnea debe comenzar y terminar en
el eje de abscisas, precisamente en el sitio que correspondera al
punto medio de dos clases inexistentes, la que precedera a la
primera y la que seguira a la ltima.
pg. 4
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
TEMA 6: PARAMETROS O MEDIDAS DE TENDENCIA CENTRAL
-.*+
Para datos agrupados, se determina por
( = )*+ + , 0
/.*+ + -.*+
recuento y se busca el valor ms )*+ : lmite inferior de la clase modal
_ Para datos no agrupados, se hace el
frecuente. Si hay empate, la moda es /.*+ : frecuencia absoluta anterior a la clase modal
mltiple. -.*+ : frecuencia absoluta posterior a la clase modal
: Amplitud de intervalos.
Media (promedio): es la suma de todos los valores dividida por el nmero de ellos.
1 4
_ Para datos no agrupados, se determina por: _ Para datos agrupados, se determina por:
1 = 1 =
_ Para datos agrupados, se determina por:
/.(*?)
(5 = )(*?) + @ 2
_ Para datos no agrupados, que deben estar
B
(*?)
ordenados:
(5 = , si N es par .
2
)(*?) : lmite inferior de la clase mediana C
+1 /.(*?) : Frecuencia acumulada anterior a Me.
(5 = , si N es impar
2 (*?) : frecuencia absoluta de la clase mediana
: Amplitud de intervalos.
Cuartil: son los 3 valores que dividen la serie de datos en 4 partes iguales, cada una de las cuales
representa un 25% de distribucin.
E
_ Para datos agrupados, se determina por:
E 4 /.
_ Para datos no agrupados, se determina por:
D = = ) +
4
D
D : cuartil pedido ) : lmite inferior de la clase
E: nmero del decil pedido /. : Frecuencia acumulada anterior a la clase.
: Total de datos. : frecuencia absoluta de la clase
: Total de datos.
pg. 5
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
Quintil: son los 4 valores que dividen la serie de datos en 5 partes iguales, cada una de las cuales
representa un 20% de distribucin.
E
_ Para datos agrupados, se determina por:
E A /.
FD = ) + 5
_ Para datos no agrupados, se determina por:
FD =
5
FD : quintil pedido ) : lmite inferior de la clase
E: nmero del quintil pedido /. : Frecuencia acumulada anterior a la clase.
: Total de datos. : frecuencia absoluta de la clase
: Total de datos.
Decil: son los 9 valores que dividen la serie de datos en 10 partes iguales, cada una de las cuales
representa un 10% de distribucin.
E
_ Para datos agrupados, se determina por:
/.
E GD = ) + 10
_ Para datos no agrupados, se determina por:
GD =
10
GD : decil pedido ) : lmite inferior de la clase
E: nmero del decil pedido /. : Frecuencia acumulada anterior a la clase.
: Total de datos. : frecuencia absoluta de la clase
: Total de datos.
Percentil: son los 99 valores que dividen la serie de datos en 100 partes iguales, cada una de las
cuales representa un 1% de distribucin.
E
_ Para datos agrupados, se determina por:
E /.
HD = ) + 100
_ Para datos no agrupados, se determina por:
HD =
100
HD : percentil pedido ) : lmite inferior de la clase
E: nmero del percentil pedido /. : Frecuencia acumulada anterior a la clase.
: Total de datos. : frecuencia absoluta de la clase
: Total de datos.
Grfico de variabilidad: Basado en los cuartiles, adopta la forma del grfico de la derecha. En l
FP F.
se reflejan los cuartiles 1 y 3 y la mediana, junto a los extremos inferior y superior :
LMN = F. 3F = F. 3 O Q
2
FP A F.
LRST FP 3F FP 3 O Q
2
Se consideran observaciones atpicas aquellas que quedan fuera del intervalo ULMN , LRST V
pg. 6
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
Los estadgrafos de dispersin nos indican si la distribucin o conjunto de datos forma grupos
homogneos o heterogneos. Las medidas de dispersin a estudiar son: rango, desviacin media,
varianza y desviacin estndar.
Rango : como ya se vio, corresponde al valor mximo menos el valor mnimo, el rango mide
"la dispersin total" del conjunto de datos. Aunque el rango es una medida de dispersin simple
y que se calcula con facilidad, su debilidad preponderante es que no toma en consideracin la
forma en que se distribuyen los da tos entre los valores ms pequeos y los ms grandes.
| A 1 |
_Para datos agrupados en intervalos es:
GW:
Donde es la marca de clase y 1 la media aritmtica.
Dos medidas de dispersin que se utilizan con frecuencia y que s toman en consideracin la forma
en que se distribuyen los valores son la varianza y su raz cuadrada, la desviacin estndar. Estas
medidas establecen la forma en que los valores fluctan con respecto a la media.
] A 1 C
_ Para datos agrupados, se determina por:
\C =
] : media de clase de casa intervalo
1 : media aritmtica (promedio de datos)
: frecuencia absoluta de cada clase
: Total de datos.
pg. 7
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
Coeficiente de variacin (4_ : es un ndice abstracto, que no tiene unidad de medida. Da igual
que midamos la variable en cm, kg, etc., el coeficiente de variacin se expresa siempre como
`
porcentaje. 4_ = 100
a
Observaciones:
Cuanto ms separados o dispersos estn los datos, es decir, para muestras
heterogneas, tanto mayores sern el rango, la varianza y la desviacin estndar.
Si todas las observaciones son iguales (de manera que no haya variacin en los datos),
el rango, la varianza y la desviacin estndar sern iguales a cero.
2) Los siguientes datos corresponden a las notas obtenidas por alumnos en un curso de
Estadstica
90 87 54 82 93 47 40 53 88 58 100 83 64 72 85 67 60 42 65 100
82 65 57 66 25 70 85 36 61 34 84 85 62 80 65 23 96 30 45 76
77 33 100 69 77 88 63 20 42 55 33 55 100 47 55 85 68 53 82 52
55 70 68 70 65 70 84 52 60 54 98 51 47 58 64 65 60 45 75 75
62 47 57 86 25 66 40 100 32 39 57 93 98 95 95 33 70 51 60 83
pg. 8
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
3) Los siguientes datos corresponden al sueldo (en miles de pesos) de trabajadores de una
empresa
120 135 138 144 146 150 156 164
125 135 140 144 147 150 157 165
126 135 140 145 147 152 158 168
128 136 142 145 148 153 161 173
132 138 142 146 149 154 163 176
4) Una fbrica empaqueta en lotes de 100 unidades los tornillos que produce. Se establece
un plan de inspeccin por muestreo consistente en examinar, de cada lote, 20 tornillos
elegidos al azar y rechazar el lote si de los 20 aparecen ms de 4 defectuosos; almacenar
el lote como revisable si el nmero de defectuosos es menor que 5 pero mayor que 1,
y aceptarlo en otro caso. Se inspeccionan 52 lotes y resulta el siguiente nmero de
tornillos defectuosos de cada muestra:
1 2 4 3 2 0 9 2 0 2 0 0 4 3 0 2 0 1 6 5 2 0 0 1 0 3
2 0 7 1 4 3 0 2 1 0 4 3 0 7 1 0 0 3 2 0 1 0 5 2 0 1
pg. 9
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
287 300 288 302 313 314 289 292 321 327
293 289 292 289 308 326 303 287 293 322
304 329 295 307 297 302 294 301 287 313
308 307 304 291 288 297 316 322 317 308
321 324 323 316 292 289 299 294 328 296
a) Cuntos discos duraron entre 293 y 299 horas?
b) Cuntos discos no alcanzaron a durar 300 horas?
c) Qu porcentaje representan los discos que duraron entre 311 y 317 horas?
d) Qu porcentaje representan los discos que duraron menos de 305 horas?
e) Cuntos discos duraron ms de 311 horas?
f) Cuntos discos duraron menos de 305 horas?
g) Qu porcentaje representan los discos que duraron entre 287 y 299 horas?
h) Cul es el intervalo de mayor frecuencia absoluta?
63 69 83 85 93 73 81 94 104 125
64 132 115 120 127 130 105 114 123 121
128 90 75 137 131 73 62 100 109 117
124 103 133 138 133 110 61 91 87 136
137 134 129 96 99 72 104 97 84 98
pg. 10
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
9) Segn la Asociacin de lucha contra la Bulimia y la Anorexia, las pautas culturales han
determinado que la delgadez sea sinnimo de xito social. Muchos jvenes luchan para
conseguir el fsico ideal motivados por modelos, artistas o por la publicidad comercial.
Durante el mes de marzo del ao 2006, en el colegio Alcntara de la ciudad de Talca,
despus de las vacaciones de verano, se observ con precaucin a 27 alumnos con
sntomas de anorexia, registrndose los siguientes signos visibles:
a) Tabular la informacin.
b) Realizar grfico circular.
c) Indique frecuencias relativas porcentuales en cada grupo.
11) Los siguientes datos corresponden a la duracin, en horas, de vlvulas que fueron
sometidas a un cierto control.
a) Complete la tabla dada.
b) Grafique el polgono de frecuencia
c) Qu porcentaje de las vlvulas duraron, en promedio 674,5 horas?
d) Qu porcentaje de las vlvulas duraron entre 650 y 749 horas?
e) Cuntas vlvulas duraron menos de 550 horas?
f) Qu porcentaje de las vlvulas duraron ms de 649 horas?
Tiempo % %
450-499 4
500-549 5
550-599 12
600-649 10
650-699 15
700-749 3
750-799 1
pg. 11
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
tabla
a) Complete la tabla dada.
b) En un slo grfico, dibuje un histograma y un polgono de frecuencia.
c) Cuntas compras se realizaron entre 11 y 30?
d) Cuntas compras se realizaron entre 16 y 25?
e) Qu porcentaje de compras se realizaron entre 16 y 20?
f) Cuntas compras se realizaron en total?
Volumen % %
6-10 1
11-15
16-20 6 9
21-25 18
26-30 27 27
Peso (Kg) A B
13) Se realizaron dos experimentos referentes al peso, en Kg., 15-19 7 3
aplicado sobre una cierta cantidad de tableros. 20-24 3 6
a) Grafique el histograma del experimento A. 25-29 2 8
b) Grafique un grfico de torta del experimento B. 30-34 11 8
c) Realice, en un mismo grfico, los histogramas con sus 35-39 10 12
polgonos de frecuencia 40-44 7 3
Total 40 40
MEDIDAS DE TENDENCIA CENTRAL
1) Un experto en estndares de trabajo observa el tiempo que se requiere para preparar una
muestra de 10 cartas de negocios en una oficina y obtiene los siguientes resultados: 42,
5, 5, 9, 7, 5, 12, 13, 12 y 10 minutos. Se pide:
a) Determinar la media, la mediana y la moda de esos 10 tiempos
b) Cul de las tres medidas de posicin central calculadas te parece ms representativa
en este caso?
c) Diras que esas 10 observaciones son valores dispersos? por qu?
6 7 7 8 8 8 8 9 9 9
pg. 12
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
9 9 9 9 10 10 10 10 10 11
3) Supongamos que desde hace 5 aos una empresa gasta cada Navidad la cantidad total de
100.000 ptas. en regalar presentes a sus clientes. Si los precios de ese presente han sido
durante los 5 aos: 400; 500; 750; 800 y 1.000 ptas respectivamente, calcular el coste
promedio por cliente para el periodo de 5 aos.
4) El precio del pan sufri los siguientes incrementos: del 7% de 1990 a 1991, del 6% de
1991 a 1992, del 4% de 1992 a 1993, del 3% de 1993 a 1994 y de 1994 a 1995. Cul es
el incremento medio anual de 1990 a 1995?
5) Si invertimos 100.000 pesetas durante 10 aos a los siguientes intereses: 3%, 5%, 6%,
9%, 8%, 5%, 5%, 4%, 3%, 3%. Calcular:
a) El capital medio durante esos 10 aos
b) El inters medio durante esos 10 aos
pg. 13
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
3) En una empresa trabajan 20000 productores, cuyos salarios, segn categoras, son:
salarios N de
(miles de ptas) productores
10-20 12000
20-40 6000
40-50 1000
50-100 800
100-200 200
a) Qu parte de la nmina recibe el 60% de los productores peor pagados?
b) Qu parte de la nmina recibe el 5% de los productores mejor pagados?
MEDIDAS DE DISPERCION
3) Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron pesos de 60,
52, 55 y 65 kilos. Hallar la varianza de los estudiantes.
EJERCICIOS COMPLETOS
1) En una industria dos operarios en siete das de trabajo, son capaces de producir, por da,
y en forma individual la siguiente cantidad de rbol es para fresa de 250 mm de longitud por
300 mm de dimetro.
pg. 14
Instituto Profesional La Araucana
Tcnico en Prevencin de Riesgos
pg. 15