Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Universidad de
Estadística Básica
ANEXO: Tablas
BIBLIOGRAFÍA GENERAL
Estadística Básica 1
Presentación
La educación superior se ha convertido hoy día en prioridad para el gobierno
Nacional y para las universidades públicas, brindando oportunidades de superación
y desarrollo personal y social, sin que la población tenga que abandonar su región
para merecer de este servicio educativo; prueba de ello es el espíritu de las
actuales políticas educativas que se refleja en el proyecto de decreto Estándares
de Calidad en Programas Académicos de Educación Superior a Distancia de la
Presidencia de la República, el cual define: “Que la Educación Superior a
Distancia es aquella que se caracteriza por diseñar ambientes de aprendizaje en
los cuales se hace uso de mediaciones pedagógicas que permiten crear una
ruptura espacio temporal en las relaciones inmediatas entre la institución de
Educación Superior y el estudiante, el profesor y el estudiante, y los estudiantes
entre sí”.
Introducción
La importancia que tiene la matemática en el desarrollo de los procesos
intelectuales del hombre es notoria a través de su historia. Fue así como en la
antigüedad el pensamiento matemático contribuyó a resolver problemas en tareas
económicas y constructoras de diferentes pueblos, dio la base para revelar tos
misterios del mundo, es decir, dar explicaciones razonables para alcanzar la verdad
de los fenómenos que lo suceden. Contrariamente a los griegos, los hombres de la
edad media utilizaron el contenido matemático como una simple rutina para
disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la
matemática en la edad moderna ayudó a buscar explicaciones concretas de
problemas que se daban en ingeniería, construcción y otras actividades prácticas
del hombre.
Por tal motivo, gracias al medio, las personas están rodeadas constantemente por
un conjunto de experiencias, que manejan y manipulan de una manera
sorprendente. Es decir, en cierta forma se está efectuando una serie de
operaciones: recoge, organiza, analiza e interpreta esas informaciones mediante
unas representaciones significativas para él y así se obtiene una serie de
conclusiones razonables.
La Estadística es utilizada en casi todas las ramas de la ciencia moderna, así como
en muchos otros campos de la actividad humana. Como dijo Salomón Fabricant
“todo el mundo parece hoy coincidir en que la Estadística puede ser útil para
comprender, evaluar y controlar el funcionamiento de la sociedad”. En nuestra
sociedad, el progreso puede medirse mediante diversos índices numéricos, la
estadística se utiliza para describir, manipular e interpretar estos números.
Aún cuando los tipos de problemas a los cuales puede aplicarse la Estadística como
herramienta fundamental para el análisis e interpretación de resultados son
bastante heterogéneos, en muchos casos los pasos de una investigación
estadística son los siguientes:
Primera etapa: formulación del problema. Para investigar con éxito un problema
dado, primero se tienen que crear conceptos precisos, formular preguntas claras e
imponer limitaciones adecuadas al problema, tomando en cuenta el tiempo, dinero
disponible y la habilidad de los investigadores.
Segunda etapa: diseño del experimento. Nuestro deseo es obtener un máximo de
información empleando un mínimo de costo y tiempo. Esto implica, entre otras
cosas, que se debe determinar el tamaño de la muestra o la cantidad y tipo de
datos que resolverán más eficientemente el problema. A la vez este tamaño será
afectado por el método empleado para la selección de la muestra representativa.
No existe una fórmula mágica ni única en estadística que tome en cuenta todas las
situaciones prácticas concebibles. Por lo cual es necesario adquirir conocimientos
generales de los métodos más importantes para hacer inferencias. En cada caso
práctico debe situarse con cuidado la naturaleza del problema específico, para
estar seguros de que será escogido el método más apropiado.
Con el apoyo del computador los cálculos matemáticos se hacen más fáciles, por lo
tanto se recomienda utilizar e integrar un software apropiado para tal fin. En la
actualidad existen varios paquetes estadísticos sencillos de manejar, tales como el
Statgraphics, Sas, Minitab, Spss.
UNIDAD 1: Generalidades de la
Estadística
Proceso de Información
1.1 DEFINICIÓN
importante que realiza, ya que permite obtener conclusiones para un grupo mayor,
denominado población, partiendo de una investigación realizada en un grupo
menor, denominado muestra.
Kendall y Stuart “la estadística es la rama del método científico que traía de los
datos reunidos al contar o medir las propiedades de alguna población”.
Fraser “la estadística trata con métodos para obtener conclusiones a partir de los
resultados de los experimentos o procesos."
1.1.1 Importancia
Es por tanto que las técnicas estadísticas se utilizan en casi todos los aspectos de
la vida:
1.1.2 Población
Ejemplo
La población consistente en todas las tuercas producidas por una fábrica en un día
específico, los estudiantes matriculados en un colegio, son poblaciones finitas;
mientras que la determinada por todos los posibles resultados (caras, cruces) de
sucesivas tiradas de una moneda, las personas que hoy y en el futuro subscriban
un seguro de vida, las piezas fabricadas por una máquina, son poblaciones
infinitas, cantidad de carros que transitan por un peaje en un tiempo determinado
es finita pero si no se especifica este tiempo es entonces infinita.
1.1.3 Muestra
Las muestras pueden ser de dos tipos: probabilística o al azar, cuando cada uno
de los elementos tiene la misma probabilidad de ser escogido y no probalística
cuando se seleccionan los datos con determinado criterio o conveniencia del
investigador; en estos casos, algunas unidades tienen mayor posibilidad que otras
de ser seleccionadas, por tal razón no se puede determina la validez, ni la
confianza que merecen dichos resultados.
Azar Simple
Este método de selección permite que todos los elementos que constituyen la
población tengan la misma posibilidad de ser incluidos en la muestra. Este método
es de gran importancia cuando la población no es grande o siendo grande, este se
concentra en un área pequeña. También cuando las características que” se
investiga presentan poca variabilidad o cuando la población facilita su enumeración
para su selección.
Ejemplo: en la fabrica T&T hay mil personas trabajando, 600 de las cuales son
obreros, 250 son técnicos y 150 son profesionales Si se quiere seleccionar una
muestra aleatoria simple de 200 personas, en este caso, la probabilidad de
selección de cada persona es: n 200
P= = = 0.2
N 1000
Lo cual indica que el 20% de los obreros corresponden a 120 de los técnicos 50 y
30 profesionales.
Por Estratos
Por Conglomerado
Sistematizada
Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene
2000 viviendas, el intervalo de selección será: K= 2000 / 500 = 4.
Dato
Variables
• Ordinal: le asigna valores numéricos a los sujetos, de tal forma que los valores
más altos se le asignan a los individuos que tienen más de la característica que
se mide. Esto hace que necesariamente satisfaga la característica de
diferenciación pero en adición introduce la posibilidad de ordenamiento.
• Variable Continua: es la variable que puede tomar cualquier valor entre dos
valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm,
1.80.
40 17 26 10 26 21 18 27 16 38
22 33 24 20 28 14 30 25 29 37
28 28 33 22 25 29 29 29 21 32
19 35 23 28 22 15 34 13 16 26
24 20 31 29 18 19 11 23 20 24
28 11 34 39 10 25 17 21 34 18
1.2.2 Intervalos
1.2.3 Amplitud
A = R / m; donde A = amplitud
A = 30 / 6 = 5 miles de pesos
Otra manera de formar los intervalos de clase es tomar un dato como medida de
referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor
de la amplitud:
NÚMERO DE
INTERVALOS
INTERVALOS
1 5 - 10
2 10 - 15
3 15 - 20
4 20 - 25
5 25 - 30
6 30 - 35
7 35 - 40
Número de
Intervalos F
Establecimientos
5 - 10 / 2
10 - 15 ///// 5
15 - 20 //////////// 12
20 - 25 ///////////// 14
25 - 30 ////////////// 15
30 - 35 //////// 8
35 - 40 //// 4
TOTAL 60
Intervalos X
5 - 10 7,5
10 - 15 12,5
15 - 20 17,5
20 - 25 22,5
25 - 30 27,5
30 - 35 32,5
35 - 40 37,5
5+10 = 7,5
X=
2
Miles de pesos; esto quiere decir que el promedio del primer intervalo es de
$7500.
Fa
Intervalos F
5 - 10 2 2 60
10 - 15 5 7 58
15 - 20 12 19 53
20 - 25 14 33 41
25 - 30 15 48 27
30 - 35 8 56 12
35 - 40 4 60 4
Fra
Intervalo Fr
5 – 10 0.0333 0.0333 1
10 - 15 0.0833 0.1167 0.9666
15 - 20 0.2 0.3167 0.8833
20 - 25 0.2333 0.55 0.6833
25 - 30 0.25 0.8 0.45
30 - 35 0.1333 0.9333 0.2
35 - 40 0.0667 1 0.0667
Fa Fra
Intervalo F Fr
5 - 10 2 0,0333 2 60 0,0333 1
10 - 15 5 0,0833 7 58 0,1167 0,9666
15 - 20 12 0,2 19 53 0,3167 0,8833
20 - 25 14 0,2333 33 41 0,55 0,6833
25 - 30 15 0,25 48 27 0,8 0,45
30 - 35 8 0,1333 56 12 0,9333 0,2
35 - 40 4 0,0667 60 4 1 0,0667
Total 60 1,00
− Realizar un inventario
− Determinar la demanda de un producto
− La posibilidad que llueva en una ciudad determinada
− El porcentaje de desempleo en una ciudad específica
− El promedio de las acciones vendidas en la bolsa de valores en una empresa en
un mes determinado
− El aumento del índice de precios al consumidor en un mes específico
− El aumento del costo de vida en un mes específico
− El número de accidentes ocurridos en una ciudad determinada
− Las ventas de un almacén en un mes determinado
68 93 71 78 82 79 83 57 88 77
84 60 59 66 75 60 71 73 78 85
75 73 85 72 94 95 79 80 62 75
82 88 75 63 77 75 62 65 76 76
68 79 61 78 69 61 67 75 53 63
90 73 65 95 74 89 97 71 74 72
62 93 75 62 68 78 78 65 86 81
88 76 87 74 60 96 85 76 67 73
Hallar:
• Responder:
69 72 62 74 78 73 79 70 73 68
82 84 63 69 88 81 99 77 82 74
75 73 86 71 73 67 76 70 67 76
66 80 72 67 71 75 78 72 64 72
• Los diámetros internos de los tubos fabricados por una empresa se miden con
precisión de milésima de pulgada. Si las marcas de clase de una distribución
de frecuencias de esos diámetros vienen dadas por 0.321, 0.324, 0.327, 0.33,
0.333 y 0.336. Hallar la anchura del intervalo de clase y los límites de clase.
Proceso de Información
Las medidas de centralización son valores que tienden a situarse en el centro del
conjunto de datos ordenados según su magnitud. Las medidas de centralización
más usadas son: Media aritmética, mediana y moda.
X1 + X2 + X3 + ……Xn ∑xi
X= = i=1
n
n
Cuando los números x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces,
respectivamente, es decir, que sus frecuencias respectivas son f1, f2, f3,....fn, la
media aritmética se puede calcular del modo siguiente:
n
En ocasiones, a cada uno de los números x1, x2, x3,....xn, se les asigna un peso
determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media
aritmética ponderada del modo siguiente:
n
Ejemplo
• Hallar la media aritmética de los siguientes datos que representan las edades
de 10 niños. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.
3*6+4*4+2*3+1*7 47
x= = = 4,7
3+4+2+1 10
111
X= = 5,55
20
2.1.2 Mediana
Ejemplo
304+332
Md = = 318
2
El puntaje de las pruebas que se encuentra en la mitad es de 318.
2.1.3 Moda
Ejemplo
Deporte Nº de Alumnos
Basket 10
Fútbol 18
Voleibol 5
Otros 4
Lo cual indica que los colores que pueden estar de moda son el gris, café y
vinotinto.
Ejemplo
Intervalos F X X*F
5 - 10 2 7.5 15
10 - 15 5 12.5 62.5
15 - 20 12 17.5 210
20 - 25 14 22.5 315
25 - 30 15 27.5 412.5
30 - 35 8 32.5 260
35 - 40 4 37.5 150
40 - 0 0
Total 60 1425
1425
X= = 23,7 = 24
60
Intervalos F X X*F
10 - 19.6 10 14.8 148
19.6 - 29.2 3 24.4 73.2
29.2 - 38.8 7 34 238
38.8 - 48.4 7 43.6 305.2
48.4 - 58 5 53.2 266
58 - 67.6 8 62.8 502.4
Total 40 1532.8
1532.8
X= = 38.3 = 38
40
El puntaje promedio de los 40 alumnos es de 38.
2.2.2 Mediana
Para hallarla cuando los datos están agrupados se siguen los siguientes pasos:
Ejemplo
Intervalos F
5 - 10 2
10 – 15 5
15 – 20 12
20 - 25 14
25 - 30 15
30 - 35 8
35 - 40 4
TOTAL 60
Intervalos F
10 - 19.6 10
19.6 - 29.2 3
29.2 - 38.8 7
38.8 - 48.4 7
48.4 - 58 5
58 – 67.6 8
Total 40
2.2.3 Moda
Ejemplo
Intervalos F
5 - 10 2
10 - 15 5
15 - 20 12
20 - 25 14
25 - 30 15
30 - 35 8
35 - 40 4
Total 60
Intervalo F
10-19.6 10
19.6-29.2 3
29.2-38.8 7
38.8-48.4 7
48.4-58 5
58-67.6 8
Total 40
Salarios F
540 - 607 6
607 - 674 19
674 - 741 36
741 - 808 24
808 - 875 26
875 - 942 19
942 - 1009 10
1009 - 1076 4
Total 144
• De entre 100 números: 20 son cuatros, 40 son cincos, 30 son seis y los
restantes sietes. Hallar la media aritmética, la media y la moda.
Altura (m) F
1.60 - 1.63 5
1.63 - 1.66 18
1.66 - 1.69 42
1.69 - 1.72 27
1.72 - 1.75 8
Total 100
PESO (Lb) F
118 - 126 3
126 – 134 5
134 – 142 9
142 – 150 12
150 - 158 5
158 - 166 4
166 - 174 2
Total 40
Carga Máxima F
(Toneladas Cortas)
9.3 - 9.7 2
9.7 - 10.1 5
10.1 - 10.5 12
10.5 - 10.9 17
10.9 - 11.3 14
11.3 - 11.7 6
11.7 - 12.1 4
Total 60
− Hallar la media, mediana y moda tanto para hombres como para mujeres,
estableciendo las respectivas conclusiones.
Proceso de Información
Las medidas de dispersión o variación dan idea de la separación de los datos
numéricos alrededor de una medida de centralización. Las medidas de dispersión
más utilizadas son:
Indica que tan dispersos están los datos con respecto a la media aritmética. Si los
datos no están agrupados, la desviación estándar de una serie de números n. X1,
x2, x3,.....xn está determinada por:
Ejemplo
X= 5.6
Intervalos F X (X-x)2 F
5 – 10 2 7.5 544.5
10 - 15 5 12.5 661.25
15 - 20 12 17.5 507
20 - 25 14 22.5 31.5
25 - 30 15 27.5 183.75
30 - 35 8 32.5 578
35 - 40 4 37.5 729
Total 60 3235
3.2 VARIANZA
Si los datos no están agrupados, la varianza de una serie de números n: x1, x2,
x3........ Xn está determinada por:
Ejemplo
X = 4.7
18.1
S2 = = 1.81
10
Intervalos F X (X-x)2 F
5 – 10 2 7.5 544.5
10 – 15 5 12.5 661.25
15 – 20 12 17.5 507
20 – 25 14 22.5 31.5
25 – 30 15 27.5 183.75
30 - 35 8 32.5 578
35 - 40 4 37.5 729
Total 60 3235
3235
S2 = = 53.9
60
S
La fórmula que se utiliza es: cv = * 100
X
Ejemplo
X = 5.6 S = 1.34
Cv = 23.9%
X = 24 S = 7.3
7.3
Cv = *100
24
5
CVA = *100 = 12.5% para el operador A
40
15
CVB = *100 = 9.4% Para el operador B
180
Altura (m) F
1.60 – 1.63 5
1.63 – 1.66 18
1.66 – 1.69 42
1.69 – 1.72 27
1.72 – 1.75 8
Total 100
F X
4 70
9 74
16 78
28 82
45 86
66 90
85 94
72 98
54 102
38 106
27 110
18 114
11 118
5 122
2 126
Carga Máxima
F
(Toneladas Cortas)
9.3 - 9.7 2
9.7 – 10.1 5
10.1 - 10.5 12
10.5 - 10.9 17
Carga Máxima
F
(Toneladas Cortas)
10.9 - 11.3 14
11.3 - 11.7 6
11.7 - 12.1 4
Total 60
Proceso de Información
4.1 CUARTILES, PERCENTILES, DECILES
Si un conjunto de datos está ordenado por magnitud, el valor central que divide al
conjunto en dos mitades iguales, es la mediana.
Extendiendo esa idea, se puede pensar en aquellos valores que dividen al conjunto
en cuatro partes iguales, (cuartiles) esos valores denotados Q1 Q2 y Q3, llamados
primer, segundo y tercer cuartil respectivamente. El Q2 coincide con la mediana.
Análogamente, los valores que dividen a los datos en 10 partes iguales se llaman
deciles y se denotan por D1 D2,...D9. El D5 coincide con la mediana.
Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles,
denotados por P1 P2,.....P99. El P50 coincide con la mediana.
Ejemplo
− Al primer cuartil
− Al tercer decil
− Al percentil 80
12 8 5 10 11 4 6 3
3 4 5 6 8 10 11 12
n*p 8*1
Q1 = = = 2
q 4
n*p 8*3
D3 = = = 2.4 ≈ 2
q 10
n*p 8 * 80
P80 = = = 6.4 ≈ 6
q 100
El dato que está en el percentil 80 es 10, ya que este valor está en la sexta
posición.
Ejemplo
Intervalos F n = 60
5 - 10 2 p=1
10 - 15 5 q=4
15 - 20 12 n*p = 60*1 = 15
20 - 25 14 q 4
25 - 30 15 Li= 15
30 - 35 8 ∑Fa = 7
35 - 40 4 F (n*p)/q = 12
A=5
Total 60
Intervalo F n = 60
5 - 10 2 p=2
10 - 15 5 q=4
15 - 20 12 n*p = 60*2 = 30
20 - 25 14 q 4
25 - 30 15 Li= 20
30 - 35 8 ∑Fa = 19
35 - 40 4 F (n*p)/q = 14
Total 60 A=5
Intervalos F n = 60
5 - 10 2 p=3
10 - 15 5 q=4
15 - 20 12 n*p = 60*3 = 45
20 - 25 14 q 4
25 - 30 15 Li= 25
30 - 35 8 ∑Fa = 33
35 - 40 4 F (n*p)/q = 15
Total 60 A=5
Intervalos F n = 60
5 - 10 2 p=1
10 - 15 5 q = 10
15 - 20 12 n*p = 60*1 = 6
20 - 25 14 q 10
25 - 30 15 Li= 10
30 - 35 8 ∑Fa = 2
35 - 40 4 F (n*p)/q = 5
Total 60 A=5
Intervalos F n = 60
5 – 10 2 p=5
10 - 15 5 q = 10
15 - 20 12 n*p = 60*5 = 30
20 - 25 14 q 10
25 - 30 15 Li= 20
30 - 35 8 ∑Fa = 19
35 - 40 4 F (n*p)/q = 14
Total 60 A=5
Intervalos F n = 60
5 - 10 2 p=6
10 - 15 5 q = 10
15 - 20 12 n*p = 60*6 = 36
20 - 25 14 q 10
25 - 30 15 Li= 25
30 - 35 8 ∑Fa = 33
35 - 40 4 F (n*p)/q = 15
Total 60 A=5
Intervalo F n = 60
5 - 10 2 p = 12
10 - 15 5 q = 100
15 - 20 12 n*p = 60*12 = 7.2 = 7
20 - 25 14 q 100
Li= 10
25 - 30 15
∑Fa = 2
30 - 35 8
F (n*p)/q = 5
35 - 40 4
A=5
Total 60
60*12
-2
P12= 10+ 100 5 = 15.2 ≈ 15
5
Por lo tanto el 12% de las ventas de los sesenta establecimientos es de $15000 o
menos.
Intervalos F n = 60
5 - 10 2 p = 50
10 - 15 5 q = 100
15 - 20 12 n*p = 60*50 = 30
20 - 25 14 q 100
25 - 30 15 Li= 20
30 - 35 8 ∑Fa = 19
35 - 40 4 F (n*p)/q = 14
Total 60 A=5
60*50
-19
P50= 20+ 100 5 = 23.9 ≈ 24
14
El 50% de las ventas de los sesenta establecimientos es de $24000 o menos.
Intervalo F n = 60
5 - 10 2 p = 80
10 - 15 5 q = 100
15 - 20 12 n*p = 60*80 = 48
20 - 25 14 q 100
25 - 30 15 Li= 25
30 - 35 8 ∑Fa = 33
35 - 40 4 F (n*p)/q = 15
Total 60 A=5
• Ordenar los datos de la muestra y obtener el valor mínimo, el máximo y los tres
cuartiles Q1, Q2, Q3, localizándolos en una recta numérica utilizando una escala
adecuada.
• Dibujar un rectángulo cuyos extremos son Q1 y Q3.
• Calcular unos limites admisibles superior e inferior que van a servir para
identificar los valores atípicos. Estos límites se calculan con :
Q3 – Q1
Li = Q1-1.5
2
Q3 – Q1
Li = Q3 +1.5
2
• Considerar como valores atípicos los situados fuera del intervalo (li, Ls).
• Dibujar una línea que vaya desde cada extremo del rectángulo central hasta el
valor más alejado no atípico, es decir, que está dentro del intervalo (li, ls).
• Identificar todos los datos que están fuera del intervalo (li, ls) marcándolos
como atípicos.
Ejemplo: Los siguientes datos muestran el número de días con aire contaminado
en 2001 y 2002 en varias ciudades colombianas:
2001 2002
A 248 221
B 208 171
C 113 131
D 128 89
E 106
F 118 101
G 60 33
H 79 63
I 55 56
2001 2002
J 47 54
K 88 55
L 47 69
M 58 59
N 82 48
O 33 16
Para 2001
15*2
Q2 = = 7.5 ≈ 8 El 50% de ciudades tienen 82 días o menos de
4 contaminación
15*3
Q3 = = 11.25 ≈ 11 El 75% de ciudades tienen 113 días o
4 menos de contaminación.
113 – 55
Li = 55 – 1,5 = 11,5
2
113 - 55
= 156,5
Ls = 113 + 1,5
2
Como todos los valores son superiores al límite inferior, la línea inferior del
diagrama de caja deberá llegar hasta el valor mínimo y no hay atípicos en esta
dirección.
2001
Este diagrama de caja, muestra que la mayor parte de las observaciones son
menores que 113 y que el extremo superior de 248 está muy alejado del grupo
principal de datos. Se ve con claridad la amplitud de los datos, que es la longitud
del diagrama completo (248 - 33 = 215).
Para 2002
14*1
El 25% de ciudades tienen 55
Q1= = 3.75 ≈ 4
días o menos de contaminación.
4
14*2
Q2= = 7 El 25% de ciudades tienen 59 días
4 o menos de contaminación.
14*3
Q3= = 10.5 ≈ 11 El 25% de ciudades tienen 101
4 días o menos de contaminación.
101 - 55
Li = 55 – 1,5 = 20.5
2
101 - 55
Ls = 101 + 1,5 = 135.5
2
2002
Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de
datos.
2001
2002
Nótese como los datos tienden a concentrarse más y más hacia el extremo inferior
de la escala, excepto el extremo alto, el cual permaneció alto durante los dos años.
Altura (m) F
1.60 - 1.63 5
1.63 - 1.66 18
1.66 - 1.69 42
1.69 - 1.72 27
1.72 - 1.75 8
Total 100
− El primer cuartil
− El quinto y octavo decil
− El percentil 10 y el percentil 45
Salario F
540 - 607 6
607 - 674 19
674 - 741 36
741 - 808 24
808 - 875 26
875 – 942 19
942 - 1009 10
1009 - 1076 4
Total 144
Peso (Lb) F
118 - 126 3
126 - 134 5
134 - 142 9
142 - 150 12
150 - 158 5
158 - 166 4
166 – 174 2
Total 40
• Las siguientes son diez medidas del diámetro de un cilindro: 3.88, 4.09, 3.92,
3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centímetros. Hallar:
Número
Vida Media
de Tubos
300 – 400 14
400 - 500 46
500 - 600 58
600 - 700 76
700 - 800 68
800 - 900 62
900 - 1000 48
1000 - 1100 22
1100 - 1200 6
Total 400
UNIDAD 5: Presentación de la
Información
Proceso de Información
Una gráfica estadística es aquella en la cual se presentan los datos estadísticos en
términos de magnitudes, para interpretarlos en forma visual.
Existen varios tipos de gráficas para representar los datos estadísticos y al mismo
tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias.
5.1 HISTOGRAMA
Intervalo F
5 - 10 2
10 - 15 5
15 - 20 12
20 - 25 14
25 - 30 15
30 - 35 8
35 - 40 4
40 - 0
Total 60
Las ventas más frecuentes de los sesenta establecimientos están entre $25000 y
$30000; $20000 y $25000. Y la menos frecuente está en $10000.
Es una curva que se traza a partir de los puntos medios de cada clase de amplitud;
estos se unen por medio de una línea recta, la cual se diseña con base en los
datos del histograma.
5.3 OJIVAS
5.4 BARRAS
Años Ventas
1987 6
1988 9
1989 15
1990 30
1991 50
1992 80
1993 110
1994 150
1995 130
1996 100
Segmentada
Agrupada
Circular o de Tortas
Se utiliza para representar las variables y sirve para hacer notar las diferencias en
las proporciones o porcentajes. Es efectiva para permitir las comparaciones
cuando los segmentos son relativamente grandes. El proceso para realizar el
diagrama consiste en una regla de tres para:
Conocer el ángulo de cada sector, entonces se debe relacionar los 360° que tiene
una circunferencia con el tamaño de la muestra y con cada una de sus frecuencias
absolutas.
360° → n
x Fi
Así por ejemplo:
360° → 60
x 2 Donde 60 es la muestra de las ventas de los
establecimientos; 2 es la frecuencia absoluta
360°*2 del primer intervalo.
x = = 12°
60
360° → 60
x 5
Donde 60 es la muestra de las ventas de los
5
360°*3 establecimientos; 5 es la frecuencia absoluta del
x = = 18° segundo intervalo.
60
Tallo y Hojas
17 02 07 04 08
17 04 04 14 03
03 02 04 10 01
Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos:
Ya que la mayor parte de las observaciones tienen el cero como primer dígito, se
puede alargar el tallo a dos categorías de O y dos de 1; en la que los segundos
dígitos del O al 4 quedarán en el renglón superior y los dígitos del 5 al 9 en el
inferior. Como es fácil de ordenar las observaciones en cualquier renglón, también
se puede presentar la gráfica ordenada de tallo y hojas.
O 1,2,2,3,3,4,4,4,4
O 7,8
1 0,4
1 7,7
Ahora se ve con facilidad que las observaciones van de 01 a 17, que nueve de las
15 observaciones son de 4 o menos.
40 17 26 10 26 21 18 27 16 38
22 33 24 20 28 14 30 25 29 37
28 28 33 22 25 29 29 29 21 32
19 35 23 28 22 15 34 13 16 26
24 20 31 29 18 19 11 23 20 24
28 11 34 39 10 25 17 21 34 18
10,0,1,1,3,4
15,6,6,7,7,8,8,8,9,9
20,0,0,1,1,1,,2,2,2,3,3,4,4,4
25,5,5,6,6,6,7,8,8,8,8,8,9,9,9,9,9
30,1,2,3,3,4,4,4
38,9
4O
4
Ciudad 2001
A 248
B 208
C 113
D 128
E 106
F 118
G 60
H 79
I 55
J 47
K 88
L 47
M 58
N 82
O 33
Para construir una gráfica de tallo y hojas con los datos del 2001, los dígitos de las
centenas y decenas formarán el tallo y las unidades serán las hojas.
03 3 11 3.8 19
04 7.7 12 8 20 8
05 5.8 13 21
06 0 14 22
07 9 15 23
08 28 16 24 8
09 17
10 6 18
Como esta gráfica es muy dispersa: hay que hacer que el tallo contenga las
centenas y las hojas los demás dígitos
0 33,47,47
0 55,58,60,79,82,88
1 06,13,18,28
1
2 08,48
2
POBLACIÓN
AÑO
(Millones)
1882 31.4
1892 39.8
1902 50.2
1912 62.9
1922 76
1932 92
1942 105.7
1952 122.8
1962 131.7
1972 151.1
1982 179.3
1992 203.3
2002 226.5
HOMBRES MUJERES
ESTADO CIVIL (% total) (% total)
Soltero 25.1 18.4
Casado 66.7 61.3
Viudo 2.4 12.4
Divorciado 5.8 7.9
19 24 26 31 18 17 22 21
24 19 18 19 21 32 31 26
28 27 22 17 19 21 22 24
30 19 26 27 28 21 24 26
ANEXO: Tablas
BIBLIOGRAFÍA GENERAL
BERNAL V. Miguel. Estadística Descriptiva: J. Elaboración y Presentación de
Datos Universidad de Pamplona, 1987.
GALLARDO, Yolanda. Estadística: Programa de Sicología Universidad de
Pamplona. 1997.
MARTÍNEZ BENCARDINO, Ciro. Estadística Comercial. Bogotá: Norma, 1981.
MORENO GARZÓN, Adonay. Serie aprender a investigar: Recolección de la
información. Cali: ICFES, 1995.
PARZEN, Emmanuel. Teoría Moderna de Probabilidades y sus Aplicaciones México:
LIMUSA, 1991.
PEÑA SÁNCHEZ, Damel. Estadística Modelos y Métodos I. Fundamentos. Madrid:
Alianza editorial, 1986.
PORTUS GOVINDEN. Lincoyán. Curso Práctico de Estadística. Bogotá: McGRAW
- Hill, 1986.
SPIEGEL Murria R. Estadística. Madrid: McGraw Hill, 1993.