Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis de Poblacion
Analisis de Poblacion
1
INDICE
Introducción………………………………………………………………3
Marco Teórico……………………………………………………………4
I. Población………………………………………………………………………4
II. Muestra………………………………………………………………………...4
III. Diagrama de tallos y hojas…………………………………………………..4
IV. Clases………………………………………………………………………….5
V. No. de clase…………………………………………………………………...5
VI. Tamaño de Clase……………………………………………………………..6
VII. Marca de Clase…………………………………………………………….....6
VIII. Rango………………………………………………………………………….6
IX. Frecuencia absoluta………………………………………………………….8
X. Frecuencia relativa…………………………………………………………...8
XI. Frecuencia acumulada……………………………………………………....8
XII. Frecuencia relativa acumulada……………………………………………..8
XIII. Media…………………………………………………………………………..9
XIV. Mediana………………………………………………………………………10
XV. Moda………………………………………………………………………….10
XVI. Varianza……………………………………………………………………...10
XVII. Desviación estándar………………………………………………………...11
XVIII. Percentil………………………………………………………………………11
XIX. Decil…………………………………………………………………………..12
XX. Cuartil…………………………………………………………………………13
XXI. Diagrama de caja y bigotes………………………………………………...14
XXII. Poligono de frecuencias……………………………………………………16
XXIII. Histograma…………………………………………………………………..16
XXIV. Ojiva porcentual…………………………………………………………….17
XXV. Grafica de pastel……………………………………………………………17
Ejercicio…………………………………………………………………19
Conclusión……………………………………………………………...28
Bibliografía……………………………………………………………...29
2
Introducción
3
Marco Teórico
Población
En estadística se le llama población al grupo grande de individuos u objetos con el
cual podemos llegar a conclusiones por medio de métodos específicos.
Muestra
Se le llama muestra al subconjunto tomado dentro de la población el cual se hace
para llegar a resultados más específicos por medio del análisis sin llegar a estudiar
a toda la población. Al proceso de obtener muestras se la llama muestreo.
Ejemplo: Desearíamos extraer conclusiones respecto a las estaturas (o pesos) de
12000 estudiantes (la población) examinando solamente 100 estudiantes (la
muestra) seleccionados de esta población.
Ejemplo: Desearíamos extraer conclusiones respecto al porcentaje de tornillos
defectuosos producidos en una fábrica durante una semana de 6 días examinando
20 tornillos diariamente producidos en tiempos diferentes durante el día. En este
caso los tornillos producidos durante la semana conforman la población en tanto
que los 120 tornillos escogidos constituyen la muestra.
4
Ejemplo:
Tallo Hoja Frecuencia
7 6 1
8 7 1
9 7 1
10 51 2
11 580 3
12 103 3
13 413535 6
14 29583169 8
15 471340886808 12
16 3073050879 10
17 8544162106 10
18 0361410 7
19 960934 6
20 7108 4
21 8 1
22 189 3
23 7 1
24 5 1
Clase
Es la categoría a la cual organizaras tus datos.
Ejemplo:
Estatura (in) Cantidad de
estudiantes
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
En este caso, las clases son cada fila de cómo se organiza las edades.
No. De clase
Es el número de clases en el que se organiza los datos. Si el problema no te dice
cuántos números de clases tendrá, esta se puede calcular con la fórmula:
1+3.332 log N
5
Ejemplo: en la tabla anterior; el no. de clase seria 5.
Tamaño de Clase
Es el tamaño que tendrá cada intervalo. Se obtiene mediante la diferencia de los
límites superior e inferior. Los límites de una clase son aquéllos que se obtienen
restándole media unidad de medida al límite aparente inferior de una clase y
sumándole media unidad de medida al límite superior aparente de las diferentes
clases.
O en otro caso (sí es que no te dan el no. de clases; sí te la dan, solo sustituye en
la formula) utilizando la siguiente formula:
rango x max−x min
c= =
No .de clases 1+3.332 log N
Ejemplo:
Con base a la tabla anterior; el tamaño de clase seria:
62.5−59.5=3
rango 74−60 14
c= = = =2.8 ≈ 3
No .de clases 5 5
Marca de clase
Es el punto medio de cada intervalo
Ejemplo:
En el intervalo 60-62, la marca de clase seria:
60+62
=61
2
Rango
El rango, también conocido como recorrido es la diferencia entre el valor más alto
y el más bajo de un conjunto de datos. En cierto modo, se puede considerar que
es el mismo concepto que el dominio de una función continua.
6
Ejemplo:
El país con una posición más alta en el ranking es Irlanda (el quinto), mientras que
el más bajo es Rumania en la posición. Así pues, el rango de dicha puntuación es:
60-5= 55 posiciones.
7
Frecuencia Absoluta
El número de veces que aparece un valor, se representa con f i donde el subíndice
representa cada uno de los valores. La suma de las frecuencias absolutas es igual
al número total de datos, representado por n .
Frecuencia Relativa
El resultado de dividir la frecuencia absoluta de un determinado valor entre el
número total de datos, se representa por ni . La suma de las frecuencias relativas
es igual a 1. Lo cual puede verse fácilmente si se factoriza n .
fi
ni =
n
Frecuencia Acumulada
La suma de frecuencias absolutas de todos los valores iguales o inferiores al valor
considerado, se representa por F i .
1,1,2,0,3,2,1,4,2,3,1,0,0,1,2
8
Hermanos fi ni Fi Ni
0 3 3 3 3
15 15
1 5 5 3+5=8 8
15 15
2 4 4 3+5+4=12 12
15 15
3 2 2 3+5+4+2=14 14
15 15
4 1 1 3+5+4+2+1=15 15
15 15
15 1
Media
Es el promedio aritmético de un grupo de datos. Si las observaciones de una
muestra de tamaño n son x1, x2,…,xn, entonces la media muestral es:
x 1+ x 2+ …+ xn
x́=
n
n
∑ xi
i=1
¿
n
La media muestral x representa el valor promedio de todas las observaciones en
la muestra. También es posible pensar en el cálculo del valor promedio de todas
las observaciones de una población. Este promedio se conoce como media
poblacional, y se denota con la letra griega µ (mu).
Cuando existe un número finito de observaciones en la población, entonces la
media poblacional es:
N
∑ xi
μ= i=1
N
9
Ejemplo: El ejemplar del 22 de abril de 1991 de Aviation Week and Space
Technology, informa que durante la operación Tormenta del Desierto, los pilotos
de aviones de combate F-117ª de la fuerza aérea de Estados Unidos volaron un
total de 1270 misiones, con un total de 6905 horas. Por tanto, la duración media
de una misión de un F-117ª durante esta operación fue
6905
μ= =5.4 hr
1270
Mediana
Punto donde la muestra se divide en dos partes iguales. Sean x (1), x(2),…, x(n) una
muestra acomodada en orden creciente de magnitud; esto es, x (1) denota la
observación más grande. Entonces, la mediana x se define como la parte media o
la ([n+1]/2)-ésima observación si n es impar, o el promedio entre las dos
observaciones intermedias [la (n/2)-ésima y la ([n/2]+1)-ésima] si n es par. En
términos matemáticos:
[ n+1 ]
( 2 )
{
x ,impar
~
x= n n
x ( )+ x( [ ]+1)
2 2
¿ , par
2
Moda
Es la observación que se presenta con mayor frecuencia en la muestra.
Ejemplo: Encuentra la moda de los siguientes datos:
3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1, 6, 2, 6, 5.
La moda es: 3 y 6 porque son las que se repiten más veces.
Varianza
Si x1, x2,…, xn es una muestra de n observaciones, entonces la varianza muestral
es:
10
n
∑ (x−x́)2
s2= i=1
n−1
Desviación Estándar
Es la raíz cuadrada positiva de la varianza muestral.
Ejemplo:
i xi x i−x́ ( x i− x́ )2
1 90 -58 3364
2 128 -20 400
3 205 57 3249
4 140 -8 64
5 165 17 289
6 160 12 144
6 6 6
La varianza es:
7510 7510
x́= = =1502( psi)2
6−1 5
Mientras que la desviación estándar está dada por:
s= √1502=38.8 psi
Percentil
Son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los
datos. Se calcula la posición en el que se encuentra k percentil con la siguiente
formula:
k∗n
pk = donde k es el percentil que quieres calcular
100
Y ahora calculamos el valor del percentil con la siguiente formula:
11
k∗n
pk =Li + a(100
−F i−1
Fi−F i−1 )
Donde:
Li = Límite inferior de la clase en el que se está trabajando.
Fi = Frecuencia acumulada de esa clase.
Fi-1 = Frecuencia acumulada de la anterior clase
a= Amplitud de la clase.
Ejemplo:
Edad fi Fi
30-35 3 3
35-40 7 10
40-45 12 22
45-50 23 45
50-55 14 59
55-60 1 60
Calcula el percentil 55
55∗60
p55= =33
100
55∗60
p55=45+5
100
(−22
45−22
=45+5
11
23 ) ( )
=47.39
Decil
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los
datos. Se calcula la posición en el que se encuentra k decil con la siguiente
formula:
12
k∗n
dk =
10
Y para calcular el valor de ese decil se utiliza la siguiente formula:
k∗n
d k =Li+ a (
10
−F i−1
Fi −F i−1 )
Ejemplo:
Con forme a la tabla anterior, calcula el 2 decil
2∗60
d 2= =12
10
2∗60
d 2=40+5
10
(−10
22−10
= 40+5 )
2
12 ( )
=40.83
Cuartil
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de
los datos. Se calcula la posición en el que se encuentra k cuartil con la siguiente
formula:
k∗n
q k=
4
Y para calcular el valor de ese cuartil se utiliza la siguiente formula:
k∗n
q k =Li +a
4
( −F i−1
F i−F i−1 )
Ejemplo:
Con forme a la tabla anterior busca el 3 cuartil:
13
3∗60
q 3= =45
4
3∗60
q 3=45+ 5 (4
−22
45−22 )
=45+5
23
23
=50 ( )
14
Q2 representa el 50%
2∗20 40
Q 2= = =10
4 4
( 33+34 )
Q 2= =33.5
2
Q3 representa el 75%
3∗20 60
Q 3= = =15
4 4
( 39+39 )
Q 3= =39
2
15
Polígono de Frecuencias
Se forma uniendo los extremos de las barras de un diagrama de
barras mediante segmentos.
También se puede realizar trazando los puntos que representan
las frecuencias y uniéndolos mediante segmentos.
Histograma
Un histograma o histograma de frecuencias consiste en un conjunto de
rectángulos que tienen: a) sus bases sobre un eje horizontal (el eje x), con sus
centros coincidiendo con las marcas de clase de longitudes iguales a la
amplitud del intervalo de clase, y b) áreas proporcionales a las frecuencias de
clase.
16
Ejemplo: Histograma que muestra a los puntos medios y las frecuencias de
clase.
Ojiva Porcentual
Es una gráfica que muestra las frecuencias acumuladas menores de cada
frontera superior de clase respecto a cada frontera superior de clase. En
algunas ocasiones se desea considerar distribuciones de frecuencias mayores
o iguales a que la frontera inferior de cada intervalo de clase.
La frecuencia acumulada relativa o frecuencia acumulada porcentual es la
frecuencia acumulada dividida entre la suma de todas las frecuencias, por
ende se obtiene una distribución de frecuencias acumuladas relativas (o
distribución acumulada porcentual) y una gráfica de frecuencias acumuladas
relativas (u ojiva porcentual).
17
Gráfica de Pastel
Sirve para representar variables
cualitativas o discretas. Se utiliza
para representar la proporción de
elementos de cada uno de los
elementos de los valores de la
variable.
Consiste en partir el círculo en
porciones proporcionales a la
frecuencia relativa. Entiéndase
como porción la parte del círculo
que representa a cada valor que
toma la variable.
Cálculo de sectores
Un círculo tiene 360°. El ángulo de cada porción debe de ser proporcional a la
frecuencia de cada valor. Por ejemplo, un 50% del total de todos los elementos, su
sector del círculo tendrá un ángulo de 180°.
18
19
Ejercicio:
Una máquina ha fabricado 100 cilindros cuya longitud en centímetros se
registra:
239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248, 250, 258, 252, 251,
250, 253, 247, 243, 245, 251, 247, 250, 248, 250, 259, 249, 249, 250, 251, 253,
241, 251, 249, 252, 250, 247, 251, 259, 250, 246, 252, 238, 251, 238, 236, 259,
249, 257, 249, 247, 251, 246, 245, 243, 250, 249, 242, 238, 236, 239, 241, 241,
240, 245, 247, 250, 258, 258, 242, 239, 240, 259, 244, 248, 251, 249, 254, 259,
255, 242, 240, 236, 254, 255, 257, 257, 240, 236, 257, 259, 255, 242, 240, 240,
239, 254, 236, 240.
20
Rango 23
Tamaño de clase: C= = =2.875≈ 3
No . de clase 8
N = 100 = 1
n 100
21
Numer Veces total
o repetidas
236 5 1180
238 3 714
239 4 956
240 7 1680
241 3 723
242 5 1210
243 2 486
244 2 488
245 3 735
246 3 738
247 5 1235
248 4 992
249 9 2241
250 10 2500
251 8 2008
252 3 756
253 3 759
254 4 1016
255 4 1020
257 4 1028
258 3 774
259 6 1554
= 24793
Mediana:
236, 236, 236, 236, 236, 238, 238, 238, 239, 239, 239, 239, 240,
240, 240, 240, 240, 240, 240, 241, 241, 241, 242, 242, 242, 242,
242, 243, 243, 244, 244, 245, 245, 245, 246, 246, 246, 247, 247,
247, 247, 247, 248, 248, 248, 248, 249, 249, 249, 249, 249, 249,
249, 249, 249, 250, 250, 250, 250, 250, 250, 250, 250, 250, 250,
251, 251, 251, 251, 251, 251, 251, 251, 252, 252, 252, 253, 253,
22
253, 254, 254, 254, 254, 255, 255, 255, 255, 257, 257, 257, 257,
258, 258, 258, 259, 259, 259, 259, 259, 259
~
x=
x ( n2 )+ x ([ n2 ]+1) = x ( 1002 )+ x ([ 1002 ]+1) = x ( 50 )+ x (51)
2 2 2
249+ 249
¿ =249
2
Varianza:
xi Veces que se ( x−x́ ) ( x−x́ )2
repite
236 5 (236-248)= -12 (−12)2=144
238 3 (238-248)= -10 (−10)2=100
239 4 (239-248)= -9 (−9)2=81
240 7 (240-248)= -8 (−8)2=64
241 3 (241-248)= -7 (−7)2=49
242 5 (242-248)= -6 (−6)2=36
243 2 (243-248)= -5 (−5)2=25
244 2 (244-248)= -4 (−4)2=16
245 3 (245-248)= -3 (−3)2=9
246 3 (246-248)= -2 (−2)2=4
247 5 (247-248)= -1 (−1)2=1
248 4 (248-248)= 0 (0)2=0
249 9 (249-248)= 1 (1)2=1
250 10 (250-248)= 2 (2)2=2
251 8 (251-248)= 3 (3)2=9
252 3 (252-248)= 4 ( 4)2=16
253 3 (253-248)= 5 (5)2=25
254 4 (254-248)= 6 (6)2=36
255 4 (255-248)= 7 (7)2=49
23
257 4 (257-248)= 9 (9)2=81
258 3 (258-248)= 10 (10)2=100
259 6 (259-248)= 11 (11)2=121
n n
n 100
s= √ 9.78=3.1285
Cuartiles:
236, 236, 236, 236, 236, 238, 238, 238, 239, 239, 239, 239, 240,
240, 240, 240, 240, 240, 240, 241, 241, 241, 242, 242, 242, 242,
242, 243, 243, 244, 244, 245, 245, 245, 246, 246, 246, 247, 247,
247, 247, 247, 248, 248, 248, 248, 249, 249, 249, 249, 249, 249,
249, 249, 249, 250, 250, 250, 250, 250, 250, 250, 250, 250, 250,
251, 251, 251, 251, 251, 251, 251, 251, 252, 252, 252, 253, 253,
253, 254, 254, 254, 254, 255, 255, 255, 255, 257, 257, 257, 257,
258, 258, 258, 259, 259, 259, 259, 259, 259
24
Q2 representa el 50% de los valores de la distribución:
k∗n 2∗100 200
Q 2= = = =50
4 4 4
El Q2 se representa con el numero 249
Q3 representa el 75% de los valores de la distribución:
k∗n 3∗100 300
Q 3= = = =75
4 4 4
El Q3 se representa con el numero 252
min 236
q1 242
q2 249
q3 252
max 259
Polígono de
Frecuencia
10
5
25
0
234.5 237.5 240.5 243.5 246.5 249.5 252.5 255.5 258 260.5
Marcas de Clase
Histograma
Histograma
Clases fi
236-239 12
239-242 15
242-245 7
245-248 12
248-251 27
251-254 10
254-257 8
257-259 9
Histograma
30
25
Frecuencia absoluta
20
15
10
0
236-239 239-242 242-245 245-248 248-251 251-254 254-257 257-259
Clases
26
Ojiva Porcentual
Ojiva porcentual
Lim. Sup. Fi
236-239 12
239-242 27
242-245 34
245-248 46
248-251 73
251-254 83
254-257 91
257-259 100
Ojiva Porcentual
120
100
Frecuencia Acumulada
80
60
40
20
0
236-239 239-242 242-245 245-248 248-251 251-254 254-257 257-259
Clases
27
Grafica de Pastel
Grafica de Pastel
Clases fi 360 ° Grados
a= (n )
( a f i)
236-239 12 (3.6)*(12) 43.2
239-242 15 (3.6)*(15) 54
242-245 7 (3.6)*(7) 25.2
245-248 12 (3.6)*(12) 43.2
248-251 27 (3.6)*(27) 97.2
251-254 10 (3.6)*(10) 36
254-257 8 (3.6)*(8) 28.8
257-259 9 (3.6)*(9) 32.4
Gráfica de Pastel
236-239
239-242
242-245
245-248
248-251
251-254
254-257
257-259
28
Conclusión
Por el contenido del trabajo expuesto se concluye que los objetivos esperados del
trabajo se cumplieron en el ámbito de análisis con base en la teoría de la
probabilidad si nos referimos a datos agrupados así como también a datos
simples, también se concluye que el uso de gráficas y tablas hacen que la
compresión del contenido sea más eficaz así como también se recalca el área
practica que fue conformado por los ejercicios resueltos y el análisis de una
población de 100 elementos fue de gran ayuda para la comprensión general del
contenido.
En cuanto a la realización del trabajo se concluye que se reforzaron los
conocimientos en el área de la estadística, esto con el motivo de resolver
problemas en un ámbito ingenieril de una manera amena y eficaz.
29
Bibliografías
30