Está en la página 1de 30

Contenido

CLASES DE ESTADÍSTICA ...................................................................................................... 3


Estadística descriptiva: ....................................................................................................... 3
Estadística inferencial:........................................................................................................ 3
Estadística multivariable: ................................................................................................... 3
CONCEPTOS BÁSICOS ........................................................................................................... 3
Población .............................................................................................................................. 3
Muestra ................................................................................................................................. 3
Muestra aleatoria ................................................................................................................. 3
Muestra significativa ........................................................................................................... 3
Estadístico ............................................................................................................................ 3
Parámetros ........................................................................................................................... 3
Variable ................................................................................................................................. 4
Constante ............................................................................................................................. 4
Datos ..................................................................................................................................... 4
Representación de los datos. ............................................................................................ 4
I. Datos no agrupados.................................................................................................... 4
II. Datos agrupados ......................................................................................................... 4
DATOS NO AGRUPADOS ........................................................................................................ 5
MEDIDAS DE TENDENCIA CENTRAL. .......................................................................... 5
MEDIDAS DE DISPERSIÓN ..................................................................................................... 6
a) Varianza ........................................................................................................................ 6
FORMA DE LOS DATOS........................................................................................................... 7
DATOS AGRUPADOS ............................................................................................................ 10
Tablas de distribución de frecuencias............................................................................ 11
MEDIDAS DE TENDENCIA CENTRAL ................................................................................. 13
a. La media aproximada ............................................................................................... 13
b. La mediana aproximada ........................................................................................... 13
c. Moda aproximada...................................................................................................... 13
d. Rango medio aproximado ........................................................................................ 13
I. MEDIDAS DE DISPERSIÓN ........................................................................................... 14
TEORIA PROBABILISTICA ..................................................................................................... 18
Conceptos Fundamentales: ............................................................................................. 16
3. Suceso o Evento ....................................................................................................... 16
PROBABILIDAD CONDICIONAL ........................................................................................... 23
TEOREMA DE BAYES ..................................................................................................... 25
TÉCNICAS DE CONTEO................................................................................................. 25
DISTRIBUCION DE PROBABILIDAD .................................................................................... 26
DEFINICIÓN 1 ................................................................................................................... 26
DEFINICIÓN 2 ................................................................................................................... 26
DEFINICIÓN 3 ................................................................................................................... 26
Variables Discretas: .......................................................................................................... 26
✓ Distribución De Probabilidad Uniforme .................................................................. 27
✓ Distribución De Probabilidad Binomial ................................................................... 27
✓ Distribución De Probabilidad Hipergeometrica: .................................................... 28
✓ Distribución De Probabilidad Poisson .................................................................... 29
Variables Continuas: ......................................................................................................... 30
✓ Distribución De Probabilidad Normal: .................................................................... 30
Distribución Muestrales Para Proporciones: ................................................................. 31
ESTADÍSTICA
Conjunto de métodos que nos permiten recolectar, presentar y analizar y obtener
información de un conjunto de datos.

CLASES DE ESTADÍSTICA
Estadística descriptiva:
Conjunto de métodos que nos permite describir cualquier conjunto de datos para obtener
información de ellos.

Estadística inferencial:
Conjunto de métodos que nos permite obtener información del comportamiento de toda
una población a partir del conocimiento de una porción significativa de esta.

Estadística multivariable:
Conjunto de métodos que nos permite analizar simultáneamente gran cantidad de
individuos con una gran cantidad de atributos.

CONCEPTOS BÁSICOS
Población (N): conjunto de objetos, valores o medidas que tienen una característica en
común o de interés para el investigador.

Muestra (n): porción o subconjunto de una población.

Muestra aleatoria(n): es aquella muestra en la que todos sus elementos tienen la misma
probabilidad de escogencia.

Muestra significativa (n): es aquella muestra que trata de involucrar la mayor cantidad
posible de atributos o características de toda una población, debe cumplir con dos (2)
condiciones:

I. Que sea aleatoria.


II. Que tenga un tamaño específico de representatividad de la población.

Estadístico: es una medida tomada a nivel de una muestra.

✓ La media como estadístico se representa como :(ẍ)


✓ La mediana: (med).
✓ La varianza (s2).
✓ La desviación (s)

Parámetros: es una medida tomada a nivel poblacional


✓ La media como parámetro se representa como :(µ(x))
✓ Varianza: (ƹx2)
✓ Desviación :(ƹx)

Variable: es un atributo, característica o magnitud que toma diferentes valores a través


del espacio o del tiempo o de ambos y se clasifican en:

• Variable cuantitativa: son aquellas que se pueden expresar a través de valores


numéricos.
o Variable discreta: se representa con los enteros y se caracteriza
por ser todo aquello que se puede contar Ej: # estudiantes /curso
o Variable continua: son aquellas que se pueden representar por los
reales y se caracteriza por ser todo aquello que se puede medir. Ej:
tiempo, edad, estatura…etc.

• Variable cualitativa: son aquellas que no podemos expresar numéricamente.


Normalmente se pueden expresar a través de proporciones .

(x) numero de exito


𝐏𝐫𝐨𝐩𝐨𝐫𝐜𝐢ó𝐧 ∶ =
(n) tamaño muestra

Constante: variable que toma un determinado valor un espacio o tiempo o en ambos.


Ejemplo la velocidad de la Luz, gravedad…etc.

Datos: secuencia de características con significado. Y se clasifican en:

o Datos numéricos: 134265


o Datos literales: carrera veintisiete con calle novena
o Datos alfanuméricos: carrera 27 con calle 9

Representación de los datos.

I. Datos no agrupados: en esta forma de datos:

Las medidas producen valores exactos y su ventaja es que conocemos el aporte de cada
dato a la medida por otro lado su desventaja es que se necesita mucho tiempo en el análisis
de volúmenes grandes de datos.

II. Datos agrupados: (tablas de distribución de frecuencia)

Sus medidas producen valores aproximados teniendo una ventaja de ahorro de tiempo y
dinero, pero con desventaja, de que no se conoce el aporte de los datos a la medida.
DATOS NO AGRUPADOS
MEDIDAS DE TENDENCIA CENTRAL.: Este grupo de medidas como su nombre
lo indica buscan siempre la mitad del conjunto de datos, y se supone que allí se
debe encontrar lo más homogéneo, lo mas parecido, lo más repetido…es decir
este grupo de medidas tratan de buscar la mejor representativa de la variable.

a) La media (ẍ): es el dato representativo de la variable, y se deja afectar


por valores extremos.

∑ni=1 xi
ẍ=
n
• La media recortada o restringida: es aquella medida de media calculada
sin los valores que se catalogan como extremos o atípicos o atipificados.
• Consultar: media ponderada; media geométrica.

b) la mediana (med): es una medida de orden. Y es el dato que cae


exactamente en la mitad del conjunto de datos.

n+1
mPosición = 2 ;

donde n es el tamaño de la muestra.

Ejemplos:

Cuando n = 5 (impar)
A= {21, 82 ,103 ,154 ,205} ; m = (5+1)/2
m= 3
med= 10

Cuando n= 6 (par)
B= {21, 82 ,103 ,154 ,205, 306} ; m= (6+1)/2
m= 3.5
1o+15
med= = 12.5
2

Es una medida robusta es decir consistente a los valores extremos.

c) Moda (mod): es el dato que más se repite y como máximo 2

A= {1, 2, 4, 4 , 8 ,20} mod = (4)2


B= {2, 2, 4, 4, 8, 8, } no hay mod
C= {2, 2, 2, 2, 4, 4, 4,} mod = (2)4

d) Rango medio(rm):
x mayor + x menor
rm =
2
MEDIDAS DE DISPERSIÓN

a) Varianza (S2)…unidades2: es casi el promedio de la sumatoria al cuadrado


de las diferencias de cada uno de los terminos(datos) menos su
representente.

∑(𝑥𝑖 )2
∑(xi − ẍ) 2 ∑ 𝑥𝑖 2 −
𝑆2 = = 𝑛
𝑛−1 𝑛−1

b) Desviacion estandar (S)…unidades


𝑆 = √𝑠 2 unid2

c) Coeficiente de variacion (CV). es una medida relativa( sin unidades) y se


expresa en porcentaje, y nos permite comparar diferentes variables y asi
poder hallar la que mejor esta representando al conjunto de los datos.

𝑆
CV = ∗ 100%

• si CV tiende a → 0% significa que hay poca variabilidad en los datos, el


representante es bueno.
• Si CV tienede a→100% significa que hay mucha variabilidad entre los
datos, el representante es malo.
d) Rango (r). determina la métrica donde varian o fluctuan los datos y se
define:

𝑟 =rmayor – rmenor

FORMA DE LOS DATOS


Consiste en comparar 2 medidas de tendencia central, la media (ẍ) medida estricta
de representatividad y la mediana (med) medida de orden.
a. ẍ = 𝐦𝐞𝐝

Grafica simétrica con sesgo = 0

b. ẍ > 𝐦𝐞𝐝

Grafica asimétrica con sesgo (+) o a la derecha, tenemos (+) del 50% de los
datos por debajo del representante y esto lo genera los valores atípicos muy
pequeños.

c. ẍ < 𝐦𝐞𝐝
Grafica asimétrica con sesgo (-) o a la izquierda, tenemos (+) del 50% de los
datos por encima del representante y esto lo genera los valores atípicos muy
grandes.

EJERCICIO DE APLICACIÓN DE LOS CONCEPTOS VISTOS EN CLASE.

aplicación de formulas

1. al probar 9 muestras de cada uno de los 4 diseños de soporte para una


prensa hidráulica, se encontró la siguiente información sobre la
representación de la variable en horas que tardo cada motor en fallar de cada
diseño. Y la dispersión y ajuste del motor funcionando a su máxima potencia.

horas en
ajuste
fallar
diseño A 20 4
diseño B 23 3
diseño C 19 8
diseño D 21 10

¿Cuál de los diseños mencionados sería el de mejor soporte según las


especificaciones de la prensa hidráulica?

Solución:
coeficiente de
variabilidad
diseño A (4/20)*100 = 20%
diseño B (3/23)*100 = 13.04%
diseño C (8/19)*100 = 42.10%
diseño D (21/10)*100 = 47.61%
EXPLICACION DE LA RESPUESTA DEL EJERCICIO: En este caso el coeficiente
mas pequeño fue el del diseño B lo que indica que el mejor soporte es el diseño B
según las especificaciones de la prensa hidráulica.

2. Dadas las siguientes edades de un grupo de 32 alumnos de estadística


aplicada I.Calcular todas las medidas vistas hasta ahora en clase.

20 20 20 23
21 18 20 20
20 20 19
20 20 20
19 19 20
19 18 19
20 19 21
22 19 20
20 19 22
21 19 20

Solución: como primer paso se ordenan los datos.

18 19 20 22
18 20 20 23
19 20 20
19 20 20
19 20 20
19 20 20
19 20 21
19 20 21
19 20 21
19 20 22

• como segundo paso se calculan las medidas de tendencia central y de


dispersión.

Medidas de tendencia central


• Media(ẍ): ẍ = 𝟔𝟑𝟕⁄𝟑𝟐 = 𝟏𝟗. 𝟗𝟎
• Mediana(med): 𝐦 = (𝟑𝟐 + 𝟏)⁄𝟐 = 𝟏𝟔. 𝟓 𝐦𝐞𝐝 = 𝟐𝟎 + 𝟐𝟎⁄𝟐 = 𝟐𝟎
• Rango medio (rm): 𝐫𝐦 = (𝟏𝟖 + 𝟐𝟑)⁄𝟐 = 𝟐𝟎. 𝟓
• Moda: (20)15

Medidas de dispersión

( ∑ 𝐱 𝐢 )𝟐
∑(𝐱𝐢 )𝟐 −
• Varianza S2: formula: 𝐬 𝟐 = 𝐧
𝐧−𝟏

∑(𝒙𝒊 ) 𝟐 = 2(18)2 + 9(19)2 + 15(20)2 + 3(21)2 + 2(22)2 + 232 = 12717

(∑ 𝒙𝒊 ) 𝟐 𝟔𝟑𝟕𝟐
= = 𝟏𝟐𝟔𝟖𝟎. 𝟐𝟖
𝒏 𝟑𝟐

( ∑ 𝐱 𝐢 )𝟐
∑(𝐱 𝐢 )𝟐 − 𝟏𝟐𝟕𝟏𝟕 − 𝟏𝟐𝟔𝟖𝟎. 𝟐𝟖
𝐬𝟐 = 𝐧 = = 𝟏. 𝟏𝟖𝟒𝟓 𝐚ñ𝐨𝐬 𝟐
𝐧−𝟏 𝟑𝟐 − 𝟏

2
• Desviación estándar (S): formula: √𝑆 2 𝑢𝑛𝑖𝑑 2
𝟐
𝑺 = √𝟏. 𝟏𝟖𝟒𝟓 𝒂ñ𝒐𝒔𝟐 = 𝟏. 𝟎𝟖𝟖𝟑 𝒂ñ𝒐𝒔

𝑠
• Coeficiente de variación (CV): formula: ( 𝑥) ∗ 100%
𝟏.𝟎𝟖𝟖𝟑
𝐶𝑉 = ∗ 𝟏𝟎𝟎 = 5.46%
𝟏𝟗.𝟗𝟎

• Rango (r): formula: r = r mayor – r menor

r = 23 – 18 = 5
• ẍ < 𝑚𝑒𝑑 grafica asimétrica con sesgo (-) a la izquierda hay más del 50% de
los datos por encima del representante.

DATOS AGRUPADOS

Tablas de distribución de frecuencias: Sus medidas dan valores aproximados.

a. Frecuencia absoluta (fi): se define como el número de datos que cae en cada
clase y la suma de estas debe ser igual a “n”.

b. Frecuencia relativa (fr): casi siempre se representa como porcentaje y se


define como :
𝑓𝑖
𝑓𝑟 =
𝑛

La suma es igual a 1 o al 100% si es en porcentaje.

c. Frecuencia acumulada (fA): son sumas sucesivas de las frecuencias absolutas


o de las frecuencias relativas. Algunas veces desde la primera clase hasta la
última clase y se llaman frecuencias Mayor que y otras veces desde la última
clase hasta primera clase y se llaman frecuencias Menor que. Las primeras
determinan los puntos máximos absolutos y relativos y las segundas los
puntos mínimos absolutos y relativos.

𝑢𝑙𝑡𝑖𝑚𝑎

∑ 𝑓𝑖
Frecuencia acumulada FA >↓ 𝑝𝑟𝑖𝑚𝑒𝑟𝑎
Punto máximo absoluto
absoluta mayor que.
𝑢𝑙𝑡𝑖𝑚𝑎

∑ 𝑓𝑟
Frecuencia acumulada 𝑝𝑟𝑖𝑚𝑒𝑟𝑎
Punto máximo relativo
relativa mayor. FA >↓%
𝑝𝑟𝑖𝑚𝑒𝑟𝑎

Frecuencia acumulada ∑ 𝑓𝑖 Punto mínimo absoluto


absoluta menor que. FA <↑ 𝑢𝑙𝑡𝑖𝑚𝑎
𝑝𝑟𝑖𝑚𝑒𝑟𝑎

Frecuencia acumulada ∑ 𝑓𝑟 Punto mínimo relativo


relativa menor que. FA <↑% 𝑢𝑙𝑡𝑖𝑚𝑎

d. Clase: es un segmento de recta con inicio y fin, límite inferior y superior.

o Clase cerrada [ ]: incluye los limites [ ]


o Clase abierta ( ): excluye los limites ( )
o Clase mixta : usa las clases anteriales ( ]

e. Intervalo de clase ( I ): es la amplitud de cada clase y se define.

𝑅𝑎𝑛𝑔𝑜
𝐼 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒

f. Determinación del número de clase . Hay varias formas aquí usaremos:

Número de clase = 1 +(3.33)log(n) n = muestra

o Redondeo [ Siguiente entero


) Anterior entero
o Conveniencia Mínimo 5 clases
Máximo 17 clases

g. Marca de clase (mi). es el dato representativo de cada clase.

𝐿𝑖 + 𝑙𝑠
𝑚𝑖 =
2
MEDIDAS DE TENDENCIA CENTRAL

Los conceptos de medida de tendencia central son los mismos vistos


anteriormente, el único cambio es la forma de la medida del cálculo.

a. La media aproximada (ẍap):

∑(𝒎𝒊 ∗ 𝒇𝒊)
ẍ𝒂𝒑 =
𝒏

b. La mediana aproximada (medap):

Hay diferentes formas de calcular la medap una de ellas es por medio de


formula y otra por medio de grafica que se verá más adelante.

𝑛
(2 − 𝑓𝐴)𝐼
𝑚𝑒𝑑𝑎𝑝 = 𝐿𝐼 +
𝑓𝑖
Clase mediana es la clase que contiene el 50% de los datos. Se
acostumbra a calcular utilizando la frecuencia acumulada relativa mayor
que (FA>%).

LI = límite inferior de la clase mediana.


n = tamaño de la muestra.
FA = frecuencia acumulada absoluta anterior a la clase mediana.
fi = frecuencia absoluta de la clase mediana.
I = intervalo de clase.

c. Moda aproximada (modap): es la marca de clase, de la clase que tiene la


mayor frecuencia absoluta fi.

d. Rango medio aproximado (rmap)

li (primera clase) + ls (ultima clase)


𝑟𝑚𝑎𝑝 =
2
I. MEDIDAS DE DISPERSIÓN.

Los conceptos de medida de dispersión son los mismos vistos


anteriormente, el único cambio es la forma de cálculo.

a. La varianza aproximada (s2ap):

∑(𝑚𝑖 − ẍ𝑎𝑝)2 ∗ 𝑓𝑖
𝐬 𝟐 ap =
𝑛−1

b. Desviación aproximada (sap):

𝑠𝑎𝑝 = √𝑠 2 𝑎𝑝 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 2

c. Coeficiente de variación (CVap):

𝑠𝑎𝑝
𝐶𝑉𝑎𝑝 = ( ) ∗ 100
ẍ𝑎𝑝

d. Rango aproximado (rap):


𝑟𝑎𝑝 = L (sup última clase) – L (inferior 1 clase)

Ejercicio de aplicación de medidas vistas en clase.

Con las edades anteriores aplicaremos las medidas vistas en datos agrupados.
n = 32
Numero de clases = 1 + (3.33)log (32)= 6.01≈ 6 ( se aproxima a 6 clases)
Rango = 23 – 18 = 5
Intervalo de clase I = (5/6 )= 0.833

(mi -
#c clase fi fr% fa>↓ fa>↓% fr<↑ fr<↑% mi mi*fi ẍap)2*fi
2/32 2/32 32/32
1 [18 - 18.83) 2 (6.25) 2 (6.25) 32 (100) 18.415 36.83 4.96
2 [18.83-19.66) 9 28.12 11 34.37 30 93.75 19.24 173.16 5.06
3 [19.66-20.49) 15 46.87 26 81.25 21 65.62 20.08 301.2 0.12
4 [20.49-21.32) 3 9.37 29 90.26 6 18.75 20.91 627.3 2.53
5 [21.32-22.16) 2 6.25 31 96.87 3 9.37 21.74 43.48 6.12
6 [22.16-23) 1 3.12 32 100 1 3.12 22.58 22.58 6.7
max
32 100% max A R min A min R 639.98 25.51

MEDIDAS DE TENDENCIA CENTRAL

e. La media aproximada (ẍap):

𝟔𝟑𝟗. 𝟗𝟖
ẍ𝒂𝒑 = = 𝟏𝟗. 𝟗𝟗
𝟑𝟐

f. La mediana aproximada (medap):

𝟑𝟐
( 𝟐 − 𝟏𝟏) ∗ 𝟎. 𝟖𝟑𝟑
𝒎𝒆𝒅𝒂𝒑 = 𝟏𝟗. 𝟔𝟔 + = 𝟏𝟗. 𝟗𝟎
𝟏𝟓

Donde la clase mediana es la clase que contiene el 50% de todos los datos
se y acostumbra a tomar la fA>↓%

g. Moda aproximada (modap): (20.08)15

h. Rango medio aproximado (rmap)

𝟏𝟖 + 𝟐𝟑
𝒓𝒎𝒂𝒑 = = 𝟐𝟎. 𝟓
𝟐

MEDIDAS DE DISPERSIÓN.

e. La varianza aproximada (s2ap):

𝟐𝟓.𝟓𝟏
𝐬𝟐 𝐚𝐩 = = 𝟎. 𝟖𝟐𝟑𝟏 𝒂ñ𝒐𝒔2
𝟑𝟏

f. Desviación aproximada (sap):

𝒔𝒂𝒑 = √𝟎. 𝟖𝟐𝟑𝟏 𝒂ñ𝒐𝒔𝟐 = 𝟎. 𝟗𝟎𝟕𝟐 𝒂ñ𝒐𝒔


g. Coeficiente de variación (CVap):

𝟎. 𝟗𝟎𝟕𝟐
𝑪𝑽𝒂𝒑 = ∗ 𝟏𝟎𝟎 = 𝟒. 𝟓𝟑%
𝟏𝟗. 𝟗𝟗

h. Rango aproximado (rap):

𝒓𝒂𝒑 = 𝟐𝟑 − 𝟏𝟖 = 𝟓

i. Forma de los datos (gráficos):

• Histograma

16
14
12 Polígono de frecuencia
frecuencia

10
8
6
4
2
0

clases
• Grafico circular o torta :

6 1 2 3 4 5 6
3%

6% 6%

10%

28%

47%

• Grafico ojiva

120

100

80

60
50
40

20

0
medap
EJERCICIOS DE APLICACIÓN DE LAS MEDIAS VISTAS EN DATOS
AGRUPDOS

• EJERCICIOS PROPUESTOS

1. Una lista de 10 números tiene media de 20, una mediana de 18 y una desviación de
5. El número más grande en la lista es de 39,27; accidentalmente este número se
cambia a 392,7.
a. ¿Cuál es la media después del cambio?
b. ¿Cuál es la mediana?
c. ¿Cuál es la desviación?

∑n
i=1 xi
ẍ= 20x10= ∑(𝒙𝒊 ) accidentalmente 29,27-------392.7
n

200 = ∑10
𝑖=1 𝑥 ∑9𝑖=1 𝑥 + 392,7 = ∑10
𝑖=1 𝑥
n: 10
ẍ: 20 200 − 39.27 = ∑9i=1 x 160,73 + 392,7 = ∑10
𝑖=1 𝑥
med: 18
S: 5 160,73 = ∑9𝑖=1 𝑥 553,43 = ∑10
𝑖=1 𝑥

553,43
a) 𝑥̃ = = 55,343
10
b) med: 18 ordenar los datos: como el valor que cambio fue el ultimo la mediana es
la misma porque al ordenar los datos sigue estando en la misma posición.

̌
∑(𝑥−𝑥)2 113663,4125
c) 𝑠 2 = 𝑠2 = 𝑠 2 = 12629.2680
𝑛−1 9
𝑠 = 112,38

2. Un grupo de 400 empleados, que tiene una compañía, se dividen en operarios y


técnicos con un salario promedio de 1.260.960. Los salarios promedios para cada
uno de los siguientes grupos son de 857.300 y de 1.320.856 respectivamente.
a. ¿Cuántos operarios y cuantos técnicos tiene la compañía?
b. Si el gerente establece una bonificación de 30.000 para los operarios y del 8%
para los técnicos. ¿Cuál será el salario promedio para los 400 empleados de la
compañía?

n= 400 𝑥̌ = 1260960 𝑥̌0 = 857300 𝑥𝑡 = ̌


1320856

∑𝑛
𝑖=0 𝑥 ∑𝑛
𝑖=0 𝑥
a) 𝑥̌0 = 𝑥̌𝑡 =
𝑛 𝑛

0 𝑛 𝑛
𝑡
857300 ∗ 𝑛0 = ∑𝑖=0 𝑥𝑖 1320856 ∗ 𝑛𝑡 = ∑𝑖=0 𝑥𝑖

∑100
𝑖=0 857300 ∗ 𝑛0 + 1320856 ∗ 𝑛𝑖 504384000 = 857300 ∗ 𝑛0 + 1320856

504384000 = 857300(400 − 𝑛𝑡 ) + 1320856 𝑛𝑡


161464000 = 463556 𝑛𝑡

162464000
𝑛𝑡 =
463556

𝑛𝑡 = 368 𝑡𝑒𝑐𝑛𝑖𝑐𝑜𝑠

𝑛0 + 𝑛𝑡 = 400
𝑛0 = 400 − 348
𝑛0=52

b) 857300+30000= 887300
1320856 + (1320856 * 8%)= 1426524,48
887300*52 + 1426524,48*348= 542570119
542570119
𝑥̂ =
400
𝑥̂ = 1356425,298

3. Una fábrica de 3 secciones se sabe que en la SECCION A con 120 trabajadores la


asistencia promedio es de 240 días al año; en la SECCION B que tiene 180 operarios,
la asistencia media es de 216 días al año. Si la asistencia media en toda la fábrica es
de 226,70 días. ¿Cuántos obreros hay en la SECCION C donde la asistencia promedio
es de 230 días al año?

SECCION A
𝑛𝐴 = 120 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑑𝑜𝑟𝑒𝑠
𝑋̃𝐴 = 240 𝑑𝑖𝑎𝑠
SECCION B
𝑛𝐵 = 180 𝑜𝑝𝑒𝑟𝑎𝑟𝑖𝑜𝑠
𝑋̌𝐵 = 216 𝑑𝑖𝑎𝑠
SECCION C
𝑛𝐶 =? 𝑜𝑏𝑟𝑒𝑟𝑜𝑠
𝑋̌𝐶 = 230 𝑑𝑖𝑎𝑠
𝑋̌𝐹 = 226,70 𝑑𝑖𝑎𝑠
𝑛𝐴 + 𝑛𝐵 + 𝑛𝐶 = 𝑛𝑓

∑𝑥 ∑𝑥 ∑𝑥
𝑋̌𝐴 = 𝑛 𝑖𝐴 𝑋̌𝐴 = 𝑛 𝑖𝐵 𝑋̌𝐴 = 𝑛 𝑖𝐶
𝐴 𝐵 𝐶

240 ∗ 120 = ∑ 𝑋𝑖𝐴

216 ∗ 180 = ∑ 𝑋𝑖𝐵

230 ∗ 𝑛𝑐 = ∑ 𝑋𝑖𝐶
̌𝑓 = ∑ 𝑋𝑖𝐴 + ∑ 𝑋𝑖𝐵
𝑥 + ∑ 𝑋𝑖𝐶

28800 + 38880 + 230 ∗ 𝑛𝐶


226,70 =
𝑛𝐴 + 𝑛𝐵 + 𝑛𝐶

67680 + 230 ∗ 𝑛𝐶
226,70 =
300 + 𝑛𝐶

226.7(300 + 𝑛𝐶 ) = 67680 + 230 ∗ 𝑛𝐶

68010 + 226,70 ∗ 𝑛𝐶 = 67680 + 230 ∗ 𝑛𝐶

68010 − 67680 = 3,3𝑛𝐶


𝑛𝐶 = 100 𝑜𝑏𝑟𝑒𝑟𝑜𝑠

4. Durante 10 días se observó en un almacén de autos, el número de estos vendidos


por su empleado estrella.

DIA 1 2 3 4 5 6 7 8 9 10
AUTOS 3 4 2 1 3 2 4 6 5 4

Cada auto vale 18.500.000 y al empleado se le paga sueldo de 270.000 básico


mensual más el 0.5% del valor de cada auto vendido, ¿Cuál será el sueldo promedio
para el vendedor estrella en este lapso de 10 días?

n = 34
18500000 *0,5=92500 270000/30=9000
92500 *34=3145000 9000*10=90000
3145000+90000=3235000 sueldo en los 10 días

5. El número de cheques cobrados diariamente en las 5 sucursales del Banco de


Bogotá durante el mes anterior tuvo la siguiente distribución de frecuencia:

CLASE Fi
0-100 10
200-399 13
400-599 17
600-799 42
800-999 18

Enrique el director de operaciones del Banco sabe que una fluctuación en el cobro de
cheques mayor a 200 cheques diarios ocasiona problemas de personal y organización de las
sucursales, debido a la carga de trabajo disparejo. ¿Deberá preocuparse por la cantidad de
empleados que va a utilizar el siguiente mes?

CLASE 𝑓𝑖 𝑚𝑖 𝑓𝑖 𝑚𝑖 (𝑚𝑖 −̌
𝑥𝑎𝑝 )2 ∗ 𝑓𝑖

0-199 10 99,5 995 2401000

200-399 13 299,5 3893,5 1093300


400-599 17 499,5 8491,5 137700

600-799 42 699,5 29379 508200

800-999 18 899.5 16191 1729800

100 58950 5870000

∑ 𝑚𝑖 𝑓𝑖
𝑥̃
𝑎𝑝 =
𝑛

58950
𝑥̃
𝑎𝑝 =
100

𝑥̃
𝑎𝑝 = 589,5

(𝑚𝑖 −̌𝑥𝑎𝑝 )2 ∗ 𝑓𝑖
𝑠𝑎𝑝 2 =
𝑛−1

̌
5870000
𝑠𝑎𝑝 2 =
99

𝑠𝑎𝑝 2 = 59292,9292

S= 243.501
Si debería preocuparse por la cantidad de empleados que va a utilizar el mes siguiente,
debido a que la variabilidad en la cantidad de cheques diarios es mayor a 200

6. La edad de los estudiantes regulares que acuden a un curso en los turnos matutino
y vespertino del nivel de licenciatura de la universidad central se da en las siguientes
2 muestra.

TURNO MATUTINO 23 29 27 22 24 21 25 26 27 24
TURNO VESPERTINO 27 34 30 29 28 30 34 35 28 29

La homogeneidad de la clase3 es de un factor importante y positivo en el aprendizaje


entonces, ¿en cuál de los dos grupos es más fácil enseñar?
TURNO MATUTINO
n=10
∑10
𝑖=0 𝑥𝑖 258
𝑥̌ = = = 24.8
𝑛 10

(𝑥𝑖− 𝑥̌)2
𝑠2 =
𝑛−1
55,6
𝑠2 = = 6,1777
19

𝑠 = √𝑠 2 = √6,1777 = 2.4835

𝑠
𝑐𝑣 = ( ) ∗ 100
𝑥̃

2,4855
𝑐𝑣 = ( ) ∗ 100 = 10,02%
24.8
TURNO VESPERTINO
55,6
𝑠2 = =
19
𝑠 = 2.8751
2,8751
𝑐𝑣 = ( ) ∗ 100 = 9,46%
24.830.4

Es más fácil de enseñar en el turno vespertino ya que el coeficiente de variación es menor.

7. El hospital krolina tiene los siguientes datos que representa el peso en libras de 200
bebes prematuros al momento de nacer.

𝑚𝑖 𝑚𝑖 𝑓𝑖 𝑓𝑎 >↓
CLASE NUMERO DE BEBES
0,5-0,9 10 0,7 7 10
1,0-1,4 19 1,2 22,8 29
1,5-1,9 24 1,7 40,8 53
2,0-2,4 27 2,2 59,4 80
2,5-2,9 29 2,7 78,3 109
3,0-3,4 34 3,2 108,8 143
3,5-3,9 40 3,7 148 183
4,0-4,4 17 4,2 71,4 200
a. ¿Cuál es el dato representativo e libras de bebes prematuros?

∑ 𝑚𝑖 𝑓𝑖 536,5
𝑥̃
𝑎𝑝 = = = 2,6825 𝑙𝑏
𝑛 200

b. Si los bebes prematuros menores de 3,0 libras se mantienen en una incubadora


durante varios días con precaución. ¿Cuál es el porcentaje aproximado de bebes
prematuros que necesitara incubadora?
109
∗ 100 = 54.5%
200

El porcentaje aproximado de bebes prematuros que necesitan incubadora es de 54,5%

8. El dueño de una farda está interesado en construir una nueva tienda. La construirá
si el número promedio de animales vendidos en los primeros 6 meses de 1995 es de
al menos 300 y si el promedio mensual global del año es al menos de 285. Los datos
para 1995 son de los siguientes.

ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
234 216 195 400 315 274 302 291 275 300 375 450

¿Qué decisión toma el dueño y porque?

∑ 𝑥𝑖 1634
𝑥̌ = = = 272
𝑛 6

∑ 𝑥𝑖 3627
𝑥̌ = = = 302
𝑛 12

No construiría una nueva tienda, ya que solo se cumple una condición de la dos para la
construcción de la misma.

9. A.T Cline superintendente minero de la super carbonera Grover, ha registrado el


tiempo por turno que el equipo de la sección 3 apaga su maquinaria para hacer
ajustes, reparaciones y desplazamientos. A continuación presentamos los datos
correspondientes a los últimos 35 turnos de trabajo:

93 129 105 113 93 87 119 121 111 97 102 99


116 114 107 113 119 100 110 99 139 108 128 84

a. Si Cline tiene la creencia de que el lapso normal de tiempo muerto por turno es de
108 minutos, ¿Cuántos de los últimos 35 turnos de la sección 3 exceda este límite?;
¿Cuántos se encuentran abajo?
b. Construya una distribución de frecuencias con intervalos de 10 minutos. ¿Cline
debería estar preocupado según la distribución construida?

60 107

66 108

72 110-2

75 111

80 112

84 113-2

87 114

91 115

93-2 116

97 119-2

99-2 121

100 126

101 128

102 129

105 139

a) Exceden: 16 turnos
Abajo: 18 turnos

# de clase clase 𝑓𝑖 𝑚𝑖 𝑚𝑖 𝑓𝑖

1 [60-70) 2 65 130

2 [70-80) 2 75 150

3 [80-90) 3 85 255

4 [90-100) 6 95 570

5 [100-110) 6 105 630

6 [110-120) 11 115 1265

7 [120-130) 4 125 500

8 [130-140) 1 135 135

∑ 𝑚𝑖 𝑓𝑖 3635
𝑥̃
𝑎𝑝 = = = 103,8571
𝑛 35
Como la media aproximada excede los 108 minuos, cline no deberá
preocuparse.

10. La American Foods comercializa con fuerza 3 de sus productos a nivel nacional. Uno
de los objetivos fundamentales de la publicidad de cada producto consiste en lograr
que los consumidores reconozcan que American Foods elabora el producto. Para
medir que tan bien cada anuncio logra este reconocimiento, se pidió a un grupo de
consumidores que identificara lo más rápido posible a la compañía responsable de
una larga lista de productos. El primer producto de la American obtuvo un tiempo
promedio, antes de ser reconocido, de 2,5 segundos, con una desviación estándar
de 0,004 segundos. El segundo producto tuvo un tiempo promedio de 2,8 segundos
con una variabilidad promedio de 0.006 segundos. El tercero un promedio de 3,7
segundos con una variabilidad de 0.00811 segundos al cuadrado. Uno de los
encuestados en particular tuvo los siguientes tiempos antes de reconocer la
procedencia del producto: 2,495 para el primer producto; 2,79 para el segundo y
3,90 para el tercero. ¿para cuál de los productos estuvo el consumidor en cuestión
más alejado del desempeño promedio, en unidades de variabilidad promedio
estándar?.

PRMER PRODUCTO
𝑋̌ = 2,5 𝑠𝑒𝑔
𝑠 = 0.004 𝑠𝑒𝑔
SEGUNDO PRODUCTO
𝑋̌ = 2,8 𝑠𝑒𝑔
𝑠 = 0.006 𝑠𝑒𝑔

TERCER PRODUCTO
𝑋̌ = 3,7𝑠𝑒𝑔
𝑠 = 0.0081 𝑠𝑒𝑔
ENCUESTADO
𝑋̌ = 2.495𝑠𝑒𝑔

𝑋̌ = 2,79𝑠𝑒𝑔
𝑋̌ = 3,90𝑠𝑒𝑔
0,004
𝑐𝑣1𝑒𝑟 𝑝𝑟𝑜𝑑 = ( ) ∗ 100 = 0,16%
2,5

0.006
𝑐𝑣𝑠𝑒𝑔 𝑝𝑟𝑜𝑑 = ( ) ∗ 100 = 0,2142%
2,8

0,09
𝑐𝑣𝑡𝑒𝑟 𝑝𝑟𝑜𝑑 = ( ) ∗ 100 = 2,4324%
3,7

0,004
𝑐𝑣𝑝𝑟𝑖 𝑝𝑟𝑜𝑑 𝑒𝑛𝑐 = ( ) ∗ 100 = 0,163%
2,495

0.006
𝑐𝑣𝑠𝑒𝑔 𝑝𝑟𝑜𝑑 𝑒𝑛𝑐 = ( ) ∗ 100 = 0,2150%
2,79

0,09
𝑐𝑣𝑡𝑒𝑟 𝑝𝑟𝑜𝑑 𝑒𝑛𝑐 = ( ) ∗ 100 = 2,3076%
3,90
Para el tercer producto estuvo el consumidor en cuestión mas alejado del desempeño
promedio.
11. La compañía sedal sport equipment tiene en existencia dos categorías de sedal de
pesca. Los datos sobre cada categoría son los siguientes:

RESISTENCIA MEDIA DE PRUEBA DESVIACION ESTANDAR


MASTER 40 kg Valor no conocido= 25 aprox
SUPER 30 kg Valor no conocido= 5 aprox

Si usted se dispone a pescar un tipo de pez cuyo peso promedio ha sido 25 Kg en esta
temporada, ¿Con cuál de los dos sedales tiene más posibilidad de atrapar una cantidad
mayor de peces?

MASTER
25
𝑐𝑣 = ( ) ∗ 100 = 62,5%
40

SUPER
5
𝑐𝑣 = ( ) ∗ 100 = 16,66%
30
Con el sedal super tiene mayor posibilidad de atrapar una mayor cantidad de peces, por
que posee menos dispersionde los datos entorno al promedio.
12. Allison Barret realiza análisis estadísticos para un equipo de carreras
automovilísticas. A continuación presentamos las cifras en galón por millas del
gasto de combustible de sus autos en carreras recientes :

4,77 6,11 6,11 5,05 5,99 4,91 5,27 6,01


5,75 4,89 6,05 5,22 6,02 5,24 6,11 5,02

a. Calcule el dato representativo del consumo de combustible con sesgo igual a cero.
b. El consumo de combustible en carreras recientes
c. Si agrupamos los datos en cinco clases de igual tamaño, ¿Cuál es el consumo de
combustible para la clase representativa de la distribución de frecuencias?

a. Sesgo = 0
X=med n=16
16 + 1
𝑚= = 8,5
2
5,27 + 5,75
𝑚𝑒𝑑 = = 5,51
2
El dato representativo con sesgo igual a cero es 5,51
b. Consumo de combustible
16

∑ 𝑥 = 88,52
𝑖=1

𝑟𝑎𝑛𝑔𝑜 1.34
c. # de clases= 5 𝐼 = # 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 = = 0,268 rango= 6,11-4.77
5
Rango= 1,34

# de clase intervalo 𝑓𝑖 𝑚𝑖 𝑚𝑖 𝑓𝑖

1 4,77-5,038 4 4.904 19.616

2 5,038-5,306 4 5.172 20.688

3 5,306-5,574 0 5.44

4 5,574-5,842 1 5.708 5.708

5 5,842-6,11 7 5.976 41.832

16 87.844

∑ 𝑚𝑖 𝑓𝑖 87,844
𝑥̃
𝑎𝑝 = = = 5.4902
𝑛 16
Consumo de 5,44 galones de combustible para la clase representativa.

13. San electrony piensa emplear uno de sus dos programas de capacitación se capacitó
a 2 grupos para la misma tarea. El grupo recibió el programa A, y el grupo 2 recibió
el B. para el primer grupo los tiempos requeridos para capacitar a los empleados
tuvieron un promedio de 32,11 horas y una variabilidad de 68,09 unidades al
cuadrado. En el segundo grupo el promedio fue de 19,75 horas y la variabilidad fue
de 75,14 unidades al cuadrado. ¿Qué programa de capacitación será mejor para la
empresa?

GRUPO 1: PROGRAMA A

𝑋̌ = 32,11 ℎ𝑜𝑟𝑎𝑠
𝑠 2 = 68,09 𝑠 = 8,2516
GRUPO 2: PROGRAMA B
𝑋̌ = 19,75ℎ𝑜𝑟𝑎𝑠
𝑠 2 = 75,14 𝑠 = 8,6683

GRUPO 1
8,2516
𝑐𝑣 = ( ) ∗ 100 = 25,69%
32,11
GRUPO 2
8,6683
𝑐𝑣 = ( ) ∗ 100 = 43,89%
19,75

Es mejor programa a ya q el grupo uno hay menor variabilidad porque su coeficiente es


menor.
TAREA: REALICE CADA UNO DE LOS SIGUIENTES EJERCICIOS ARGUMENTADO CADA
PROCESO.

14. Talento Ltda. una compañía de Hollywood de selección de elenco, esa en proceso
de elegir un grupo de extras para una película. Las edades delos 20 hombres que se
entrevistaron primero son:

50 56 55 49 52 57 56 57 56 59
55 61 60 51 59 62 52 54 49 54
El editor de la película quiere hombres cayas edades se agrupen de manera cercana
alrededor de los 55 años. Con sus conocimientos de estadística, el director sugiere que
sería aceptable una desviación estándar de 3 años. ¿Califica este grupo de extras?

15. Las tiendas Reality Estéreo, etiquetaron su mercancía 35% arriba del costo de su
última adición al inventario. Hasta hace 4 meses, la grabadora Dynami 400s costaba
$300. Durante los últimos 4 meses Reality recibió 4 embarques mensuales de esta
grabadora con los siguientes costos unitarios: $275, $250, $240, $225. ¿a qué tasa
promedio mensual ha disminuido el precio de venta reality en estos 4 meses?

También podría gustarte