Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIVERSIDAD NACIONAL
MAYOR DE SAN MARCOS
FACULTAD DE INGENIERÍA INDUSTRIAL
E.A.P. INGENIERIA TEXTIL Y CONFECCIONES
ESTADISTICA Y PROBABILIDADES
ESTUDIO ESTADISTICO DE LAS
CANTIDADES DE PRENDAS
CONFECCIONADAS POR LA EMPRESA
FERETOP E.I.R.L
ALUMNOS: CÓDIGO:
Lima-Perú
INDICE
INTRODUCCIÓN.......................................................................................................3.
TABLA DE FRECUENCIA.........................................................................................5.
HISTOGRAMAS.......................................................................................................10.
MEDIDAS DE DISPERSIÓN....................................................................................24.
MEDIDAS DE FORMA.............................................................................................30.
DIAGRAMA DE CAJA..............................................................................................33.
TABLAS BIDIMENSIONALES.................................................................................41.
CONCLUSIONES......................................................................................................50
APENDICE................................................................................................................50
2
ESTADISTICA Y PROBABILIDADES
INTRODUCCIÓN
En el Perú, el tema de elaboración y confección de prendas de vestir va
avanzando moderadamente, el surgimiento de nuevas microempresas y
pequeñas empresas genera la mayor demanda a los nuevos empresarios, si
bien es cierto, el sector textil ha decaído en los últimos años, pero la industrial
textil en el Perú comparada con 20 años atrás, mantiene una tendencia al
crecimiento.
Se sabe que los regímenes exportadores son más complicados, pues las
prendas deben pasar por un procesos de control de calidad detallados al
máximo, lo cual presenta en muchos casos merma; una empresa en su punto
de vista financiero y contable siempre está orientada en generar ganancias y
no perdidas, punto por el cual esta merma es importante, ya que esta se
considera como perdida, por lo que se considera en los gastos y esto es
restado a la ganancia por mes, para así obtener la ganancia total real.
3
ESTADISTICA Y PROBABILIDADES
4
ESTADISTICA Y PROBABILIDADES
TABLA DE FRECUENCIA
Una vez que tenemos recopilados los datos de las diversas cantidades de
prendas de vestir confeccionadas (QTY) por la empresa FERETOP E.I.R.L por
mes, empezaremos a construir la Tabla de Distribución de Frecuencia, para así
poder hallar el promedio de las cantidades de prendas de vestir confeccionadas
por mes (mediante la media), el número de cantidades de prendas de vestir
confeccionadas que se repite mayormente por mes (hallando la moda), el
grado de dispersión de cantidades de prendas de vestir confeccionadas con
respecto al promedio de esta misma (hallando la desviación estándar) y otros
datos que nos pueden ser importantes para poder así resolver nuestra
problemática.
PRESENTACIÓN DE DATOS
12560 13096 12635 13580 12870 13620 13250 13962 14185 13885
12658 11078 12790 11250 12855 11470 12660 11740 12960 12050
12600 11030 12855 11155 13590 11450 13750 11660 13985 11750
11840 11640 12225 11670 12565 11140 12763 11785 12675 11840
12050 12890 12270 13045 12410 13265 12853 13450 13050 13595
13455 13250 13560 13465 13630 13745 13950 14050 14026 14270
5
ESTADISTICA Y PROBABILIDADES
b) Se construye la tabla de frecuencias adecuada:
En el Excel:
Hallamos el Rango
Hacemos los mismos cálculos que hicimos en Excel para hallar la
Amplitud
7
ESTADISTICA Y PROBABILIDADES
8
ESTADISTICA Y PROBABILIDADES
Algunas interpretaciones:
f4= 13; 13 son las cantidades de meses en las que se encuentran las
cantidades producidas de prendas de vestir entre 12418.5 y 12881.5.
h7= 13.33; 13.33 es la proporción del total de meses en los que se
encuentran entre 13807.5 y 14270.5 de las cantidades producidas de
prendas de vestir.
F6= 52; hay 52 meses en los que se produjeron prendas de vestir entre
11029.5 hasta 13807.5.
9
ESTADISTICA Y PROBABILIDADES
HISTOGRAMAS
Es una representación gráfica que maneja distintas estadísticas. Su utilidad se
basa en ver o mostrar la posibilidad de establecer de manera visual, ordenada
y fácil los datos numéricos y estadísticos que pueden tornarse complicados de
entender. Existen varios tipos de histogramas que ejecutan de manera variada
muchos tipos de información.
Normalmente son utilizados en la estadística, con la intención de exponer
gráficamente número, variables y cifras con el fin de que los resultados sean
visualmente claros y ordenados. Casi siempre se presenta en barras, ya que es
mucho más fácil entenderlos de esta manera, dependiendo de cómo se utilicen,
las ramas en las que más facilita los datos son las ciencias sociales, de hecho
pueden compararse datos sociales como resultados de censo, nivel de
analfabetismo o mortalidad infantil.
Los puntos focales de un histograma, son los siguientes:
Realizar un análisis de distribución de datos.
Comprobar el grado de cumplimiento de las especificaciones.
Evaluar la eficacia de las soluciones.
Polígono de frecuencia y ojiva porcentual: ambos son utilizados
normalmente por expertos.
10
ESTADISTICA Y PROBABILIDADES
TIPOS DE HISTOGRAMAS
Histograma Simple
La altura de las barras es proporcional a las frecuencias relativas.
Histograma
Acumulado
A veces es más útil representar las frecuencias acumuladas. En este
caso la altura de las barras es proporcional a las frecuencias absolutas.
Histograma Compuesto
11
ESTADISTICA Y PROBABILIDADES
En Excel:
El histograma hecho es de todos los datos (60 datos), es muy sencillo hacerlo y
analizarlo.
PASO 1
Se coloca los datos de ganancia total y cantidad producida (QTY) por mes
desde enero del 2012 hasta diciembre del 2016 en ambos casos.
12
ESTADISTICA Y PROBABILIDADES
PASO 2
Con la opcion insertar histograma se crea una teniendo en consideracion todos
los datos.
S/.250,000.00
S/.200,000.00
S/.150,000.00
S/.100,000.00
S/.50,000.00
S/.-
16000
14000
12000
10000
8000
6000
4000
2000
13
ESTADISTICA Y PROBABILIDADES
PASO 3
Analizar el histograma de ganacias
14
ESTADISTICA Y PROBABILIDADES
CONCLUSIONES:
El mes con mayores ganancias es diciembre del 2016 contraparte el que
tiene menores ganancias es setiembre del 2012.
El mes con mayores prendas producidas es el diciembre del 2016, en
contraparte el que tiene menores prendas producidas es setiembre del
2012.
Se puede observar que de cierta forma la cantidad producida está
relacionada con la ganancia que se obtiene.
En Minitab:
PASO 1:
Se copian todas las cantidades de prendas producidas y las cantidades
de ganancias por mes.
PASO 2:
Después de esto se va a estadísticas descriptivas.
15
ESTADISTICA Y PROBABILIDADES
Paso 4:
Luego se halla la amplitud y el número de intervalos.
Paso 5:
Se construye el histograma.
PASO 6:
Se elige el histograma simple y se selecciona la variable. Creamos 4
tipos de histogramas. Pero este se modifica para una mejor lectura.
16
ESTADISTICA Y PROBABILIDADES
HISTOGRAMAS CREADOS:
17
ESTADISTICA Y PROBABILIDADES
∑ Xi f i
x́= i=1
n
Aplicando la fórmula:
LI LS Xi fi Fi Xi * fi LRI LRS
11030 11492 11261 7 7 78827 11029.5 11492.5
11493 11955 11724 8 15 93792 11492.5 11955.5
11956 12418 12187 5 20 60935 11955.5 12418.5
12419 12881 12650 13 33 164450 12418.5 12881.5
12882 13344 13113 8 41 104904 12881.5 13344.5
13345 13807 13576 11 52 149336 13344.5 13807.5
13808 14270 14039 8 60 112312 13807.5 14270.5
n 60 764556
764556
x́= =12742.6
60
Por Excel:
Se realiza a través de la función PROMEDIO sobre todos los datos a analizar.
x́=127 57
18
ESTADISTICA Y PROBABILIDADES
Por Minitab:
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
MEDIANA
Con esta medida podemos identificar el valor que se encuentra en el centro de
los datos, es decir, nos permite conocer el valor que se encuentra exactamente
en la mitad del conjunto de datos después que las observaciones se han
ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos
se encuentran por debajo de este valor y la otra mitad por encima del mismo.
En conclusión la mediana nos indica el valor que separa los datos en dos
fracciones iguales con el cincuenta por ciento de los datos cada una. Para las
muestras que cuentan con un número impar de observaciones o datos, la
mediana dará como resultado una de las posiciones de la serie ordenada;
mientras que para las muestras con un número par de observaciones se debe
promediar los valores de las dos posiciones centrales.
Por formula:
Es igual al valor del término central. En el caso de datos agrupados se ubica en
el lugar n/2 se ubica en el lugar de las columnas de las frecuencias absolutas
acumuladas Fi.
Y se evalúa la siguiente fórmula:
n
Me=LRI j + A j [ ]
2
−F j−1
fj
Dónde:
LRI j=Limite inferior del intervalo mediana
19
ESTADISTICA Y PROBABILIDADES
LI LS Xi fi Fi Xi * fi LRI LRS
11030 11492 11261 7 7 78827 11029.5 11492.5
11493 11955 11724 8 15 93792 11492.5 11955.5
11956 12418 12187 5 20 60935 11955.5 12418.5 J-1
12419 12881 12650 13 33 164450 12418.5 12881.5 J
12882 13344 13113 8 41 104904 12881.5 13344.5
13345 13807 13576 11 52 149336 13344.5 13807.5
13808 14270 14039 8 60 112312 13807.5 14270.5
60 764556
Me=12774.6538
Por Excel:
Se realiza a través de la función MEDIANA sobre todos los datos a analizar.
Me=12854
Por Minitab:
A través del comando
Estadísticas/Estadística básica/
Mostrar estadísticas descriptivas.
Se observa lo siguiente:
20
ESTADISTICA Y PROBABILIDADES
MODA
La medida modal nos indica el valor que
más veces se repite dentro de los datos; es
decir, si tenemos la serie ordenada (2, 2, 5
y 7), el valor que más veces se repite es el número 2 quien sería la moda de
los datos. Es posible que en algunas ocasiones se presente dos valores con la
mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos
valores, lo que se conoce como multimodal.
Por Fórmula:
Es el valor de la variable que se presenta con mayor frecuencia. Puede ser
unimodal, bimodal o multimodal. En caso de datos agrupados se halla usando
la siguiente fórmula:
( f j−f j−1 )
Mo=LRI j + A j
[ ( f j−f j−1) +( f j−f j+1) ]
Dónde:
LI LS Xi fi Fi Xi * fi LRI LRS
11030 11492 11261 7 7 78827 11029.5 11492.5
11493 11955 11724 8 15 93792 11492.5 11955.5
11956 12418 12187 5 20 60935 11955.5 12418.5 J-1
12419 12881 12650 13 33 164450 12418.5 12881.5 J
12882 13344 13113 8 41 104904 12881.5 13344.5 J+1
13345 13807 13576 11 52 149336 13344.5 13807.5
13808 14270 14039 8 60 112312 13807.5 14270.5
60 764556
21
ESTADISTICA Y PROBABILIDADES
Aplicando la fórmula con los siguientes datos:
LRI= 12418.5
A= 463
fj-1=5
fj=13
fj+1=8
Mo=12418.5+ 463
[ (13−5)
]
( 13−5 ) +(13−8)
=12703.423
Mo=12703.423
Por Excel:
Se realiza a través de la función MODA sobre todos los datos a analizar.
Mo=1 1840
Por Minitab:
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
22
ESTADISTICA Y PROBABILIDADES
MEDIDAS DE DISPERSIÓN
RANGO O RECORRIDO
Es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, más dispersos están los datos de un conjunto.
Por Fórmula:
Es la diferencia entre los valores máximo y mínimo de los datos.
R=X máx −X min
Por Excel:
Se obtiene por las funciones MAX y MIN sobre los datos a analizar.
23
ESTADISTICA Y PROBABILIDADES
La amplitud existente
entre la mayor cantidad
de prendas y la menor
cantidad de prendas es
de 3 240.
Por Minitab:
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
VARIANZA
Por Fórmula:
Es un valor numérico que cuantifica el grado de dispersión de los valores de
una variable respecto a su media aritmética. Es el promedio de los cuadrados
de las desviaciones de la variable respecto a su media aritmética.
k k 2
( )
2
∑ fi∗X i ∑ fi∗Xi
S2x = i=1 i=1
−
n n
Dónde:
f i=Frecuencia relativa por cada intervalo
24
ESTADISTICA Y PROBABILIDADES
LI LS Xi fi Fi Xi * fi fi * xi2
11030 11492 11261 7 7 78827 887670847
11493 11955 11724 8 15 93792 1099617408
11956 12418 12187 5 20 60935 742614845
12419 12881 12650 13 33 164450 2080292500
12882 13344 13113 8 41 104904 1375606152
13345 13807 13576 11 52 149336 2027385536
13808 14270 14039 8 60 112312 1576748168
60 764556 9789935456
n=60
60
∑ fi∗X 2i =9789935456
i=1
60
∑ fi∗Xi = 764556
i=1
9789935456 764556 2
S2x =
60
− (
60 )
=791736.17
S2x =791736.17
Por Excel:
Se realiza a través de la función VAR sobre todos los datos a analizar.
Por Minitab:
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
25
ESTADISTICA Y PROBABILIDADES
DESVIACION ESTANDAR
Por Fórmula:
Es la raíz cuadrada positiva de la varianza y posee las mismas unidades que la
media aritmética, Estas unidades ya no están elevadas al cuadrado como en la
varianza.
S= √V ( x )
Por Excel:
Se realiza a través de la función DESVEST sobre todos los datos a analizar.
Por Minitab:
26
ESTADISTICA Y PROBABILIDADES
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
COEFICIENTE DE VARIACIÓN
Por Fórmula:
Es la desviación estándar dividida sobre la media aritmética multiplicada por
100. El mismo nos permite comparar desviaciones típicas de variables con
unidades de medición distintas. Mide la variabilidad relativa a la media.
S
CV = x 100 %
X́
Por Excel:
Se realiza a través de la división entre la desviación estándar y la media por
100% sobre todos los datos a analizar.
Por Minitab:
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRIA
Por Fórmula:
28
ESTADISTICA Y PROBABILIDADES
Son medidas que recorren dos aspectos de la población: su asimetría,
alrededor de una medida de tendencia central y su curtosis o grado de
apuntamiento de la distribución.
Una distribución es asimétrica cuando sus datos tienden a agruparse hacia uno
de los extremos de la distribución. Cuando una curva es asimétrica tiene un
sesgo. Existen dos tipos de asimetría o sesgo: positiva y negativa.
Formula:
X́− Mo
SK=
S
Evaluaremos:
Si una curva es simétrica si la media es igual que la mediana y la moda.
X =Mo La curva es simétrica
X > Mo La curva es asimétrica positiva
X < Mo La curva es asimétrica negativa
12742.6−1203.4231
SK= =0.04402918
889.79558
Se observa que la curva es asimétrica positiva.
Por Minitab:
29
ESTADISTICA Y PROBABILIDADES
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
30
ESTADISTICA Y PROBABILIDADES
Fórmula:
A 4=¿ ¿
LI LS Xi fi Fi fi * (Xi- X)^4
11030 11492 11261 7 7 3.68579E+16
11493 11955 11724 8 15 5.20554E+16
11956 12418 12187 5 20 3.97802E+16
12419 12881 12650 13 33 1.25251E+17
12882 13344 13113 8 41 9.25278E+16
13345 13807 13576 11 52 1.51514E+17
13808 14270 14039 8 60 1.30272E+17
60 6.28258E+17
Aplicando sobre los datos:
N = 60
S4 = 6.28258E+17
∑ f ∗( X i − X́ ) =6.28258E+17
4 (6.28258E+17)4
A= =0.39337
60∗6.28258E+17
Entonces, hallamos:
A 4−3=−2.6066
Por lo que se obtiene que la curva sería platicúrtica, es decir poca
concentración y sus frecuencias son similares.
Por Minitab:
A través del comando Estadísticas/Estadística básica/ Mostrar estadísticas
descriptivas. Se observa lo siguiente:
31
ESTADISTICA Y PROBABILIDADES
RIQ=Q 3−Q1
VALORES ATIPICOS
Son datos que están fuera de los límites inferior y superior.
Valor atípico (x): observación que se encuentra más allá del bigote superior o
inferior.
Donde:
n:
Cantidad de datos
K: Cuartil
Pi: Posición inferior
Ps: Posición superior
Datos:
Pi = 11840 Ps = 12050
k ( Ps−Pi ) 1 ( 12050−11840 )
Q k=Pi + →Q 1=11840+ →Q 1=11892.5
4 4
Entonces el Primer Cuartil es 11892.5
Cálculo del Segundo Cuartil o la Mediana (Med):
k ( n+1 ) 2 ( 60+1 )
Para k=2 y n=60; → =30.5
4 4
Como “n” es par:
1362 1363 1374 1375 1388 1395 1396 1398 1402 1405 1418 1427
0 0 5 0 5 0 2 5 6 0 5 0
Pi =12853 Ps = 12855
k ( Ps−Pi ) 2 ( 12855−12853 )
Med =Qk=Pi + → Med =Q 2=12853+
4 4
→ Med=Q 2=12854
La Mediana o el Segundo Cuartil es 12854.
RIQ = Q3 – Q1
RIQ = 1682.5
35
ESTADISTICA Y PROBABILIDADES
El Rango Intercuartil es 1682.5
Cálculo del Límite Inferior (L1) y Límite Superior (L2):
L 1=¿11030
L 2=14270
Entonces el límite inferior es 11030 y el límite superior es 14270.
Por año:
En Excel:
36
ESTADISTICA Y PROBABILIDADES
En Minitab:
Interpretación:
Observamos el desplazamiento de las gráficas de caja hacia la derecha, ello
nos indica que la cantidad de prendas producidas cada año va en aumento y lo
mismo también nos indica el desplazamiento de la mediana. Pero también
notamos que la producción cada vez es más disperso.
Se puede ver que el año 2012 tiene menor variabilidad en comparación con los
años posteriores.
Global
37
ESTADISTICA Y PROBABILIDADES
En Excel:
En Minitab:
38
ESTADISTICA Y PROBABILIDADES
Datos de cinco años acomodados de menor a mayor.
39
ESTADISTICA Y PROBABILIDADES
TABLA BIDIMENSIONAL
Variable estadística bidimensional: es el conjunto de pares de valores de dos
caracteres o variables estadísticas unidimensionales X e Y sobre una misma
población.
La variable estadística bidimensional se representa por el símbolo (X, Y) y cada
uno de los individuos de la población viene caracterizado por la pareja (x i,yi) ,
en el cual xi representa los datos, valores o marcas de clase x1, x2, ..., x n de la
variable X; e yi representa los datos, valores o marcas de clase y 1, y2, ..., ym de
la variable Y.
Se denominan distribuciones bidimensionales a las tablas estadísticas
bidimensionales formadas por todas las frecuencias absolutas de todos los
posibles valores de la variable estadística bidimensional (X, Y).
Variable x Variable y
MEDIA x́=
∑ x i ni ý=
∑ y i ni
n n
2
VARIANZA 2
S x=
∑ ni x i −x́ 2 2
S y=
∑ ni x2 i − ý 2
n n
40
ESTADISTICA Y PROBABILIDADES
Fórmula 1
S xy =
∑ x i y i −x́ ý
N
Formula 2
r s
∑ ∑ ( x i−x́ ) ( y i− ý ) nij
S xy = i=1 j=1
N
Formula 3
r s
∑ ∑ ( x i ) ( y i ) nij
S xy = i=1 j=1
− x́ ý
N
Interpretación
Si Qxy > 0 hay dependencia directa (positiva), es decir a grandes
valores de X corresponden grandes valores de Y.
Si Qxy = 0 Una covarianza (0) se interpreta como la no existencia de
una relación lineal entre las dos variables estudiadas.
Si Qxy < 0 hay dependencia inversa o negativa es decir, a grandes
valores de X corresponden pequeños valores de Y
S xy
r xy =
Sx S y
n ∑ xy−∑ x ∑ y
r=
2 2
√ [ n∑ x −( ∑ x ) ][ n∑ y −(∑ y ) ]
2 2
∑ ( x i−x́ ) ( y i− ý )
i=1
r xy = N N
√ ∑ ( x i− x́ )
i=1
2
√∑ (
i=1
y i− ý )
2
41
ESTADISTICA Y PROBABILIDADES
r=
∑ ( x− x́ ) ( y− ý )
( n−1 ) S x S y
42
ESTADISTICA Y PROBABILIDADES
Interpretación:
El valor del índice de correlación varía en el intervalo [-1,1], indicando el signo
el sentido de la relación:
Si r = 1, existe una correlación positiva perfecta. El índice indica una
dependencia total entre las dos variables denominada relación directa:
cuando una de ellas aumenta, la otra también lo hace en proporción
constante.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todavía relaciones no lineales entre las
dos variables.
Si r = -1, existe una correlación negativa perfecta. El índice indica una
dependencia total entre las dos variables llamada relación inversa:
cuando una de ellas aumenta, la otra disminuye en proporción constante.
Coeficiente de determinación
43
ESTADISTICA Y PROBABILIDADES
En estadística, el coeficiente de determinación, denominado R², es
un estadístico usado en el contexto de un modelo estadístico cuyo principal
propósito es predecir futuros resultados o probar una hipótesis. El coeficiente
determina la calidad del modelo para replicar los resultados, y la proporción de
variación de los resultados que puede explicarse por el modelo.
Coeficiente de determinación= r2
Coeficiente de no determinación
En estadística, el coeficiente de no determinación es la proporción de la
variable total en Y que no está explicada por la variación en X.
Coeficiente de no determinación =1-r2
Regresión lineal
Uno de los objetivos que se persiguen, al estudiar conjuntamente dos variables
X e Y, es encontrar alguna manera de predecir los valores de una de ellas
conocidos los de la otra. En este sentido, es lógico pensar que, si hay una
curva en torno a la cual se agrupan los puntos de un diagrama de dispersión,
ésta ha de dar una aproximación de los valores reales. Al análisis que pretende
determinar la curva que mejor aproxima un diagrama de dispersión se le llama
regresión. En este curso estudiaremos el caso de la regresión lineal, es decir,
la determinación de la recta que mejor aproxima una nube de puntos. Es fácil
hallar una recta que se ajuste aproximadamente a una distribución. Basta con
dibujar la que a simple vista nos parezca más representativa de la nube de
puntos. Sin embargo, éste es un método subjetivo. Para evitar este problema
se considera algún criterio que permita determinar objetivamente la recta que
se ajusta mejor a la distribución.
Fórmula
44
ESTADISTICA Y PROBABILIDADES
Valoración de predicciones
La recta de regresión nos permite predecir valores de una variable a partir de
los de la otra. No obstante, hay que tener siempre presente que existen las
siguientes limitaciones:
Las predicciones realizadas a partir de una recta de regresión no son
fiables si entre X e Y no hay un alto grado de correlación lineal, es decir,
si r no es, en valor absoluto, cercano a 1.
Las predicciones deben hacerse con valores próximos a los pares
considerados. Las estimaciones obtenidas para valores próximos al
centro de gravedad de la distribución son más fiables que las obtenidas
para valores muy alejados de él.
La fiabilidad de una recta de regresión es mayor cuanto mayor sea el
número de datos considerados para calcularla
Casos
En esta parte de nuestro trabajo se analizarán 4 casos de distribución
bidimensional, en el cuál se presentará la covarianza, coeficiente de relación,
coeficiente de determinación y no determinación, recta de regresión en cada
caso; con el fin de evaluar la relación entre las 2 variables correspondientes en
cada uno de ellos.
45
ESTADISTICA Y PROBABILIDADES
Covarianza:
S xy =
∑ x i y i −x́ ý
N
46
ESTADISTICA Y PROBABILIDADES
1. 5363 E+11
S xy = −¿ 12756.68333*199689.1313= 13128987.56
60
r 2=0.992412=0.984872
47
ESTADISTICA Y PROBABILIDADES
PROMEDIO X 12756.68333
PROMEDIO Y 199689.1313
787263734
(x-X)(y-Y)
48758707
(x-X)^2
12922100461
(y-Y)^2
787263734
b 1= =16 . 146
48758707
b 0=199689 .1313−16 .146∗12756 . 68333
b 0=−6280 . 27774618
48
ESTADISTICA Y PROBABILIDADES
QTY VS GANANCIA
250000
240000
230000
GANANCIA (Nuevos Soles)
49
ESTADISTICA Y PROBABILIDADES
CONCLUSIONES
Se puede observar que de cierta forma la cantidad producida está relacionada
con la ganancia que se obtiene, dando así que setiembre del 2012 fue el mes
que obtuvo menores ganancias y también menor fue su cantidad de prendas
producidas, caso contrario con diciembre de 2016.
Observamos mediante las gráficas de caja que las prendas producidas cada
año va en aumento y lo mismo también nos indica el desplazamiento de la
mediana. Pero también notamos que la producción cada vez es más dispersa.
Se puede ver que el año 2012 tiene menor variabilidad en comparación con los
años posteriores.
APÉNDICE
Ingeniero, ya que la tabla de los datos entregados por la empresa Import Export D’ Gala
S.A.C. en EXCEL y PDF, se lo adjuntamos ambos archivos: Excel “Data FERETOP E.I.R.L” y
PDF “Data FERETOP E.I.R.L”.
50