Está en la página 1de 19

UNIVERSIDAD DON BOSCO

TRABAJO DE INVESTIGACIÓN (PRIMERA


ENTREGA)

Estadística Aplicada

Docente:
Katya Patricia Valle
Estudiantes:
Cesar Andrés Cubias Quinteros CQ161943
Eleazar Uziel Martínez Campos MC162095
Josué Augusto Vaquerano Monterroza VM191796
Geovanni Alexander Polanco González PG182590
Pamela Michelle Chavez Vindel CV180410
ÍNDICE
ÍNDICE................................................................................................................................................2

Introducción.......................................................................................................................................3

Objetivos............................................................................................................................................4

Cálculos y conceptos..........................................................................................................................5

Conclusiones....................................................................................................................................17

Bibliografía.......................................................................................................................................18

Introducción
En el siguiente trabajo de investigación se realizaran varios
cálculos estadísticos en Excel de una muestra de resistencia
a la tracción que tienen los textiles tomando los datos de 3
tipos de textiles en 2 condiciones diferentes para los primeros
análisis y luego tomando todos los datos sin distinción alguna
para los siguientes análisis, con estos cálculos se podrá
obtener información valiosa para el cuidado y resistencia que
tienen los textiles para futuras producciones y así poder tomar
las decisiones correctas para la empresa

Objetivos
Objetivo general
Analizar con interés el uso práctico y teórico de la Estadística por medio de un
trabajo de investigación, tomando de referencia las muestras seleccionadas de la
resistencia a la tenacidad de tres tipos diferentes de telas.
Objetivos específicos
 Demostrar la importancia del uso de medidas de tendencia central para el
análisis de diferentes datos.
 Resumir las características de las medidas de dispersión con ejemplos
prácticos.

Cálculos y conceptos
1. CONCEPTOS: (TEORÍA) Defina los conceptos: Medidas de
posición central: a) Media. b) Mediana c) Moda. Medidas de
dispersión: a) Desviación típica. b) Varianza c) Coeficiente
de Variación. ¿Qué significa esta medida?

Medidas de posición central


MEDIA
Se representa por la letra griega µ cuando se trata del promedio del universo y por
X cuando se trata del promedio de la muestra. Es importante destacar que µ es
una cantidad fija mientras que el promedio de la muestra es variable puesto que
diferentes muestras extraídas de la misma población tienden a tener diferentes
medias.

EJEMPLO.

1. Encuentre la media del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.


Hay 8 números en el conjunto. Súmelos, y luego divida entre 8.

= 6.75

Así, la media es 6.75

2. Calculemos la media aritmética:


MEDIANA
La mediana es el valor de la variable que ocupa la posición central, cuando los
datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones
tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o
superiores a la mediana.

EJEMPLO.
Calcular la mediana de los siguientes datos: 11, 6, 7, 7, 4.

Solución:

1. Ordenamos los datos de menor a mayor: 4, 6, 7, 7, 11.


Ahora tomamos el dato que se encuentra al centro: 4, 6, 7, 7, 11.
El valor de la mediana es: Me = 7.

2. (tomando los datos de ejemplo de la media) Lo primero que debemos


hacer para poder calcular la mediana es identificar la clase mediana. Para
esto tenemos que buscar el intervalo en el que se encuentre. N / 2

en este caso N / 2 =  31 / 2  ⇒ 15,5


 
Ahora debemos buscar el intervalo donde la frecuencia acumulada (F i ) contenga
el valor obtenido  (15,5).

MODA
La moda de una distribución se define como el valor de la variable que más se
repite. En un polígono de frecuencia la moda corresponde al valor de la variable
que está bajo el punto más alto del gráfico. Una muestra puede tener más de una
moda.

Li Extremo inferior del intervalo modal  (intervalo que tiene mayor


frecuencia absoluta).
fi  Frecuencia absoluta del intervalo modal.
fi-1  Frecuencia absoluta del intervalo anterior al modal.
fi+1  Frecuencia absoluta del intervalo posterior al modal.
ti  Amplitud de los intervalos.
EJEMPLO.

1. Calcular la moda de los siguientes datos: 11, 6, 7, 7, 4.

Podemos ver que el valor que más se repite es el 7, ya que tiene una frecuencia
absoluta de 2, por lo tanto, Mo = 7.

2. (Siguiendo el ejemplo anterior)


Lo primero que debemos hacer es identificar el intervalo modal:
Si la moda está en el primer intervalo, entonces fi-1= 0. Si la moda está en el último
intervalo, entonces fi+1= 0.
MEDIDAS DE DISPERSIÓN
VARIANZA Y DESVIACIÓN TÍPICA.
La varianza se define como el cociente entre la suma de los cuadrados de las
desviaciones de los valores de la variable y el número de datos del estudio.
Matemáticamente, se expresa como:

Por su parte, la desviación típica, simbolizada por s, se define sencillamente como


la raíz cuadrada de la varianza:
Por lo tanto, se tiene que:

La varianza y la desviación típica, cada una con su respectivo valor, se usan


indistintamente en los estudios estadísticos.
EJEMPLO

Calcular la varianza y la desviación estándar de los siguientes datos: 1, 3, 5, 7 y 9


sabiendo que corresponden a una muestra

Solución:
Nos indican que estos datos forman una muestra, por lo tanto, usaremos las
fórmulas de varianza y desviación estándar para la muestra, teniendo en cuenta
que tenemos 5 datos, es decir, n = 5.
Empezamos calculando la media de la muestra:

Ahora calculamos la varianza de la muestra:

El valor de la varianza poblacional, es de 10.


Ahora calculamos la desviación estándar, teniendo en cuenta que es la raíz
cuadrada de la varianza.

COEFICIENTE DE VARIACION
Es una medida de la dispersión relativa de los datos. Se define como la desviación
estándar de la muestra expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersión entre variables con distintas
unidades de medida. Esto porque el coeficiente de variación, a diferencia de la
desviación estándar, es independiente de la unidad de medida de la variable de
estudio.

EJEMPLO.
Pensemos en una población de elefantes y otra de ratones. La población de
elefantes tiene un peso medio de 5.000 kilogramos y una desviación típica de 400
kilogramos. La población de ratones tiene un peso medio de 15 gramos y una
desviación típica de 5 gramos. Si comparáramos la dispersión de ambas
poblaciones mediante la desviación típica podríamos pensar que hay mayor
dispersión para la población de elefantes que para la de los ratones.

Sin embargo al calcular el coeficiente de variación para ambas poblaciones, nos


daríamos cuenta que es justo al contrario.

Elefantes:  400/500=0,08
Hormigas:  5/15=0,33

Si multiplicamos ambos datos por 100, tenemos que el coeficiente de variación


para los elefantes es de apenas un 8%, mientras que el de las ratones es de un
33%. Como consecuencia de la diferencia entre las poblaciones y su peso medio,
vemos que la población con mayor dispersión, no es la que tiene una mayor
desviación típica.

CÁLCULOS ESTADISTICOS CON EXCEL


I. TOME LOS DATOS DE CADA TIPO DE TELA y los datos para la medida de la
resistencia: en seco o en húmedo. (Al realizar esto cálculos, se está tomando cada
tipo de tela y su estado en seco o en húmedo, como una muestra diferente, son 6
muestras). Para cada muestra calcule, utilizando comandos de Excel:

Tenacidad [gr/Denier]
Algodón Lino Seda
Seco Húmedo Seco Húmedo Seco Húmedo
3.538 6.795 3.974 4.458 3.235 4.263
3.308 4.124 5.355 6.293 2.513 3.529
3.761 5.134 4.289 7.283 4.202 3.402
4.747 5.001 5.797 5.653 4.624 2.43
4.999 3.381 5.042 5.551 4.567 2.388
3.229 4.065 5.204 5.668 4.253 3.913
4.449 5.111 5.132 5.555 4.68 4.88
4.243 4.345 5.982 6.159 4.335 2.068
3.753 5.826 5.023 6.607 5.228 2.446
3.249 6.357 5.261 7.046 4.142 3.354
4.86 6.737 5.448 4.719 4.438 4.125
4.52 6.337 6.229 5.965 5.039 3.222

a. Las Medidas de posición Central:


Media aritmética.
Mediana
Moda

Algodón Seco Algodón Húmedo


Media: 4.055 Media: 5.268
Mediana Median
: 4.002 a: 5.123
No Existe No Existe
Moda: Moda Moda: Moda
Lino Seco Lino Húmedo
Media: 5.228 Media: 5.913
Mediana Median
: 5.233 a: 5.817
No Existe No Existe
Moda: Moda Moda: Moda

Seda Seco Seda Húmedo


Media: 4.271 Media: 3.335
Mediana Median
: 4.387 a: 3.378
No Existe No Existe
Moda: Moda Moda: Moda

Escriba una conclusión de estos resultados.


Moda:
Como conclusión, podemos demostrar que ninguna de las muestras tiene moda, eso
quiere decir que ningún dato se repite o es igual a otro,

Media:
Como podemos observar el promedio en tela de algodón seco es de 4.055 mientras que el
algodón húmedo es de 5.268 eso quiere decir que la resistencia en seco es menor que en
la húmeda, al igual manera el lino seco tiene una media de5.228 y en húmedo es 5.913
eso quiere decir que la diferencia de la resistencia en el lino seco y húmedo es mínima, po
otro lado la seda en seco la media es de 4.271 y en húmedo es de 3.335 eso nos
demuestra que la seda en seco en promedio es menos resistente en húmedo.

Mediana:
El 50% de los datos obtenidos en la resistencia de tela de algodón seco está por encima
4.002 y el otro está por debajo de 4.002, al igual que en húmeda esta por 5.123.

En la tela de lino seco el 50% los datos de la resistencia están encima5.233 y demás están
por debajo, mientras que en húmedo el 50% está por encima 5.817 y el otra esta 50%
está por debajo.

En la tela de seda seco el 50% los datos de la resistencia están encima 4.387 y demás
están por debajo, mientras que en húmedo el 50% está por encima 3.378 y el otra 50%
está por debajo.

b. Medidas de dispersión:
Desviación típica.
Varianza.
Coeficiente de variación.

Algodón Seco Algodón Húmedo


Desv. Desv.
Típica: 0.658 Típica: 1.145
Varianza: 0.433 Varianza: 1.310
C. 16.223 C. 21.729
Variación: % Variación: %

Lino Seco Lino Húmedo


Desv. Desv.
Típica: 0.640 Típica: 0.841
Varianza: 0.409 Varianza: 0.707
C. 12.235 C. 14.222
Variación: % Variación: %

Seda Seco Seda Húmedo


Desv. Desv.
Típica: 0.745 Típica: 0.872
Varianza: 0.555 Varianza: 0.761
C. 17.438 C. 26.161
Variación: % Variación: %

Escriba un análisis de los resultados, haciendo referencia al grado de representatividad de la


media.

Según lo que podemos observar el grado de representatividad en la tela de algodón seco es


bastante representativa porque su C.V.=16.22%, mientras que el algodón húmedo la media tiene
representatividad menor que en seco porque en húmedo se C.V = 21.72%

En cambio lo que podemos observar el grado de representatividad en la tela de lino seco es


bastante representativa porque su C.V.=12.24%, mientras que el algodón húmedo la media tiene
bastante representatividad al igual que en seco porque en húmedo se C.V = 14.22% eso da
entender que la tela de lino tiene una resistencia mu igualada

Y por último observamos el grado de representatividad en la tela de sea seca es bastante


representativa porque su C.V.=17.44%, mientras que seda húmeda la media tiene
representatividad menor que en seco porque en húmedo su C.V = 26.16%.
II. ELABORACION DE GRAFICO.

a. Elabore un gráfico lineal que compare el comportamiento para la tela de algodón, el


comportamiento de la tenacidad en seco y en húmedo. Luego observe el grafico y
escriba un análisis del comportamiento observado.

Algodón
Seco Húmedo
3.538 6.795
3.308 4.124
3.761 5.134
4.747 5.001
4.999 3.381
3.229 4.065
4.449 5.111
4.243 4.345
3.753 5.826
3.249 6.357
4.86 6.737
4.52 6.337

En conclusión, se puede demostrar que la tenacidad de la muestra de algodón


húmedo es más resistente que la muestra en seco del algodón.
b. Elabore un gráfico circular utilizando los datos de la tela lino es su estado en seco ¿Es
correcto realizar este tipo de grafico? ¿Sí? ¿No? Explique.

Lino
Seco Húmedo
3.974 4.458
5.355 6.293
4.289 7.283
5.797 5.653
5.042 5.551
5.204 5.668
5.132 5.555
5.982 6.159
5.023 6.607
5.261 7.046
5.448 4.719
6.229 5.965

En conclusión, se puede asegurar que no es correcto hacer el grafico circular, por ser una
lista de datos de una misma muestra.

III.TOME TODOS LOS DATOS COMO UNA SOLA POBLACIÓN: TELA PRODUCIDA POR UNA
EMPRESA (No habrá diferencia por tipos de tela, ni si su estado es húmedo o seco)
A) Medidas de posición Central: Media aritmética, Mediana y Moda. Escriba una
conclusión de estos resultados.
B) Medidas de dispersión: Desviación típica, Varianza y Coeficiente de variación. Escriba
un análisis de los resultados, haciendo referencia al grado de representatividad de la
media.
Algodón Lino Seda
Seco Humedo Seco Humedo Seco Humedo
3.538 6.795 3.974 4.458 3.235 4.263
3.308 4.124 5.355 6.293 2.513 3.529
3.761 5.134 4.289 7.283 4.202 3.402
4.747 5.001 5.797 5.653 4.624 2.43
4.999 3.381 5.042 5.551 4.567 2.388
3.229 4.065 5.204 5.668 4.253 3.913
4.449 5.111 5.132 5.555 4.68 4.88
4.243 4.345 5.982 6.159 4.335 2.068
3.753 5.826 5.023 6.607 5.228 2.446
3.249 6.357 5.261 7.046 4.142 3.354
4.86 6.737 5.448 4.719 4.438 4.125
4.52 6.337 6.229 5.965 5.039 3.222

Prom 4.67830556  
Mediana 4.652  
Moda No hay  
Desv 1.18872257  
Varianza 1.41306134  
COEFICIENTE 30.2045543 (DESV/PROM)

Conclusiones
 El promedio de tela producida por una empresa es 4,678
 El 50% de la tela producida por una empresa es menor a 4.652 y el otro 50% es
mayor

 No hay producción de tela más frecuente

 La representación de la producción de tela por una empresa es dudosa

Conclusiones

Se puede asegurar que la mejor manera de tomar una


decisión es teniendo todos los datos claros y ordenados,
ocupando los diferentes métodos que nos ofrece la
estadística nosotros podemos tener la información de una
manera distinta a solo tener números ya que nos da entender
que significan esos números, así como también nos ayuda a
saber si algo pasa con la información que nos están dando y
poder verificar que tan confiable es esa información para así
evitar posibles engaños
Bibliografía

Quevedo F. Medidas de tendencia central y dispersión. Medwave 2011


ECONOMIPEDIA
Probabilidad y Estadística para ingeniería y ciencias, Ronald E. Walpole y Raymond
H. Myers
Probabilidad y Estadística, Alejandro D. Zylberberg