Está en la página 1de 33

UNIVERSIDAD NACIONAL DE TRUJILLO

FACULTAD DE CIENCIAS AGROPECUARIAS


ESCUELA DE INGENIERIA AGROINDUSTRIAL

METODOS
ESTADÍSTICOS PARA LA
INVESTIGACIÓN
MSC. ING. NILSON D. CAMPOS VASQUEZ
CLASE 02: Estadística descriptiva
• Variables, histogramas, diagramas de caja
Práctica: Diagramas de caja
APRENDIZAJE ESPERADO DE LA
SEMANA:
Al término de la sesión, el estudiante utiliza técnicas, recursos y Herramientas
estadísticas para el diseño de experimentos y su solución, mediante el desarrollo
de casos prácticos
TENDENCIA Media, Mediana y
CENTRAL Moda
DESCRIPTIVA: Organiza Varianza, Desviación
MEDIDAS DE
reúne y comunica estándar, Rango
DISPERSIÓN
información numérica
MEDIDAS DE Distribución:
DISTRIBUCIÓN Simetría, Curtosis

ESTADISTICA:

INFERENCIAL: Conduce a
conclusiones sobre la
población
MEDIA:

MEDIA- MEDIANA Y MODA MEDIA= (180+170+170+100+90)/5


= 142 g

Para datos agrupados se utiliza la


POBLACIÓN siguiente formula
MEDIANA: 170
MUESTRA
* Dato que
PESOS: ocupa la
180 g posición central
170 g de un conjunto
170 g de datos
100 g
90 g

MODA: 170
* El valor que se
presenta con
mayor
frecuencia
POBLACIÓN MUESTRA PESOS: ENTONCES:
180 g MEDIA: 142
VARIANZA:
170 g
170 g VARIANZA P 1496
100 g
VARIANZA M 1870
90 g
DESVIACIÓN ESTANDAR:
43.2434966
-52
VARIANZA
-42
28

28

38

RANGO = Valor Máximo-Valor Mínimo


= 180-90
Ingeniería
DISTRIBUCIÓN AGROINDUSTRIAL

NORMAL
Importancia

Efecto del límite


central

Robustez a la no
normalidad

8
Ingeniería
AGROINDUSTRIAL

DISTRIBUCIÓN
SIMETRIA

CURTOSIS
Ingeniería
AGROINDUSTRIAL

ESTADÍSTICA
INFERENCIAL
ERROR
EXPERIMENTAL
Desviación del valor medido de una magnitud física respecto al
valor real de dicha magnitud. En general los errores
experimentales son ineludibles y dependen básicamente del
procedimiento elegido y la tecnología disponible para realizar la
medición.

Responsables:
Error de medición
Variaciones en la materia prima Muestreo
Condiciones de trabajo 1
DISTRIBUCIÓN
NORMAL
Pruebas de Normalidad de una muestra
Pruebas Gráficas
Histograma de Frecuencias
IQR/S
Gráficos de Probabilidad normal

Pruebas Formales
Shapiro – Wilk N < 50
Kolmogorov – Smirnov N > 50
Test de D´Agostino N ≥ 10

1
DISTRIBUCIÓN
NORMAL
Pruebas de Normalidad de una muestra

Ho = Los datos siguen una distribución normal p ≥ 0.05


Ha = Los datos no siguen una distribución normal p < 0.05

Pruebas Paramétricas

Prueba de Distribución
Normalidad normal

No No
Transformación Pruebas No Paramétricas

1
PRUEBAS
ESTADÍSTICAS Datos del
Experimento
Shapiro – Wilk n <
Prueba de Normalidad 50 Kolmogorov –
Smirnov n ≥ 50 Test de D
Transformación ´Agostino n ≥
10 Si los datos vienen de
muestras transformadas,
Sin Distribución Distribución Normal se debe continuar con
Normal estos datos hasta el final
del análisis estadístico.
Pruebas Paramétricas
Pruebas No Paramétricas
Comparación de
medias Test de Test de
Homogeneida
Levene
d de
Varianzas
Transformación
2 muestras k muestras

Varianzas p<0.05 Varianzas p>0.05


Wilcoxon Test de 1 muestra
distintas iguales
Friedman
(Relaciona (Relacionad
das) as)
Mann – Kruskal – 2 muestras K muestras 2 muestras k muestras Prueba T
Whitney Walis
(Independien (Independien
tes) tes) Kruskal – Kruskal – Prueb T ANOVA
Walis ó Test Walis ó Test (Relacionada) (1 Factor)
de Friedman de Friedman
Prueb
Si al menos T
un
Test Duncan Si al menos
(Indepen un
trat. de y/o tratamiento
d.)
es Tamha Tuckey es diferente
diferen
te ne

1
PRUEBAS
PARAMÉTRICAS
Es la Prueba Paramétrica más poderosa que existe para determinar
diferencia entre dos poblaciones (ó tratamientos), sin embargo requiere
PRUEBA T que los datos pertenezcan a una DISTRIBUCIÓN NORMAL y que LAS
VARIANZAS DE LOS GRUPOS SEAN IGUALES (Existe una prueba T para
varianzas distintas).

Requiere una DISTRIBUCIÓN NORMAL MODERADA (ROBUSTA), sin


ANOVA embargo es necesario que se cumpla la IGUALDAD DE VARIANZAS entre
las muestras. Caso contrario puede usarse la Prueba de Kruskal-Walsis o
el Test de Friedman (No Paramétricas)

Pruebas de Comparaciones múltiples de medias, son robustas a la falta


DUNCAN de normalidad, sin embargo requieren que se cumpla la IGUALDAD DE
Y/O TUCKEY VARIANZAS, caso contrario usar la Prueba Paramétrica de Tamhane.

Pruebas Paramétrica de Comparaciones múltiples de medias, robusta a la


TAMHANE falta de normalidad, no requiere que se cumpla la igualdad de varianzas.
PRUEBAS NO
PARAMÉTRICAS
Prueba No Paramétrica, cuya finalidad es la misma que la Prueba
WILCOXON T para muestras relacionadas, por lo tanto requiere que los
individuos sean los mismos en ambos tratamientos.

Prueba No Paramétrica, cuya finalidad es la misma que la Prueba


MANN – T para muestras independientes, por lo tanto NO requiere que
WHITNEY los individuos sean los mismos en ambos tratamientos.

Prueba de Comparación de medias para más de 2 poblaciones


FRIEDMAN (tratamientos), cuyos individuo deben haber sido los mismos en
todos los tratamientos.

Prueba de Comparación de medias para más de 2 poblaciones


KRUSKAL – (tratamientos), cuyos individuos no necesariamente deben haber
WALIS sido los mismos en todos los tratamientos.
DISEÑO DE
INVESTIGACIÓN
Análisis de Varianza (ANOVA)
• Idea básica
Descomponer la variabilidad total en las partes asociadas a
cada factor, más una residual (no justificables por los
factores estudiados).
Variabilidad debida a Variabilidad residual
Variabilidad
= diferencias entre + (diferencias dentro
total
tratamientos de cada tratamiento)
• Usos:
 Determinar si existen diferencias significativas entre tratamiento.
 Evaluar si los factores tienen efecto significativo sobre las respuestas.
• Nivel de significancia = 95% y valor de p = 0.05
DISEÑO DE
INVESTIGACIÓN
Factor: Variable (Independiente) manipula el
investigador para estudiar sus efectos
que la
sobre
variable dependiente.
Nivel del Factor: es cada una de las
categorías, valores o formas específicas del factor.
Tratamientos: Conjunto de condiciones experi-
mentales que serán impuestas a
una
experimental unidad
en un diseño elegido. En experimentos
unifactoriales, un tratamiento corresponde a un nivel
de factor. En experimentos multifactoriales, un
tratamiento corresponde a la combinación de niveles
de factores.
DISEÑO DE
INVESTIGACIÓN
Tratamiento Control: tratamiento al que no se le
aplica tratamiento alguno.
Réplicas: mediciones que se toman durante corridas
experimentales idénticas, pero separadas.
Repeticiones: mediciones que se toman durante la
misma corrida experimental.
Objetivo de réplica y/o repeticiones: Lograr mayor
precisión en la estimación de los efectos de los
factores y de sus interacciones, y estimar el error
experimental.
EJEMPLO DE HISTOGRAMAS CON
RSTUDIO
DISEÑO CON DOS O MÁS
TRATAMIENTOS
Se realizó un
experimento para
evaluar el efecto del
tiempo de
almacenamiento a
temperatura ambiente
en la flexibilidad de
masa panadera
(dureza) preparada con
harina de quinua
1.- Acondicionamiento de la data en Excel
para poder importar archivo a RStudio
*Recomendaciones:
- No debe de haber celdas
vacias antes de la data.
- Los títulos no deben tener
espacios por ejemplo: Dureza
(g), o caracateres separados.
Esto dificultaría la
identificación de Rstudio de
la data.
- Se debe de indentificar las
variables a graficar, en este
caso se graficará la dureza
respecto al tiempo
(diferentes tratamientos)
2.- Verificación y descarga de paquete
(packages) readxl
*Recomendaciones:
a) Debe estar disponible el
paquete readxl,
b) En caso no este debe de ir a
la sección install, descargar e
instalar el paquete.
3.-Importación de datos desde archivo
excel
from Excel
*Recomendaciones:
a) Se debe de tener cuidado que
la ubicación del archivo no esté
en demasiadas sub carpetas, en
caso el sistema arroje error al
importar la data. Se debe
cambiar la ubicación del archivo
Excel: Ejemplo ubicar el archivo
en el escritorio.
4.-Importación de datos desde archivo
excel
Brownse…

*Recomendaciones:
a) Se debe de ubicar el archivo
xls y abrir
5.-Importación exitosa de datos desde
archivo excel
R Script

*Recomendaciones:
a) Se podrá observar la data en
el panel R Script
6.- Escribiendo el código correspondiente
R Script
7.- Escribiendo el código correspondiente
R Script

*Recomendaciones:
a) Se iniciará con la drecripción
del código.
b) Para ejecutar las líneas de
código, estas se podrían
ejecutar con las teclas
Ctrl+enter u optar por
colocar el cursor en la
pestaña RUN
ACTIVIDAD 2
CUESTIONARIO

Con los resultados proporcionados realizar lo siguiente:

a) En Excel:
Media, Mediana, Moda, Varianza, desviación estándar y rango.

b) En Rstudio:
• Elabore el histograma de valores de luminosidad obtenidos por cada colorímetro.
• Elabore el diagrama de caja.
• Interprete los resultados.
EJERCICIO DE PRÁCTICA
En la siguiente tabla se muestran valores del parámetro de color
L (Luminosidad) medidas en 50 rodajas de yacón utilizando
Colorímetro Konica Minolta (CKM) y Sistema de Visión
Computacional (SVC):

Colorímetro Konica Minolta Sistema de Visión Computacional


45 45 45 48 50 42.3 45.3 45 53.8 45.1
11 63 37 45 8 19.1 63.2 36.3 47.4 2.6
60 89 73 60 20 67.8 86.7 81 59.5 17.3
45 40 34 34 67 27.5 50 25.5 27 70
14 23 15 56 64 14.6 21 12.7 56 66.6
10 5 50 34 67 10.1 5.4 54.3 34 68.9
63 70 63 64 67 42.2 78.6 63 70.4 67.1
90 57 54 56 24 75 57 51.9 56.1 15.4
59 60 68 70 35 59 60 75.1 72.5 31.4
52 52 35 51 36 52 55.9 39.1 48.2 32.1
• Presente los resultados obtenidos, con las capturas de pantallas del
trabajo realizado, en donde se evidencia, la fecha y hora de ejecución
de cada uno de los trabajos
Ingeniería
AGROINDUSTRIAL

GRACIAS!!

Nilson D. Campos Vasquez


ncampos@unitru.edu.pe
https://agroind.unitru.edu.pe/

También podría gustarte