Está en la página 1de 38

ENAF

Metodología de la investigación en nutrición


Análisis Estadístico

Dr. Javier Villanueva Sánchez


Agosto 2019
Estadística
 Disciplina que se ocupa del tratamiento de datos
numéricos derivados de grupos de casos. Pueden ser
personas, animales, organismos, y sus partes. Se extiende
el concepto a las cosas u objetos de interés.

 Razones de aplicación

Administrativas

Toma de
 Científicas
decisiones
Estadística y experimentación

Experimentos agrícolas

Mejorar, aumentar la
producción y disponibilidad

Optimización de la aplicación de insumos


Estadística
 Facilita el alcance de los objetivos
 Permite evaluar y cuantificar la variabilidad debida al azar

 “Juega un papel primordial en la cuantificación de los efectos, la


evaluación de las consecuencias, la medición de los riesgos, y la
interpretacón de la evidencia “ Reza 1998.

 Premisa:
 Diseño y ejecución correctos
Proceso de
Etapas de Investigación
Científica Investigación Estadística
•Identificación de los hechos
•Problema general
•Revisión bibliográfica
•Marco teórico conceptual •Hipótesis Estadísticas
Conceptual •Delimitación del problema •Variables de estudio
•Objetivos
•Hipótesis

•Diseño
•Recolección
•Experimento
Empírica •Organización
•Tratamiento de la
•Resumen
información
DESCRIPTIVA

•Discusión de resultados PROBABILIDAD


Interpretativa •Extrapolación •Inferencia
ANALITICA
Estadística

Descriptiva Inferencial
• Permite organizar, • Permite establecer
presentar y sintetizar conclusiones
información referidas a
• Fundamental en la poblaciones a partir
revisión de la calidad de los resultados de
y validez de los datos una muestra
Análisis Análisis
Exploratorio Confirmatorio
Métodos estadísticos posibles
según escala de medición
Escala Estadísticas Ejemplo
posibles
Numero de casos Especies en animales y plantas
Moda Tipos de microorganismos
Nominal Tabla de contingencia Números asignados a jugadores para
Correlación identificarlos
Lugares de colecta
+ Mediana Dureza de minerales
Ordinal +percentiles Grados de piel, madera, etc

+promedio, mediana Temperaturas (Fo, Co)


+desviación estándar Magnitud Seismo: Richter
Intervalo -cuantiles Intensidad seismo: Mercalli
+ correlación
+análisis de varianza
+promedio Longitud
+desviación estándar Peso
Razón +coeficiente de variación Volumen
¿Como se describe el análisis estadístico en una
investigación?
La descripción del análisis estadístico, debe contener al menos los
siguientes elementos:

1 Medidas o estimadores estadísticos aplicados

2 Las pruebas o métodos estadísticos aplicados en cada caso para


verificar las hipótesis en estudio

3 El nivel de significancia con que deberán ser interpretados los


resultados

4 El programa o software usado cuando así se haga.


Descripción del
análisis
estadístico en
un informe: Un
ejemplo simple

4
1
2
3
Descripción del análisis
estadístico en un informe: Un
ejemplo simple

3 ¿4?
Notas adicionales:

•El orden en el análisis estadístico se organiza en


concordancia con los objetivos e hipótesis de estudio.

•Aún cuando en un articulo o publicación no siempre se


señalan o exigen las denominaciones de variables
dependiente, independientes o covariables, es necesario
tenerlo presente para facilitar la organización de las
explicaciones acerca de las relaciones entre las variables
estudiadas.

•Es necesario revisar que exista congruencia del análisis


estadístico con las hipótesis, los objetivos, la presentación
de resultados, la discusión que se haga de ellos y las
conclusiones derivadas.
La descripción del análisis estadístico deberá seguir una
secuencia en función de la complejidad de la o las hipótesis
de estudio y/o de los objetivos planteados:

a Análisis univariado. Descripción variable por variable y/o


construcción de indicadores o re-escalamiento de
variables

Bivariado. Forma en que se presentan o analizan las


b relaciones entre dos variables. Dependiente (D) e
independiente principal (I) y por cada una de las
covariables (C)

c Multivariado. Relaciones entre mas de dos variables de


modo simultaneo, lo que se llama ajuste de relaciones
entre la D y la I en función del resto de C.
c
Experimentación

Se caracteriza porque:
involucra el manejo de variables
independientes y variables dependientes,
facilita la comprensión y el análisis del
efecto de los factores (variables
independientes) sobre las variables de
respuesta (variables dependientes).
Visualización del proceso de diseño de experimentos: combinación de
máquinas, equipos, métodos y personas que inciden sobre la unidad
experimental obteniendo una o más variables de respuesta.

FACTORES CONTROLABLES

Factores o Variables
variables Unidad dependientes
experimental o variables de
independientes
(y sus niveles) respuesta
(nivel o
niveles)

FACTORES INCONTROLABLES
EJEMPLO 3

Mejorando el efecto de un proceso

Antecedentes: las variables del proceso que influyen en las propiedades


funcionales de la masa para producir tortillas son TEMPERATURA y
HUMEDAD. El proceso actual se lleva a cabo a 90-120 °C, baja humedad y
cortos tiempos de proceso.

• Tamaño de partícula Variables de respuesta


Factor(es)
• Humedad
• Temperatura • Índice de
• Tiempo solubilidad en agua
• Índice de absorción
de agua
• Adhesión
Maíz • Dureza
Nixtamalización
• Temperatura de
Composición pasta
• Viscosidad
• Retrogradación
Al combinar distintos NIVELES (de temperatura y tamaño de
partícula) en algunos experimentos, llamados EXPERIMENTOS
FACTORIALES, se obtiene la siguiente gráfica:
Variables cualitativas
Frecuencias

Absoluta

Porcentaje
Relativas simple

Acumulado
Variables cuantitativas: Medidas de
tendencia central y dispersión

Promedios Desviaciones

Desviación
estándar
Media
Intervalo de
confianza

Rango
Mediana
intercuartil
EJEMPLO 1. ESTADISTICA DESCRIPTIVA

¿Cuál el contenido de polifenoles de las tunas?

Toma de
muestra Análisis de laboratorio

ANALISIS ESTADÍSTICO x1 x2 x3

Media  desviación estándar DATOS


Ejemplo de datos generados en el
análisis del lote 1:
Y1 = 3.4
Observe la variación
Y2 = 3.6 entre los datos
Y3 = 3.1

Calcule su coeficiente de variación (%C.V.) como analista


Desviación estándar
%C.V. = X 100
media

Criterios:
Valores < del 5% son aceptables
Valores > del 5%, siga practicando. Los datos generados no son
aceptados por su gran margen de error
Diagrama de caja y bigotes (boxplot)
(Koopmans, 1985)

Dalgleish, 2013
10
Estimación
 Estimar significa querer e inferir.
 Estimación estadística . Proceso mediante el que
establecemos qué valor debe tener un parámetro según
deducciones que realizamos a partir de estadísticos.
 Puntual: consiste en establecer un valor concreto (es decir, un
punto) para el parámetro.
 Intervalo: la estimación se representa mediante dos números
que determinan un intervalo sobre la recta.
Características de un estimador 𝜃෠
Si  denota un parametro entonces ˆ denotará un estimador

• Si el sesgo
No sesgado መ = 𝐸( 𝜃መ − 𝜃 ) = 0.
( 𝜃)

෠ |>ε) tiende a 0, para


• Si P(| 𝜃-θ
Consistente Δ ε>0, cuando el tamaño de la
muestra tiende a ∞.

• 𝜃෠ es eficiente si tiene la
Eficiente mínima varianza posible.
Si ˆ es un estimador de un parametro  y si la media de la distribución de ˆ es  , es decir E (ˆ) = 0,
entonces se dice que ˆ es un estimador no sesgado. De otra manera ˆ es sesgado.
Intervalo de confianza

Consiste en determinar un par de valores a y b, tales que constituidos en


intervalo [a, b] ; y para una probabilidad 1-α prefijada (nivel de confianza) se
verifique al parámetro a estimar  cumpla:

P ( a, b  ) = 1 − 
P (a    b ) = 1 − 
Intervalo de (1-)% para estimación de la media μ,
con distribución normal.

/2 /2

a b
μ
xˆ − 1.96  / n xˆ + 1.96  / n
Margen de error
Intervalo de confianza para μ
 Dada una variable aleatoria X con media μ y desviación
estándar σ, el teorema del limite Central afirma que:

xˆ − 
Z=
 / n estándar si X se
posee una distribución normal
encuentra distribuida normalmente y posee una
distribución normal estándar aproximada aunque X no
esté distribuida normalmente siempre y cuando n sea
suficientemente grande. Para una variable aleatoria
normal estándar, 95% de las observaciones se ubican
entre -1.96 y +1.96.
Intervalo de confianza para μ
 La probabilidad de que Z tome un valor entre -1.96 y +1.96
será:

P(−1.96  Z  +1.96) = 0.95


xˆ − 
P(−1.96   +1.96) = 0.95
/ n
P(−1.96  / n  xˆ −   +1.96  / n ) = 0.95
P(−1.96  / n − xˆ  −   +1.96  / n − xˆ ) = 0.95
P(1.96  / n + xˆ    −1.96  / n + xˆ ) = 0.95
P( xˆ − 1.96  / n    xˆ + 1.96  / n ) = 0.95
( xˆ − 1.96  / n ; xˆ + 1.96  / n )
Valores de Z/2 que corresponden a
areas bajo la curva normal
 1-  Z/2

0.01 0.99 2.576

0.05 0.95 1.960

0.10 0.90 1.645

0.15 0.85 1.440

0.20 0.80 1.282


Ejercicio
 Considere los niveles de Colesterol de toda la población de
hombres hipertensos y que fuman. Esta distribución es
aproximadamente normal con media desconocida y una
desviación estándar de 46 mg/dL. Suponga que toma una
muestra de 12 sujetos hipertensos fumadores. Tienen un nivel
medio de colesterol en sangre de 217 mg/dL. Interesa conocer
el nivel medio deçç Colesterol en esta población. Con base en
esta muestra:
 construya intervalos de confianza de 90%,95% y 99% para μ.
 Que observa en el tamaño del intervalo?
 Que pasaría si incrementamos o disminuimos el numero de
sujetos en estudio en cada caso
 Que pasaría con la amplitud de este intervalo si encontramos
que la varianza se modifica en algún sentido
según n

xˆ = 0.5
0.7

0.6

0.5

0.4

0.3

0.2

0.1

0
100
1 200
2 400
3 800
4 1600
5 3200
6 6400
7
p + 1.96 ee 0.598 0.569 0.549 0.535 0.525 0.517 0.512
p Estimado 0.5 0.5 0.5 0.5 0.5 0.5 0.5
p - 1.96 ee 0.402 0.431 0.451 0.465 0.476 0.483 0.488

Margen de error 0.20 - - - - - 0.02


según n

xˆ = 0.2
0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0
100
1 200
2 400
3 800
4 1600
5 3200
6 6400
7
p + 1.96 ee 0.278 0.255 0.239 0.228 0.220 0.214 0.210
p Estimado 0.2 0.2 0.2 0.2 0.2 0.2 0.2
p - 1.96 ee 0.122 0.145 0.161 0.172 0.180 0.186 0.190

Margen de error 0.15 - - - - - 0.03


Estimación de intervalos

n Limites de Amplitud de
confianza de intervalo
95% para μ
10 x̂ ± 0.620σ 1.240σ
100 x̂ ± 0.196σ 0.392σ
1000 x̂ ± 0.062σ 0.124σ
Ejercicio 1
 Una empresa dedicada a la comercialización de semillas
desea estimar la altura promedio de un sorgo forrajero
que ha desarrollado. Para ello toma una muestra de 50
plantas y se calcula la media de la altura, la que resulta ser
130 cm. Se sabe por experiencias anteriores que la
desviación estándar es 22 cm.
 Construir los intervalos de confianza para µ con una
confianza del 95 % y 99 %, respectivamente.
 Comparar ambos intervalos y concluir.
Ejercicio 2
 Se desea establecer el contenido vitamínico de un
alimento balanceado. Se toma una muestra de 49 bolsas y
se encuentra que el contenido promedio de vitaminas por
cada 100 grs. es de 12 mg y que la desviación estándar es
de 2 mg
 Encontrar el intervalo de confianza del 95% para el
verdadero promedio del contenido de vitaminas.

También podría gustarte