Está en la página 1de 55

GENERALIDADES

DE ESTADÍSTICA
Introducción

Después de haber recolectado las respuestas de los jueces o consumidores,


¿qué podemos decir sobre las muestras evaluadas?

¿Los productos son diferentes?


¿Los productos son iguales? Analizar
estadísticamente
¿En qué atributos son diferentes las muestras? los resultados

¿Qué producto prefieren los consumidores?


¿Qué producto gusta más?
¿Los consumidores tienen los mismos gustos?
Definición: ESTADÍSTICA
• Ciencia que se ocupa de recopilar, organizar,
representar, extraer y generalizar información
contenida en un conjunto de datos

• Ciencia de recolectar, describir, e interpretar


datos
La estadística es muy importante en evaluación sensorial
debido a la variabilidad de las mediciones que se
obtienen con los sentidos.

La variabilidad implica:

• Una segunda o tercera observación repetida del mismo Cambios deseables:


evento no necesariamente será la misma que la primera -Maduración de un queso
observación. -Fermentación de vegetales encurtidos

• Diferentes personas participan en una prueba sensorial. Cambios no deseables


-Oxidación
• Cambios que puede presentar el producto (ingredientes, -Rancidez
proceso, empaque o a través del tiempo) -Envejecimiento del producto.
La metodología estadística da reglas para estimar y minimizar el riesgo de tomar decisiones cuando se
está generalizando sobre una población de interés a partir de una muestra.

Considera 3 factores:

3. El número de observaciones
1. Valores medidos 2. La variación de dichos valores.
realizadas (tamaño de muestra).
RECOLECTAMOS DATOS PARA SABER ALGO
DE UNA POBLACIÓN
Para conocer sus elementos mas importantes
Para detectar una estructura entre lo aleatorio
Para confrontar una teoría a la realidad

1. Hacer inferencias de una población con base en un una


muestra
La media como una prueba

2. Queremos describir a una población

La media como un resumen

3. Queremos predecir
Inferencial Descriptivo
Predicción

“El perfil ideal de estos


“Podemos ver cómo los
productos es….”
datos se agrupan en 6
“Trident blue tiene clusters”
significativamente más
menta”
Ramas de la estadística Hay dos “ramas” principales de la estadística que se utilizan
dependiendo de la forma en la que queremos utilizar los datos.

Clasificación de datos (histogramas construidos a partir de una distribución de frecuencias, gráficas y


pictogramas, cálculos de medias, medianas o modas; rangos, etc.)

Dar la evidencia de que el tratamiento experimental (cambio de ingrediente o una variación en el proceso), tuvo
un efecto real en las propiedades sensoriales del producto. Las diferencias observadas entre tratamientos no
fueron debido al azar.
1.ESTADÍSTICA DESCRIPTIVA:

Estudia o trabaja con toda la


población

2. ESTADISTICA INFERENCIAL

Estudia o trabaja con la muestra


y los resultados se aplican o
infieren a toda la población
DESCRIPTIVA
INFERENCIAL

+Mayor aplicación
-Medidas de tendencia central (media, mediana, moda) -Distribución normal o campana de Gauss
-Medidas de dispersión de variabilidad, o de posición -Pruebas de significancia o pruebas de hipótesis
(rango, varianza, y desviación estándar). (t-student, F (Fisher), (X2).
-Métodos gráficos -Diseño de experimentos
-Histogramas
CONCEPTOS BÁSICOS
VARIABLE: -Es la propiedad de un objeto o evento que
puede tomar diferentes valores.
-Característica de interés sobre cada elemento de una
población o de una muestra

Componentes de una variable


a) Nombre de la variable Ej. Quiero saber el peso de los alumnos
del grupo X

b) Valores que puede tomar la variable Nombre de variable: Peso


Valores: 60, 55,70,...etc.
Procedimiento: Pesar a cada alumno
c) Procedimiento para obtener el valor que Población: Alumnos del grupo de X
toma la variable materia.
La variable peso se puede medir en cada
alumno
d) La población o conjunto de
elementos/casos particulares, en los que
se puede obtener el valor de la variable
CONCEPTOS BÁSICOS
POBLACIÓN: -Conjunto de individuos u objetos o eventos cuyas propiedades
serán analizadas.
-Conjunto de casos particulares/elementos que son de interés. Determina el
alcance del estudio.
“No se estudia a toda la población, se evalúan las variables en una muestra
de la población”

MUESTRA: Una parte de la población/Un subconjunto de


la población/Una parte representativa de la población.

DATOS: Los valores que toman las variables en la


muestra (pueden ser números, palabras, símbolos).
Ej. Quiero saber el peso promedio de los alumnos de la Ibero
Población: Alumnos de Ibero
Muestra: 500 alumnos de Ibero elegidos al azar
Datos: Peso de cada uno de los 500 alumnos
Cada alumno es un elemento de la población “alumnos de la Ibero”
CONCEPTOS BÁSICOS *VARIABLE: Característica de interés sobre
elemento de una población o de una muestra
cada

Variables cualitativas Cualidad en cada caso particular

-Clasifica o describe a un elemento. Las operaciones aritméticas NO tienen significado.

*Los valores de la variable no son números


• Tipo de cabello:
Etiquetas: para las diferentes modalidades
Cabello lacio
Cabello chino
Cabello ondulado
• Estado Civil: • Vacunación: • Sexo
Soltero Si
Casado No
Viudo
Divorciado

Pueden tener dos categorías: dicotómicos, o más de dos categorías.


CONCEPTOS BÁSICOS *VARIABLE: Característica de interés sobre
elemento de una población o de una muestra
cada

Variables cuantitativas Cantidades o magnitudes


-Cuantifica o asigna un valor numérico a un elemento. Las operaciones aritméticas SI tienen
significado.

*Los valores de la variable son números

Longitudes, temperatura, talla, peso, volúmenes, edad,


ingresos, Kilómetros, goles en un partido, distancias.

“Los números están contenidos dentro de un continuo y pueden tomar valores enteros y con decimales”

-Discretas
Se dividen en:
-Continuas
En evaluación sensorial se utiliza mucho la
estadística inferencial

“De una muestra dada se infieren los resultados de


una población”

2 tipos de pruebas:

No paramétricas Paramétricas
Se usan para variables nominales y para Se usan para números obtenidos de
variables ordinales escalas de intervalos y de razón
Tipos de variables
Variable: Es la propiedad de un objeto o evento que puede tomar diferentes
valores

• Nominales*: con un nombre: azul, verde, caliente, hombre, mujer,


aciertos.. (distribución binomial, ji-cuadrada)

• Ordinales*: el orden tiene un sentido: ranking. La distancia entre un punto


y otro puede no ser la misma. (ji-cuadrada, Friedman, Mann-Whitney)
*Las operaciones aritméticas no tienen sentido con variables nominales y ordinales: Pruebas no paramétricas.

• Intervalo: cifras continuas: temperatura, talla, escalas hedónicas. La


distancia entre un punto y otro es la misma.

• Razón: Cuando el 0 tiene razón de ser: km, correlaciones.


(medidas de tendencia central y dispersión, pruebas paramétricas)
Estadística paramétrica y no paramétrica

Paramétrica No paramétrica
Para variables cuantitativas Para variables cualitativas

*Generalmente *Generalmente

Cuando la variable cualitativa pasa a una cuantitativa se utiliza a escala liker

liker
Cualitativa Cuantitativa

Ej. 5-10 preguntas de hábitos de consumo


1. Se asignan respuestas y su valor:
Nunca=2 A veces=4 Frecuentemente=6 Mucho=8 Siempre=10
2. Tabular respuestas
3. De cuantitativo regresa a cualitativo para poder entender la escala
Se usan para variables nominales y ordinales.

Escala Con un nombre -Azul, verde, caliente, frío,


Nominal hombre, mujer, aciertos…

• Tienen valores que identifican la pertenencia de un sujeto a un grupo.

• El valor que se le asigna no tiene ningún sentido solo es para diferenciar o clasificar a
los sujetos.

• Ejemplos:
• Estado Civil: • Aceptación o • Tipo de
• Sexo: 1=
1= soltero rechazo hacia cabello:
2= casado un producto 1 = cabello lacio
3= viudo 1 = Aceptación 2 = cabello chino
4= divorciado 2 = Rechazo
2=

VARIABLES NOMINALES CON NÚMERO : Pruebas estadísticas:


Se cuentan frecuencias y se analizan con pruebas no paramétricas: distribución binomial y en la ji-cuadrada.
Se usan para variables nominales y ordinales.

. Escala El orden sí tiene un sentido


Ordinal
Tienen datos ordenados en rangos sin conocer la diferencia entre los valores adyacentes.

• Para los valores que toma esta variable si importa el orden.

• Solamente se puede decir si un sujeto es igual, diferente, mayor o menor, pero no se


mide que tanto difiere.

• El intervalo o distancia entre un punto y otro, no es igual!!!!!

Ejemplos:
• Ordenar gustos (1er producto
• Intensidad de fragancia preferido, 2do producto
o de algún atributo. preferido y así sucesivamente).

*Pruebas estadísticas: Friedman, ji-cuadrada, Newell. * Las operaciones aritméticas no tienen sentido con variables nominales y ordinales.
Pruebas no paramétricas
Se usan para variables de intervalo o de razón.

INTERVALO O “Los números están contenidos dentro de un continuo y


pueden tomar valores enteros
DE RAZÓN y con decimales”

• Se puede decir si un sujeto es igual, diferente mayor o menor y se mide que tanto
difiere.

Las variables de intervalo no incluyen al cero y las de razón si lo


incluyen.

INTERVALO- RAZÓN-
Temperatura, talla Kilómetros,
escalas hedónicas, correlaciones, goles en
edad, ingresos. un partido, distancias.

*Pruebas estadísticas: Medidas de tendencia central (medias, mediana, moda) y medidas de dispersión (desviación estándar, rangos, varianza)-Pruebas
ESCALAS DE INTERVALO
ESCALAS DE RAZÓN

Cuando el 0
tiene razón
de ser…
Las distribuciones matemáticas son importantes en análisis sensorial y estadística, debido a su relación entre
distribución y probabilidad.

Una distribución de
probabilidad es una gráfica en
donde se representa la
probabilidad de encontrar un
valor dado.

*Es la distribución de las probabilidades


asociadas con cada uno de los valores
de una variable aleatoria.
Distribución normal Binomial
• Ampliamente utilizada en Evaluación
• Es la distribución + importante en estadística sensorial
• Distribución Normal estandarizada (σ2=1, µ=0). • Pruebas no paramétricas
• Simétrica. • Para datos que toman 2 valores
• Pruebas paramétricas • Número fijo de ensayos
• Para variables de intervalo y de razón • Para variables nominales y ordinales
Distribución normal (N) o campana de Gauss
Importancia: Gran número de fenómenos se distribuyen aproximadamente o exactamente en
forma normal.
Puede deberse a que la naturaleza tiende a promediar los efectos de las diversas variables que
intervienen en una respuesta determinada.

Características: Ejemplos: Pesos, alturas, IQ, rendimientos.


1. La media y desviación estándar describen
totalmente a esta distribución
2. La curva es asintótica
3. El área bajo la curva es igual a 1
4. Es simétrica
5. Tiene un pico (unimodal)
6. La media, mediana y moda se encuentran en el
centro de la curva

Función de
densidad de la
distribución normal: X~ N (µ, σ2)
La distribución normal, es la más utilizada en evaluación sensorial debido a:

1. Entre las variables dependientes de interés, la mayoría de ellas, se supone que siguen una
distribución normal en la población estudiada.

2. Si la variable sigue una distribución aproximada a la normal, es posible realizar inferencias sobre los
valores de dicha variable.

3. La mayoría de los análisis estadísticos que se utilizan en la evaluación sensorial suponen que los datos
se distribuyen de una manera normal.

Forma de la distribución normal


Datos de evaluación sensorial que, generalmente, siguen una distribución normal:

• Datos de escalas (mayores a 3 puntos).

• Datos obtenidos de un análisis descriptivo: QDA,


Spectrum, etc.

• Datos provenientes de estudios con consumidores N≥ 60.

¿Cómo saber si mis datos se distribuyen de forma


“normal”?
Mediante pruebas de “normalidad”:

• Kolmogorov-Smirnov
• Chi-cuadrada
• Anderson-Darling
Distribución binomial Parámetros de la
distribución binomial:
-Los datos discretos obtenidos se conocen como
p = acierto
proceso Bernoulli, en honor al matemático
suizo del s.XVII Jacob Bernoulli. n = # ensayos

Propiedades de la distribución:
-El experimento tiene n ensayos idénticos

-Cada ensayo produce uno de los 2 resultados


posibles (dicotómicos):

Acierto o éxito= p
Fracaso o fallo= 1-p= q

-Probabilidad constante en cada ensayo -Ej. Aprobar o reprobar asignatura


-Ensayos independientes (el resultado de un Lanzar una moneda.
ensayo no interfiere con los resultados de los Cada ensayo produce 2 resultados
demás ensayos) Probabilidad constante
éxito (p) =águila; fracaso (q) =sol
-El experimentador desea saber el número de
P= ½ P= ½
aciertos observados en los n ensayos.
Distribución binomial
De entre un cierto número de ensayos independientes cada uno da un resultado sobre 2 resultados
posibles (mutuamente excluyentes).

A los dos posibles resultados se led denomina generalmente:

• Éxito o fracaso
• Acierto o error (en el caso particular de las pruebas discriminativas en análisis sensorial)

La probabilidad de la distribución
binomial se ve afectada por el número
de ensayos realizados, o el
número de panelistas empleados en
una prueba discriminativa.

Distribución binomial de 10 ensayos con una probabilidad de éxito de 0.5


Pruebas de hipótesis
Las pruebas de hipótesis comienzan con una suposición “hipótesis” acerca de un parámetro de la población.

Objetivo: Decir qué tan probable es que la hipótesis del parámetro de la población sea correcta.

- Se obtienen datos muestrales


- Se producen estadísticos
- Se determina la diferencia entre el valor de la hipótesis y el valor real de la muestra.
- Se determina si la diferencia es significativa.

Mientras menor sea la diferencia, mayor será la probabilidad de que el valor hipotético poblacional
esté correcto, y viceversa.

1. Se establece el valor hipotético del parámetro de la población antes de muestrear: Se plantea la hipótesis
nula H0 (la suposición que se desea probar).
2. Si los resultados de la prueba fallan para soportar la hipótesis nula, se debe concluir que otra afirmación es
cierta: la hipótesis alternativa H1. (Cada vez que se rechaza la hipótesis nula, la conclusión es aceptar la
hipótesis alterna)
3. Se debe seleccionar una de las 3 posibilidades existentes para la hipótesis alterna.
4. Comparar el valor estadístico con su distribución probabilística, asumiendo que H0 es verdadera.
5. Decisión:
Pruebas de hipótesis…. Estadística inferencial

H0: Hipótesis Nula: Ha: Hipótesis Alternativa:


No existe diferencia significativa entre el Ha: Si existe diferencia significativa entre el
producto A y el B (A @ B). producto A y el B (A  B).

Una vez establecidas las hipótesis es necesario decidir un nivel de significancia (a)….

El nivel de significancia es un intervalo que se denomina “zona de rechazo” o “región critica”, en


otras palabras, se relaciona con la probabilidad de que la diferencia sea real y no debida al azar.

-1 respuesta de cada 10 se deberá al azar


*Por ejemplo, un nivel de probabilidad del 10%: -9 de cada 10 respuestas la diferencia se detecta
realmente.
Pruebas de hipótesis…. Estadística inferencial
ERRORES TIPO
I Y II
Grados de libertad (gl)
Definiciones:
-“Es la sumatoria de los valores, las desviaciones y valores individuales, respecto a su media siendo igual a
cero”
-”Los grados de libertad como el número de datos libres de variación al calcular una prueba estadística”.
-“Los grados de libertad y su valor están relacionados con el número de oportunidades en que se usa la
información de la muestra”.
El número de dimensiones en el espacio en que un
valor es libre de variar o moverse.
“LA LIBERTAD PARA VARIAR”

Ej. A Juan le gusta usar diferentes playeras cada día, pero sólo
tiene 7 playeras (1 por día)
Lunes: Puede elegir cualquiera de las 7
Martes: Elige cualquiera de las 6 restantes
Miércoles: Elige cualquiera de las 5 restantes
Jueves: Elige cualquiera de las 4 restantes
Viernes: Elige cualquiera de las 3 restantes
Sábado: Elige cualquiera de las 2 restantes (Aquí se le acabaron sus
opciones)
Los grados de libertad se definen
Domingo:….. DEBE USAR LA PLAYERA RESTANTE
frecuentemente como el número de
observaciones (piezas de información) en los
Juan tenía 7-1 = 6 días de libertad de “playeras” respecto a la
datos que pueden variar libremente al estimar
variación de la playera que podía utilizar.
parámetros estadísticos.
Distribución ji cuadrada (X2)

Parámetro de la distribución
Distribución X2 ji cuadrada (X2):
1. La distribución es asimétrica, derivada de la suma de Grados de libertad= gl
los cuadrados de varias normales estándar
2. La variable toma valores mayores o iguales a cero

El parámetro de X2 toma valores enteros positivos


Ej. Distribución X2 con 4 grados de libertad= X2gl = X24

-A medida que los gl crecen la distribución X2 se parece


más a la normal estándar.

Existen 2 pruebas de X2:


- Bondad de ajuste
- Independencia

*df= degree freedom = grados de libertad


Prueba de bondad de ajuste……ji cuadrada (X2)
X2= 9.25 Calcular Revisar tablas
grados de libertad

X2 calculada > X2 teórica (crítico) Se rechaza la hipótesis nula y, por lo tanto:


“Existe diferencia entre la preferencia de las muestras”
Prueba de independencia……ji cuadrada (X2)
Prueba de independencia……ji cuadrada (X2)

Frecuencias
observadas

Frecuencias
teóricas X2 calculada > X2
teórica (crítico)
Diferencia
entre
muestras
Prueba de Friedman Para pruebas de ordenamiento
T-student (1 muestra)
T-student (1 muestra)
T-student (2 muestras independientes)
T-student (2 muestras independientes)
T-student (2 muestras pareadas)
T-student (2 muestras pareadas)
Técnica más usada en evaluación sensorial y estudios con consumidores
El modelo subyacente….

Características
intrínsecas como
el error….
Condiciones para aplicar el ANOVA

Se puede tener diferente tamaño en las observaciones


Ejemplo….

Comparación de medias
Cálculos

Interpretación:

1) Comparando el valor de F a
través de las tablas de Fisher
(se busca el valor crítico
dependiendo de los grados de
libertad y α deseados.

2) Por medio de la probabilidad


Tabla resumen (p-value). Si el valor de la
probabilidad es menor a α, las
muestras son significativamente
diferentes.

También podría gustarte