Está en la página 1de 131

UNIVERSIDAD DE ORIENTE

NÚCLEO DE ANZOÁTEGUI
ESCUELA DE INGENIERÍA Y CIENCIAS APLICADAS
DEPARTAMENTO DE INGENIERÍA QUÍMICA

ESTADÍSTICA APLICADA
Y DISEÑO DE EXPERIMENTOS

Profa. Ana Teresa Ciarfella Pérez


ESTADÍSTICA APLICADA
OBJETIVO GENERAL
 Aplicar los conocimientos de la
estadística y diseño de experimentos en
el uso de la probabilidad y sus teoremas.
ESTADÍSTICA APLICADA Y DISEÑO DE EXPERIMENTOS

CONTENIDO

UNIDAD 1. Historia de la Estadística. Conceptos básicos.


Muestreo. Métodos gráficos de análisis de datos
UNIDAD 2. Probabilidad
UNIDAD 3. Distribuciones de probabilidad
UNIDAD 4. Teorema del límite central. Intervalos de
confianza.
UNIDAD 5. Contraste de hipótesis
UNIDAD 6. Pruebas no paramétricas de contraste de
hipótesis
UNIDAD 7. Diseño de experimentos
UNIDAD 8. Control estadístico de la calidad
ESTADÍSTICA APLICADA Y DISEÑO DE EXPERIMENTOS

BIBLIOGRAFIA
1. Montgomery, D. “Diseño y Análisis de Experimentos” Grupo
Editorial Iberoamérica, México (1991).
2. Lohr, S.L. “Muestreo: Diseño y Análisis”, International Thomson
Editores, México (2000).
3. Pitard, F.F. “Pierre Gy´s Sampling Theory and Sampling Practice”
Second Edition, CRC Press, United States of America (1993).
4. Cochran, W.G.”Sampling Techniques”, 3er Ed., Wiley, New York
(1977).
5. Särndal, C.E., Swensson, B., Wretman, J. “Model Assisted Survey
Sampling”, Springer-Verlag, New York (1992).
6. Sudman, S. “Applied Sampling”, Academic Press, San Diego (1976).
7. Devore, J.L. Probabilidad y estadística para ingeniería y ciencias, 5ª
ed. Int. Thomson Ed. México (2001).
8. Hines, W. y Douglas C. Montgomery. Probabilidad y estadística
para ingeniería. 3ª ed. C.E.C.S.A. México (1998).
9. Miller, J. C. y J. N. Miller. Estadística para química analítica, 2ª ed.
Addison-Wesley. Argentina (1993).
ESTADÍSTICA APLICADA Y DISEÑO DE EXPERIMENTOS

BIBLIOGRAFIA
10. Milton, J. Susan y J. C. Arnold. Introduction to Probability and Statistics:
Principles and Applications for Engineering and the Computer Sciences.
McGraw-Hill, Inc. New York, 1995.Prentice-Hall Hisp. México (1997).
11. Johnson, L.W., J. T. Arnold y R. D. Riess. Montgomery, D. C. y G. C. Runger.
Probabilidad y estadística aplicadas a la ingeniería. McGraw-Hill. México
(1996)
12. Pérez Salvador, B. R., A. Castillo y S. de los Cobos. Introducción a la
probabilidad. Edit. UAM-I (2000).
13. Walpole, Ronald E., R.H. Myers y S.L. Myers. Probabilidad y estadística para
ingenieros. 6ª ed. Prentice-Hall. México (1999).
14. Sheaffer, R.L. McClave, J.T. “Probabilidad y estadística para Ingenieros”,
Grupo Editorial Iberoamérica (1993).
15. Sevilla, A. “Calidad Total, Aseguramiento y Mejora Continua”, Limusa,
México (1999).
16. Alfonso, C. “Control estadístico de la calidad”, Alfaomega, México (2001).
17. Evans, J.R.; William, L. “Administración y Control de la Calidad”, Thomson-
Editores (2000).
18. Grantn, L., Worth, L. “Control estadístico de la Calidad”, C.E.C.S.A., México
(1986).
ESTADÍSTICA APLICADA Y DISEÑO DE EXPERIMENTOS

EVALUACIÓN
 Primer práctico: tema 1
 Primer parcial: temas 2 y 3
 Segundo práctico: tema 4
 Segundo parcial: temas 5, 6
 Tercer práctico: tema 7 y 8

Prácticos: 20% Parciales: 50% Final: 30%


ESTADÍSTICA
ESTADÍSTICA

 Ciencia aplicada que usa la probabilidad para


el estudio del comportamiento de variables
aleatorias
 Estadística descriptiva: se ocupa de los
métodos y procedimientos para recoger,
clasificar, resumir, hallar regularidades y analizar
los datos
 Estadística inferencial: realiza inferencias a
partir de los datos para la toma de decisiones
y formular predicciones
UNIDAD 1

HISTORIA DE LA ESTADÍSTICA
HISTORIA DE LA ESTADÍSTICA

 La palabra estadística proviene de “estado”,


ya que, en la antigüedad y hasta el presente, es
función principal de los gobiernos llevar un
registro de la población, nacimientos,
defunciones, impuestos, cosechas, etc.
HISTORIA DE LA ESTADÍSTICA

 Los primeros asentamientos utilizaban


representaciones gráficas u otros símbolos en
pieles, rocas, palos de madera y paredes de
cuevas para contar el número de personas,
animales u otros objetos
HISTORIA DE LA ESTADÍSTICA

 En la isla de Cerdeña existen monumentos


prehistóricos llamados Nuragas, que son
bloques de basalto en cuyas paredes hay
signos que han sido interpretados como
muescas que servían para llevar la cuenta del
ganado y la caza
HISTORIA DE LA ESTADÍSTICA

 Los babilonios (3.000 a.C.) recopilaban


datos en tablas, usando tablillas de arcilla,
sobre la producción agrícola y los géneros
vendidos o cambiados mediante trueque
HISTORIA DE LA ESTADÍSTICA

 Los egipcios analizaban los datos de la población y la renta


del país mucho antes de construir la pirámides
 Llevaban cuenta de los movimientos poblacionales y
continuamente hacían censos, bajo la dirección del Faraón (a
partir del año 3050 a.C.)
 Tenían a la diosa de los libros y las cuentas, Safnkit
HISTORIA DE LA ESTADÍSTICA

 En el libro Pentateuco de la Biblia, bajo el


nombre de Números, se indica que Moisés
realizó un censo después de la salida de
Egipto.
 En el libro bíblico Crónicas se describe el
bienestar material de las diversas tribus judías.
HISTORIA DE LA ESTADÍSTICA

 En China (hacia el año 2.200 a.C.) se


realizaban censos ordenados por el
emperador Tao
HISTORIA DE LA ESTADÍSTICA

 En Roma (hacia el año 500 a.C.) se


realizaron censos para conocer la población
existente
 La misión del “censor” era controlar el
número de habitantes y su distribución por
los distintos territorios.
HISTORIA DE LA ESTADÍSTICA

 Carlomagno (año 762 d.C.) ordenó la


creación de un registro de todas sus
propiedades, así como de los bienes de la
iglesia.
HISTORIA DE LA ESTADÍSTICA

 El rey Guillermo I de Inglaterra (1.066 d.C.)


elaboró un catastro que puede considerarse
el primero de Europa.
HISTORIA DE LA ESTADÍSTICA

 Los Reyes Católicos (1.482 d.C.) ordenaron


el recuento de hogares de las provincias de
Castilla.
HISTORIA DE LA ESTADÍSTICA

 John Graunt (Inglaterra, 1662 d.C.) publicó un tratado con


las cifras de nacimientos y defunciones ocurridas en Londres
durante el periodo 1.604-1.661, así como las influencias que
ejercían las causas naturales, sociales y políticas de dichos
acontecimientos. Puede considerarse el primer trabajo
estadístico serio sobre la población.
 Por otro lado, B. Pascal (1.623-1.662) y C. Huygens
(1.629-1.695) trabajaban en el mismo tema
HISTORIA DE LA ESTADÍSTICA

 El astrónomo Edmund Halley (1.656- 1.742)


presentó la primera tabla de mortalidad que se
puede considerar como base de los estudios
contemporáneos. En dicho trabajo se intenta
establecer el precio de las anualidades a satisfacer a
las compañías de seguros (estadística y probabilidad)
HISTORIA DE LA ESTADÍSTICA

 En el siglo XIX, la estadística entra en una nueva


fase de su desarrollo con la generalización del
método para estudiar fenómenos de las ciencias
naturales y sociales
 Galton(1.822-1.911) y Pearson (1.857-1936) se
pueden considerar como los padres de la estadística
moderna, pues a ellos se debe el paso de la
estadística deductiva a la estadística inductiva.
HISTORIA DE LA ESTADÍSTICA

 R. A. Fisher implementó los fundamentos


de la estadística actual y muchos de
los métodos de inferencia. Sus trabajos
culminan con la publicación de la obra
“Métodos estadísticos para investigaciones”
donde aparece la metodología estadística
actual
HISTORIA DE LA ESTADÍSTICA

 La estadística moderna comienza a


mediados del siglo XX con la aparición y
popularización de los computadores. Se
aplican técnicas de computación para el
análisis de grandes masas de datos
HISTORIA DE LA ESTADÍSTICA

 Se incorpora el cálculo de probabilidades


como instrumento de análisis para el estudio
de los fenómenos económicos y sociales y en
general para el estudio de fenómenos
IMPORTANCIA DE LA ESTADÍSTICA
IMPORTANCIA DE LA ESTADÍSTICA

 Es la ciencia de la experimentación

 Su función principal es la recolección y


agrupamiento de datos para construir con ellos
informes estadísticos cuantitativos con alcance
ilimitado de aplicaciones en diversas disciplinas
(ciencias, ingeniería, medicina, leyes, etc.)

 Las leyes de las ciencias físicas y sociales tienen


su demostración en los hechos estadísticos, al
demostrar que un porcentaje determinado de los
casos observados presentó un resultado
particular y no otro.
IMPORTANCIA DE LA ESTADÍSTICA

 Vinculada al diseño de experimentos para


recoger la información suficiente y tomar una
decisión (inferencia)

 Minimiza los costos de muestreo y análisis


para obtener la información deseada a partir
de un número mínimo de observaciones
UNIDAD 1

CONCEPTOS BÁSICOS DE LA ESTADÍSTICA


POBLACIÓN

 Colección o totalidad de posibles individuos,


especímenes, objetos o medidas de interés
sobre los que se hace un estudio
 Parámetros: características que, mediante su
valor numérico, describen a la población
 Puede ser finita o infinita
MUESTRA – INFERENCIA ESTADÍSTICA
 Si la población es infinita o finita grande es
imposible e incosteable medir a todos los
individuos,
 Muestra representativa: Es una parte de una
población, seleccionada adecuadamente, que
conserva los aspectos clave de la población y con
la cual se podrán hacer afirmaciones acerca de
los parámetros de la población (INFERENCIA)
 Objetivo de la inferencia: hacer afirmaciones
válidas acerca de la población con base en la
información de la muestra. Permite coadyuvar
en la toma de decisiones.
ESTADÍSTICOS

 Características medidas en la muestra


 Es una variable aleatoria, ya que su valor
dependerá de la muestra tomada y, por lo
tanto, varía de una muestra a otra.
 Si se conoce la distribución de probabilidad
de un estadístico, se podrá estimar el valor
del parámetro poblacional y verificar la
validez de hipótesis o conjeturas que se
tengan sobre la población
POBLACIÓN Y MUESTRA
VARIABLES
VARIABLE
 Valor de una característica que
corresponde a un sujeto
 Varía de un sujeto a otro
 Dependiendo de la variable, se aplica un
tratamiento estadístico
TIPOS DE VARIABLE
VARIABLE CUALITATIVA CON ESCALA NOMINAL
 Valores: categoría.
 Se le da valores para el análisis pero todos
tienen igual valor
 Ejemplo: encuestas, alimentos que
consume, estado civil, equipo de fútbol
preferido, etc.
TIPOS DE VARIABLE
VARIABLE CUALITATIVA CON ESCALA NOMINAL
TIPOS DE VARIABLE
VARIABLE CON ESCALA ORDINAL:
 Sus valores son categorías, pero cada una
de ellas tiene un valor diferente
 Ejemplo: clase social: alta- media-baja;
posición en gradas: arriba-centro-abajo;
grado de gusto: gusta mucho-ni gusta ni
disgusta-disgusta mucho
TIPOS DE VARIABLE
VARIABLE CUANTITATIVA:
 Escala: de intervalo. Depende de lo que se
mida
 Valores: números
 Ejemplo: edad, distancia, contenido de
humedad, diferencia en el contenido de un
envase con respecto al valor real, etc.
TIPOS DE VARIABLE
VARIABLE CUANTITATIVA:
TIPOS DE VARIABLE CUANTITATIVA
VARIABLE DISCRETA:
 Sus valores son números enteros
 Intervalo finito entre dos valores
 Ejemplo: dedos de una manos, personas en
un salón, etc.
 Variables nominal y ordinal son
consideradas variables discretas
VARIABLE DISCRETA:
TIPOS DE VARIABLE otra clasificación
VARIABLE CONTINUA:
 Toma cualquier valor en el conjunto de
número reales
 Intervalo infinito entre dos valores
 Ejemplo: cantidad de Ca en huesos, edad,
altura, etc.
Número de ESCALA
valores
Nominal (variable Ordinal Intervalo (variable
cualitativa) cuantitativa)
Discreta X X
Continua X
TIPOS DE VARIABLE otra clasificación
VARIABLE CONTINUA:
TIPOS DE VARIABLE otra clasificación

 VARIABLE DEPENDIENTE (Y): es la que


se predice o se calcula

 VARIABLE INDEPENDIENTE (X): es la


que proporciona la base para el cálculo

 Ejemplo: Se suministran diferentes dosis de un


medicamente (X) para determinar la frecuencia
cardíaca (Y)
REPASO
 Parámetros
 Estadísticos
 Variable cualitativa vs cuantitativa
 Variable discreta vs variable continua
 Variable dependiente vs variable
independiente
DISTRIBUCIÓN DE DATOS
DISTRIBUCIÓN DE DATOS

Los términos más importantes para describir


una distribución de datos son:
1.- Medidas de tendencia central
2.- Medidas de dispersión
3.- Medidas de correlación
MEDIDAS DE TENDENCIA CENTRAL

1.- Medidas de tendencia central: disposición de


los datos para agruparse alrededor del
centro o de ciertos valores numéricos.
Determina el punto central del conjunto de
datos de la variable aleatoria.
CONCEPTOS BÁSICOS DE LA ESTADÍSTICA

2.- Medidas de dispersión: permite observar la


variabilidad o dispersión: de los datos
alrededor de una medida de tendencia
central
CONCEPTOS BÁSICOS DE LA ESTADÍSTICA

3.- Correlación o asociación: mide e indica el


grado en que se relacionan los valores de
dos variables
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMÉTICA (Promedio)

 Centro de gravedad de una distribución


 La media de las observaciones x1, x2, ... xn
es el promedio aritmético de éstas y se
denota por:
Ejemplo:
 Determine la media aritmética de los
siguientes datos

ESPUMA MASA (g) Promedio


0,1526
EAC1 0,1337 0,1459
0,1515
0,1938
EAC2 0,2035 0,6063
0,2090
0,2518
EAC3 0,2526 0,2490
0,2425
MEDIA GEOMÉTRICA (MG)

 Útil para calcular medias de porcentajes,


puntuaciones, datos de progresión
geométrica, etc.
 Trabaja con valores estrictamente
positivos
MEDIA GEOMÉTRICA

Calcular la media geométrica del % de


crecimiento durante 3 años de 6 niños de 3
años de edad
Datos: 3,00%, 5,25%, 4,10%, 3,30%, 5,55%,
4,76%
MEDIA GEOMÉTRICA

Calcular la media geométrica del % de


crecimiento durante 3 años de 6 niños de 3
años de edad
Datos: 3,00%, 5,25%, 4,10%, 3,30%, 5,55%,
4,76%

MG  6 (3,00) (5,25)(4,10)(3,30)(5,55)(4,76)

MG  4,22 %
MEDIA ARMÓNICA (H)

 Corresponde al valor recíproco de la media


aritmética por el número de elementos
 Trabaja con valores estrictamente no nulos
 Sensible a valores extremo cercanos a cero
TEMA 1
MEDIADE
MODELOS BÁSICOS ARMÓNICA
PROBABILIDAD Y ESTIMACIONES

 Útil para cálculos de velocidad o tiempo


promedios
MEDIA ARMÓNICA

 Determinar la H de la velocidad de
empaquetamiento de tres líneas de
producción de arroz
 Datos: línea 1= 30 s; línea 2= 45 s; línea
2= 38 s
3 3
H 
1 1 1 0,033  0,022  0,026
30 45 38

H  37,04s / empaque
TEMA 1
MEDIA
MODELOS CUADRÁTICA
BÁSICOS (RMS)
DE PROBABILIDAD Y ESTIMACIONES

 Útil para datos que toman valores


positivos o negativos, pero en donde sólo
interesa el valor absoluto de los mismos,
como los errores de medida de una serie
de datos

x1  x2  ...xn
2 2 2
RMS 
N
TEMA 1
MODELOSMEDIA
BÁSICOSCUADRÁTICA
DE PROBABILIDAD Y ESTIMACIONES
MEDIA CUADRÁTICA

Calcular la media cuadrática de los valores


del error experimental cometido durante el
llenado de botellas de jugo:
+0,15
-0,55
-0,30
-0,27
+0,05
+0,19
MEDIA CUADRÁTICA
 Calcular la media cuadrática de los
valores del error experimental cometido
durante el llenado de botellas de jugo:
+0,15 – -0,55 – -0,30 – -0,27 – +0,05 –
+0,19

0,15  (-0,55)  (-0,30)  (-0,27)  0,05  0,19


2 2 2 2 2
RMS 
6
TEMA 1
MEDIA
MODELOS BÁSICOSPONDERADA
DE PROBABILIDAD Y ESTIMACIONES

 Otorga a cada observación un peso de


acuerdo a la importancia del valor

p1x1  p 2 x2  ... pnxn


MP 
p1  p2  p3
TEMA 1
MODELOS MEDIA
BÁSICOS PONDERADA
DE PROBABILIDAD Y ESTIMACIONES

 Útil para calcular promedios de nota o


IPC
MEDIA PONDERADA
 Calcular la media ponderada de las notas
de un estudiante del PIQ: 9 (3 UC)- 10 (1
UC)- 7 (4 UC)- 8 (3 UC)- 7 (2 UC)
MEDIA PONDERADA
 Calcular la media ponderada de las notas
de un estudiante del PIQ: 9 (3 UC)- 10 (1
UC)- 7 (4 UC)- 8 (3 UC)- 7 (2 UC)

3(9)  1(10)  4(7)  3(8)  2(7)


MP 
13
MP  7,92
TEMA 1
MEDIANA
MODELOS BÁSICOS DE PROBABILIDAD Y ESTIMACIONES

 La mediana es el valor para el cual la mitad de


las observaciones, ordenadas de menor a
mayor, está por debajo de ese valor y la otra
mitad por encima (percentil 50)
 Este valor es deseable a la media si existen
algunos valores extremos y un agregado alto
de observaciones (ej: los ingresos)
TEMA 1
MEDIANA
MODELOS BÁSICOS DE PROBABILIDAD Y ESTIMACIONES

 Si el número de observaciones es par, la


mediana es el promedio de las dos
observaciones centrales y si es impar es el
valor central
EJEMPLO:
 Determine la mediana de los siguientes
datos:
 3, 13, 7, 25, 40, 23, 8, 17
 3, 13, 7, 25, 40, 23, 8, 17, 22
TEMA 1
MODELOS BÁSICOSMODA
DE PROBABILIDAD Y ESTIMACIONES

 La moda es el valor de la observación que


ocurre con mayor frecuencia
TEMA 1
MODELOS BÁSICOSMODA
DE PROBABILIDAD Y ESTIMACIONES

 Muestra hacia que valor tienden los datos a


agruparse
 No es conveniente para un conjunto pequeño
de datos o donde la frecuencia más alta esté
compartida por dos o más observaciones
 Corresponde al punto más alto de una
distribución, es decir, es el punto de inflexión
Ejercicio:
 Determine la moda de los siguientes
datos:
 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56,
23, 29
MEDIDAS DE DISPERSIÓN
TEMA 1
MEDIDAS
MODELOS BÁSICOSDE DISPERSIÓN
DE PROBABILIDAD Y ESTIMACIONES

 La medida de tendencia central proporciona


información del conjunto de datos pero no
proporciona información de la variabilidad de las
observaciones.

 Las medidas de tendencia central son valores


puntuales y las medidas de dispersión son
intervalos en la escala de medida

 La variabilidad es la dispersión de las


observaciones en el conjunto, indica como se
separan los datos de la media
TEMA 1
MEDIDAS DE DISPERSIÓN-
MODELOS BÁSICOS DE PROBABILIDADRANGO
Y ESTIMACIONES

 Diferencia entre los valores extremos de un


conjunto de datos (recorrido estadístico). Indica el
número de unidades necesarios para incluir todos
los valores

 Mientras más grande sea el rango, mayor será la


dispersión
 Fuertemente influenciado por valores extremo
atípicos
 Adecuado para un número pequeño de datos

Rango  x(máx)  x(mín)


Ejercicio:
 Determine el rango de los siguientes
datos:
 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56,
23, 29
 En el ejemplo de la humedad en raíces de
yuca, determine cuál es el rango de los datos
 En el ejemplo de la humedad en raíces de
yuca, determine cuál es el rango de los datos

Rango  74,9g  64,2g  10,7 g


MEDIDAS DE DISPERSIÓN-
TEMA 1
MODELOS
RANGO BÁSICOS DE PROBABILIDAD Y ESTIMACIONES
INTERCUARTÍLICO
 Corresponde a la diferencia entre el tercer y
el primer cuartil
 Utilizado cuando la medida de tendencia
central es la mediana
 Q3= tercer cuartil = 75%
 Q1= primer cuartil= 25%

RIQ  Q3  Q1
Ejercicio:
 Determine el RIQ de los siguientes datos:
 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56,
23, 29
TEMA 1
MEDIDAS DE DISPERSIÓN-
MODELOS BÁSICOS VARIANZA
DE PROBABILIDAD Y ESTIMACIONES

 Mide la dispersión de los datos alrededor


de la media

 Es una medida razonablemente buena de la


variabilidad ya que si las diferencias son
grandes, la varianza también lo será
TEMA 1
MEDIDAS
MODELOS BÁSICOSDE DISPERSIÓN
DE PROBABILIDAD Y ESTIMACIONES

 Es el promedio del cuadrado de la distancia


entre cada observación y la media del
conjunto de datos
 Toma valores positivos (> 0)
 Su valor es cero cuando todos los datos
tienen el mismo valor
Ejemplo:
 Determine la varianza de los siguientes
datos

ESPUMA MASA (g) Promedio Varianza


0,1526
EAC1 0,1337 0,1459
0,1515
0,1938
EAC2 0,2035 0,6063
0,2090
0,2518
EAC3 0,2526 0,2490
0,2425
MEDIDAS DE DISPERSIÓN-
TEMA 1
MODELOS BÁSICOS
DESVIACIÓN DE PROBABILIDAD
ESTÁNDAR Y ESTIMACIONES
(Desviación típica)

 Es la raíz cuadrada positiva de la


varianza

 Se prefiere la DE porque trabaja con


las mismas unidades que la muestra
MEDIDAS DE DISPERSIÓN-
TEMA 1
MODELOS BÁSICOS DE PROBABILIDAD
DESVIACIÓN ESTÁNDAR Y ESTIMACIONES

D.E. Muestral

D.E. Poblacional
Ejemplo:
 Determine la DE de los siguientes datos

ESPUMA MASA (g) Promedio Varianza s


0,1526
EAC1 0,1337 0,1459
0,1515
0,1938
EAC2 0,2035 0,6063
0,2090
0,2518
EAC3 0,2526 0,2490
0,2425
MEDIDAS DE DISPERSIÓN-
COEFICIENTE DE VARIACIÓN
 Compara la variabilidad de diferentes
muestras en una misma variable o la
variabilidad existente entre variables
diferentes
s
CV  x100
x
 En agronomía se acepta hasta un 10% ,
pero para otros procesos puede ser hasta
menor de 1%
MEDIDAS DE CORRELACIÓN
MEDIDAS DE CORRELACIÓN - TIPOS

 Evalúa el grado de asociación entre dos o más


variables

 CORRELACIÓN SIMPLE: Sólo involucra una


variable independiente con una dependiente

 CORRELACIÓN MÚLTIPLE: involucra dos o


más variables independientes con una
dependiente

 CORRELACIÓN CANÓNICA: se da entre


un grupo de variables dependientes y un grupo
de variables independientes
MEDIDAS DE CORRELACIÓN SIMPLE

 Cuantifica la fuerza de la relación lineal


entre variables, mediante el coeficiente de
correlación (r)

 Toma valores entre -1 y +1

 Permite determinar el coeficiente de


determinación o regresión (R2), que es
una medida de la bondad de ajuste del
modelo de regresión
CORRELACIÓN LINEAL - INTERPRETACIÓN

MAGNITUD (r) SIGNIFICADO DE LA


CORRELACIÓN
-1,00 Negativa perfecta
-0,90 Negativa fuerte
-0,75 Negativa considerable
-0,50 Negativa media
-0,10 Negativa débil
ALTA 0 Nula
CORRELACIÓN
+0,10 Positiva débil
+0,50 Positiva media
+0,75 Positiva considerable
+0,90 Positiva fuerte
+1,00 Positiva perfecta
CORRELACIÓN LINEAL - INTERPRETACIÓN

MAGNITUD (r) SIGNIFICADO DE LA


CORRELACIÓN
-1,00 Negativa perfecta
-0,90 Negativa fuerte
-0,75 Negativa considerable

CORRELACIÓN -0,50 Negativa media


NULA -0,10 Negativa débil
0 Nula
+0,10 Positiva débil
+0,50 Positiva media
+0,75 Positiva considerable
+0,90 Positiva fuerte
+1,00 Positiva perfecta
MEDIDAS DE CORRELACIÓN
SEGÚN LA DIRECCIÓN

 CORRELACIÓN POSITIVA O DIRECTA:


cuando ambas características muestran la
misma tendencia
 Ejemplo: edad y peso hasta cierta edad,
volumen-temperatura, etc.
Volumen

Temperatura
MEDIDAS DE CORRELACIÓN
SEGÚN LA DIRECCIÓN

 CORRELACIÓN NEGATIVA O INVERSA:


cuando una características aumenta y la otra
disminuye, tendencias inversas
 Ejemplo: demanda y precio de un producto,
presión-volumen, etc.
MEDIDAS DE CORRELACIÓN
SEGÚN LA DIRECCIÓN

 CORRELACIÓN NULA:
MEDIDAS DE CORRELACIÓN
SEGÚN LA DIRECCIÓN

 CORRELACIÓN NO LINEAL:
MEDIDAS DE CORRELACIÓN

Coeficiente de correlación de Spearman


(no paramétrico)
 Mide la relación entre dos variables donde no se
cumple el supuesto de normalidad en la distribución
de los valores.

6 D 2

rS  1 
n(n  1)
2

 D= diferencia entre datos; n= número de datos


MEDIDAS DE CORRELACIÓN
Correlación de Spearman (Pasos para hallar rs) :

 a) Clasificar por jerarquía los valores de X, desde 1


hasta n

 b) Clasificar por jerarquía los valores de Y, desde 1


hasta n

 c) Calcular di para cada pareja de observaciones (Xi-


Yi)

6 D 2
 d) Elevar al cuadrado cada di rS  1 
n(n 2  1)
Ejemplo:
 En un estudio de la
relación entre la edad y
los resultados del
electroencefalograma
/EEG), se recopilaron
datos en 20 personas
con edades entre 20 y
60 años. Los
investigadores
pretenden saber si es
posible concluir que
este rendimiento del
EEG particular tiene
relación inversa con la
edad
Ejemplo:
Ejemplo:
Ejemplo:

Decisión: Las variables EDAD y EEG están inversamente


relacionas
Ejercicio
 Se tienen las notas de un examen parcial
de diez alumnos de las asignaturas de
matemáticas y español. Determine si los
alumnos con mejores notas en
matemáticas (X) tienen las mejores notas
en español (Y).
ALUMNO 1 2 3 4 5 6 7 8 9 10
X 40 56 64 65 66 68 75 76 85 95

Y 45 59 67 60 69 70 61 82 75 100
Ejercicio
ALUMNO 1 2 3 4 5 6 7 8 9 10
X 40 56 64 65 66 68 75 76 85 95
Y 45 59 67 59 69 70 61 82 75 100

ALUMNO 1 2 3 4 5 6 7 8 9 10
X 1 2 3 4 5 6 7 8 9 10
Y 1 2 4 2 5 6 3 8 7 9
X-Y 0 0 -1 2 0 0 4 0 2 1
D2 0 0 1 4 0 0 16 0 2 2

6 D 2 6(25) 150
rS  1  rs  1   1  0,848
n(n 2  1) 10(99) 990

DECISIÓN: correlación positiva alta


Regression Analysis - Linear model: Y = a + b*X
-----------------------------------------------------------------------------
Dependent variable: Y
Independent variable: X
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
Intercept 8,49971 10,9965 0,77295 0,4618
Slope 0,873917 0,156001 5,602 0,0005
-----------------------------------------------------------------------------

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 1587,03 1 1587,03 31,38 0,0005
Residual 404,566 8 50,5708
-----------------------------------------------------------------------------
Total (Corr.) 1991,6 9

Correlation Coefficient = 0,892672


R-squared = 79,6864 percent
Standard Error of Est. = 7,11131

The StatAdvisor
---------------
The output shows the results of fitting a linear model to describe
the relationship between Y and X. The equation of the fitted model is

Y = 8,49971 + 0,873917*X

Since the P-value in the ANOVA table is less than 0.01, there is a
statistically significant relationship between Y and X at the 99%
confidence level.

The R-Squared statistic indicates that the model as fitted explains


79,6864% of the variability in Y. The correlation coefficient equals
0,892672, indicating a moderately strong relationship between the
variables. The standard error of the estimate shows the standard
deviation of the residuals to be 7,11131. This value can be used to
construct prediction limits for new observations by selecting the
Forecasts option from the text menu.
MEDIDAS DE CORRELACIÓN
SEGÚN LA NATURALEZA DE LA VARIABLE

Coeficiente de correlación de Pearson (rxy)


(Datos paramétricos)

rxy 
 ( X  X )(Y  Y )
 ( X  X )  (Y  Y )
2 2
MEDIDAS DE CORRELACIÓN
CORRELACIÓN DE PEARSON

1.- Hacer los siguientes cálculos:


Promedio
o suma
X Ẋ=

|X-Ẋ | ∑=

2
(X-Ẋ) ∑=
Y Ÿ=
|Y-Ÿ | ∑=
2
(Y-Ÿ) ∑=
(X-Ẋ)(Y-Ÿ) ∑=
EJERCICIO
 Determine el
coeficiente de
correlación de Pearson
para los siguientes
datos correspondientes
al peso y la talla de 20
niños:
Cálculos con Excel y Statgrafic
 Coeficiente de correlación:
=COEF.DE.CORREL(B3:B22;C3:C22)
Cálculos con Excel y Statgrafic
Regression Analysis - Linear model: Y = a + b*X
-----------------------------------------------------------------------------
Dependent variable: Y kg
Independent variable: X cm
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
Intercept -7,92821 1,93422 -4,09891 0,0007
Slope 0,234035 0,0289483 8,08459 0,0000
-----------------------------------------------------------------------------

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 68,0573 1 68,0573 65,36 0,0000
Residual 18,7427 18 1,04126
-----------------------------------------------------------------------------
Total (Corr.) 86,8 19

Correlation Coefficient = 0,885478


R-squared = 78,4071 percent
Standard Error of Est. = 1,02042

The StatAdvisor
---------------
The output shows the results of fitting a linear model to describe
the relationship between Y kg and X cm. The equation of the fitted
model is

Y kg = -7,92821 + 0,234035*X cm

Since the P-value in the ANOVA table is less than 0.01, there is a
statistically significant relationship between Y kg and X cm at the
99% confidence level.

The R-Squared statistic indicates that the model as fitted explains


78,4071% of the variability in Y kg. The correlation coefficient
equals 0,885478, indicating a moderately strong relationship between
the variables. The standard error of the estimate shows the standard
deviation of the residuals to be 1,02042. This value can be used to
construct prediction limits for new observations by selecting the
Forecasts option from the text menu.
Cálculos con Excel y Statgrafic
 Promedio: =PROMEDIO(B3:K10)
 Desviación estándar: =DESVEST(B3:K10)
 Coeficiente de correlación:
=COEF.DE.CORREL(B3:B22;C3:C22)
EJERCICIO 1
 Los siguientes datos corresponden a 80 datos
del contenido de humedad(%) de raíces de
yuca. Determine con ellos los siguientes datos:
promedio, mediana, moda, rango, RIQ
 Utilizando el programa estadístico o el
programa Excel, determine: varianza,
desviación estándar y coeficiente de variacion.
EJERCICIO

64,2 67,9 68,6 69,1 69,5 70,2 71,0 72,0


65,8 67,9 68,7 69,1 69,6 70,3 71,0 72,1
66,3 68,2 68,7 69,1 69,7 70,4 71,1 72,2
66,6 68,2 68,8 69,2 69,8 70,4 71,2 72,4
66,9 68,3 68,9 69,3 69,9 70,5 71,4 72,5
67,0 68,4 68,9 69,3 69,9 70,5 71,4 72,8
67,4 68,5 68,9 69,4 70,0 70,6 71,4 73,0
67,5 68,5 69,0 69,5 70,0 70,6 71,6 73,4
67,6 68,6 69,0 69,5 70,1 70,9 71,7 74,2
67,8 68,6 69,0 69,5 70,1 70,9 71,8 74,9
EJERCICIO 2

 Determine el promedio, la varianza y la


desviación estándar de los valores de
proteína (%) en raíces de yuca

1,25 – 1,31 – 1,55 – 1,22 – 1,23 – 1, 40

También podría gustarte