Está en la página 1de 45

10/01/2017

ESTADSTICA I

JUSTIFICACIN DE LA ASIGNATURA EN
EL PLAN DE ESTUDIOS
La estadstica es una herramienta fundamental
en la formacin profesional de Ciencias
Administrativas, Publicidad y mercadeo, Gestin
Comercial y Financiera etc; los contenidos de esta
asignatura contribuyen al desarrollo de una
actitud crtica, metdica e investigativa, mediante
la aplicacin de conocimientos y herramientas
estadsticas que contribuyan a la toma de
decisiones confiables en estudios investigativos
de corte cuantitativo y cualitativo.

1
10/01/2017

LOS PROPSITOS

Adquirir un conocimiento preciso de las bases necesarias de la


Estadstica Descriptiva y de las probabilidades para su aplicacin en
la vida profesional, como herramienta determinante en la toma de
decisiones.
El curso de Estadstica I pretende desarrollar en los estudiantes las
competencias propias del rea, para poder realizar un anlisis
estadstico bsico como la media, la varianza y la desviacin
estndar a partir de un conjunto de datos dado, al igual podr
describir probabilsticamente una distribucin de datos,
identificando el tipo de variable (discreta o continua).
Adquirir las destrezas para la formulacin de problemas que
requieren la administracin de datos.
Aplicar con sentido los paquetes computacionales para abordar un
problema en el ambiente de la Estadstica (EXCEL)

LA ESTADSTICA

La estadstica, en general, es la ciencia que


trata de la recopilacin, organizacin,
presentacin, anlisis e interpretacin de
datos numricos con el fin de realizar una
toma de decisin ms efectiva.

2
10/01/2017

HISTORIA DE LA ESTADSTICA
Historia.

DIVISIN DE LA ESTADSTICA

Estadstica Estadstica
Descriptiva Inferencial

3
10/01/2017

ESTADSTICA DESCRIPTIVA:

Consiste en la presentacin de datos en


forma de tablas y grficas. Esta comprende
cualquier actividad relacionada con los datos
y est diseada para resumir o describir los
mismos sin factores pertinentes adicionales;
esto es, sin intentar inferir nada que vaya
ms all de los datos.

ESTADSTICA INFERENCIAL:
Se deriva de muestras, de observaciones
hechas slo acerca de una parte de un
conjunto numeroso de elementos y esto
implica que su anlisis requiere de
generalizaciones que van ms all de los
datos. La Estadstica Inferencial investiga
o analiza una poblacin partiendo de una
muestra tomada.

4
10/01/2017

MTODO ESTADSTICO
El conjunto de los mtodos que se utilizan para medir las
caractersticas de la informacin, para resumir los valores
individuales, y para analizar los datos a fin de extraerles el
mximo de informacin, es lo que se llama mtodos
estadsticos. Los mtodos de anlisis para la informacin
cuantitativa se pueden dividir en los siguientes seis pasos:
1. Definicin del problema.
2. Recopilacin de la informacin existente.
3. Obtencin de informacin original.
4. Clasificacin.
5. Presentacin.
6. Anlisis.
7. Toma de decisiones.

APLICACIN DE LA ESTADSTICA
La estadstica prcticamente se puede
utilizar en todas las actividades del ser
humano, donde se presenta con mayor
incidencia es en: Economa, Agricultura,
Informtica, Prevencin de Riesgos,
Control de Medio Ambiente, Qumica
Analtica, Medicina, Ingeniera,
Psicologa, etc.

5
10/01/2017

DEFINICIONES BSICAS
LA POBLACIN: es el conjunto de todos los elementos
sobre los que se quiere realizar un estudio estadstico.
LA MUESTRA: es una parte representativa de la poblacin
que se elige para hacer el estudio estadstico.
VARIABLE: Caracterstica de la poblacin que se analiza en
el estudio estadstico. Hay dos tipos de variables
estadsticas:
Cuantitativas, (variables) son los que se pueden
expresar con nmeros (estatura de todas la personas
de la U.) se pueden describir por medio nmeros.
Cualitativas, (atributos) son los que no se pueden
expresar con nmeros (el estado civil, el sexo, la raza,
etc.) se pueden describir por medio de palabras.

VARIABLES CUANTITATIVAS
Datos Discretos: Son aquellos que surgen por el
procedimiento de conteo. Es decir, los datos
discretos toman valores enteros (ej., el nmero
de hijos por familia; el nmero de automviles
que pasan por una avenida en una hora, etc.).

Datos Continuos: Son aquellos que surgen


cuando se mide alguna caracterstica. Es decir,
toman al menos tericamente cualquier valor
dentro de un intervalo (ej., el peso, la estatura, la
tensin arterial de las personas, etc.)

6
10/01/2017

EJERCICIOS
1. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes caracteres
estadsticos estudiados en los coches de cierta
marca:
a) Modelo de coche
b) Color de su carrocera
c) Potencia de su motor
d) Consumo medio en 100 km
e) Nmero de piezas

EJERCICIOS
2. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes
caracteres estadsticos estudiados en una
fbrica de tornillos:
a) La produccin diaria de tornillos.
b) Las longitudes de los tornillos.
c) El color de los tornillos.
d) Las anchuras de los tornillos.

7
10/01/2017

QU ES UN DATO?
Dato es una representacin simblica (numrica,
alfabtica, etc.), un atributo o una caracterstica
de una entidad. El dato no tiene valor semntico
(sentido) en s mismo, pero si recibe un
tratamiento (procesamiento) apropiado, se
puede utilizar en la realizacin de clculos o toma
de decisiones. Es de empleo muy comn
prcticamente en cualquier disciplina cientfica.
Un Conjunto de datos es una coleccin de datos
normalmente tabulada. Por cada elemento (o
individuo) se indican varias caractersticas.

FORMAS DE RESUMIR LOS DATOS


Tablas
Tablas de frecuencias (distribucin de
frecuencias)
Frecuencias relativas (porcentaje del total)
Grficos
Histogramas
Polgonos de Frecuencias
Diagrama de Puntos
Diagrama de Cajas (Box plots) etc.

8
10/01/2017

DISTRIBUCIN DE FRECUENCIAS
Es un mtodo para clasificar, organizar y
resumir datos.

SMBOLOS:

TABLAS DE FRECUENCIAS
Variables discretas:
Ejemplo: En un estudio con un grupo de 2.000 personas
que haban sido tratadas psicolgicamente por problemas
de ansiedad, se desea preguntar a las mismas, cuntas
veces haban sufrido un ataque de ansiedad desde que
termin el tratamiento recibido. Pero no se quiere
realizar una investigacin exhaustiva, por lo cual se
selecciono una muestra de 20 personas. El resultado de
esta encuesta, se anota a continuacin:

X1= 2 X6= 4 X11= 4 X16= 0


X2= 2 X7= 0 X12= 0 X17= 2
X3= 1 X8= 1 X13= 0 X18= 3
X4= 2 X9= 0 X14= 4 X19= 0
X5= 1 X10= 0 X15= 4 X20= 3

9
10/01/2017

TABLAS DE FRECUENCIAS
N=
n=

Yi ni hi Ni Hi
0 7 35% 7 35%
1 3 15% 10 50%
2 4 20% 14 70%
3 2 10% 16 80%
4 4 20% 20 100%
n= 20 100%

La siguiente es una muestra que representa un


estudio hecho en la ciudad de Bogot, este se
realiz con fin de conocer la principal causa de
muerte en esta ciudad. Cul sera la principal
causa de muerte? Con qu porcentaje?; Cul
sera la menor causa de muerte? Con qu
porcentaje?; Qu quiere decir N2? Qu quiere
decir H3? 1 5 3 1 2 4 1 3 1 5
2 1 1 5 3 1 2 1 4 1
4 1 3 1 5 1 2 1 1 2
5 1 1 5 1 5 3 1 2 1
2 3 1 1 2 1 5 1 5 1
1 2 5 1 1 2 3 4 1 1
1 1 2 1 1 2 1 1 2 3
3 3 1 5 2 3 5 1 3 4
1 1 2 4 5 4 1 5 1 5
5 1 1 5 1 1 5 1 1 5

10
10/01/2017

LOS GRFICOS ESTADSTICOS MS


UTILIZADOS SON:
DIAGRAMA DE BARRAS, consiste en dibujar una
barra sobre cada uno de los datos con una altura
proporcional a la frecuencia absoluta o relativa. Si
en un diagrama de barras unimos los extremos
superiores de cada una obtenemos una lnea
poligonal que se llama polgono de frecuencias
EL DIAGRAMA DE SECTORES, es un crculo
dividido en sectores circulares de amplitudes
proporcionales a las frecuencias absolutas o
relativas

EJEMPLOS DE GRFICOS VARIABLES


DISCRETAS:

11
10/01/2017

TABLAS DE FRECUENCIAS
Variables continuas:
Tomamos como ejemplo una muestra de 20
alumnos a fin de conocer su peso en kilos:
1 67,9 6 56,4 11 50,2 16 47,4
2 61,6 7 75,3 12 80,2 17 78,7
3 64,4 8 65,8 13 68,5 18 43,5
4 62,6 9 72,3 14 61,1 19 59,0
5 47,2 10 58,3 15 68,8 20 99,5

PASOS PARA ELABORAR TABLA DE


FRECUENCIAS EN DATOS CONTINUOS
Determinar el valor mximo y mnimo.
Calcular el rango: R =Xmax - Xmin
Introducir dos nuevos smbolos:
M = nmero de intervalos
C = amplitud del intervalo.

12
10/01/2017

LA REGLA DE STURGES
Consiste en obtener una primera aproximacin de
cuntas clases debe tener la serie de clases y
frecuencias mediante la raz cuadrada del nmero
de elementos. Ejemplo: se tienen 72 salarios de una
empresa, la raz cuadrada de 72 es 8.49, la
sugerencia inicial ser utilizar 9 clases para construir
las dems clases segn el nmero de datos. Los
salarios mximo y mnimo 179.2 y 74.65, lo que da
una diferencia (rango) de 104.55. Y como la regla de
Sturges indica 9 clases, cada una debe medir
aproximadamente 104.55/9 = 11.61 que
redondeado a 12 si es una variable de tipo discreta.

Calcular:
Yj-1 = Lmite inferior del intervalo Y
Yj = Lmite superior del intervalo Y
Donde Yj-1 - Yj = C
Y0 = Xmin Yj-1 Yj
Y0 Y1
Y1 Y2
Y2 Y3
Y3 Y4
Y4 Y5
Calcular: frecuencia absoluta, relativa, etc.

13
10/01/2017

PASOS
1. X MAX= 99,5
X MIN= 43,5
2. R= 55,9
3. n= 20
m= 5 5 < m < 16
4. C= 11,19 m= 1 + 3.3 log n
m= n

Yj-1 Yj ni hi Ni Hi
1 43,54 54,73 4 20,0% 4 20,0%
2 54,73 65,92 8 40,0% 12 60,0%
3 65,92 77,11 5 25,0% 17 85,0%
4 77,11 88,30 2 10,0% 19 95,0%
5 88,30 99,49 1 5,0% 20 100,0%
RESPUESTA

Ejercicio
En un barrio de Bogot, en el ao 2012, se entrevist a
un cierto nmero de mujeres casadas nacidas entre los
aos 1935 y 1944 y se les pregunt a qu edad
contrajeron matrimonio. A continuacin se muestran
los datos correspondientes a 50 de estas mujeres:
Realizar tablas de frecuencias, con 6 intervalos.

15 17 25 15 16 11 15 13 12 10
15 14 16 14 17 13 14 20 29 19
16 18 10 18 12 11 20 34 13 22
19 14 17 16 16 15 12 24 25 9
21 15 13 23 24 10 10 16 14 18

14
10/01/2017

FORMAS DE RESUMIR LOS DATOS


CONTINUOS
Grficos
Histogramas. Est formado por rectngulos cuyas
bases miden la amplitud de las clases y cuyas
alturas son proporcionales a las frecuencias
absolutas (o relativas, si es el caso).

Polgonos de Frecuencias. Si en un histograma


unimos los extremos superiores de cada una
obtenemos una lnea poligonal que se llama
polgono de frecuencias

15
10/01/2017

MEDIDAS DE TENDENCIA
CENTRAL
Media (aritmtica, ponderada, geomtrica,
armnica)

Mediana

Moda

Cuartiles, deciles, percentiles

MEDIA ARITMTICA
Datos originales: El ndice de tendencia central
ms utilizado es la media. Se define como la
suma de los valores observados, dividida por
el nmero de ellas. Se representa con la X, en
maysculas , con una barra horizontal encima.
Datos originales:

Calcula la media de los siguientes datos

14 25 14 8 22 14 14 14 13 21 15

16
10/01/2017

MEDIA ARITMTICA
Datos agrupados:

Hallar la media de los ejercicios:


En un estudio con un grupo de 2.000 personas..
Tomamos como ejemplo una muestra de 20.
En cierto barrio de Bogot, en el ao 2012, se
entrevist.

MEDIA ARITMTICA PONDERADA

Es una media aritmtica que se emplea en distribuciones


de tipo unitario, en las que se introducen unos coeficientes
de ponderacin, denominados , que son valores
i

positivos, que representan el nmero de veces que un valor


de la variable es ms importante que otro.

Ejemplo: un alumno de estadstica I, obtuvo las siguientes


notas durante los tres cortes: 1 corte 2.3; 2 corte 3.1; y
3 corte 2.9; cul ser la nota definitiva del este alumno?

17
10/01/2017

LA MEDIANA
La mediana de un conjunto de datos es un
valor tal, que cuando escribimos todos los
datos ordenados de menor a mayor ocupa el
lugar central de la lista ordenada. Si el nmero
de datos es impar, la mediana es el dato
central; si el nmero de datos es par, la
mediana es la media de los dos datos
centrales.

EJEMPLOS DATOS ORIGINALES


X1= 14
X2= 15
X3= 12
X4= 5
Nmero impar de observaciones. X5= 9
X6= 6
X7= 11

X1= 27
X2= 38
X3= 23
Nmero par de observaciones. X4= 28
X5= 36
X6= 39
X7= 35
X8= 26

18
10/01/2017

PASOS A SEGUIR EN EL CLCULO DE LA


MEDIANA DATOS AGRUPADOS
1) Obtener las frecuencias absolutas acumuladas.
2) Buscar la mitad de las observaciones, por medio
de n/2.
3) Localizar el resultado anterior n/2 en las
columnas de las frecuencias absolutas
acumuladas. Si no aparece, se toma el valor
inmediatamente anterior y se simboliza con Nj-1
y al inmediatamente superior por Nj.
4) Casos.

CASOS DATOS AGRUPADOS

CASO A
Variables discretas

CASO B

CASO A


Variables continuas
CASO B

19
10/01/2017

EJERCICIOS
Variables discretas, caso a:
Yj nj Nj
0 2 2
1 3 5
2 6 11
3 5 16
4 4 20

Variables discretas, caso b:


Yj nj Nj
0 2 2
1 3 5
2 5 10
3 6 16
4 4 20

EJERCICIOS
Variables continuas, caso a:
Yj-1 Yj ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 5 10
14,1 18 6 16
18,1 22 4 20

Variables continuas, caso b:


Yj-1 Yj ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 6 11
14,1 18 5 16
18,1 22 4 20

20
10/01/2017

LA MODA
La moda es el valor de la variable que ms
veces se repite, y en consecuencia, en una
distribucin de frecuencias, es el valor de la
variable que viene afectada por la mxima
frecuencia de la distribucin.

EJERCICIOS
Datos originales:

Calcula la moda los


siguientes datos:

14 25 14 8 22 14 14 14 13 21 15

21
10/01/2017

EJERCICIOS
Datos agrupados:
Variables discretas Yj
0
nj
2
1 3
2 6
3 5
4 4

Yj-1 Yj ni Yi
Variables continuas 2,1 6 2 4,05
6,1 10 3 8,05
10,1 14 5 12,05
14,1 18 6 16,05
18,1 22 4 20,05

MEDIDAS DE DISPERSIN
Las medidas de dispersin tratan de medir el grado de
dispersin que tiene una variable estadstica en torno a
una medida de posicin o tendencia central,
indicndonos lo representativa que es la medida de
posicin. A mayor dispersin menor representatividad
de la medida de posicin y viceversa.

Variancia (Poblacional, Muestral)


Desviacin Estndar (tpica)
Coeficiente de variacin

22
10/01/2017

VARIANZA (POBLACIONAL, MUESTRAL)


La varianza mide la mayor o menor dispersin
de los valores de la variable respecto a la
media aritmtica. Cuanto mayor sea la
varianza mayor dispersin existir y por tanto
menor representatividad tendr la media
aritmtica.

EJEMPLOS
Una aseguradora vende 5 plizas de seguros, sus
valores fueron 110, 145, 125, 95 y 150 dlares, hallar
la media, la varianza y la desviacin estndar.
Hallar la varianza y la desviacin estndar de la variable
ansiedad, que siente una persona cuando se encuentra
mucha gente alrededor de ella, de una muestra de 7
personas. 9; 3; 10; 5; 9; 4; 9
Calcular la varianza y la desviacin estndar para la
variable Tiempo empleado en completar un
laberinto por una muestra de 20 ratas:
Tiempo (seg) ni
9 3
10 8
11 6
12 2
13 1

23
10/01/2017

DESVIACIN ESTNDAR
Desviacin estndar: tambin llamada desviacin tpica, es
una medida de dispersin usada en estadstica que nos dice
cunto tienden a alejarse los valores puntuales del
promedio en una distribucin. Especficamente, la
desviacin estndar es "el promedio de la distancia de cada
punto respecto del promedio". Se suele representar por
una S o con la letra sigma, segn se calcule en una muestra
o en la poblacin.
Una desviacin estndar grande indica que los puntos estn
lejos de la media, y una desviacin pequea indica que los
datos estn agrupados cerca de la media.

POBLACIONAL
MUESTRAL

COEFICIENTE DE VARIACIN

Se utiliza para comparar la variabilidad de dos series de datos.

Tenemos datos sobre el gasto anual en nuevas tecnologas en los


colegios pblicos de 2 ciudades En cul de las 2 ciudades presenta
ms homogeneidad esta variable?

Ciudad A
X = 240.000
Sx = 3.300
Ciudad B
X = 150.000
Sx = 2.900

24
10/01/2017

MEDIDAS DE ASIMETRA
En una distribucin simtrica se cumple que: X=Me=Mo. Ver figura
(c).
Si en una distribucin existen muy pocos valores altos respecto a los
dems, entonces la media aritmtica se ver influenciada por stos y
la asimetra es a la derecha o asimetra positiva o distribucin con
sesgo positivo. En stas condiciones: X>Me>Mo. Ver figura (a)
Si en una distribucin existen muy pocos valores bajos respecto a los
dems, entonces, la media aritmtica se ver influenciada por stos
y la asimetra ser a la izquierda o asimetra negativa o distribucin
con sesgo negativo. En estas condiciones: X< Me < Mo. Ver figura (b)

COEFICIENTE DE KARL PEARSON

25
10/01/2017

EJEMPLO
El tiempo utilizado para atender entrevistas de
unos aspirantes a empleo en una empresa, se
clasifican de acuerdo a la siguiente tabla.
NMERO DE
TIEMPO NECESARIO ENTREVISTAS
(ni)
1 12 20 6
2 21 29 9
3 30 38 14
4 39 47 72
5 48 56 95
n= 196

a) Calcular la media aritmtica, la mediana, la moda


y el histogramas.
b) Identificar el tipo de asimetra y curtosis.

MEDIDAS DE CURTOSIS O
APUNTAMIENTO
Curtosis o Apuntamiento es utilizado para mostrar el grado
apuntamiento o de concentracin de los datos.
En la medida en que los diferentes tramos de la variable
presenten frecuencias muy similares en todo su recorrido.
Esta situacin contribuye a que la dispersin sea alta. Una
distribucin con stas caractersticas, se denomina
PLATICRTICA O ACHATADA.

26
10/01/2017

MEDIDAS DE CURTOSIS O
APUNTAMIENTO
Por el contrario, si existe una cantidad muy
significativa de datos que se encuentran
concentrados en algn tramo de la variable,
entonces decimos que la distribucin es
altamente concentrada o que tiene alta
curtosis. Una distribucin de stas
caractersticas se denomina LEPTOCRTICA
O APUNTADA.

MEDIDAS DE CURTOSIS O
APUNTAMIENTO
Si la concentracin es intermedia entre las dos
situaciones anteriores, se dice que la distribucin es
MESOCRTICA o MODERADA CONCENTRACIN DE LOS
DATOS. Una distribucin con esta caracterstica es
propia de la distribucin normal. Una manera de medir
el grado de curtosis, es mediante el coeficiente de
curtosis A4.

27
10/01/2017

COEFICIENTE DE CURTOSIS A4
ste coeficiente, resulta del cociente existente entre el momento de
orden cuatro respecto a la media y la desviacin estndar elevada a la
cuarta.

La mayora de los autores consideran que:


a) Si A4 - 3 = 0, la distribucin es mesocrtica o moderada
concentracin de los datos. Tal es el caso de la distribucin
normal.
b) Si A4 - 3 > 0, la distribucin es apuntada o leptocrtica o alta
concentracin de los datos.
c) Si A4 - 3 < 0, la distribucin es achatada o platicrtica o baja
concentracin de los datos.

MEDIDAS DE POSICIN
Las medidas de posicin dividen un conjunto
ordenado de datos en grupo con la misma
cantidad de individuos.

Esto cuando se requiere obtener un promedio


de una parte de ella, se puede dividir la
distribucin en cuatro, diez, o en cien, partes.
Hablamos entonces del primer caso de
cuartiles, el segundo de deciles y percentiles.

28
10/01/2017

PERCENTIL
Son 99 valores que dividen en cien porciones
iguales el conjunto de datos ordenados.
Ejemplo, el percentil de orden 15 deja por
debajo al 15% de las observaciones, y por
encima queda el 85%.
Cuando los datos estn agrupados en una
tabla de frecuencias, y son datos continuos,
se calculan mediante la frmula:

PASOS A SEGUIR EN EL CLCULO DEL


PERCENTIL K EN DATOS AGRUPADOS
1) Obtener las frecuencias absolutas acumuladas.
2) Buscar el valor K de las observaciones, por
medio de K*n/100.
3) Localizar el resultado anterior K*n/100 en las
columnas de las frecuencias absolutas
acumuladas. Si no aparece, se toma el valor
inmediatamente anterior y se simboliza con Nj-1
y al inmediatamente superior por Nj.
4) Formula.

29
10/01/2017

EJEMPLO DATOS AGRUPADOS CON


VARIABLES CONTINUOS.
Con los siguientes datos, hallar el primer
cuartil, tercer cuartil, sexto decil, el noveno
decil, el percentil 80 y el percentil nmero 50.

Yj-1 Yj ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60

DIAGRAMAS DE CAJA Y BIGOTES


A partir del valor de la mediana y los cuartiles se
pueden representar las distribuciones
estadsticas mediante los llamados diagramas
de caja y bigotes. Una vez ordenados los datos,
se calculan los valores mnimo y mximo, los
cuartiles y la mediana. mn=1300; Q1=1675 ;
Me=1900; Q3=2150; mx=2500

30
10/01/2017

EJERCICIO
Analiza el siguiente diagrama de caja y bigotes
y calcula, a partir de l, los valores mximo y
mnimo, la mediana y los cuartiles.

RANGO INTERCUARTL
Una medida que no es afectada por los valores
extremos es el rango intercuartl (RIC). Esta
medida de variabilidad es la diferencia entre el
tercer cuartil Q3 y el primer cuartil Q1. En otras
palabras, el rango intercuartl es el rango en que
se encuentra el 50% central de los datos.
Datos atpicos
RIC= 3 1 = 1 1.5 3 1
= 3 + 1.5 3 1

31
10/01/2017

EJERCICIO
Una empresa suministra publicidad sobre
propiedades exclusivas ubicadas en Estados
Unidos. A continuacin se dan los precios de 22
propiedades. Los precios se dan en miles.
Calcula la mediana, cuartiles 1; 3 y graficar el
diagrama de caja y bigotes. (Datos originales).

32
10/01/2017

EJERCICIO
Analiza el siguiente diagrama de caja y bigotes.
Muestra los minutos que tarda en hacer efecto
un medicamento en una poblacin. Interpreta la
informacin que presenta y responde a las
preguntas.

preguntas

A qu porcentaje de la poblacin haba hecho


efecto al cabo de 30 minutos?.
Al cabo de cuntos minutos haba hecho efecto al
50 % de la poblacin?.
Cuntos minutos tard en hacer efecto al 100% de
la poblacin?
A qu porcentaje haba hecho efecto a los 55
minutos?.
Cunto tard en hacer efecto a las tres cuartas
partes de la poblacin?

33
10/01/2017

EJERCICIO
Con los siguientes datos graficar el diagrama
de caja y bigotes.

Yj-1 Yj ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60

EJEMPLO

34
10/01/2017

REGRESIN LINEAL Y CORRELACIN


La regresin y la correlacin aunque son dos conceptos
diferentes guardan una intima relacin:
La regresin es una expresin cuantitativa de la
naturaleza de la relacin entre las variables que se
expresa mediante una ecuacin matemtica, que se
puede utilizar para estimar o predecir los valores
futuros que puede tener una variable cuando se
conocen o suponen los valores de la otra variable.
La correlacin determina la fuerza de la relacin entre
las variables.

El anlisis de regresin y correlacin se constituye en


una de las principales herramientas a la hora de llevar a
cabo cualquier investigacin y/o estudios en las
mayoras de las disciplinas cientficas; de all que sea
muy utilizado en las investigaciones medicas,
ingenieriles, administrativas, sociales, econmicas,
psicolgicas etc, ya que su medio se pueden establecer
ecuaciones predictivas, la naturaleza de la relacin y su
grado o fuerza de unin.
Aunque existe una gran variedad de ecuaciones de
regresin para diferentes curvas de ajuste por mnimos
cuadrados, entre las cuales tenemos las lineales
simples y mltiples, las cuadrticas, las polinmicas, las
exponenciales , las logartmicas, las logsticas, etc.

35
10/01/2017

La finalidad de una ecuacin de regresin es estimar


los valores de una variable basndose en los valores
conocidos de la otra.
Otra forma de utilizar las ecuaciones de regresin es
para explicar los valores de una variable en funcin de
la otra, es decir, una relacin de causa y efecto.
por ejemplo:
Un economista puede intentar explicar los cambios en
la demanda de vivienda , en trminos de las altas tasas
de inters.
Los drogadictos creen que encarecimiento de la
cocana es consecuencia de los altos niveles de
fumigacin.
El profesor que el bajo rendimiento estudiantil es
consecuencia de la poca dedicacin de los estudiantes

REGRESION LINEAL
La regresin lineal simple es el mtodo mediante
el cual se intenta hallar la ecuacin de una lnea
recta que describa la relacin entre las dos
variables. En un Anlisis de Regresin simple
existe siempre una variable respuesta o
dependiente (Y) y una variable explicativa o
independiente (X). El propsito es obtener una
funcin sencilla de la variable explicativa, que sea
capaz de describir lo ms ajustadamente posible
la variacin de la variable dependiente.

36
10/01/2017

Como los valores observados de la variable


dependiente difieren generalmente de los que
predice la funcin, sta posee un error. La funcin
ms eficaz es aquella que describe la variable
dependiente con el menor error posible o, dicho
en otras palabras, con la menor diferencia entre
los valores observados y calculados. La diferencia
entre los valores observados y calculados (el
error de la funcin) se denomina variacin
residual o residuos.

Para estimar los parmetros de la funcin se


utiliza el ajuste por mnimos cuadrados. Es decir,
se trata de encontrar la funcin en la cual la suma
de los cuadrados de las diferencias entre los
valores observados y esperados sea menor. Sin
embargo, con este tipo de estrategia es necesario
que los residuos o errores estn distribuidos
normalmente y que varen de modo similar a lo
largo de todo el rango de valores de la variable
dependiente.

37
10/01/2017

Cuando la variable dependiente es cuantitativa y


la relacin entre ambas variables sigue una lnea
recta, la funcin es del tipo Y = A + BX, en donde
A es el intercepto o valor del punto de corte de la
lnea de regresin con el eje de la variable
dependiente y B es la pendiente o coeficiente de
regresin.
La finalidad de una ecuacin de regresin es
estimar los valores de una variable basndose en
los valores conocidos de la otra.

DIAGRAMA DE DISPERSIN
Es la representacin en un plano cartesiano de las
parejas de puntos de los datos de las variables
independiente y dependiente. De su observacin
podemos estimar que o cual es mejor tipo de
ajuste que se puede hacer manualmente de estos
puntos en lo que llamamos ajuste de curvas por
el mtodo de ajuste por mnimos cuadrados. En
el diagrama de dispersin se acostumbra colocar
en eje horizontal la variable independiente y en el
vertical la variable dependiente.

38
10/01/2017

Ejemplo

LA RECTA REGRESION DE MINIMOS


CUADRADOS
La recta de ajuste de mnimos cuadrados o de
regresin que aproxima a un conjunto de
parejas ordenadas (X1,Y1),(X2,Y2),.....(Xn,Yn)
tiene la siguiente ecuacin:

39
10/01/2017

ECUACIONES

EJEMPLO
COEFICIENTE CAPACIDAD
INTELECTUAL LECTORA
80 25
70 20
60 15
90 30
100 35
40 5
50 10

40
10/01/2017

COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin es el termino
que mide el poder explicativo del modelo de
regresin, es decir, la parte de la variacin de
Y explicada por la variacin de X. Se designa
como r2. El valor de este coeficiente vara
entre 0 y 1, ya que es imposible explicar mas
del 100%.; a mayor valor de r2 mayor poder
explicativo tendr nuestro modelo .

COEFICIENTE DE CORRELACIN
La correlacin mide la fuerza o grado de unin entre las
variables dependiente y la independiente y para su
medicin utilizamos el coeficiente de Pearson,
comnmente llamado coeficiente de correlacin. Este
coeficiente de correlacin y el coeficiente de
determinacin sirven para determinar la bondad de
ajuste, es decir, si el modelo encontrado es adecuado
para el anlisis de regresin lineal. El coeficiente de
correlacin es igual a la raz cuadrada del coeficiente
de determinacin y se designa con la letra r, revela
qu porcentaje del cambio en Y se explica por
un cambio en X.

41
10/01/2017

FORMULA

El valor del coeficiente de correlacin flucta entre 1 y +1


y siempre tiene el mismo signo del coeficiente de regresin
(B), es decir, la inclinacin o pendiente de la recta de
regresin . Si r > 0, la pendiente ser positiva y ascendente
pero si r< 0, la pendiente ser negativa y descendente. El
valor absoluto de r mide la fuerza de la relacin entre las
variables mientras que el signo nos dice si estn
relacionadas en forma directa o inversa. Cuando r =+1 se
dice que hay una correlacin positiva perfecta y si r = -1 , la
correlacin es negativa y perfecta. Si r = 0, se dice que no
hay correlacin , es decir no hay ninguna relacin entre las
variables. Cabe decir que hay mucha discrepancia para
decir cuales son intervalos que determinan si una
correlacin es buena, lo que es aceptado que en la medida
que nos acercamos a 1 o a +1 la correlacin es buena y a
medida que nos acercamos a cero la correlacin tiende a
ser mala.

42
10/01/2017

El grado de correlacin lo podemos clasificar en los


siguientes intervalos:

Correlacin perfecta: cuando r=1 r=-1


Correlacin excelente: (0,9<r<1) (-1<r<-0,9)
Correlacin aceptable: (0,8<r<0,9) (-0,9<r<-0,8)
Correlacin regular: (0,6<r<0,8) (-0,8<r<-0,6)
Correlacin mnima: (0,3<r<0,6) (-0,6<r<-0,3)
No hay correlacin: (-0,3<r<0,3)

EJERCICIO
El gerente tcnico del Acueducto de una ciudad,
desea establecer la relacin entre el consumo
mensual domiciliario de agua y el tamao de las
familia. Se recogi una muestra aleatoria con los
datos que se muestran en la tabla. Para los datos
de esta tabla desarrolle las siguientes tareas:
a) Dibuje un diagrama de dispersin
b)Determine manualmente la ecuacin de
regresin, el coeficiente de determinacin y el
coeficiente de correlacin

43
10/01/2017

Consumo de agua potable por grupo familiar


Tamao de la familia Galones de agua utilizados
3 700
7 1200
9 1700
4 800
10 1700
6 1000
9 1800
3 640
3 700
2 500
2 500
2 550
4 650
5 900
5 850
6 1100
6 1200
2 550
3 450
3 640
6 1200
6 1350
7 1320
8 1750

Merece la pena estudiar? Para contestar esta


pregunta un estudiante curioso de una clase de
estadstica pregunto a otros 10 estudiantes
cuantas horas dedicaron al estudio para el ltimo
examen y la nota que obtuvieron. Los datos se
muestran en la tabla.
a) Calcule la ecuacin de regresin y el coeficiente
de correlacin Cual es la conclusin ?
b) Si usted estudia 30 horas para el examen Cul
seria la calificacin que obtendras en virtud del
modelo ?

44
10/01/2017

Calificacin Horas (T)


75 30
85 40
35 15
95 45
90 40
30 10
75 25
85 35
50 15
60 20

45

También podría gustarte