Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADSTICA I
JUSTIFICACIN DE LA ASIGNATURA EN
EL PLAN DE ESTUDIOS
La estadstica es una herramienta fundamental
en la formacin profesional de Ciencias
Administrativas, Publicidad y mercadeo, Gestin
Comercial y Financiera etc; los contenidos de esta
asignatura contribuyen al desarrollo de una
actitud crtica, metdica e investigativa, mediante
la aplicacin de conocimientos y herramientas
estadsticas que contribuyan a la toma de
decisiones confiables en estudios investigativos
de corte cuantitativo y cualitativo.
1
10/01/2017
LOS PROPSITOS
LA ESTADSTICA
2
10/01/2017
HISTORIA DE LA ESTADSTICA
Historia.
DIVISIN DE LA ESTADSTICA
Estadstica Estadstica
Descriptiva Inferencial
3
10/01/2017
ESTADSTICA DESCRIPTIVA:
ESTADSTICA INFERENCIAL:
Se deriva de muestras, de observaciones
hechas slo acerca de una parte de un
conjunto numeroso de elementos y esto
implica que su anlisis requiere de
generalizaciones que van ms all de los
datos. La Estadstica Inferencial investiga
o analiza una poblacin partiendo de una
muestra tomada.
4
10/01/2017
MTODO ESTADSTICO
El conjunto de los mtodos que se utilizan para medir las
caractersticas de la informacin, para resumir los valores
individuales, y para analizar los datos a fin de extraerles el
mximo de informacin, es lo que se llama mtodos
estadsticos. Los mtodos de anlisis para la informacin
cuantitativa se pueden dividir en los siguientes seis pasos:
1. Definicin del problema.
2. Recopilacin de la informacin existente.
3. Obtencin de informacin original.
4. Clasificacin.
5. Presentacin.
6. Anlisis.
7. Toma de decisiones.
APLICACIN DE LA ESTADSTICA
La estadstica prcticamente se puede
utilizar en todas las actividades del ser
humano, donde se presenta con mayor
incidencia es en: Economa, Agricultura,
Informtica, Prevencin de Riesgos,
Control de Medio Ambiente, Qumica
Analtica, Medicina, Ingeniera,
Psicologa, etc.
5
10/01/2017
DEFINICIONES BSICAS
LA POBLACIN: es el conjunto de todos los elementos
sobre los que se quiere realizar un estudio estadstico.
LA MUESTRA: es una parte representativa de la poblacin
que se elige para hacer el estudio estadstico.
VARIABLE: Caracterstica de la poblacin que se analiza en
el estudio estadstico. Hay dos tipos de variables
estadsticas:
Cuantitativas, (variables) son los que se pueden
expresar con nmeros (estatura de todas la personas
de la U.) se pueden describir por medio nmeros.
Cualitativas, (atributos) son los que no se pueden
expresar con nmeros (el estado civil, el sexo, la raza,
etc.) se pueden describir por medio de palabras.
VARIABLES CUANTITATIVAS
Datos Discretos: Son aquellos que surgen por el
procedimiento de conteo. Es decir, los datos
discretos toman valores enteros (ej., el nmero
de hijos por familia; el nmero de automviles
que pasan por una avenida en una hora, etc.).
6
10/01/2017
EJERCICIOS
1. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes caracteres
estadsticos estudiados en los coches de cierta
marca:
a) Modelo de coche
b) Color de su carrocera
c) Potencia de su motor
d) Consumo medio en 100 km
e) Nmero de piezas
EJERCICIOS
2. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes
caracteres estadsticos estudiados en una
fbrica de tornillos:
a) La produccin diaria de tornillos.
b) Las longitudes de los tornillos.
c) El color de los tornillos.
d) Las anchuras de los tornillos.
7
10/01/2017
QU ES UN DATO?
Dato es una representacin simblica (numrica,
alfabtica, etc.), un atributo o una caracterstica
de una entidad. El dato no tiene valor semntico
(sentido) en s mismo, pero si recibe un
tratamiento (procesamiento) apropiado, se
puede utilizar en la realizacin de clculos o toma
de decisiones. Es de empleo muy comn
prcticamente en cualquier disciplina cientfica.
Un Conjunto de datos es una coleccin de datos
normalmente tabulada. Por cada elemento (o
individuo) se indican varias caractersticas.
8
10/01/2017
DISTRIBUCIN DE FRECUENCIAS
Es un mtodo para clasificar, organizar y
resumir datos.
SMBOLOS:
TABLAS DE FRECUENCIAS
Variables discretas:
Ejemplo: En un estudio con un grupo de 2.000 personas
que haban sido tratadas psicolgicamente por problemas
de ansiedad, se desea preguntar a las mismas, cuntas
veces haban sufrido un ataque de ansiedad desde que
termin el tratamiento recibido. Pero no se quiere
realizar una investigacin exhaustiva, por lo cual se
selecciono una muestra de 20 personas. El resultado de
esta encuesta, se anota a continuacin:
9
10/01/2017
TABLAS DE FRECUENCIAS
N=
n=
Yi ni hi Ni Hi
0 7 35% 7 35%
1 3 15% 10 50%
2 4 20% 14 70%
3 2 10% 16 80%
4 4 20% 20 100%
n= 20 100%
10
10/01/2017
11
10/01/2017
TABLAS DE FRECUENCIAS
Variables continuas:
Tomamos como ejemplo una muestra de 20
alumnos a fin de conocer su peso en kilos:
1 67,9 6 56,4 11 50,2 16 47,4
2 61,6 7 75,3 12 80,2 17 78,7
3 64,4 8 65,8 13 68,5 18 43,5
4 62,6 9 72,3 14 61,1 19 59,0
5 47,2 10 58,3 15 68,8 20 99,5
12
10/01/2017
LA REGLA DE STURGES
Consiste en obtener una primera aproximacin de
cuntas clases debe tener la serie de clases y
frecuencias mediante la raz cuadrada del nmero
de elementos. Ejemplo: se tienen 72 salarios de una
empresa, la raz cuadrada de 72 es 8.49, la
sugerencia inicial ser utilizar 9 clases para construir
las dems clases segn el nmero de datos. Los
salarios mximo y mnimo 179.2 y 74.65, lo que da
una diferencia (rango) de 104.55. Y como la regla de
Sturges indica 9 clases, cada una debe medir
aproximadamente 104.55/9 = 11.61 que
redondeado a 12 si es una variable de tipo discreta.
Calcular:
Yj-1 = Lmite inferior del intervalo Y
Yj = Lmite superior del intervalo Y
Donde Yj-1 - Yj = C
Y0 = Xmin Yj-1 Yj
Y0 Y1
Y1 Y2
Y2 Y3
Y3 Y4
Y4 Y5
Calcular: frecuencia absoluta, relativa, etc.
13
10/01/2017
PASOS
1. X MAX= 99,5
X MIN= 43,5
2. R= 55,9
3. n= 20
m= 5 5 < m < 16
4. C= 11,19 m= 1 + 3.3 log n
m= n
Yj-1 Yj ni hi Ni Hi
1 43,54 54,73 4 20,0% 4 20,0%
2 54,73 65,92 8 40,0% 12 60,0%
3 65,92 77,11 5 25,0% 17 85,0%
4 77,11 88,30 2 10,0% 19 95,0%
5 88,30 99,49 1 5,0% 20 100,0%
RESPUESTA
Ejercicio
En un barrio de Bogot, en el ao 2012, se entrevist a
un cierto nmero de mujeres casadas nacidas entre los
aos 1935 y 1944 y se les pregunt a qu edad
contrajeron matrimonio. A continuacin se muestran
los datos correspondientes a 50 de estas mujeres:
Realizar tablas de frecuencias, con 6 intervalos.
15 17 25 15 16 11 15 13 12 10
15 14 16 14 17 13 14 20 29 19
16 18 10 18 12 11 20 34 13 22
19 14 17 16 16 15 12 24 25 9
21 15 13 23 24 10 10 16 14 18
14
10/01/2017
15
10/01/2017
MEDIDAS DE TENDENCIA
CENTRAL
Media (aritmtica, ponderada, geomtrica,
armnica)
Mediana
Moda
MEDIA ARITMTICA
Datos originales: El ndice de tendencia central
ms utilizado es la media. Se define como la
suma de los valores observados, dividida por
el nmero de ellas. Se representa con la X, en
maysculas , con una barra horizontal encima.
Datos originales:
14 25 14 8 22 14 14 14 13 21 15
16
10/01/2017
MEDIA ARITMTICA
Datos agrupados:
17
10/01/2017
LA MEDIANA
La mediana de un conjunto de datos es un
valor tal, que cuando escribimos todos los
datos ordenados de menor a mayor ocupa el
lugar central de la lista ordenada. Si el nmero
de datos es impar, la mediana es el dato
central; si el nmero de datos es par, la
mediana es la media de los dos datos
centrales.
X1= 27
X2= 38
X3= 23
Nmero par de observaciones. X4= 28
X5= 36
X6= 39
X7= 35
X8= 26
18
10/01/2017
CASO A
Variables discretas
CASO B
CASO A
Variables continuas
CASO B
19
10/01/2017
EJERCICIOS
Variables discretas, caso a:
Yj nj Nj
0 2 2
1 3 5
2 6 11
3 5 16
4 4 20
EJERCICIOS
Variables continuas, caso a:
Yj-1 Yj ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 5 10
14,1 18 6 16
18,1 22 4 20
20
10/01/2017
LA MODA
La moda es el valor de la variable que ms
veces se repite, y en consecuencia, en una
distribucin de frecuencias, es el valor de la
variable que viene afectada por la mxima
frecuencia de la distribucin.
EJERCICIOS
Datos originales:
14 25 14 8 22 14 14 14 13 21 15
21
10/01/2017
EJERCICIOS
Datos agrupados:
Variables discretas Yj
0
nj
2
1 3
2 6
3 5
4 4
Yj-1 Yj ni Yi
Variables continuas 2,1 6 2 4,05
6,1 10 3 8,05
10,1 14 5 12,05
14,1 18 6 16,05
18,1 22 4 20,05
MEDIDAS DE DISPERSIN
Las medidas de dispersin tratan de medir el grado de
dispersin que tiene una variable estadstica en torno a
una medida de posicin o tendencia central,
indicndonos lo representativa que es la medida de
posicin. A mayor dispersin menor representatividad
de la medida de posicin y viceversa.
22
10/01/2017
EJEMPLOS
Una aseguradora vende 5 plizas de seguros, sus
valores fueron 110, 145, 125, 95 y 150 dlares, hallar
la media, la varianza y la desviacin estndar.
Hallar la varianza y la desviacin estndar de la variable
ansiedad, que siente una persona cuando se encuentra
mucha gente alrededor de ella, de una muestra de 7
personas. 9; 3; 10; 5; 9; 4; 9
Calcular la varianza y la desviacin estndar para la
variable Tiempo empleado en completar un
laberinto por una muestra de 20 ratas:
Tiempo (seg) ni
9 3
10 8
11 6
12 2
13 1
23
10/01/2017
DESVIACIN ESTNDAR
Desviacin estndar: tambin llamada desviacin tpica, es
una medida de dispersin usada en estadstica que nos dice
cunto tienden a alejarse los valores puntuales del
promedio en una distribucin. Especficamente, la
desviacin estndar es "el promedio de la distancia de cada
punto respecto del promedio". Se suele representar por
una S o con la letra sigma, segn se calcule en una muestra
o en la poblacin.
Una desviacin estndar grande indica que los puntos estn
lejos de la media, y una desviacin pequea indica que los
datos estn agrupados cerca de la media.
POBLACIONAL
MUESTRAL
COEFICIENTE DE VARIACIN
Ciudad A
X = 240.000
Sx = 3.300
Ciudad B
X = 150.000
Sx = 2.900
24
10/01/2017
MEDIDAS DE ASIMETRA
En una distribucin simtrica se cumple que: X=Me=Mo. Ver figura
(c).
Si en una distribucin existen muy pocos valores altos respecto a los
dems, entonces la media aritmtica se ver influenciada por stos y
la asimetra es a la derecha o asimetra positiva o distribucin con
sesgo positivo. En stas condiciones: X>Me>Mo. Ver figura (a)
Si en una distribucin existen muy pocos valores bajos respecto a los
dems, entonces, la media aritmtica se ver influenciada por stos
y la asimetra ser a la izquierda o asimetra negativa o distribucin
con sesgo negativo. En estas condiciones: X< Me < Mo. Ver figura (b)
25
10/01/2017
EJEMPLO
El tiempo utilizado para atender entrevistas de
unos aspirantes a empleo en una empresa, se
clasifican de acuerdo a la siguiente tabla.
NMERO DE
TIEMPO NECESARIO ENTREVISTAS
(ni)
1 12 20 6
2 21 29 9
3 30 38 14
4 39 47 72
5 48 56 95
n= 196
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
Curtosis o Apuntamiento es utilizado para mostrar el grado
apuntamiento o de concentracin de los datos.
En la medida en que los diferentes tramos de la variable
presenten frecuencias muy similares en todo su recorrido.
Esta situacin contribuye a que la dispersin sea alta. Una
distribucin con stas caractersticas, se denomina
PLATICRTICA O ACHATADA.
26
10/01/2017
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
Por el contrario, si existe una cantidad muy
significativa de datos que se encuentran
concentrados en algn tramo de la variable,
entonces decimos que la distribucin es
altamente concentrada o que tiene alta
curtosis. Una distribucin de stas
caractersticas se denomina LEPTOCRTICA
O APUNTADA.
MEDIDAS DE CURTOSIS O
APUNTAMIENTO
Si la concentracin es intermedia entre las dos
situaciones anteriores, se dice que la distribucin es
MESOCRTICA o MODERADA CONCENTRACIN DE LOS
DATOS. Una distribucin con esta caracterstica es
propia de la distribucin normal. Una manera de medir
el grado de curtosis, es mediante el coeficiente de
curtosis A4.
27
10/01/2017
COEFICIENTE DE CURTOSIS A4
ste coeficiente, resulta del cociente existente entre el momento de
orden cuatro respecto a la media y la desviacin estndar elevada a la
cuarta.
MEDIDAS DE POSICIN
Las medidas de posicin dividen un conjunto
ordenado de datos en grupo con la misma
cantidad de individuos.
28
10/01/2017
PERCENTIL
Son 99 valores que dividen en cien porciones
iguales el conjunto de datos ordenados.
Ejemplo, el percentil de orden 15 deja por
debajo al 15% de las observaciones, y por
encima queda el 85%.
Cuando los datos estn agrupados en una
tabla de frecuencias, y son datos continuos,
se calculan mediante la frmula:
29
10/01/2017
Yj-1 Yj ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60
30
10/01/2017
EJERCICIO
Analiza el siguiente diagrama de caja y bigotes
y calcula, a partir de l, los valores mximo y
mnimo, la mediana y los cuartiles.
RANGO INTERCUARTL
Una medida que no es afectada por los valores
extremos es el rango intercuartl (RIC). Esta
medida de variabilidad es la diferencia entre el
tercer cuartil Q3 y el primer cuartil Q1. En otras
palabras, el rango intercuartl es el rango en que
se encuentra el 50% central de los datos.
Datos atpicos
RIC= 3 1 = 1 1.5 3 1
= 3 + 1.5 3 1
31
10/01/2017
EJERCICIO
Una empresa suministra publicidad sobre
propiedades exclusivas ubicadas en Estados
Unidos. A continuacin se dan los precios de 22
propiedades. Los precios se dan en miles.
Calcula la mediana, cuartiles 1; 3 y graficar el
diagrama de caja y bigotes. (Datos originales).
32
10/01/2017
EJERCICIO
Analiza el siguiente diagrama de caja y bigotes.
Muestra los minutos que tarda en hacer efecto
un medicamento en una poblacin. Interpreta la
informacin que presenta y responde a las
preguntas.
preguntas
33
10/01/2017
EJERCICIO
Con los siguientes datos graficar el diagrama
de caja y bigotes.
Yj-1 Yj ni Ni
3,1 8,1 14 14
8,1 13,1 15 29
13,1 18,1 8 37
18,1 23,1 6 43
23,1 28,1 7 50
28,1 33,1 10 60
EJEMPLO
34
10/01/2017
35
10/01/2017
REGRESION LINEAL
La regresin lineal simple es el mtodo mediante
el cual se intenta hallar la ecuacin de una lnea
recta que describa la relacin entre las dos
variables. En un Anlisis de Regresin simple
existe siempre una variable respuesta o
dependiente (Y) y una variable explicativa o
independiente (X). El propsito es obtener una
funcin sencilla de la variable explicativa, que sea
capaz de describir lo ms ajustadamente posible
la variacin de la variable dependiente.
36
10/01/2017
37
10/01/2017
DIAGRAMA DE DISPERSIN
Es la representacin en un plano cartesiano de las
parejas de puntos de los datos de las variables
independiente y dependiente. De su observacin
podemos estimar que o cual es mejor tipo de
ajuste que se puede hacer manualmente de estos
puntos en lo que llamamos ajuste de curvas por
el mtodo de ajuste por mnimos cuadrados. En
el diagrama de dispersin se acostumbra colocar
en eje horizontal la variable independiente y en el
vertical la variable dependiente.
38
10/01/2017
Ejemplo
39
10/01/2017
ECUACIONES
EJEMPLO
COEFICIENTE CAPACIDAD
INTELECTUAL LECTORA
80 25
70 20
60 15
90 30
100 35
40 5
50 10
40
10/01/2017
COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin es el termino
que mide el poder explicativo del modelo de
regresin, es decir, la parte de la variacin de
Y explicada por la variacin de X. Se designa
como r2. El valor de este coeficiente vara
entre 0 y 1, ya que es imposible explicar mas
del 100%.; a mayor valor de r2 mayor poder
explicativo tendr nuestro modelo .
COEFICIENTE DE CORRELACIN
La correlacin mide la fuerza o grado de unin entre las
variables dependiente y la independiente y para su
medicin utilizamos el coeficiente de Pearson,
comnmente llamado coeficiente de correlacin. Este
coeficiente de correlacin y el coeficiente de
determinacin sirven para determinar la bondad de
ajuste, es decir, si el modelo encontrado es adecuado
para el anlisis de regresin lineal. El coeficiente de
correlacin es igual a la raz cuadrada del coeficiente
de determinacin y se designa con la letra r, revela
qu porcentaje del cambio en Y se explica por
un cambio en X.
41
10/01/2017
FORMULA
42
10/01/2017
EJERCICIO
El gerente tcnico del Acueducto de una ciudad,
desea establecer la relacin entre el consumo
mensual domiciliario de agua y el tamao de las
familia. Se recogi una muestra aleatoria con los
datos que se muestran en la tabla. Para los datos
de esta tabla desarrolle las siguientes tareas:
a) Dibuje un diagrama de dispersin
b)Determine manualmente la ecuacin de
regresin, el coeficiente de determinacin y el
coeficiente de correlacin
43
10/01/2017
44
10/01/2017
45