Está en la página 1de 59

ESTADISTICA

Ing. Edilberto Huamn Castro


Marzo 2013
1
QU ES LA ESTADSTICA?
Estadstica I 2
RECOLECTAR
ORGANIZAR
PRESENTAR
ESTADSTICA
INTEPRETAR
DATOS
ANALIZAR
Toma de
decisiones
efectiva
Estadstica I 3
4
Qu es la estadistica?
Estadstica es la ciencia de:
Recolectar
Describir
Organizar
Interpretar
para transformarlos en informacin,
para la toma mas eficiente de
decisiones.
Datos
5
Quienes usan la
estadstica?
Organismos oficiales.
Diarios y revistas.
Polticos.
Deportes.
Marketing.
Control de calidad.
Administradores.
Ingenieros
Investigadores cientficos.
Mdicos
etc.
6
Estadstica
ESTADISTICA
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los ltimos aos.

En qu areas se aplica la estadstica?
Actualmente se aplica en todas las reas del saber, por ejemplo en Sociologa, Ingeniera,
Educacin, Psicologa, Administracin, Economa, Medicina, Ciencias Polticas,
entre otras.

Ejemplos de su aplicacin son:

1) En ingeniera, se utiliza las tcnicas estadsticas para una mejor aplicacin de los
datos y en investigacin.
2) En Administracin de Empresas: la estadstica se utiliza para evaluar un producto
antes de comercializarlo.

2) En Economa: para medir la evolucin de los precios mediante nmeros ndice o para
estudiar los hbitos de los consumidores a travs de encuestas de presupuestos
familiares.
7
Estadstica
Ejemplos de su aplicacin:

3) En Ciencias Polticas: para conocer las preferencias de los electores antes de una
votacin mediante sondeos y as orientar las estrategias de los candidatos.

4) En Sociologa: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.

5) En Psicologa: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).

6) En Medicina: uno entre muchos usos de la estadstica, es para determinar el estado de
salud de la poblacin.

En general en las Ciencias Sociales, la estadstica se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
8
Estadstica
Etapas de un estudio estadstico

Un anlisis estadstico se lleva a cabo siguiendo las etapas habituales en el llamado
mtodo cientfico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigacin y
precisar el universo o poblacin.

2) Recogida de la informacin: consiste en recolectar los datos necesarios
relacionados al problema de investigacin.

3) Anlisis descriptivo: consiste en resumir los datos disponibles para extraer la
informacin relevante en el estudio.

4) Inferencia estadstica: consiste en suponer un modelo para toda la poblacin
partiendo de los datos analizados para obtener conclusiones generales.

5) Diagnstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la poblacin
DESCRIPTIVA
Organiza, resume y
presenta los datos de
manera informativa
Distribucin de
frecuencias, grficas,
medidas tendencia central
INFERENCIAL
Conocer algo sobre una
poblacin basndose en
una muestra
Poblacin: conjunto individuos,
objetos o medidas
Muestra: una parte de la
poblacin
TIPOS DE ESTADSTICA
Estadstica I 9
10
Estadstica
Esquema de las etapas de un estudio estadstico
AREA DE INTERES
DATOS
Tema de Investigacin
-Antecedentes Previos
-Objetivos
-Preguntas de Investigacin
-Posibles Hiptesis
-Unidad de Anlisis
-Poblacin
-Variables
ORGANIZAR Y RESUMIR
ESTADSTICA DESCRIPTIVA
(Tablas, Grficos, Medidas
Descriptivas, etc.)
INTERPRETACIN
INFERENCIA ESTADSTICA
Poblacin o Muestra?
CONCLUSIONES
Poblacin
Muestra
Probabilidad
INFORMACIN
11
Estadstica
Introduccin
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminacin salarial debida al sexo de
la persona empleada.

2) Se quiere determinar el perfil de los trabajadores en trminos de condiciones
econmicas y sociales en diferentes comunidades.

3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a
vestuario, alimentacin, ocio y vivienda.

4) Se quiere determinar las tallas estndar en vestuario para mujeres tarmeas.

5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de
distintas empresas del pas.

6) Se quiere determinar el perfil sociodemogrfico de los estudiantes de una Universidad.

7) Se quiere estudiar el gasto en telfono mvil mensual de los estudiantes de una
Universidad, y si ste tiene alguna relacin con su edad u otras caractersticas.
12
Poblacin y Muestra
Poblacin
Muestra
13
POBLACIN : Es el total de unidades de anlisis que son tema de estudio.
Muestra: 60 trabajadores de empresas de comunicacin
Unidad de anlisis: Trabajador de empresa de comunicacin
Variables: sexo, edad, salario, N de horas de trabajo, etc.
Poblacin:
Las personas que
trabajan en empresas de
comunicacin
Estadstica
MUESTRA: Es un conjunto de unidades de anlisis provenientes de una poblacin.
Muestra
14
Parmetro: Valor numrico que resume
todos los datos de una poblacin completa.
Se utilizan letras griegas para simbolizar un parmetro
como ser y o .
Ejemplos: La calificacin promedio del secundario en el
momento de admisin de todos los estudiantes que han asistido
alguna vez a la Universidad de Lujan o la proporcin de
estudiantes cuyo lugar de origen era distinto del partido de Lujan.
Estadstica: Valor numrico que resume los
datos de una muestra. Se utilizan letras del
alfabeto espaol para simbolizarlas como ser x y s .
Ejemplo: La edad promedio registrada en una encuesta de 150
consumidores de choripanes.
Parmetro y Estadstica
15
Variable: Caracterstica de inters sobre
cada elemento individual de una
poblacin o muestra.
Dato: Valor de la variable asociada a un
elemento de la poblacin o muestra. Este
valor puede ser un nmero, una palabra
o un smbolo.
Ejemplo: La familia Gonzlez tiene 4 miembros,
sus ingresos mensuales son de $685, 2 son de
sexo femenino y 2 masculino.
Variable
16
Variable (cont.)
Datos: Conjunto de valores recolectados
para la variable de cada uno de los
elementos que pertenecen a la poblacin
o muestra.
Ejemplo1: El conjunto de 54 cantidad de
miembros recolectados de 54 familias residentes
en Tarma.
Ejemplo2: El conjunto de las calificaciones de
los 43 estudiantes de estadstica de la carrera de
Sistemas
17
VARIABLE: es lo que se va a medir y representa una caracterstica de la UNIDAD DE ANLISIS.
QUINES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Anlisis de una
Poblacin o una Muestra
1. En un colegio se quiere saber cul es el deporte ms
practicado por los alumnos.
Poblacin: Todos loa alumnos del Colegio.
Muestra: Cinco alumnos de cada curso, elegidos por sorteo.
Individuo: Alumno o alumna.
Dato: Deporte que practica

2. Se desea evaluar cul es la estatura de los alumnos del
Colegio.
Poblacin: Todos los alumnos del colegio.
Muestra: 10 alumnos por curso, elegidos al azar.
Individuo: Alumno o alumna (cada uno de los 10 elegidos de
cada curso)
Dato: Estatura
Llevamos a un diagrama y complementamos con un ejemplo:
18
TIPOS DE VARIABLES
Variables Cuantitativas
Variable: corresponde a la caracterstica de la Unidad de Anlisis
Intervalo
DISCRETA
Variables Cualitativas
CONTINUA
Toma valores enteros
Ejemplos: Nmero de Hijos, Nmero de
empleados de una empresa, Nmero de
asignaturas aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc.
Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
ORDINAL NOMINAL
Caracterstica o cualidad
cuyas categoras no tienen
un orden preestablecido.
Ejemplos: Sexo, Deporte
Favorito, etc.
Caracterstica o cualidad cuyas
categoras tienen un orden
preestablecido.
Ejemplos: Calificacin (S, N, A);
Grado de Inters por un tema, etc.
Estadstica
Tipos de Variables(cont.)
Cuantitativa o Numrica Cuantifica un
elemento de la poblacin. Los valores que
puede asumir constituyen un espacio
mtrico, por lo tanto las operaciones
aritmticas, como sumar y obtener
promedios,son significativas.
Ejemplos: Cantidad de Habitaciones, Nmero de
hijos, Kilmetros recorridos, Tiempo de vuelo,
Ingreso, etc..
Las variables cuantitativas se pueden
clasificar a su vez en discretas o continuas.
Cuantitativas Discretas: solo pueden
asumir ciertos valores y normalmente hay
huecos entre ellos. Son conteos
normalmente.
Ejemplo1: cantidad de materias aprobadas.(1, 2,3 ......)
Ejemplo2: cantidad de hijos (1, 2, 3,4...)
1-9
Tipos de Variables(cont.)
Las variables cuantitativas se pueden
clasificar a su vez en discretas o continuas.
Cuantitativas Continuas: puede asumir
cualquier valor dentro del rango de
medicin. Normalmente se miden
magnitudes como ser longitud, superficie,
volumen, peso, tiempo, dinero
Ejemplo 1: Peso al nacer.
Ejemplo 2: Salario de un empleado
Ejemplo 3: Tiempo de viaje en mnibus entre Tarma y
Huancayo
1-9
Tipos de Variables(cont.)
1-12
Escalas de Medicin
Las variables cualitativas se miden en
escala nominal o ordinal.
Nominal: los elementos solo pueden ser
clasificados en categoras pero no se da
un orden o jerarqua
Ejemplo 1: Barrio de residencia de los alumnos .
Ejemplo 2: Color de ojos
Ejemplo 3: Simpatizante de un club de futbol
Cualitativa o de Atributos Clasifica o
describe un elemento de la poblacin. Los
valores que puede asumir no constituyen un
espacio mtrico, por lo tanto las
operaciones aritmticas, como sumar y
obtener promedios, no son significativas.
Ejemplos: Sexo, Nacionalidad, Marcas de auto, Grado
de Satisfaccin con la Universidad, etc..
1-7
Tipos de Variables
1-12
Escalas de Medicin
Las variables cualitativas se miden en
escala nominal o ordinal.
Ordinal: los elementos son clasificados en
categoras que tienen un orden o jerarqua,
la diferencia entre valores no se pueden
realizar o no son significativas.
Ejemplo 1: Grado de satisfaccin en el uso de un
servicio pblico .
Ejemplo 2: Ocupacin
Escalas de Medicin
Las variables cuantitativas se miden en
escala de intervalo o razn.
Intervalo: los elementos son clasificados
en categoras que tienen un orden o
jerarqua, la diferencia entre valores se
pueden realizar y son significativas.La
diferencia entre dos valores consecutivos
es de tamao constante y no existe el 0
absoluto.
Ejemplo: Temperatura en grados Celsius
Escalas de Medicin
Las variables cuantitativas se miden en
escala de intervalo o razn.
Razon: los elementos son clasificados en
categoras que tienen un orden o jerarqua,
la diferencia entre valores se pueden
realizar y son significativas. Existe el 0
absoluto, es decir la ausencia de la
variable medida.
Ejemplo 1: Tiempo de vuelo.
Ejemplo 2: Ingresos familiares

Resumen de Tipos de variables y
Escalas de Medicin

Nominal
Ordinal
Escala de medicin
Cualitativa o Atributo
Intervalo
Razn
Escala de medicin
Discreta
Continua
Cuantitativa o Nmerica
Variables
28
Frecuencia: desde un conjunto de unidades, corresponde al Nmero o Porcentaje de veces que se
presenta una caracterstica.
DISCRETA
CONTINUA
ORDINAL
NOMINAL
TIPO FRECUENCIA
Frecuencia Absoluta (F) Frecuencia Relativa (f)
Frecuencia Absoluta
Acumulada (FAA)
Frecuencia Relativa
Acumulada (fra)
DISCRETA
CONTINUA
NOMINAL
ORDINAL
Variable
Cuantitativa
Variable
Cualitativa
Variable
Cuantitativa
Variable
Cualitativa
Estadstica
29
Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- N de Empleados: se refiere al nmero de empleados en las lneas de produccin. (cuantitativa discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las reas de
produccin. (cuantitativa continua)
- Calificacin: calificacin realizada por una institucin pblica sobre cumplimiento de ciertos estndares
(Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)
Industria n Tipo N Empleados Superficie Calificacin
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
Problema de Investigacin: Se quiere establecer el perfil de las industrias
de conserva en funcin de algunas caractersticas.
Unidad de Anlisis: Industria de Conserva
Poblacin: Industrias de Conservas del pas
Datos
EJEMPLO
Estadstica
30
EJEMPLO
TABLAS DE
FRECUENCIA
Tipo de
Industria
Frecuencia
Absoluta (F
j
)
Frecuencia
Relativa (f
j
)
Porcentaje
(%)
A
B
C
D
Total 300 1 100
Calificacin
Frec.
Absoluta (F
j
)
Frec.Relativa
(f
j
) o %
Frec. Absol.
Acum. (FAA
j
)
Frec. Relat.
Acum. (fra
j
) o %
Muy Bien
Bien
Regular
Mal 300 1 (o 100)
Total 300 1 (o 100)
Numero de
Empleados
Frec.
Absoluta (F
j
)
Frec.Relativa
(f
j
) o %
Frec. Absol.
Acum. (FAA
j
)
Frec. Relat.
Acum. (fra
j
) o %
<100
[100-150[
.
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie
(mt
2
)
Frec.
Absoluta (F
j
)
Frec.Relativa
(f
j
) o %
Frec. Absol.
Acum. (FAA
j
)
Frec. Relat.
Acum. (fra
j
) o %
<200
[200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)
(1)
(2)
(3)
(4)
Problema de Investigacin: Se quiere establecer el perfil de las industrias de conserva en
funcin de algunas caractersticas.
Unidad de Anlisis: Industria de Conserva
Poblacin: Industrias de Conservas del pas
Estadstica
31
Elementos de una tabla de frecuencia cuando la variable es continua (x)
Intervalo
Centro
de clase Amplitud F f FAA fra
I
1
c
1
a
1

I
2
c
2
a
2

.
.
I
k
c
k
a
k
n 1
Total n 1

[L
I1
; L
S1
[
[L
I2
; L
S2
[
[L
Ik
; L
Sk
]
a
j
= (L
Sj
L
Ij)
) c
j
= (L
Ij)
+ L
Sj
)/2
Estadstica
32
Ejercicio: confeccin de una tabla de frecuencia para una variable continua
10,5 10,7 9,5 10,5 11,8 11,2
12,0 10,3 13,5 12,3 10,6 9,8
10,7 11,5 11,1 10,6 9,3 12,9
10,4 7,5 10,2 8,7 10,9 9,9
11,7 10,3 10,6 10,5 11,9 11,0
13,9 10,6 10,0 10,8 10,6 -
7,3 8,0 8,5 12,5 9,7 -

Los datos corresponden a la edad de los
hijos de los trabajadores de una empresa
7,3 9,7 10,4 10,6 11,1 12,3
7,5 9,8 10,5 10,6 11,2 12,5
8,0 9,9 10,5 10,7 11,5 12,9
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 -
9,5 10,3 10,6 11,0 12,0 -

Datos ordenados de menor a mayor
1) Construya un Diagrama de Tallo y Hoja
2) Cul es la variable?; Cul es la Unidad de
anlisis?; Cunto vale n?; Cul es el rango
de la variable?.
3) Sobre una Tabla de frecuencia: Cuntos
intervalos podra construir?; Cul es la
amplitud de cada intervalo?; Cuntas
medidas de frecuencia puede obtener para
cada intervalo?.
4) Construir tabla de frecuencia para la
variable: Intervalos, centro de clase,
amplitud, frecuencias.
Realice la siguiente actividad
Diagrama de Tallo y Hoja: permite organizar los
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automticas para
ordenar los datos.
Estadstica
33
TIPOS DE GRFICOS 1. Grfico de Sectores Circulares (de Torta)
Distribucin de las unidades de anlisis de
acuerdo a variable 1
A
20%
D
10%
C
40%
B
30%
Distribucin de las unidades de
anlisis de acuerdo a variable 1
B
30%
C
40%
D
10%
A
20%
Distribucin de las unidades de
anlisis de acuerdo a variable 1
B
30%
C
40%
D
10%
A
20%
Estadstica
34
TIPOS DE GRFICOS 2. Grfico de Barras
Numero de unidades de anlisis
de acuerdo a variable 1
0
100
200
300
400
500
A B C D
variable 1
N

Porcentaje de unidad de anlisis de acuerdo a


variable 1
0 20 40 60 80 100
A
B
C
D
v
a
r
i
a
b
l
e

1
% unidad de anlisis
-Este tipo de grfico se utiliza generalmente para
representar la frecuencia de las categoras de una
variable cualitativa.
-Cuando una variable es cuantitativa se puede utilizar
este tipo de grfico slo si la variable se ha
transformada en categoras.
-Hay distintas versiones de estos grficos (por ejemplo
en Excel), y en algunos casos son muy tiles para
describir el comportamiento de una variable en distintos
grupos.
Proporcin de unidad de anlisis de acuerdo a
variable 1
0 0,2 0,4 0,6 0,8 1
A
B
C
D
v
a
r
i
a
b
l
e

1
Proporcin de unidad de anlisis
Estadstica
35
Histograma
- Permite la representacin de
la frecuencia de una variable
Cuantitativa.
- El eje x se refiere a la
variable.
- El eje y se refiere a la
frecuencia (N , %).
- Cada barra representa la
frecuencia de la variable en la
poblacin en estudio (o la
muestra).
-El histograma se puede
construir desde los datos de la
tabla de frecuencia de la
variable en estudio.
TIPOS DE GRFICOS 3. Histograma
14 13 12 11 10 9 8 7
15
10
5
0
edad
F
r
e
c
u
e
n
c
i
a
N


edad
Histograma
Distribucin de los hijos de trabajadores
de la empresa de acuerdo a edad
Ejemplo
En el grfico se puede observar el nmero de
hijos , de menor edad (7-8 aos), las de mayor
edad (13-14 aos); y adems que la mayora de
hijos de los trabajadores estn entre los 10 y 12
aos.
Estadstica
36
TIPOS DE GRFICOS 5. Polgono de Frecuencia
edad
14 13 12 11 10 9 8 7
15
10
5
0
edad
F
r
e
c
u
e
n
c
i
a
N


Distribucin de los hijos de trabajadores
de la empresa de acuerdo a edad
-Esta representacin se basa en
el Histograma.
-Slo es til para variables
cuantitativas.
-El eje x se refiere a la
variable.
- El eje y se refiere a la
frecuencia (N , %).
-Los puntos que permiten la
unin de las lneas representa
el centro de clase (o marca de
clase).
Estadstica
37
TIPOS DE GRFICOS 5. Diagrama de Caja
- Permite identificar grficamente la
mediana, los cuartiles 1 y 3
(percentiles 25 y 75), mnimo y
mximo de una variable.
- Slo es til para variables
cuantitativas.
-El eje x permite identificar la
poblacion en estudio.
- El eje y representa los valores de la
variable en estudio.
Estadstica
1473 584 N =
Hombres Mujeres
E
d
a
d
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron
angioplasta entre 1980 y 2000
38
TIPOS DE GRFICOS 6. Otros
Nmero de alumnos matriculados en la
Carrera A segn ao de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
ao de ingreso
N


d
e

a
l
u
m
n
o
s
Nmero de alumnos matriculados en la
Carrera B segn ao de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
ao de ingreso
N


d
e

a
l
u
m
n
o
s
Nmero de alumnos matriculados en las Carreras
segn ao de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
ao ingreso
N


d
e

a
l
u
m
n
o
s
Carrera B
Carrera A
ao de ingreso Carrera A Carrera B
1998 60 80
1999 55 70
2000 80 50
2001 40 60
2002 68 50
2003 70 75
N de alumnos
Estadstica
39
OBSERVACIONES
* El Tipo de Grfico seleccionado va a depender de la variable en estudio.
* El Grfico debe contener un Ttulo General y la identificacin de cada
eje (variable en estudio y frecuencia).
* En ocasiones resulta ms ilustrativo un grfico que una tabla de
frecuencia.
* Al igual que las tablas, los grficos deben ser auto-explicativos.
Variables Cuantitativas
variable = x
i individuo el en variable la de valor =
i
x
n i ,..., 1 =
nc c c c
n
i
= + + =

=

1

= =
= + + =
n
i
i n
n
i
i
x c cx cx cx
1
1
1

b x a b ax b ax b ax
n
i
i n
n
i
i
+ = + + + + = +

= = 1
1
1
) ( ) ( ) (
2 2
1
1
2
n
n
i
i
x x x + + =

=

2
1
2
1
) ( ) (
n
n
i
i
x x x + + =

=

) ( ) ( ) (
1 1
1
n n
n
i
i i
y x y x y x + + + + = +

=

) ( ) ( ) (
1 1
1
n n
n
i
i i
y x y x y x + + =

=

variable = y
i individuo el en variable la de valor =
i
y
NOTACION
constantes : , , c b a
Estadstica
40
MEDIDAS DE TENDENCIA CENTRAL
-Media Aritmtica (Promedio)
-Mediana
-Moda
n
x
x
n
i
i

=
=
1
Media Aritmtica o Promedio
Mediana
) ( E
M
k
x =
2
M
) 1 ( ) (
E
+
+
=
k k
x x
x
1
x
2
x


n
x


Datos Cuantitativos
x
) 1 (
x
) 2 (
x


) (n
x


Datos Cuantitativos ordenados de menor a mayor
Si n es par
Si n es impar
centro del dato
) (
=
k
x
repite" se ms que dato el " M
o
=
Moda Datos
Cualitativos y Cuantitativos
Estadstica
41
Percentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que rene al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posicin 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posicin 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos estn ordenados de Menor a Mayor
Estadstica
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que rene al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posicin 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posicin 22.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que rene al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posicin 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posicin 64.
42
MEDIDAS DE DISPERSIN
-Rango
-Varianza
-Desviacin Estndar
Rango
Varianza
x
1
x
2
x


n
x


Datos Cuantitativos
Coeficiente de Variacin
Comparacin entre Variables
Se refiere al comportamiento de las variables cuantitativas en un
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que
se les mide Estatura, Peso, Edad: Entre estas variables cul
presenta mayor variacin?
) min( ) max(
i i
x x R =
Desviacin Tpica o Estndar
2
1
2 1 1
2 2
1
2
2
1
) (
1
) (
x x
n n
x
n
x
n
x x
s
n
i
i
n
i
n
i
i i
n
i
i
=

=


=
= = =
2
s s =
x
s
cv =
Estadstica
43
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Adems de la posicin y la dispersin de los datos, otra medida de inters en una distribucin de frecuencias
es la simetra y el apuntamiento o kurtosis.
Coeficiente de Asimetra
3
1
3
) (
s n
x x
CA
n
i
i

=
Si CA=0 si la distribucin es simtrica alrededor de la media.
Si CA<0 si la distribucin es asimtrica a la izquierda
Si CA>0 si la distribucin es asimtrica a la derecha
Coeficiente de Apuntamiento
4
1
4
) (
s n
x x
CAp
n
i
i

=
- Si CAp=0 la distribucin se dice normal (similar
a la distribucin normal de Gauss) y recibe el
nombre de mesocrtica.
- Si CAp>0, la distribucin es ms puntiaguda que
la anterior y se llama leptocrtica, (mayor
concentracin de los datos en torno a la media).
- Si CAp<0 la distribucin es ms plana y se
llama platicrtica.
44
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Ejemplos Histogramas con distinta asimetra y apuntamiento
V2
7,0 6,0 5,0 4,0 3,0 2,0 1,0
14
12
10
8
6
4
2
0
Desv. tp. = 1,67
Media = 3,9
N = 30,00
V4
2,0 1,0 0,0 -1,0
30
20
10
0
Desv. tp. = ,64
Media = 0,0
N = 30,00
V5
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
6
5
4
3
2
1
0
Desv. tp. = 2,42
Media = 5,2
N = 28,00
45
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Ejemplos
Media 3,9
Mediana 4
Moda 4
Desviacin estndar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetra -0,02
Rango 6
Mnimo 1
Mximo 7
Cuenta 30
V1
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
16
14
12
10
8
6
4
2
0
Desv. tp. = 1,77
Media = 5,4
N = 66,00
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
Datos
Histograma
Medidas descriptivas
46
Estadstica
Media, Desviacin tpica, Coeficientes de Asimetra y Apuntamiento
para datos Agrupados (tabla de frecuencias)
Intervalo
Centro
de clase Amplitud F f FAA fra
I
1
c
1
a
1

I
2
c
2
a
2

.
.
I
k
c
k
a
k
n 1
Total n 1

f
1

f
2

f
k

n
1

n
2

n
k

Tabla de frecuencia (para variable cuantitativa)

1) La Media para datos agrupados es igual a la
suma de los productos de las marcas de clase
por sus frecuencias relativas, de la forma:

=
= =
k
j
j j c c
f c x Media
1
Sea c
j
la marca de clase (o centro de clase) y f
j
la
frecuencia relativa de la clase j, donde j=1, 2,, k.
2) La Desviacin tpica para datos
agrupados esta dada por:

=
=
k
j
j c j c
f x c s
1
2
) (
3) El Coeficiente de Asimetra para
datos agrupados esta dado por:
3
1
3
) (
c
k
j
j c j
c
s
f x c
CA

=

=
4) El Coeficiente de apuntamiento para
datos agrupados esta dada por:
4
1
4
) (
c
k
j
j c j
c
s
f x c
CAp

=

=
47
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
Tabla 1 Actividad
Transporte Estudia Pensionado Trabaja
Autobus 5 7 0
Bicicleta 3 3 2
Caminar 2 5 2
Coche 5 4 5
Metro 6 7 4
Transporte N %
Autobus 12 20,0
Bicicleta 8 13,3
Caminar 9 15,0
Coche 14 23,3
Metro 17 28,3
TOTAL 60 100
Actividad N %
Estudia 21 35,0
Pensionado 26 43,3
Trabaja 13 21,7
TOTAL 60 100
Problema
Interesa estudiar cual es el
principal medio de transporte
preferido por un grupo de
personas a la hora de dirigirse
al centro comercial.

Para esto se consult a cada
persona sobre la actividad a la
que se dedicaba y el medio de
transporte preferido.
48
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
Tabla 2 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60
49
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100
50
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100
51
MEDIDAS DE ASOCIACIN LINEAL
- Covarianza
- Correlacin
x
1
x
2
x


n
x


Datos
Cuantitativos
Covarianza:
Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersin
(Varianza y Desviacin Estndar) para una Variable
Cuantitativa (x).
Es una medida de Variabilidad Conjunta entre dos variables (x
1
, x
2
) o bien (x , y)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Si Cov(x,y) es positiva: la asociacin entre x e y es directamente proporcional,
es decir que cuando x aumenta y tambin aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociacin entre x e y es inversamente proporcional,
es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociacin entre x e y.

=
=
n
i
i i
) y y )( x x (
n
) y , x cov(
1
1
Estadstica
52
MEDIDAS DE ASOCIACIN LINEAL
- Covarianza
- Correlacin
Datos
Cuantitativos
Coeficiente de Correlacin de Pearson (r): Mide el grado de Asociacin Lineal
entre dos variables Cuantitativas
Se refiere al grado de asociacin entre dos variables (x
1
, x
2
) o bien (x , y)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Si r es positivo: la asociacin entre x e y es directamente proporcional, es decir que
cuando x aumenta y tambin aumenta; y viceversa. Si r=1: la asociacin lineal es
perfecta.
Si r es negativo: la asociacin entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociacin lineal es
perfecta.
Si r es cero: no existe asociacin entre x e y.
Correlacin:
1 1 s s r
y x
s s
) y , x cov(
r =
y x
n
i
i i
s s ) n (
y x n y x
r
1
1

=
Estadstica
53
r=1 r=-1
EJEMPLO : Representacin grfica de las variables x e y
Estadstica
54
Objetivo 2
Estudiar si los valores de una
variable pueden ser utilizados para
predecir el valor de la otra
REGRESION LINEAL SIMPLE
Datos Cuantitativos
Determinar si existe relacin
entre las variables x e y:
Coeficiente de Correlacin
Objetivo 1
Determinar si dos variables estn
asociadas y en qu sentido se da
la asociacin.
Estudiar la dependencia de una
variable respecto de la otra:
Modelo de Regresin
Trminos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relacin Lineal (modelo lineal)
Parmetros (intercepto y pendiente)
I ntercepto (respuesta media)
Pendiente(efecto de la variable explicativa sobre la respuesta)
Error (residuo)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Estadstica
55
REGRESION LINEAL SIMPLE
Datos Cuantitativos
Notacin
Variable Respuesta: y
Variable Explicativa: x
Modelo de Regresin Lineal Simple: y
i
=o+|x
i
+e
i

I ntercepto: o
Pendiente: |
Error: e
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Modelo Estimado
(recta de regresin)
bx a y + =
x b y a =
2
1 1
2
1 1 1
|
.
|

\
|

=


= =
= = =
n
i
i
n
i
n
i
i
n
i
i
n
i
x x n
y x xy n
b
Mtodo de Estimacin: Mnimos Cuadrados
i i i
y y e =
Residuos o Errores
Estadstica
56
REGRESION LINEAL SIMPLE
DATOS
MODELO DE REGRESIN LINEAL SIMPLE
y
i
=o+|x
i
+e
i

x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
MODELO ESTIMADO
bx a y + =
x b y a =
2
1 1
2
1 1 1
|
.
|

\
|

=


= =
= = =
n
i
i
n
i
n
i
i
n
i
i
n
i
x x n
y x xy n
b
ESTIMADORES
i i i
y y e =
ERRORES
Estadstica
57
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
nio edad (meses) talla (cm)
i x
i
y
i
1 3 55
2 6 68
3 5 64
4 5 66
5 3 62
6 4 65
7 9 74
8 8 75
9 9 73
10 7 69
11 6 73
12 5 68
13 8 73
14 6 71

y=talla / x=edad / n=14

956
14
1
=

= i
i
y 3 , 68 = y
6 , 5 =
y
s

84
14
1
=

= i
i
x

6 = x

2 =
x
s

07 , 9 ) , cov( = y x

88 , 0 =
xy
r

5863
14
1
=

= i
i i
y x

556
14
1
2
=

= i
i
x


Estadstica
58
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
Modelo Estimado
bx a y + =


44 , 2 = b 64 , 53 = a

x y 44 , 2 64 , 53 + =


Interpretacin de los resultados
- Existe asociacin o dependencia entre la Talla del nio y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresin lineal simple, se tiene que la talla
media de un nio es de 53,64 cm. Cuando la edad del nio (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
Estadstica
59
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
De acuerdo al coeficiente de
determinacin, el modelo ajustado
a los datos es adecuado (R
2

cercano a 1)
Bondad de Ajuste del Modelo
R
2
= 0,77

nio edad (meses) talla (cm) Talla estimada error
i x
i
y
i
i
y
i
e
1 3 55 61,0 -6,0
2 6 68 68,3 -0,3
3 5 64 65,8 -1,8
4 5 66 65,8 0,2
5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6
8 8 75 73,2 1,8
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7
11 6 73 68,3 4,7
12 5 68 65,8 2,2
13 8 73 73,2 -0,2
14 6 71 68,3 2,7

86 , 402 ) (
14
1
2
=

= i
i i
y y
7 , 92 ) (
14
1
2
14
1
2

= =
= =
i
i
i
i i
e y y

Estadstica

También podría gustarte