Está en la página 1de 15

ESTADSTICA

DESCRIPTIVA
Unidad 1
Definicin de Estadstica.
Es una disciplina dedicada a la aplicacin de mtodos
para colectar, organizar, resumir, presentar y
analizar datos. Tambin es una disciplina que genera
conclusiones vlidas acerca de las caractersticas de
la fuente de donde fueron obtenidos los datos. Se
divide en Estadstica Descriptiva y Estadstica
Inferencial.
Estadstica Descriptiva.
Es la parte de la Estadstica dedicada a colectar, organizar,
resumir, presentar y analizar datos.

Estadstica Inferencial.
Es la parte de la Estadstica dedicada a generar conclusiones
vlidas acerca de las caractersticas de la fuente de donde
fueron obtenidos los datos.

Poblacin.
Es el conjunto que contiene todos los elementos cuyas
caractersticas son sujetas a estudio estadstico.
MUESTRA.
ES UNA PORCIN DE LA POBLACIN QUE ES
ESTUDIADA PARA CONOCER DICHA POBLACIN.
MUESTRA ALEATORIA.
ES UNA MUESTRA OBTENIDA DE LA POBLACIN DE
TAL MANERA QUE TODAS LA POSIBLES MUESTRAS DE
IGUAL NMERO DE OBSERVACIONES TIENEN LA
MISMA PROBABILIDAD DE SER SELECCIONADA.
MANERAS DE OBTENER MUESTRAS ALEATORIAS.
SORTEO, NMEROS ALEATORIOS Y SOFTWARE.
Organizacin de datos

TABLAS DE FRECUENCIAS.
LOS DATOS SE AGRUPAN EN CLASES O INTERVALOS DE CLASE, LUEGO
SE CUENTA EL NMERO DE OBSERVACIONES QUE CAEN EN CADA
CLASE.
NMERO DE CLASES.
SEA N EL TAMAO O NMERO DE OBSERVACIONES EN LA MUESTRA.
LUEGO EL NMERO DE CLASES SE PUEDE DETERMINAR COMO , SE
RECOMIENDAN DE 5 A 20 CLASES.
LONGITUD DE LOS INTERVALOS DE CLASE.
SEA MAX LA MAYOR OBSERVACIN DE LA MUESTRA Y SEA MIN LA
MENOR OBSERVACIN DE LA MUESTRA. LUEGO, LA LONGITUD DE
CLASE ES , LO ANTERIOR ES CONSIDERANDO QUE TODAS LAS CLASES
TIENEN LA MISMA LONGITUD.
Frecuencia absoluta de una clase. Es el nmero de
observaciones contenidas en dicha clase.

Frecuencia relativa absoluta de una clase. Es su


frecuencia absoluta dividida entre n.

Frecuencia acumulada absoluta de una clase. El el


nmero de observaciones menores al lmite superior
de la clase.

Frecuencia acumulada relativa de una clase. Es su


frecuencia acumulada absoluta dividida entre n.
Ejemplo. Lo siguiente son horas por semana dedicadas a ver TV
de una muestra de 50 estudiantes.
16, 24, 22, 21, 23, 25, 15, 18, 20, 20, 22, 18, 15, 23, 21, 21, 21,
15, 21, 22, 21, 18, 21, 18, 22,
21, 23, 19, 19, 20, 19, 22, 22, 20, 22, 21, 19, 20, 20, 15, 22, 21,
17, 23, 20, 20, 18, 19, 20, 18.
Hacer una tabla de frecuencias de los datos anteriores.
LI MC LS conteo F FR FAA FAR


Tcnicas Grficas
Histograma.
Es una grfica de la tabla de frecuencias, colocando una barra
rectangular sobre cada intervalo de clase. La longitud de la
base es la longitud del intervalo de clase y la altura es la
frecuencia de clase.
20
Frequency

10

15.715 17.145 18.575 20.005 21.435 22.865 24.295

horas
0.25

0.20

0.15
Density

0.10

0.05

0.00

15.715 17.145 18.575 20.005 21.435 22.865 24.295

horas
50

Cumulative Frequency
40

30

20

10

15.715 17.145 18.575 20.005 21.435 22.865 24.295

horas
100

Cumulative Percent
50

15.00 16.43 17.86 19.29 20.72 22.15 23.58 25.01

Cuartiles. horas

El Primer cuartil (q1). Es el valor cuya frecuencia acumulada


relativa es el 25% de los datos.
El segundo cuartil (q2). Es el valor cuya frecuencia acumulada
relativa es el 50% de los datos.
El Tercer cuartil (q3). Es el valor cuya frecuencia acumulada
relativa es el 75% de los datos. El rango intercuartlico es q3
q1.
El Diagrama de Caja.
Boxplot of horas

observaciones entre 0 y observaciones entre


1.5 veces el rango 0 y 1.5 veces el
intercuartlico en el 1er. cuartil 1 cuartil 2 cuartil 3 rango intercuartlico
cuartil. a partir del 3er.
cuartil.

15 20 25

horas
Tcnicas Nmericas
Medidas de Tendencia central. Estas medidas tratan de obtener el
valor numrico ubicado en el centro de los datos.
La media aritmtica. Es la suma de los datos dividida entre n. Es
decir; .
Ejemplo. Calcular la media aritmtica de los datos de las horas de
TV.

La mediana . Es el valor cuya frecuencia acumulada relativa es el


50% (el 2. cuartil).
Para calcular la mediana, primero se ordenan los datos en forma
creciente (de menor a mayor).
Luego, si n es un nmero impar la mediana es el valor ubicado en
el centro de los datos.
Si n es par, la mediana se obtiene promediando los dos valores
centrales.
Ejemplo. Calcular la mediana de; 18, 19, 21, 21, 25, 27, 27, 32,

Medidas de dispersin.
Tratan de medir el alejamiento o distanciamiento de los datos.
El Rango. Es la diferencia; dato mayor dato menor.
Ejemplo. Calcular el rengo de; 18, 19, 21, 21, 25, 27, 27, 32,
33.

La varianza poblacional . Se obtiene mediante la frmula;

La varianza muestral . Se obtiene mediante la frmula;

La desviacin estndar. Es la raz cuadrada de la varianza ( ,


S ).
Ejemplo. Calcular y para 18, 19, 21, 21, 25, 27, 27, 32, 33.

Ejemplo: Estadsticas descriptiva de las


horas de TV.
Descriptive Statistics
Variable: horas

Anderson-Darling Normality Test


A-Squared: 0.930
P-Value: 0.017

Mean 20.0600
StDev 2.3596
Variance 5.56776
Skewness -5.2E-01
Kurtosis 4.59E-02
N 50
15 17 19 21 23 25
Minimum 15.0000
1st Quartile 18.7500
Median 20.0000
3rd Quartile 22.0000
95% Confidence Interval for Mu Maximum 25.0000
95% Confidence Interval for Mu
19.3894 20.7306
19.5 20.0 20.5 21.0 95% Confidence Interval for Sigma
1.9711 2.9404
95% Confidence Interval for Median
95% Confidence Interval for Median
20.0000 21.0000

También podría gustarte