Está en la página 1de 13

Estadı́stica Descriptiva

Eduardo V. Domı́nguez

October 28, 2015

1 Introducción
• Modelación

• Realidad versus Modelo

• Modelos Deterministicos

• Modelos no-Deterministicos

• Toma de decisiones bajo Incertidumbre

• Estadistica: Mezcla entre ciencia y arte que entrega herramientas


para modelar fenómenos no-deterministicos

• Algunas aplicaciones:

– Ingenierı́a
– Compañı́as de Seguros
– Estudios de Mercado
– Control de Calidad
– Instrumentos Financieros
– Medicina

2 Algunos Términos
• Población: Colección completa de todas los individuos de interes
para el investigador.

• Parámetro: Valor que caracteriza un aspecto de la población.

1
• Muestra: Subconjunto de la población y que es representativa de
esta.

• Estadistico: Medida descriptiva de la muestra que se utiliza para


estimar al respectivo parámetro poblacional.

• Variable: Caracteristica de la población que se analiza en el estudio


estadistico.

3 Técnicas de Muestreo
• Muestreo Aleatorio simple: Procedimiento mediante el cuál todas
las muestras de un determinado tamaño, poseen la misma ”chance”
de ser extraidas.

• Muestreo Aleatorio Estratificado: Esquema de muestreo que primero


particiona a la población en diversos ”estratos” y posteriormente ex-
trae una mustra aleatoria simple en cada uno de ellos.

3.1 Muestreo
• Error muestral: Diferencia entre el valor del parámetro poblacional
y el producido por el estadistico o estadigrafo basado en una muestra.

• Sesgo muestral: Tendencia a favorecer la selección de determinados


individuos de la población.

3.2 Muestreo
• Población vs Muestra

• Muestreo implica Error muestral

• Acotar la probabilidad de cometer errores

3.3 Estadistica
• Descriptiva

• Inferencial

2
3.4 Tipos de Variables
• Variables cualitativas: Caracteristica que representa una cualidad de
los individuos poblacionales.
• Variables cuantitativas: Caracteristica que corresponde a una magni-
tud asociada a laos individuos de la población.

4 Estadistica Descriptiva
Proporciona procedimientos que permiten organizar, procesar y presentar
los datos muestrales con el fin de extraer información relevante que este
contenida en ellos.

Datos Muestrales

Clasificación

A1 , A2 , . . . , Ak : clases

4.1 Número de clases


Si se dispone de n datos muestrales, se suele usar la regla de “Sturges”:
k = [3, 3 · log10 (n)] + 1
Ejemplo: Para n = 1000, se obtienen 10 clases, pues:
k = [3, 3 · log10 (1000)] + 1 = [3, 3 · 3] + 1 = 9 + 1 = 10

4.2 Observaciones y Preguntas


• Las clases deben ser excluyentes y todo elemento muestral debe pertenecer
a una de ellas.
• ¿Existen clases que concentren mas datos?.
• ¿Se presenta un comportamiento uniforme?.
• ¿Se visualiza mas de un punto de concentración?.

3
5 Construcción de clases
Si los datos muestrales estan medidos por lo menos al nivel de intervalos y
si los representamos por:
x1 , x2 , . . . , xn
entonces la amplitud de las clases es de:
max xi − min xi
c=
k
con esto se determinan los limites superior e inferior de cada clase:
clase limites relacion
A1 [a1 → b1 ] b1 = a1 + c
A2 ]a2 → b2 ] b2 = a2 + c
.. .. ..
. . .
Ak ]ak → bk ] bk = ak + c
en donde a1 = min xi y ak+1 = bk
Cabe hacer notar que existen otras formas de construir las clases.

6 Ejemplo
Consideremos una muestra de n = 50 datos:

68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
numero de clases: k = [3, 3 log10 (50)] + 1 = 6.
Además:
min xi = 50 y max xi = 102, por lo que c = 102−506 = 8, 7 por lo que
redondeando, tomaremos c = 9, con lo que las clases quedan:
clase limites marca de clase
A1 [50 → 59] 54, 5
A2 ]59 → 68] 63, 5
A3 ]68 → 77] 72, 5
A4 ]77 → 86] 81, 5
A5 ]86 → 95] 90, 5
A6 ]95 → 104] 99, 5

4
7 Distribuciones de Frecuencias
Para descubrir como se “reparten” o “distribuyen” los datos entre las clases,
consideraremos las frecuencias:

• Frecuencia absoluta: Es el número de observaciones muestrales que


caen en cada clase: ni , para i = 1, . . . , k.

• Frecuencia relativa: Es la proporción de datos con respecto a toda la


muestra que pertenecen a cada clase: fi , para i = 1, . . . , k.
ni
• Se tiene que: fi = n

• Frecuencia absoluta acumulada: Es la suma acumulada de las fre-


cuencias absolutas hasta cada clase: Ni , para i = 1, . . . , k. con
Ni = ij=1 nj , para i = 1, . . . , k
P

• Frecuencia relativa acumulada: Es la suma acumulada de las fercuen-


cias relativas hasta cada clase: Fi , para i = 1, . . . , k. con Fi = ij=1 fj ,
P

para i = 1, . . . , k
Ni
• Se tiene que: Fi = n

7.1 Ejemplo
clase limites ni Ni fi Fi
A1 [50 → 59] 3 3 0, 06 0, 06
A2 ]59 → 68] 5 8 0, 10 0, 16
A3 ]68 → 77] 15 23 0, 30 0, 46
A4 ]77 → 86] 17 40 0, 34 0, 80
A5 ]86 → 95] 7 47 0, 14 0, 94
A6 ]95 → 104] 3 50 0, 06 1, 00
total 50 1, 00

5
Una forma alternativa de visualizar los datos, es mediante la repre-
sentación de tallo y hoja:

La coma decimal esta un digito a


la derecha de los dos puntos:

5 : 079
6 : 0567899
7 : 001122344567788999
8 : 001233344456
9 : 01233457
10 : 12

6
8 Representaciones Gráficas
Otra forma de representar la información muestral, es mediante gráficos

• Histograma: Se grafican las frecuencias con respecto a las diversas


clases.

• Poligono de frecuencias: Representa las frecuencias en las marcas de


clases unidas por segmentos de rectas.

• Distribucion de frecuencias acumuladas: Aqui se representan las fre-


cuencias acumuladas hasta cada clase.

• Ojiva: Poligonal que une las frecuencias acumulativas en cada clase.

• Gráfico de barras: Las frecuencias se representan por barras propor-


cionales a ellas.

• Gráficos circulares: Las frecuencias se muestran como sectores circu-


lares.

8.1 Histograma

7
8.2 Ojiva

Page 1/1

8
8.3 Pastel

Page 1/1

9
9 Estadistica descriptiva bivariada
Analisis descriptivo conjunto de dos o mas variables. Si (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn )
es una muestra bivariada de las variables X e Y . Si k es el número de clases
para X y l, para Y , se definen:

• Frecuencia absoluta conjunta: El número de observaciones muestrales


que caen en la clase Ai segun X y en la clase Bj segun Y .

ni,j , i = 1, . . . , k, j = 1, . . . , l

ni,j
• Frecuencia relativa conjunta: Proporción muestral fi,j = n .

Se definen las frecuencias marginales de X e Y respectivamente por:


l
X k
X
ni,. = ni,j , n.,j = ni,j
j=1 i=1

y las respectivas frecuencias relativas marginales por:


ni,. n.,j
fi,. = , f.,j =
n n
La representación tabular de estas frecuencias, se denomina “Tabla de
Contingencia”.

10
Ejemplo:

[10;30] ]30;50] ]50;70] ni,.


[1000;2000] 15 8 4 27
]2000;3000] 5 12 9 26
]3000;4000] 2 13 10 25
]4000;5000] 1 16 18 35
n.,j 23 49 41 113

10 Medidas de tendencia central


Son estadisticos que proporcionan valores representativos de la muestra, de
tal manera que todos los datos muestrales caen en torno a estos valores.

• Moda

• Mediana

• Media ( geométrica )

• Media ( aritmética )

Si los datos muestrales han sido agrupados en clases y estas marcas de


clase son x1 , . . . , xk con frecuencias relativas fi . Se define la media de x
por
k k
X 1X
x̄ = fi xi = ni xi
i=1
n i=1

11 Medidas de variabilidad
Las medidas de variabilidad o de dispersión, pretenden cuantificar el grado
de homogeneidad presente en la muestra; determinan que tan concentrados
o dispersos estan los datos. Algunas medidad de dispersión son:

• Rango

• Desviación media

• Rango intercuartı́lico

• Varianza y Desviación estandar

11
La varianza se define por:
k k
X 1X
Sx2 = fi (xi − x̄)2 = ni (xi − x̄)2
i=1
n i=1

y la desviación estandar por:


q
Sx = + Sx2

12 Observación
Cabe hacer notar que cuando la varianza muestral se usa como un estimador
de la varianza poblacional, su definición se modifica levemente en la forma:
k
1 X
S2 = ni (xi − x̄)2
n − 1 i=1

Esta varianza modificada es preferible como estimador, pues posee mejores


propiedades que Sx2 .

13 Desigualdad de Tschebyscheff
Una interpretación interesante de la desviacion estandar es la proporcionada
por la “Desigualdad de Tschebyscheff”, que plantea intuitivamente que:
En todo conjunto de observaciones y para todo numero real r > 1, se
tiene que al menos 1 − r12 de ellas caen en el intervalo:

[x̄ − rSx ; x̄ + rSx ]

12
14 Resumen
Las principales medidas descriptivas de la muestra son:

Resumen de $x$

Min. 1st Q. Med. Mean 3rd Q. Max.


50.00 71.00 78.50 78.36 84.00 102.00

N = 50 Median = 78.5
Quartiles = 71; 84

las cuales pueden representarse gráficamente por el “Gráfico de Cajón” o


“Boxplot”:

Page 1/1

13

También podría gustarte