Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Descriptiva
Estadistica Descriptiva
Ncleo Bolvar
Unidad de Cursos Bsicos
Estadstica Descriptiva
Prof. Luis Alfredo Machado P.
INTRODUCCIN
De lo estudiado en el tema I pudimos conocer que la estadstica es una ciencia referente
a la recoleccin, anlisis e interpretacin de datos, ya sea para ayudar en la resolucin
de la toma de decisiones o para explicar condiciones regulares o irregulares de algn
fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin
embargo estadstica es mucho ms que eso, dado que en otras palabras es el vehculo
que permite llevar a cabo el proceso relacionado con la investigacin cientfica.
A partir de este concepto podemos diferenciar dos corrientes o dos tipos de estadstica,
una estadstica descriptiva y una estadstica inferencial, definiendo la primera como
aquella que se dedica a los mtodos de recoleccin, descripcin, visualizacin y
resumen de datos originados a partir de los fenmenos en estudio y donde los datos
pueden ser resumidos numrica o grficamente. Por otra parte, la estadstica inferencial
que se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los
fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa
para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba
de hiptesis), estimaciones de caractersticas numricas (estimacin), pronsticos de
futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de
relaciones entre variables (anlisis de regresin). En este tema nos dedicaremos a tratar
todo lo referente (en sentido global) a la estadstica descriptiva.
Ejemplos de este tipo de anlisis descriptivo pueden encontrarse en la prensa diaria, en
la parte de informacin econmico-social: series de tiempo, grfica de barras, ndices de
Marca de
clase
relativa
Relativa
% Frecuencia
relativa
acumulada
Estas tablas de frecuencia sirven para todo tipo de variables en donde la nica diferencia
sera la forma de determinar las clases. Si las variables son cualitativas, cada cualidad
estudiada es una clase. Si las variables son cuantitativas continuas es necesario
determinar intervalos de clase los cuales, para efectos de este curso, se determinan
utilizando la regla de Sturges. Para el caso de las variables cuantitativas discretas es
necesario conocer la modalidad de la variable de estudio, si esta es muy grande (por
ejemplo, cantidad de aos que puede vivir una persona) es necesario dividir esa
Responder:
DESCRIPCIN
DE
UN
CONJUNTO
DE
MEDICIONES:
MTODOS
NUMRICOS
Las tablas de frecuencia y los histogramas de frecuencia relativa introducidos en el tema
I proporcionan una informacin til respecto al conjunto de mediciones, pero no son
adecuados para hacer inferencias por que no estn bien definidos. De hecho, se podran
construir muchos histogramas semejantes a partir del mismo conjunto de medidas. Para
hacer inferencias de una poblacin basadas en datos de una muestra y medir la validez
de estas necesitamos definir cantidades de manera rigurosa para analizar la informacin
de la muestra. Mediante las matemticas es posible obtener ciertas propiedades de esas
cantidades mustrales y establecer conclusiones probabilsticas en cuanto a la validez de
nuestras inferencias.
Las cantidades que definiremos son medidas numricas descriptivas de un conjunto de
datos. Buscamos nmeros que describan la distribucin de frecuencias de cualquier
conjunto de mediciones. En este tema abordaremos las medidas de tendencia central,
medidas de dispersin y variabilidad, medidas de posicionamiento y medidas de
apuntamiento o curtosis.
Parmetro y Estadstico
Una medida descriptiva relacionada con una variable aleatoria, cuando la variable se
considera sobre toda una poblacin se denomina parmetro. Los parmetros se indican
por lo general con letras griegas. Un parmetro con el que es frecuente encontrarse es el
valor promedio de la poblacin o media de la poblacin, la cual se indica mediante la
letra griega . Por ejemplo, en el estudio de las enfermedades cardiacas, el investigador
estara interesado en determinar el valor promedio de cigarros fumados por da por los
miembros de la poblacin, sin embargo no es posible obtener el valor exacto de este
parmetro a menos que se estudien todos los miembros de la poblacin, lo cual es una
tarea casi imposible. Puesto que es imposible hacerlo, el valor del parmetro seguir
siendo una incgnita desconocida incluso despus de terminar el estudio, pero la cual
podremos aproximar mediante el uso de diversos mtodos estadsticos aplicados a una
serie de datos (una muestra) recogidos de esa poblacin.
Una medida descriptiva relacionada con una variable aleatoria, cuando las variables solo
se considera sobre una muestra, se denomina estadstico. Los estadsticos tienen dos
fines, por un lado, describen la muestra que est disponible, y por el otro, sirven como
aproximacin a los parmetros correspondientes a la poblacin. Por ejemplo, la media
de cigarrillos fumados diariamente por los miembros de una muestra de pacientes con
enfermedades cardiacas es un estadstico que se denomina promedio de la muestra o
media muestral. Su valor para una muestra dada, probablemente, no ser igual a la
media de la poblacin, pero sin embargo, se espera que al menos su valor se aproxime
a .
Como ejemplo de estos conceptos pudiramos citar el evento de las elecciones
presidenciales de un pas. El hecho de votar, implica que tericamente (y segn las
restricciones constitucionales de cada pas) toda la poblacin debera ir a escoger un
candidato. Una vez que se realiza el proceso de votacin y finaliza el conteo de votos
los resultados dados pudieran ser, por ejemplo, 60% de los votos a favor del candidato
alfa y 40% de los votos a favor del candidato beta (suponiendo que solo fueron dos
candidatos a elecciones). Estos valores 60% y 40% son parmetros, ya que estos
valores descriptivos fueron calculados a partir de datos de una poblacin completa.
Tomando este mismo ejemplo es fcil imaginar que antes de las elecciones cada uno de
los candidatos quera conocer o tener una idea de con cuanta popularidad cuentan y
pronosticar los resultados. Para ello cada cierto tiempo tomaban una muestra aleatoria a
la cual estudiar y tener una idea de la popularidad con la que cuentan antes de las
elecciones. As, el estudio de un cierto da podra dar 30% a favor del candidato beta
versus un 70% a favor del candidato alfa y otro da podra dar 50% y 50% para ambos
candidatos, todos estos datos obtenidos son estadsticos ya que fueron calculados a
partir de una muestra aleatoria y aunque no son iguales a los parmetros tienen cierta
tendencia a aproximarse a ellos.
Medidas de tendencia central
Cuartiles: Los cuartiles, son un caso particular de los percentiles. Hay 3, y se definen
como:
Q1 = P25
Q2 = P50 = Med
Q3 = P75
Estadsticos de Asimetra
Al ver la simetra o asimetra de un conjunto de datos, vamos a plantear el saber si los
datos se distribuyen de forma simtrica con respecto a un valor central, o si bien la
grfica que representa la distribucin de frecuencias es de una forma diferente del lado
derecho que del lado izquierdo.
Para saber si una distribucin de frecuencias es simtrica, hay que precisar con respecto
a que. Un buen candidato es la mediana, ya que para variables continuas, divide al
histograma de frecuencias en dos partes de igual rea.
Podemos basarnos en ella para, de forma natural, decir que una distribucin de
frecuencias es simtrica si el lado derecho de la grafica (a partir de la mediana) es la
imagen por un espejo del lado izquierdo (vase la figura a continuacin). Cuando la
variable es discreta, decimos que es simtrica, si lo es con respecto a la media.
Dentro de los tipos de asimetra posible, vamos a destacar los dos fundamentales:
FUNDAMENTACIN BIBLIOGRFICA
Wackerly, D. Mendenhall III, W. Scheafer, R. (2002) Estadstica matemtica con
aplicaciones. Editorial Thomson, Mexico, D.F. Mexico.
Daniel, W. (2006) Bioestadstica, base para el anlisis en ciencias de la salud.
Editorial Limusa-Weiley, Mexico D.F. Mexico.
FORMULARIO
Medidas de tendencia central
n
xi
x= i=1
n
n
Datos Agrupados:
Mediana
Datos Agrupados:
x=
1
fi mi
n i=1
M =L+
w
(0,5 nfb)
fm
Medidas de dispersin
n
1
2
2
(xix)
Datos sin agrupar: = n1
i=1
fimi
n
i=1
Varianza
Datos Agrupados:
(2 n)
mi 2 fi
i=1
x=
Desviacin
estndar
Coeficiente de
Variacin
n1
2
Con datos agrupados o sin agrupar: =
%CV =
Medidas de Localizacin
Percentil
Medida de Asimetra
P=L+
w
(0,5 nfb)
fm
Metodo de
Yule-Bowley
As=
Q32 Q2+ Q1
Q 3Q1
EJERCICIOS
453
4
246
2
762
4
863
9
662
7
837
2
702
0
400
0
154
8
741
7
448
4
822
5
672
5
337
8
480
1
608
2
563
3
614
2
742
8
418
9
532
1
6964
7343
737
1024
1
962
4148
658
8
935
9
897
3
849
389
4
584
7
916
6
432
7
574
9
180
1
463
2
1213
0
5
2
4
3
1
5
4
5
3
2
2
4
3
3
1
2
5
5
4
3
Catolico
Protestante
Budista
Protestante
Ateo
Musulman
Ateo
Catolico
Ateo
Budista
Protestante
Catolico
Musulman
Budista
Catolico
Budista
Protestante
Protestante
Catolico
Ateo
Ateo
Musulman
Budista
Budista
Protestante
Budista
Catolico
Ateo
Musulman
Protestante
Catolico
Protestante
Protestante
Musulman
Catolico
Catolico
Ateo
Budista
Protestante
Protestante
Budista
Musulman
Musulman
Protestante
Ateo
Catolico
Budista
Catolico
Budista
Catolico
38.00%
36.00%
34.00%
32.00%
30.00%
28.00%
26.00%
24.00%
22.00%
20.00%
18.00%
16.00%
14.00%
12.00%
10.00%
8.00%
6.00%
4.00%
2.00%
0.00%
-2.00%
2,10
1,73
1,90
1,74
1,65
1,77
1,68
1,74
1,69
1,83
1,57
2,38
A partir de estos calcule las medidas de tendencia central y dispersin, utilizando los
mtodos de datos sin agrupar, luego agrupe los datos en una tabla de frecuencias y
calcules las mismas medidas utilizando el mtodo de datos agrupados y compare los
resultados. Por ltimo, intente dar una conclusin sobre los resultados.
7. A partir de los siguientes datos:
agrupados. Por ltimo calcule las medidas de tendencia central y dispersin utilizando
los mtodos de datos sin agrupar y compare con lo anteriormente calculados.