Está en la página 1de 41

ESTADSTICA DESCRIPTIVA

Depto. Matemtica 2010 www.matecsc.com

ESTADSTICA DESCRIPTIVA
Los orgenes de la estadstica, aunque no se sabe con exactitud cundo se comenz a utilizar, pueden estar ligados al antiguo Egipto como a los censos chinos que se realizaron hace unos 4.000 aos, aproximadamente. Sin duda, fueron los romanos, romanos maestros de la organizacin poltica, quienes mejor supieron ocupar la estadstica. Cada cinco aos realizaban un censo de la poblacin, cuyos datos de nacimientos, defunciones y matrimonios eran esenciales para estudiar los avances del imperio; sin olvidar los recuentos de ganancias y las riquezas que

ESTADSTICA DESCRIPTIVA
Para poder comprender mejor este tipo de estudio es importante que conozcas los siguientes trminos bsicos: Poblacin: Es un conjunto de
personas, eventos o cosas de las cuales se desea hacer un estudio, y tienen una caracterstica en comn.

ESTADSTICA DESCRIPTIVA
Muestra: Es un subconjunto cualquiera de la poblacin; es importante escoger la muestra en forma aleatoria (al azar), pues as se logra que sea representativa y se puedan obtener conclusiones ms a fines acerca de las caractersticas de la poblacin.

ESTADSTICA DESCRIPTIVA
Todo estudio estadstico debe considerar diferentes tipos de variables:

Variable s

Variables cualitativas Variables Cuantitativas

ESTADSTICA DESCRIPTIVA
Variables cualitativas: Relacionadas con caractersticas no numricas de un individuo (por ejemplo: atributos de una persona, nacionalidad, color de la piel, sexo).

ESTADSTICA DESCRIPTIVA
Variables Cuantitativas: Relacionadas con caractersticas numricas del individuo por ejemplo: edad, precio de un producto, ingresos anuales. Las variables cuantitativas se dividen en discretas (aquellas que pueden tomar solo algunos valores en un intervalo y no valores intermedio, ejemplo: edad, nmero de hermanos que puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr ser 3,45) o continuas (aquellas que pueden tomar cualquier valor en un intervalo real, ejemplo: alturas, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.).

Estadstica Descriptiva: Es la parte de la estadstica que trata solamente de describir y analizar un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a partir de ella. La estadstica descriptiva incluye las tcnicas que se relacionan con el resumen y la descripcin de datos numricos. Estos datos pueden ser grficos o pueden incluir anlisis computacional. Estadstica Inferencial: Cuando una muestra es representativa de una poblacin se pueden deducir importantes conclusiones acerca de esta, a partir de su anlisis. La inferencia estadstica comprende aquellas tcnicas por medio de las cuales se toma decisiones sobre una poblacin estadstica basadas solo en la muestra observada. Debido a que dichas decisiones se toman en condiciones de incertidumbre, entonces estas sern confiables con cierto grado de probabilidad. Considerando que las caractersticas medidas de una muestra se denominan estadsticas de la muestra, las caractersticas medidas de una poblacin

ESTADSTICA DESCRIPTIVA

Ordenando la Informacin

Al ordenar datos muy numerosos, es usual agruparlos en clases o categoras. Al determinar cuntos pertenecen a cada clase, establecemos la frecuencia. Construimos as una tabla de datos llamada tabla de frecuencias.

ESTADSTICA DESCRIPTIVA
Para qu se construyen las tablas de frecuencias ?
1. ORDENAR 2. AGRUPAR 3. RESUMIR informacin

El formato general de una tabla estadstica , llamada tambin TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIN DE FRECUENCIAS es la siguiente:

ESTADSTICA DESCRIPTIVA

Nombre de la variable Categoras o Recorrido de la variable TOTAL

Frecuencia Frecuencias Observadas n

En la siguiente tabla se presenta el motivo de la consulta mdica, durante una semana. Motivo Consulta Bronquitis Otitis Heridas Fracturas Vacunas Nmero de pacientes 19 13 7 18 20

ESTADSTICA DESCRIPTIVA

ESTADSTICA DESCRIPTIVA
TIPOS DE FRECUENCIAS
a) Frecuencia o Frecuencia Absoluta: Es el nmero de veces que se presenta un valor o categora de una variable. Se representa por fi.
b) Frecuencia Relativa: La frecuencia relativa se puede expresar

en trminos de porcentaje o de proporcin y se representa por fr. (Es la razn entre la frecuencia absoluta y el total de datos)

ESTADSTICA DESCRIPTIVA
Los siguientes datos corresponden a las notas obtenidas por un curso de 24 alumnos en un trabajo de matemticas: 3,2 4,2 5,0 3,9 3,2 6,0 5,6 3,9 4,2 6,0 3,2 5,0 2,8 3,2 5,6 3,9 4,2 5,0 4,2 5,6 4,2 6,0 5,0 6,0

Ordenemos estos datos en una tabla: Anota en tu cuaderno una tabla de frecuencias que considere Nombre de variable: Notas Frecuencia Absoluta Frecuencia relativa (ambas) Si tu resultado es un decimal, usa 3 dgitos despus de la coma

ESTADSTICA DESCRIPTIVA
Nota Frecuencia Absoluta Frecuencia Relativa Frecuencia Relativa Porcentual (%)

2,8 3,2 3,9 4,2 5,0 5,6 6,0

ESTADSTICA DESCRIPTIVA
Nota Frecuencia Absoluta Frecuencia Relativa Frecuencia Relativa Porcentual (%)

2,8 3,2 3,9 4,2 5,0 5,6 6,0

1 4 3 5 4 3 4

0,041 0,166 0,125 0,208 0,166 0,125 0,166

4,166 16,666 12,500 20,833 16,666 12,500 16,666

Qu conclusiones puedes obtener de la tabla anterior?

ESTADSTICA DESCRIPTIVA
Hasta el momento slo hemos trabajado con una pequea cantidad de datos. Qu crees que deberamos hacer si tenemos muchos datos?
Tabla de Frecuencias de datos agrupados (tambien llamadas tabla de frecuencias con clase) En ocasiones, el agrupar los datos en intervalos, nos puede ayudar para realizar un mejor anlisis de ellos.

ESTADSTICA DESCRIPTIVA
Definiciones: Rango: Diferencia entre el mximo y el mnimo valor de una variable. Marca de clase: Representante de un intervalo, y corresponde al promedio entre los extremos de ste. Tamao de un intervalo: Es el cuociente entre el valor del rango y la cantidad de intervalos que se desea obtener. Se recomienda tomar como longitud de los intervalos un valor entero que sea mayor o igual al cuociente obtenido.

Para estas tablas debemos considerar cada intervalo con lmites cerrado y abierto, o sea [ [ La tabla siguiente la vamos a elaborar con: frecuencias absolutas: estas frecuencias son las que se obtienen directamente del conteo frecuencias relativas: corresponden a los porcentajes de cada frecuencia absoluta. frecuencia absoluta acumulada: corresponde a la frecuencia absoluta del intervalo ms la suma de las frecuencias absolutas de todos los valores anteriores. frecuencia relativa acumulada: corresponde al porcentaje de la frecuencia relativa del intervalo ms la suma de las frecuencias relativas de todos los valores anteriores.

ESTADSTICA DESCRIPTIVA

Nivel de colesterol en la sangre de una muestra de hombres estadounidenses que tienen entre 25 y 34 aos de edad , que fueron atendidos en centros mdicos de New York y sufren de hipertensin arterial , en el ao 2001

Nivel de Colesterol (mg/100 ml) 80-120 120-160 160-200 200-240 240-280

Cantidad de hombres 13 15 44 29 9

Cul es la variable de inters?

Qu se mide?

Observa: El rango de cada intervalo es de 40.

Ejemplo: Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de Cuarto ao de Educacin Media. 1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,75 1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,73 1,75 1,78 1,77 1,67 1,83 1,83 1,72 1,85 1,84 1,93 1,82 1,69 1,70 1,81 1,66 1,75 1,80 1,79 1,84 1,86 1,80 1,77 1,80 1,88 1,75 1,79 1,87 1,79 1,77 1,67 1,74 1,78 1,77 1,74 1,73 1,83 1,76 1,83 1,77 1,77 1,77 1,84 1,83 1,79 1,82 1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77 1,92 1,77 1,71 1,76 1,76 1,75 1,75 1,76

ESTADSTICA DESCRIPTIVA

ESTADSTICA DESCRIPTIVA
Estatura Mayor: 1,93 metros Estatura Menor: 1,66 metros Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm. Formaremos 6 intervalos. Para calcular el tamao de intervalo de cada uno dividimos 27 y 6, obteniendo finalmente 4,5 5 Luego los intervalos de la tabla son:
Intervalo 1,65 1,69 1,70 1,74 1,75 1,79 1,80 1,84 1,85 1,89 1,90 1,94 Marca de Clase Frecuencia Absoluta

ESTADSTICA DESCRIPTIVA
Representaciones Grficas Para hacer ms clara y evidente la informacin que nos dan las tablas se utilizan los grficos. Existen mltiples tipos de grficos, pero aqu trataremos solamente de los usados ms frecuentemente, que son: grfico de barras, grfico de sectores o circular (pastel), histograma, polgono de frecuencias, la ojiva y el pictograma.

Grficos estadsticos

GRFICOS

La informacin contenida en las tablas de frecuencias resulta ms accesible y fcil de interpretar si se representan por medio de grficos estadsticos. Diagrama de barras Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representacin de series cronolgicas o histricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificacin utilizada.

GRFICOS
Histograma

Est formado por rectngulos, cuyas bases corresponden con los intervalos de clase y sus reas son iguales o proporcionales a sus frecuencias. Este grfico se usa para representar una distribucin de frecuencias de una variable cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable

GRFICOS
Polgono de frecuencias Es una lnea poligonal que une los vrtices superiores de las barras de un diagrama de barras, o los puntos medios de las bases superiores de los rectngulos de un histograma. Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confeccin sino segmentos de recta, de ah el nombre de polgono. Habitualmente se usa cuando se quiere mostrar en el mismo grfico ms de una distribucin.

GRFICOS
Diagrama de sectores o grfico circular Grfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este grfico se hace corresponder la medida del ngulo de cada sector con la frecuencia correspondiente a la clase en cuestin. Si los 360 del crculo representan el 100 % de los datos clasificados, a cada 1% le correspondern 3,6. Luego, para obtener el tamao del ngulo para un sector dado bastara con multiplicar el por ciento correspondiente por 3,6 (por simple regla de tres).

GRFICOS
Pictogramas Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de frecuencias. Este tipo de grfica atrae la atencin por los dibujos, pero la desventaja es que se lee en forma aproximada. Grfico de lneas u ojiva En este tipo de grfico, al igual que el histograma y el polgono de frecuencias el objetivo es representar distribuciones de frecuencias de variables cuantitativas continuas, pero slo para frecuencias acumuladas. se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar: una serie o ms series

ESTADSTICA DESCRIPTIVA
Ejercicios: 1)Construya una tabla de frecuencia de los siguientes grficos.

ESTADSTICA DESCRIPTIVA
Das N Frecuenc Frecuenc Artculos ia ia Relativa relativa porcentu al 3 5,2 4,8 6 4,2 23,2 0,129 0,224 0,206 0,258 0,181 0,998 12,9 22,4 20,6 25,8 18,1 99,8

Lunes Martes Mircole s Jueves Viernes Total

ESTADSTICA DESCRIPTIVA
Edad Frecuen cia Absoluta 6 5 3 2 16 Frecuen cia Relativa Frecuen cia Relativa %

20-24 24-28 28-32 32-36 Total

MEDIDAS DE RESUMEN
Entre las medidas que permiten resumir informacin proveniente de una poblacin, podemos considerar las medidas de posicin, medidas de dispersin y medidas de forma.

Medidas de Posicin
Tienen por objeto, obtener un valor que resuma en s todas las mediciones. La mayora de ellas trata de ubicar el centro de la distribucin, razn por la cual, se llaman MEDIDAS DE TENDENCIA CENTRAL; estas son: Media, Mediana y Moda.

MEDIDAS DE TENDENCIA CENTRAL

Media aritmtica o promedio: Es una de las medidas de tendencia central de mayor uso. La media muestral se simboliza por X y la media poblacional de denota por .

PROMEDIO PARA DATOS NO TABULADOS

Sea X una variable cuantitativa y x1, x2,, xn una muestra de tamao "n" de valores de la variable, se define la media aritmtica de X como:

X=

x1 + x2 + x3 + ..... + xn n

X =

x
i= 1 i

PROMEDIO PARA DATOS TABULADOS Para calcular la media aritmtica de un conjunto de datos, se suma cada uno de los valores y se divide entre el total de casos. Sea X una variable estadstica que toma los valores , con frecuencias absolutas , respectivamente, la media viene dada por:

x1 f 1 + x 2 f 2 + ... + x n f n x= = f 1 + f 2 + ... + f n

x
i =1 n i =1

fi
i

Ejemplo N1 Consideremos la edad en aos de ocho personas 10 18 25 32 12 5 7 7

En este ejemplo el promedio , media o media aritmtica de la edad de estas personas est dada por:

10 + 18 + 25 + 32 + 12 + 5 + 7 + 7 x= 8
Es decir la edad promedio de estas personas es de 14,5 aos.

Mediana (Me) Sea X una variable por lo menos ordinal y sea x1, x2,xn una muestra de tamao n de observaciones de la variable, se define como Mediana "Me" un valor tal que supera a no ms del 50% de las observaciones y es superado por no ms del 50% de las observaciones, cuando estas han sido ordenadas segn magnitud. MEDIANA PARA DATOS NO TABULADOS Ejemplo: Consideremos la edad en aos de ocho personas 10 18 25 32 12 5 7 7

Para calcular la mediana , previamente se deben ordenar las observaciones. En este caso lo haremos en forma creciente:

10

12

18

25

32

Como la cantidad de datos es par, entonces la mediana corresponde al promedio de los datos centrales, por lo tanto la mediana es 11.

MEDIANA PARA DATOS TABULADOS

En casos de datos agrupado es un poco ms complejo y requiere de la utilizacin de la siguiente frmula

lmite inferior de la clase mediana c = amplitud del intervalo N = nmero total de datos Fi 1 = frecuencia absoluta acumulada de la clase anterior a la mediana f i = frecuencia absoluta de la clase mediana

Li =

N Fi 1 M = Li + c 2 fi

Moda o Modo (Mo) para datos no tabulados La moda se identifica al observar el valor que se presenta con ms frecuencia en la distribucin. Si consideramos el ejemplo del peso de una muestra de personas: 65 76 48 48 68 78 90 87 67 72 78 Mo = 48 kilos Mo = 78 kilos. Esto significa que la mayora de estas personas pesa 48 kilos y 78 kilos. Esta distribucin es bimodal. Moda o Modo (Mo) para datos tabulados
Ahora bien, en el caso de datos agrupados en intervalos, es fcil determinar la clase modal (clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor frecuencia se obtiene a partir de la siguiente expresin: lmite inferior de la clase modal. amplitud de los intervalos. diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior. diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente.

Cuantiles La mediana divide a la distribucin en dos partes iguales, los cuantiles son parmetros que dividen los datos de la distribucin en partes iguales. Los ms usados son: Cuartiles: Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales. ( cuartil primero, cuartil segundo y cuartil tercero ) Quintiles: Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales. ( quintil primero,... ) Deciles: Nueve valores iguales que dividen la distribucin en 10 partes iguales. ( decil primero,...) Percentiles: Noventa y nueve valores que dividen la serie en 100 partes iguales. ( percentil primero,... ) El clculo es anlogo al de la mediana.

También podría gustarte