Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRESENTA:
Estadstica descriptiva
Es una parte de la estadstica que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las caractersticas de ese conjunto. Ejemplo:
Edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc. con el fin de describir apropiadamente las diversas caractersticas de ese conjunto.
La estadstica inferencial inductiva utiliza datos provenientes de una muestra para obtener resultados que se infieren a toda la poblacin.
ESCALAS DE MEDICIN
Sirven para ofrecernos informacin sobre las clasificaciones que podemos hacer con respecto a las variables son una sucesin de medidas que permiten organizar datos en orden jerrquico
Nominales Ordinales
Intervalo Razn
ESCALA NOMINAL.
Utiliza los nmeros para identificar que un dato pertenece a un grupo o a una categora. Es aquella escala que no presenta un orden o dimensin particular, son observaciones que pueden clasificarse o contarse. - hombre, mujer; - soltero, casado, viudo, pareja, otros.
ESCALA ORDINAL
Se establecen categoras con dos o ms niveles que implican un orden inherente entre si. La escala de medicin ordinal es cuantitativa porque permite ordenar a los eventos en funcin de la mayor o menor posesin de un atributo o caracterstica. Ejemplo: Clasificar familias conforme a sus respectivo estado socioeconmico: Superior, media superior, media inferior, inferior.
ESCALA DE INTERVALO
La medicin de intervalo posee las caractersticas de la medicin nominal y ordinal. Establece la distancia entre una medida y otra.
El ejemplo ms representativo de este tipo de medicin es un termmetro, cuando registra cero grados centgrados de temperatura indica el nivel de congelacin del agua y cuando registra 100 grados centgrados indica el nivel de ebullicin, el punto cero es arbitrario no real, lo que significa que en este punto no hay ausencia de temperatura.
ESCALA DE RAZN
Una escala de medicin de razn incluye las caractersticas de los tres anteriores niveles de medicin (nominal, ordinal e intervalo). Determina la distancia exacta entre los intervalos de una categora. Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero no existe la caracterstica o atributo que se mide. Las variables de ingreso, edad, nmero de hijos, etc. son ejemplos de este tipo de escala.
PROPORCIONES
Una proporcin es una igualdad entre dos razones , y aparece frecuentemente en notacin fraccionaria. N 1 + N2 + N 3 + N4 = N N1 + N 2 + N3 + N4 = N = 1 N N N N N 4 + 5 + 2 + 1 = 12 = 1 12 12 12 12 12
Reincidentes
No delincuentes Total
43
481 582
137
1081 1286
Proporciones de delincuentes y de no delincuentes en dos localidades hipotticas. Sujetos Delincuentes Primer delito Reincidentes No delincuentes Total .100 .074 .826 1.000 .053 .107 .840 1000 Localidad 1 Localidad 2
PORCENTAJES
Los porcentajes pueden obtenerse de las proporciones multiplicando simplemente por 100. La palabra porcentaje significa por ciento.
Distribucin de los nmeros y porcentajes de casos tratados por tres agencias hipotticas de servicios domsticos
63/133 = 0.473 X 100= 47.3 %
Clase de casos
Matrimonios Divorciados Novios Madres Solteras Otros
Agencia A N %
63 19 27 13 11 47.3 14.3 20.3 9.8 8.3 100.0
Agencia B N %
88 37 20 32 16 193 45.5 19.2 10.4 16.6 8.3 100.0
Agencia C N %
41 26 15 21 9 112 36.6 23.2 13.4 18.8 8.0 100.0
N 192 82 62 66 36 438
Total
Total 133
RAZONES
Cuando un nmero se relaciona con otro 10 2 =5 8 4 2 = 20 10 = 2
ESCALAS DE INTERVALO
La medicin de intervalo posee las caractersticas de la medicin nominal y ordinal. Establece la distancia entre una medida y otra. 40, 42, 43, 44, 45, 46, 46, 48, 48, 50, 50, 50, 52, 52, 52, 52, 53, 62, 63, 71
Intervalo Frecuencia, f
40 43 44 47 48 51 52 55 56 59 60 63 64 67 68 -- 71
3 4 5 5 0 2 0 1
Elementos para la construccin de tablas de frecuencia X = Valores que puede tomar una variable n = Nmero de veces que se repite cada valor F = % Porcentaje que la repeticin da cada valor supone sobre el total
El objetivo de los grficos es facilitar la lectura e interpretacin de los resultados de una variable. Se elaboran segn el tipo de variable y la poblacin a la cual va dirigida. Los tipos de grficos de frecuencia utilizados son:
FRECUENCIA ACUMULATIVA
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. La frecuencia acumulada se representa por Fi. xi 27 28 29 30 31 32 33 34 fi 1 2 6 7 8 3 3 1 31 Fi 1 3 9 16 24 27 30 31
Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
Idiomas, matemticas, ciencias, artsticas, Sociales, ciencias, idiomas, sociales, ciencias matemtica, artsticas, ciencias, matemticas, idiomas, sociales, matemticas, sociales, ciencias, matemticas, ciencias.
Datos xi rea Matemticas Sociales Ciencias Idiomas Artsticas Total Frecuencia absoluta f1 5 4 6 3 2 20 Frecuencia acumulada Fi 5 9 15 18 20 Frecuencia relativa fr 25% 20% 30% 15% 10% Frecuencia relativa acumulada Fr 25% 45% 75% 90% 100%
REPRESENTACIN GRFICA
ALUMNOS
6 6 5 4 3 5 2 1 0 SocialesCienciasIdiomasArtsticas 4 3 2 Matemticas Sociales Ciencias Idiomas Artsticas 6 4 3
ALUMNOS
7 6 5 4 5 3 2 1 0 6
4
3 2
Sociales
Ciencias
Idiomas
Artsticas
PRESENTACIN GRFICA:
HISTOGRAMAS
presentar los datos para destacar las diferencias entre las frecuencias, consiste en servirse de figuras de reas o alturas proporcionales a las frecuencias de cada categora.
POLGONOS DE FRECUENCIA
OJIVAS
HISTOGRAMAS
Buena indicacin visual La frecuencia absoluta o la proporcin de los casos pueden indicarse a lo largo de la ordenada. Las alturas de las barras se toman como proporcionales a las frecuencias en cada intervalo de clase (cerrados). Manipular ms fcilmente los datos que comportan intervalos desiguales El rea de los rectngulos son proporcionales al nmero de los casos.
POLGONOS DE FRECUENCIA
Se crea a partir de un histograma Se obtiene al unir los puntos medios de los lados superiores de cada rectngulo por medio de rectas y se borran los rectngulos. (se conectan por medio de rectas cierto nmero de puntos.
OJIVA
Grfica similar al polgono de frecuencias Es una grfica curvilnea asociada a la distribucin de frecuencias acumuladas Se pueden usar como un mtodo grfico de determinar el nmero de casos por encima o por debajo de un cierto valor Habr de ser creciente o decreciente segn se acumule hacia arriba o hacia abajo, la curva ser horizontal en los intervalos vacos
Deciles Cuartiles
Percentiles
Ejemplo 1: En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (nmero total de datos)
La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el promedio. Ejemplo 2: Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de frecuencias y luego calcular la media aritmtica. El siguiente cuadro con las medidas de 63 varas de pino lo ilustra.
LA MEDIANA
Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Es un nmero que posee la propiedad de tener el mismo nmero de marcas con valores menores que las que hay de valores mayores. Divide el total de los datos en dos mitades. Si el nmero de casos es impar , ser la mediana el caso de en medio. Si fuera par, a los 2 casos que se encuentren del centro se calculara la media Ejemplos: 72, 81, 86, 69 y 57 55, 57, 69, 72, 81, 86 69+72/2=70.5
fidi -51 000 -52 000 -38 000 0 36 000 42 000 -63 000
Clculo de la media de datos agrupados por el mtodo corto y de las desviaciones graduales
fi 17 26 38 51 36 21 189
di -3 -2 -1 0 1 2
17 26 38 51 36 21 189
Puede emplearse tanto con las escalas ordinales como las de intervalo
Categora modal
Intervalo 2000-2900 3000-3900 4000-4900 5000-5900 6000-6900 7000-7900 Frecuencia 17 26 38 51 36 21
1950-2950
2950-3950 3950-4950 4950-5950
17
26 38 51
17
43 81 32
K= Total
5950-6950
6950-7950 Total
36
21 189
168
189
En primer lugar buscamos la clase donde se encuentra , el cuartil en la tabla de las frecuencias acumuladas.
Li =es el lmite inferior de la clase donde se encuentra la mediana. N =es la suma de las frecuencias absolutas. Fi-1 =es la frecuencia acumulada anterior a la clase mediana. ai =es la amplitud de la clase f1 = nmero de casos del intervalo (frecuencia absoluta)
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.
f 17 26 38 51 36 21 189
F 17 43 81 32 168 189
f 17 26 38 51 36
F 17 43 81 32 168
6950-7950
Total
21
189
189
189 6 = 113.4 10
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.
f 17 26 38 51 36
F 17 43 81 32 168
6950-7950
Total 189 76 = 143.64 100
21
189
189
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.
Las medidas de dispersin Tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana y la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana y a la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.
Una
medida de dispersin de un conjunto de datos, mide cuan esparcidos se encuentran estos o que tan heterogneos son. Hay varias medidas de dispersin, siendo las ms comunes las siguientes:
El recorrido
Se define como la diferencia entre la marca ms alta y la ms baja. As, pues, en relacin con el grupo de datos proporcionados :
(72,81,86,69 y 57)
La Desviacin cuartil
La mediana de una distribucin divide los datos en dos partes iguales: Datos ordenados en orden creciente: 50% Mnimo Mediana 50% Mximo
Tambin es posible dividir los datos en ms de dos partes. Cuando se dividen un conjunto ordenado de datos en cuatro partes iguales, los puntos de divisin se conocen como cuartiles y los representamos por Q1, Q2 y Q3. Datos ordenados en orden creciente: 25% Mnimo Q1 25% Q2 25% Q3 25% Mximo
Ejercicio:
1. Encontrar la mediana de todas las observaciones. 2. Encontrar el primer cuartil = Q1 = mediana de las observaciones que son menores a la mediana. 3. Encontrar el tercer cuartil = Q3 = mediana de las observaciones que son mayores a la mediana. *Cuartiles para la Edad. Lista de las edades de los 20 sujetos en el estudio mdico: 47 49 50 39 40 32 37 41 43 45 46 47 51 41 42 44 45 41 42 45 -Si la distribucin es simtrica, los cuartiles deben estar a la misma distancia de la mediana. *Cuartiles para la Edad. Lista ordenada de las edades de los 20 sujetos en el estudio mdico: 32 37 39 40 41 41 41 42 42 43 44 45 45 45 46 47 47 49 50 51 median = 43.5 Q1 = 41 Q3 = 46.5
La desviacin media
Se define como la medida aritmtica de las diferencias absolutas de cada marca con respecto a la medida, o en smbolos:
La media de los nmeros 72, 81, 86, 69 y 57 es73.0. Si sustraemos 73.0 de cada uno de dichos nmeros, ignorando los signos y luego adicionamos los resultados y dividimos entre 5 obtendremos la desviacin media:
= 1+8+13+4+16 = 42 = 8.4 5 5
Pese a que la desviacin media representa una interpretacin intuitiva ms directa que la desviacin estndar, tiene, con todo, varios inconvenientes graves. 1ro. los valores absolutos algebraicamente con facilidad. no se dejan manipular
2do. y ms importante, la desviacin media no es de fcil interpretacin terica ni conduce a resultados matemticos simples.
Desviacin Estndar
Esta se define como la raz cuadrada de la media aritmtica de las desviaciones cuadradas con respecto a la media, o en formula:
Tomamos la desviacin de cada marca con respecto a la media, cuadramos cada diferencia sumamos los resultaos, dividimos entre el nmero de casos y extraemos la raz cuadrada.
Xi 72
(Xi X) -1
(Xi X)2 1
81
86 69 57 X = 73.0
8
13 -4 -16 0
64
169 16 256 506
S= 506/5
= 101.2 =10.06
Por el momento aceptaremos como significado de desviacin estndar como un nmero abstracto. Observbamos, en efecto, que cuando mayor es la dispersin alrededor de la media tanto mayor es la desviacin estndar .
Si los cinco valores hubieran sido cero entonces las desviaciones alrededor de la media haban sido cero, lo mismo la desviacin estndar .
La Distribucin normal
Esta distribucin es muy til, no slo por que un gran nmero de distribuciones empricas se encuentran ser aproximadamente normales, sino debido tambin a su significado terico en la estadstica inductiva. Esta distribucin se examina en la estadstica descriptiva ms que en la inductiva por dos razones principales.
1. La curva normal puede emplearse para proporcionar una interpretacin de la desviacin estndar. 2. Sern tiles al lector para familiarizarse con la distribucin normal.
Una gran cantidad de los fenmenos del comportamiento humano se manifiesta de la siguiente forma: la mayora de las puntuaciones se concentran en el Centro de la distribucin, en tanto que los extremos encontramos slo algunas puntuaciones. Por ejemplo, la inteligencia: hay pocas personas muy inteligente (genios), pero tambin hay pocas personas con muy baja inteligencia (personas con capacidades mentales diferentes). La mayora de los seres humanos somos medianamente inteligentes. Esto podra representarse as:
Inteligencia
Las principales caractersticas de la distribucin normal son: 1.- Es unimodal, una sola moda.
2.- La simetra es cero. La mitad de la curva es exactamente igual a la otra mitad. La distancia entre la media y +3 S es la misma que la distancia entre la media y -3 s.
3.- Es una funcin particular entre desviaciones con respecto a la media de una distribucin y la probabilidad de que stas ocurran. 4.- La base est dada en unidades de desviacin, destacando las puntuaciones -1S, -2s,-3S, +1S, +2S y +3S. 5.- La media, la mediana y la moda coinciden en el mismo punto.
Distribuciones de frecuencias finitas versus infinitas Las distribuciones de frecuencias hasta aqu examinada conformaban un nmero finito de casos . Todas las distribuciones empricas conforman necesariamente un nmero infinito de casos, aunque sea muy grande, los matemticos consideran necesario pensar en termino de distribuciones basadas en un nmero de casos infinitamente grande. Resulta posible concebir curvas lisas basadas en un nmero indefinidamente grande de casos y susceptible de ser expresadas en trmino de ecuaciones matemticas relativamente sencillas. Una de estas curvas lisas es la distribucin normal.
Esta es la representacin grfica que tiene el mayor nmero de intervalos ms angostos , lo que hace que se asemeje aun ms la curva de distribucin normal.
Resulta claro que los rectngulos van formando aproximaciones cada vez mejores a la curva lisa, a medida que el nmero de los mismos aumenta, esto es, a medida que disminuye el ancho de cada intervalo.
La curva normal es un tipo especial de curva lisa simtrica, se basa en un nmero indefinidamente grande de casos, slo es posible aproximarse a la misma mediante distribuciones de frecuencia que comportan datos efectivos, teniendo forma de campana.
La estadstica descriptiva, tiene una enorme utilidad en nuestras actividades de la vida diaria, cualquiera que estas sean, esta ciencia de la matemtica aplicada, nos proveer de herramientas suficientes para desempear mejor las labores que realizamos tanto en el hogar, la oficina, la escuela y todas las profesiones del saber humano.
La estadstica descriptiva nos ayuda a analizar y comprender de manera rpida y sin equivocaciones, la informacin que obtenemos, la cual es importante para tomar las decisiones ms acertadas. Nos permite concentrar la informacin en cuadros, tablas y grficas para una mayor visin y comprensin de datos que manejemos o propongamos.
Actualmente existen programas de computacin que permiten el calculo y representacin grfica de los datos acumulados, lo que facilita la recogida de datos, el clculo, el anlisis y la interpretacin de los mismos. Las medidas de tendencia central muestran en qu lugar se ubica un caso promedio o tpico del grupo, por lo cual es un mtodo que sirve para comparar, interpretar incluso clasificar, cualquier resultado obtenido por ste. Al analizar estos resultados se pueden tomar decisiones oportunas para crear un proyecto en el cual por lo general se busqu la mejora de una situacin.
La media es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de calcular, se presta para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos.
Las medidas de dispersin nos permiten saber en dnde estn ubicadas los valores obtenidos de una investigacin con relacin a las medidas de tendencia central, como la media, moda y la mediana.
Es decir estas medidas de variabilidad son intervalos que indica la dispersin de los datos en la escala de medicin las medidas de dispersin ms utilizadas son el recorrido y la desviacin cuartil, desviacin media , y desviacin estndar. Una gran cantidad de los fenmenos del comportamiento humano se manifiesta de la siguiente forma, la mayora de las puntuaciones se concentran en el Centro de la distribucin, en tanto que los extremos encontramos slo algunas puntuaciones. Debido a ello, se cre un modelo de probabilidad llamado curva normal o distribucin normal. Como todo modelo es una distribucin terica que difcilmente se presentan en la realidad tal cual, pero si se presenta aproximaciones a este.