Está en la página 1de 11

CONCEPTO GENERAL SOBRE ESTADSTICA.

La estadstica se aplica prcticamente en todos los campos del saber humano. La estadstica es el estudio cientfico de datos numricos basados en fenmenos naturales. Es una tcnica matemtica de investigacin que ayuda a delimitar una muestra, a reconocer los datos, ordenarlos, presentarlos, analizarlos y sacar conclusiones. La estadstica es una rama de las matemticas que estudia los mtodos de obtencin de datos sobre una poblacin utilizndolos con el fin de hallar alguna informacin para un efecto dado. La estadstica generalmente es definida como la rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y as mismo que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. La estadstica inferencial trabaja con muestras, subconjuntos, formados por algunos individuos de la poblacin. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin. La estadstica descriptiva analiza, estudia y describe a la totalidad de individuos de una poblacin. Su finalidad es obtener informacin, analizarla,evaluarla y simplificarla lo necesario para que pueda ser interpretada cmoda y rpidamente.

ESTADSTICA DESCRIPTIVA
Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin. La Estadstica Descriptiva es la parte que conocemos desde los cursos de educacin primaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as evitar malentendidos, tergiversaciones o errores.

TRMINOS ESTADSTICOS
El primer campo de actuacin de la estadstica, como se ha visto, es la demografa. De esta ciencia ha tomado la nomenclatura (poblacin, individuo). Los datos se basan en observaciones individuales o tems. As, por ejemplo si se pesan 100 ratones blancos, el peso de cada ratn es una observacin individual y los pesos de los 100 ratones representan la muestra de observaciones. Se llama poblacin al conjunto de todos los elementos cuyo conocimiento interesa. Cada uno de esos elementos es un individuo. Si se est estudiando el resultado de ciertos experimentos qumicos, cada uno de esos experimentos ser un individuo estadstico y el conjunto de todos los posibles experimentos en esas condiciones ser la poblacin. Cada individuo puede ser descrito mediante uno o varios caracteres. Por ejemplo, si los individuos son personas, el sexo, el estado civil, el nmero de hermanos o su estatura son caracteres. Y si el individuo es una reaccin qumica, el tiempo de reaccin, la cantidad de producto obtenido o si ste es cido o bsico sern posibles caracteres que pueden analizarse.

*INDIVIDUO
Cada uno de los elementos del colectivo que es objeto de estudio. Por ejemplo, si se estn estudiando datos sobre la habitabilidad de las viviendas de una barriada, cada vivienda es un individuo estadstico.

*POBLACIN
Es la recoleccin completa de todas las observaciones de inters para el observador. Es un conjunto completo de individuos, objetos o medidas que tienen una caracterstica comn observable. La poblacin, o el universo, est formado por la totalidad de los elementos que se desean estudiar, ejemplos podran ser: La poblacin total de Venezuela, los alumnos cursantes en las universidades del pas, la produccin de toda una industria, a cosecha de un ao dado, el rendimiento de una raza de ganado, entre otros. Por ejemplo: si se est estudiando el resultado de ciertos experimentos qumicos cada uno de esos experimentos ser un individuo estadstico y el conjunto de todos los posibles experimentos en esas condiciones ser la poblacin. La poblacin es el conjunto de todos los individuos cuyo conocimiento es objeto de inters desde un punto de vista estadstico. Por ejemplo, si se est interesado en las ventas de los comercios de una cierta ciudad, cada comercio es un individuo, y la poblacin tambin llamada universo es el conjunto de todos los comercios de la ciudad. El estudio estadstico de una poblacin se puede realizar mediante un anlisis exhaustivo de todos sus individuos (estadstica descriptiva) o bien mediante una inferencia realizada a partir de una muestra extrada de la poblacin (estadstica inferencial). Una poblacin la constituyen todos los individuos de una especie determinada que se encuentran en un rea limitada en un momento dado. La poblacin es la totalidad de observaciones individuales sobre las cuales se hacen inferencias, las cuales existen en cualquier parte del mundo o al menos dentro de un rea de muestreo claramente especificada, limitada en espacio y tiempo.

*MUESTRA
Conjunto de individuos extrado de una poblacin con el fin de inferir mediante su estudio, caractersticas de toda la poblacin. En los estudios estadsticos, en vez de analizar la totalidad de la poblacin o universo, se acude al recurso de considerar solamente una parte de ella, a la cual se llama muestra. Es requisito indispensable que la muestra a analizar sea representativa realmente de la poblacin o universo, al cual sustituye en el estudio estadstico, o sea, que debe contener valores tpicos del fenmeno que se desea estudiar. Es un subconjunto de la poblacin o el universo.

Es una parte representativa de la poblacin seleccionada para ser estudiada ya que la poblacin es demasiado grande como para analizarla en su totalidad. Conjunto de individuos extrados de una poblacin con el fin de inferir, mediante su estudio, caractersticas de toda la poblacin. Se dice que una muestra es representativa cuando, por la forma en que ha sido seleccionada, aporta garantas suficientes para realizar inferencias fiables a partir de ella. Una muestra se puede definir como un conjunto de observaciones individuales seleccionadas por un procedimiento especfico. Ejemplo, el peso de un ratn a travs de un periodo de tiempo. El diseo de muestra o disea de encuesta especifica el mtodo de obtencin de la muestra. El diseo no especifica la forma de recolectar o medir los datos reales. Especifica nicamente el mtodo de recoleccin de los objetos que contienen la informacin requerida. Estos objetos se llaman elementos. Un elemento es un objeto del cual se toma una medicin. Los elementos pueden ocurrir individualmente o en grupos en la poblacin. Un grupo de elementos, como una familia o una caja de cerillos se llama unidad de muestreo. Las unidades de muestreo son colecciones disjuntas de elementos de la poblacin. En algunos casos una unidad muestral est constituida por un solo elemento. Para seleccionar una muestra aleatoria de unidades de elementos muestrales, es necesaria una lista de todas las unidades muestrales contenidas en la poblacin. Esta lista se le denomina marco muestral. Un marco muestral es una lista de unidades muestrales.

Tipos de variable estadsticas

*Variable cualitativa

Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: *Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. *Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no numricas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3, ... Medallas de una prueba deportiva: oro, plata, bronce.

*Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos: *Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3. *Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.

Variables Discretas:
Son el resultado de contar y slo toman valores enteros (nmero de hijos).

Variables Continuas:
Son el resultado de medir y pueden contener decimales (temperatura, peso, altura).

Las variables tambin se pueden clasificar en:


Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales:

recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).

DISTRIBUCIN DE FRECUENCIAS
Distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora.1 Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

CARACTERSTICAS
Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

TIPOS DE FRECUENCIAS:
*Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. puesto que es mentira se hace el intercambio en la interfaz de la frecuencia absoluta.

*Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1.

*Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa.

*Frecuencia relativa acumulada


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. xi 27 28 29 30 31 32 33 34 fa 1 2 6 7 8 3 3 0.032 FA 1 3 9 16 24 27 30 Fr 0.032 0.065 0.194 0.226 0.258 0.097 0.097 FR 0.032 0.097 0.290 0.516 0.774 0.871 0.968

31

DISTRIBUCIN DE FRECUENCIAS AGRUPADAS


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Construccin de una tabla de datos agrupados: 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. *Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. *Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos queramos establecer. Es conveniente que el nmero de intervalos oscila entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no no pertenece intervalo, se cuenta en el siguiente intervalo.

ci [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) Total:

fi 2.5 1 7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 1 1 3 3 3 6 7 10 4 2

Fi 1 2 5 8 11 17 24 34 38 40

ni

Ni 0.025 0.025 0.025 0.050 0.075 0.125 0.075 0.200 0.075 0.2775 0.150 0.425 0.175 0.600 0.250 0.850 0.100 0.950 0.050 1

Medidas de tendencia central


Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace

referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas como medidas de posicin.1 En este caso se incluyen tambin los cuantiles entre estas medidas. Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se est observando, en este caso se observan variables cuantitativas. Entre las medidas de tendencia central tenemos: Media . Media ponderada. Media geomtrica.

Media armnica.
Mediana. Moda.

Media
En matemticas y estadstica una media o promedio es una medida de tendencia central que segn la Real Academia Espaola (2001) [] resulta al efectuar una serie determinada de operaciones con un conjunto de nmeros y que, en determinadas condiciones, puede representar por s solo a todo el conjunto. Existen distintos tipos de medias, tales como la media geomtrica, la media ponderada y la media armnica aunque en el lenguaje comn, el trmino se refiere generalmente a la media aritmtica.

Mediana
En el mbito de la estadstica, la mediana, representa el valor de la variable de posicin central en un conjunto de datos ordenados. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil. Su clculo no se ve afectado por valores extremos.

Moda
En estadstica, la moda es el valor con una mayor frecuencia en una distribucin de datos. Hablaremos de una distribucin bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

MEDIDAS DE POSICIN NO CENTRAL


En estadstica descriptiva, las medidas de posicin no central permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre las medidas de posicin no central ms importantes estn los cuantiles. El trmino cuantil fue usado por primera vez por Kendall en 1940. El cuantil de orden p de una distribucin (con 0 < p < 1) es el valor de la variable que marca un corte de modo que una proporcin p de valores de la poblacin es

menor o igual que . Por ejemplo, el cuantil de orden 0.36 dejara un 36% de valores por debajo y el cuantil de orden 0.50 se corresponde con la mediana de la distribucin. Los cuantiles suelen usarse por grupos que dividen la distribucin en partes iguales; entendidas estas como intervalos que comprenden la misma proporcin de valores. Los ms usados son:

cuartiles
Los Cuartiles, que dividen a la distribucin en cuatro partes (corresponden a los cuantiles 0.25, 0.50 y 0.75); Los Quintiles, que dividen a la distribucin en cinco partes (corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80) ; Los Deciles, que dividen a la distribucin en diez partes; Los Percentiles, que dividen a la distribucin en cien partes.

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.

Clculo de los cuartiles


1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa cada cuartil mediante la expresin


Nmero impar de datos 2, 5, 3, 6, 7, 4, 9

Nmero par de datos 2, 5, 3, 4, 6, 7, 1, 9

Percentiles
Se representan con la letra P. Para el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que l y el 100-i % restante son mayores. Aparecen citados en la literatura cientfica por primera vez por Francis Galton en 18853 P25 = Q1. P50 = Q2 = mediana. P75 = Q3. Clculo con datos no Agrupados Un mtodo para establecer un percentil sera el siguiente: Calculamos...

donde n es el nmero de elementos de la muestra e i, el percentil. El resultado de realizar esta operacin es un nmero real con parte entera E y parte decimal D. Teniendo en cuenta estos dos valores, aplicamos la siguiente funcin:

Esta ltima operacin brinda el valor del percentil pedido.

*Los Deciles, que dividen a la distribucin en diez partes;

También podría gustarte