Está en la página 1de 13

Es la sigma mayscula ni=k que debe entenderse como una abreviacin de "sumar desde k hasta n la sucesin", donde el trmino

genrico de la sucesin se pone enseguida de la sigma: ni=kai. Por ejemplo, en vez de poner 1+r+r2+r3+r4 se pone 4i=0ri.

La Estadstica es la parte de las Matemticas que se encarga del estudio de una determinada caracterstica en una poblacin, recogiendo losdatos, organizndolos en tablas, representndolos grficamente y analizndolos para sacar conclusiones de dicha poblacin. Estadstica descriptiva. Realiza el estudio sobre la poblacin completa, observando una caracterstica de la misma y calculando unos parmetros que den informacin global de toda la poblacin Estadstica inferencial. Realiza el estudio descriptivo sobre un subconjunto de la poblacin llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la poblacin. Poblacin: En estadstica, se identifica el trmino poblacin al de variable aleatoria , o magnitud numrica de naturaleza aleatoria, X, asociada a los objetos (individuos) sobre los que se desarrolla una experiencia, cuyo resultado depende del azar. La repeticin n veces, en idnticas condiciones, de la citada experiencia aleatoria, afectar a una muestra de n objetos u individuos de la poblacin, y tendr asociada una sucesin de n variables aleatorias, independientes, X1 , X2 ,..., Xn , rplicas de X. Un ejemplo obvio de poblacin y muestra surgira al considerar una urna de bolas blancas y negras, con independencia de su nmero. Si la experiencia consistir en extraer al azar una bola y nuestro inters se centra en el color de la bola, nuestra poblacin, desde el punto de vista estadstico, es una variable dicotmica, por ejemplo, unavariable de Bernoulli, que toma dos nicos valores: X=1 si la bola extrada es blanca, X=0 si es negra. Una muestra de tamao n, una vez extrada de la poblacin, y observado el color de las correspondientes bolas, no ser otra cosa que una secuencia de unos y ceros, n en total. (Las idnticas condiciones a las que se alude anteriormente, pueden asegurarse

reintroduciendo la bola despus de cada extraccin, o bien considerando que el tamao de la muestra es pequeo respecto al "gran nmero" de bolas de la urna.
Muestra: En otro mbito, el de la estadstica, el trmino muestra, tambin es ampliamente utilizado, ya que de ese modo se designa al subconjunto de casos o individuos de una poblacin estadstica. El objetivo primordial de las muestras en estadstica es el de poder inferir propiedades, comportamientos, entre otras cuestiones de la totalidad de la poblacin, por eso es que deben ser representativas de la misma.

Frecuencia: La frecuencia es el nmero de veces que se repite (aparece) el mismo dato estadstico en un conjunto de observaciones de una investigacin determinada, las frecuencias se les designan con las letras fi, y por lo general se les llaman frecuencias absolutas.

Frecuencia Relativa La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribucin de frecuencia de clase entre el nmero total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %). Frecuencias acumuladas Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribucin de frecuencia de clase, esto se logra cuando la acumulacin de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser menor que (fa que) y frecuencias acumuladas mayor que (faque). Distribucin de Frecuencia: En estadstica existe una relacin con cantidades, nmeros agrupados o no, los cuales poseen entre s caractersticas similares. Existen investigaciones relacionadas con los precios de los productos de la dieta diaria, la estatura y el peso de un grupo de individuos, los salarios de los empleados, los grados de temperatura del medio ambiente, las calificaciones de los estudiantes, etc., que pueden adquirir diferentes valores gracias a una unidad apropiada, que recibe el nombre de variable. La representacin numrica de las variables se denomina dato estadstico.

La distribucin de frecuencia es una disposicin tabular de datos estadsticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados ypara datos agrupados o de intervalos de clase.

Medidas tendencia central: Media Mediana


Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden ha reunir los datos (Punto central). Estas medidas aplicadas a lascaractersticas de las unidades de una muestra se les denomina estimadores o estadgrafos; mientras que aplicadas a poblaciones se les denomina parmetros ovalores estadsticos de la poblacin. Los principales mtodos utilizados para ubicar el punto central son la media, la mediana y la moda. 1. MEDIA Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos. La media se define como la suma de todos los valoresobservados, dividido por el nmero total de observaciones.

Ecuacin 5-1

Cuando los valores representan una poblacin la ecuacin se define como:

Ecuacin 5- 2

Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa cada uno de los valores de la poblacin. Ya que en la mayora de los casos se trabajan con muestras de la poblacin todas las ecuaciones que se presenten a continuacin sern representativas para las muestras. La mediaaritmtica para una muestra esta determinada como

Ecuacin 5-3

Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi) representa cada uno de los valores observados. Esta frmula nicamente

es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicacin de los diferentes valores por la frecuencia con que se encuentren dentro de la informacin; es decir,

Ecuacin 5-4

Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero de observaciones en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las frecuencias de cada clase. Para entender mejor este concepto vamos a suponer que hemos tomado la edadde 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos datos se representan en la tabla [5-1].

Figura 5-1

Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si ha estos mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los valores individuales, obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los clculos, principalmente al aumentar el nmero de datos. Para evitar estos inconvenientes, SPSS nos permite calcular lasMedias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados.

Es importante resaltar que existe una gran variedad de medias como la Mediageomtrica, la Media ponderada, la Media cuadrtica, etc. Por el momento slo hacemos nfasis en la media aritmtica ya que es la ms utilizada, aunque se recomienda a los lectores profundizar en estos temas. 2. MEDIANA Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos despus que las observaciones se han ubicado enserie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posicin de la mediana se utiliza la frmula

Ecuacin 5-5

Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posicin de la mediana sera:

Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie, que equivale al nmero (8). Si por el contrario contamos con un conjunto de datos que contiene un nmero par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendramos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posicin de la mediana sera,

Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor. En conclusin la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un nmero impar de observaciones o datos, la medianadar como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un nmero par de observaciones se debe promediar los valoresde las dos posiciones centrales. 3. MODA La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms

veces se repite es el nmero 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denominaBimodal o en otros casos ms de dos valores, lo que se conoce como multimodal. En conclusin las Medidas de tendencia central, nos permiten identificar losvalores ms representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendra cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por ltimo la Moda nos indica el valor que ms se repite dentro de los datos.

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza) DATOS AGRUPADOS 1.- su fin es resumir la informacin. 2.- generalmente, los elementos son de mayor tamao, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias. 3.- se agrupa a los datos, si se cuenta con 20 o ms elementos. Aunque contemos con ms de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la informacin sea repetitiva, tambin debemos de verificar que los datos puedan clasificarse. Y que dicha clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos esta pidiendo) . Una vez que ya hemos ordenado y clasificado, presentaremos la informacin obtenida mediante una tabla de frecuencias 4.- la agrupacin de los datos puede ser simple o mediante intervalos de clase.

DATOS NO A GRUPADOS. 1.- los datos son brutos( es decir, no se presentan clasificados)

2.- no es necesario clasificar ni generar una tabla de frecuentas, ya que no tiene mucho sentido. 3.- elementos que menor tamao (generalmente menor a 20 elementos).Esto no sucede as siempre. Aunnque contemos con menos de 20 elementos, debe de verificarse que los datos no sean significativos, Esto es: que la informacin no sea repetitiva, de esta forma, sabremos que no se podr clasificar y por lo tanto ser resumida en una tabla de frecuencias. En caso de que una vez que hayamos ordenado los elementos, se cuente con datos significativos. Procedemos a clasificarlos (si es posible, ya que tambin debemos de buscar la lgica al clasificar los elementos) para convertirlos en datos agrupados. Por ejemplo: *si nos pidieran obtener la informacin del territorio de cada uno de los estados de Mxico. No tiene mucho sentido que que tratemos de agrupar, ya que solo nos pide el nombre del estado de la republica mexicana y la extensin territorial. Para que necesitaramos una tabla de frecuencia de 32 elementos, cuando estos se repiten solo 1 vez ?

4.- los datos no agrupados, tambin pueden ser ordenamos y de la misma forma, tambin se pueden obtener graficas, determinar media, desviacin estndar, etc. El hecho de que los datos no agrupados pueden ordenarse, no significa que se conviertan en datos agrupados. Ejemplos: Vas a investigar la edad a un grupo de 20 Nios en datos no agrupados (es decir, vienen los 20 nios y asi como te dan la edad asi la anotas 2,2,1,3,3,3,4,4,5,6,1,2,2,3,3,3,4,4,3,6 (Total 20 nios) Estos son datos no agrupados por qu no los has clasificado y contado 1,1,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,5,5,6 (Total 20 nios) Los datos no agrupados tambin los puedes ordenar, por ejemplo de la edad menor a la edad mayor, no estn contabilizados ni clasificados solamente estn ordenados Para que sean datos agrupados tienes que contarlos y clasificarlos, por ejemplo cuntos nios haba de cada ao. (y siguen siendo 20 nios) Edad..........Frecuencia 1..................2 2..................4 3..................7 4..................4 5..................2 6..................1 Total............20

o tambin los puedes agrupar (Serie agrupada) en clases, rangos, grupos o intervalos por ejemplo de 2 aos para este caso (y siguen siendo 20) Edad..........Frecuencia 1-2...............6 3-4...............11 5-6...............3 Total.............20

SE PUEDE CONSULTAR LA SIGUIENTE BIBLIOGRAFA. "estadistica", Murray R. Spiguel Editorial schaum. Segunda edicin * Estadstica aplicada SOTY, NORBERTO Guarin Salazar *"ESTADISTICA PASO A PASO", Howard B. Christense. [center]

Invitado Invitado

Tema: Re: DIFERENCIAS ENTRE DATOS AGRUPADOS Y NO AGRUPADOS Jue 7 Abr - 23:39 perdn era este el tema del que me preguntabas cualquier duda la posteas y que Lat te responda jajaja porque yo no lo creo..

gabytp83 An en el cascarn

Tema: Re: DIFERENCIAS ENTRE DATOS AGRUPADOS Y NO AGRUPADOS Lun 18 Jul - 22:04 Gracias, muy bien explicado

Mensajes: 3

En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En

los casos en los que los datos son cualitativos (no-numricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso.

Polgono de frecuencia
Un polgono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras mediante segmento s. Tambin se puede rea lizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos.

Ejemplo

Las temperaturas en un da de otoo de una ciudad han sufrido la s siguientes variaciones:

Hora 6 9 12 15 18 21 24

Temperatura 7 12 14 11 12 10 8

Polgonos de frecuencia para datos agrupados


Para clase que construir coincide el polgono con de frecuencia se medio de toma la marca de

el punto

cadarectngulo de

un histograma.

Ejemplo

El peso de 65 personas adultas viene dado por la siguiente ta bla:

ci

fi

Fi

[50, 60)

55

[60, 70)

65

10

18

[70, 80)

75

16

34

[80, 90)

85

14

48

[90, 100)

95

10

58

[100, 110)

110

63

[110, 120)

115

65

65

Polgono de frecuencias acumuladas


Si se representan las frecuencias obtiene ac umuladas de de una tab la frecuencias

de dato s agrupados se

el h isto grama

acumulad as o su correspondiente polgono.

La ojiva es una grfica circular a la distribucin de frecuencias, es decir, que en ella se permite ver cuntas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los nmeros asignados a cada intervalo. La ojiva apropiada para informacin que presente frecuencias mayores que el dato que se est comparando tendr una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores, tendr una pendiente positiva. Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas, existen las ojivas mayor que y las ojivas menor que. Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por esto la aplicacin de la tcnica es parcial): Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que" sucede con el extremo izquierdo; para la ojiva "menor que", con el derecho. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor. Las siguientes son ejemplos de ojivas, a la izquierda la "mayor que", a la derecha la "menor que", utilizando los datos que se usaron para ejemplificar el histograma: La ojiva "mayor que" (izquierda) se le denomina de esta manera porque viendo el punto que est sobre la frontera de clase 4:00 se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se dira, sin errores de gramtica: despus de las 4:00). De forma anloga, en la ojiva "menor que" la frecuencia que se representa en cada frontera de clase son el nmero de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de observaciones antes de la hora que seala la frontera).

El diagrama de Pareto, tambin llamado curva 80-20 o Distribucin A-B-C, es una grfica para organizar datos de forma que estos queden en orden descendente, de izquierda a derecha y separados por barras. Permite, pues, asignar un orden de prioridades. El diagrama permite mostrar grficamente el principio de Pareto (pocos vitales, muchos triviales), es decir, que hay muchos problemas sin importancia frente a unos pocos graves. Mediante la grfica colocamos los "pocos vitales" a la izquierda y los "muchos triviales" a la derecha. El diagrama facilita el estudio comparativo de numerosos procesos dentro de las industrias o empresas comerciales, as como fenmenos sociales o naturales, como se puede ver en el ejemplo de la grfica al principio del artculo. Hay que tener en cuenta que tanto la distribucin de los efectos como sus posibles causas no es un proceso lineal sino que el 20% de las causas totales hace que sean originados el 80% de los efectos. El principal uso que tiene este diagrama es para poder establecer un orden de prioridades en latoma de decisiones dentro de una organizacin.