Está en la página 1de 3

TERMINOS

Repaso del captulo 2

y3

Arreglo u ordenamiento de datos Organizacin de los datos sin procesar en orden descendente o ascendente. Clase de extremo abierto Clase que permite que el extremo superior o inferior de un esquema de clasificacin cuantitativo no tenga lmite. Conjunto de datos Una coleccin de datos. Curva de frecuencias Polgono de frecuencias suavizado al aumentar el nmero de clases y datos puntuales a un conjunto de datos. Dato puntual Una sola observacin de un conjunto de datos. Datos Coleccin de cualquier nmero de observaciones relacionadas de una o ms variables. Datos continuos Datos que pueden pasar de una clase a la siguiente sin interrupcin y que pueden expresarse mediante nmeros enteros o fraccionarios. Datos discretos Datos que no pasan de una clase a la siguiente sin que haya una interrupcin; esto es, en donde las clases representan categoras o cuentas distintas que pueden representarse mediante nmeros enteros. Datos sin procesar Los datos antes de ser organizados o analizados por mtodos estadsticos. Distribucin de frecuencias Presentacin organizada de datos que muestra el nmero de observaciones del conjunto de datos que entra en cada una de las clases de un conjunto de clases mutuamente excluyentes y colectivamente exhaustivas. Distribucin de frecuencias acumuladas Presentacin de datos en forma de tabla que muestra cuntos datos estn por encima o por debajo de ciertos valores. Distribucin de frecuencias relativas Presentacin de un conjunto de datos en el que se muestra la fraccin o porcentaje del total del conjunto de datos que entra en cada clase mutuamente excluyente y colectivamente exhaustiva. Histograma Grfica de un conjunto de datos compuesta por una serie de rectngulos, cada uno con un ancho proporcional al rango de los valores de cada clase y altura proporcional al nmero de elementos que entran en la clase (o altura proporcional a la fraccin de elementos de la clase). Muestra Coleccin de algunos elementos no todos, de la poblacin bajo estudio, utilizada para describir poblaciones. Muestra representativa Muestra que contiene las caractersticas importantes de la poblacin en las mismas proporciones en que estn contenidas en la poblacin. Ojiva Grfica de una distribucin de frecuencias acumuladas. Poblacin Coleccin de todos los elementos que se estn estudiando y sobre los cuales intentamos llegar a conclusiones. Polgono de frecuencias Lnea que une los puntos medios de cada clase de un conjunto de datos, trazada a la altura correspondiente a la frecuencia de los datos. Clase de la mediana Clase de una distribucin de frecuencias que contiene el valor mediano de un conjunto de datos. Coeficiente de variacin Medida relativa de la dispersin, que puede compararse para diferentes distribuciones y que expresa la desviacin estndar como porcentaje de la media. Cuartiles Fractiles que dividen los datos en cuatro partes iguales. Curtosis Medida de lo puntiagudo de una distribucin de puntos. Deciles Fractiles que dividen los datos en 10 partes iguales. Desviacin estndar Raz cuadrada positiva de la varianza; medida de dispersin con las mismas unidades que los datos originales, ms que en las unidades al cuadrado en que se expresa la varianza. Dispersin La separacin o variabilidad de un conjunto de datos. Distribucin bimodal Distribucin de datos puntuales en la que dos valores ocurren con ms frecuencia que los dems valores del conjunto de datos. Estadsticos Medidas numricas que describen las caractersticas de una muestra. Representados por caracteres latinos. Fractil En una distribucin de frecuencias, es la posicin de un valor en, o ms grande que, una fraccin dada de los datos. Media Medida de tendencia central que representa el promedio aritmtico de un conjunto de observaciones. Mediana Punto situado a la mitad del conjunto de datos, medida de localizacin que divide al conjunto de datos en dos partes iguales. Medida de dispersin Medida que describe cmo se dispersan o separan las observaciones de un conjunto de datos. Medida de tendencia central Medida que indica el valor que debe esperarse para un dato tpico o situado en el centro. Moda El valor que ocurre ms a menudo un conjunto de datos. Est representado por el punto ms alto de la curva de la distribucin de un conjunto de datos. Parmetros Valores numricos que describen las caractersticas de una poblacin completa; suelen representarse con letras griegas. Percentiles Fractiles que dividen los datos en 100 partes iguales. Rango Distancia entre los valores ms bajo y ms alto de un conjunto de datos. Rango intercuartil Diferencia entre los valores del primer y tercer cuartiles; esta diferencia representa el rango de la mitad central del conjunto de datos. Rango interfractil Medida de la dispersin entre dos fractiles de una distribucin; es decir, la diferencia entre los valores de dos fractiles. Resultado estndar Expresin de una observacin en trminos de unidades de desviacin estndar arriba o debajo de la media; es decir, la transformacin de una observacin al restarle la media y dividirla entre la desviacin estndar. Sesgo Grado en que una distribucin de puntos est concentrada en un extremo o en el otro; falta de simetra. Simtrica Caracterstica de una distribucin en la que cada mitad es la imagen de espejo de la otra. Teorema de Chebyshev No importa qu forma tenga la distribucin, al menos 75% de los valores de la poblacin caern dentro de dos desviaciones estndar a partir de la media, y al menos 89% caer dentro de tres desviaciones estndar. Varianza Medida del cuadrado de la distancia promedio entre la media y cada observacin de la poblacin.

Ecuaciones introducidas en el captulo 2 y 3

Para organizar datos sin procesar, escoja el nmero de clases entre las cuales va a dividir los datos (por lo general, entre 6 y 15 clases), y despus utilice la ecuacin 2-1 para determinar el ancho de los intervalos de clase de igual tamao. Esta frmula utiliza el valor ms alto siguiente de las mismas unidades debido a que mide el intervalo entre el primer valor de una clase y el primer valor de la siguiente.

La media aritmtica de la poblacin es igual a la suma de los valores de todos los elementos de la poblacin (_x) dividida entre el nmero total de elementos que componen la poblacin (N).

Para calcular la media aritmtica de la muestra, sume los valores de todos los elementos de la muestra (_x) y divida el resultado entre el nmero total de elementos de la muestra (n).

Para encontrar la media aritmtica de la muestra con datos agrupados , calcule los puntos medios (x) de cada clase de la muestra. Luego multiplique cada punto medio por la frecuencia ( f ) de observaciones de cada clase, sume (_) todos estos productos y divida la suma entre el nmero total de observaciones de la muestra (n).

Esta frmula nos permite calcular la media aritmtica de la muestra de datos agrupados mediante el uso de cdigos, con el fin de evitarnos trabajar con puntos medios muy grandes o inconvenientes. Asigne estos cdigos (u) de la manera siguiente: fije el valor cero al punto medio (denotado por x0), enteros positivos consecutivos a los puntos medios mayores a x0 y enteros negativos consecutivos a los puntos medios menores. Luego multiplique el cdigo asignado a cada clase (u) por la frecuencia ( f ) de las observaciones de cada clase y sume (_) todos los productos. Divida el resultado entre el nmero total de observaciones de la muestra (n), multiplique por el ancho numrico del intervalo de clase (w) y sume el valor del punto medio correspondiente al cdigo cero (x0).

La mediana es un solo valor que mide el elemento central del conjunto de datos. La mitad de las observaciones quedan arriba de la mediana y la otra mitad abajo. Si el conjunto de datos contiene un nmero impar de observaciones, el elemento de en medio es la mediana. Para un nmero par de elementos, la mediana es el promedio de las dos observaciones de en medio. Utilice esta ecuacin cuando los datos no estn agrupados.

Esta frmula nos permite encontrar la mediana de la muestra de datos agrupados . En ella, n es igual al nmero total de observaciones de la distribucin; F es la suma de todas las frecuencias de clase hasta la clase mediana, sin incluirla; fm es la frecuencia de las observaciones de la clase de la mediana; w es el ancho de intervalos de clase, y Lm es el lmite inferior del intervalo de la clase de la mediana.

La moda es el valor que con se repite ms frecuencia en el conjunto de datos. Para hallar la moda de datos agrupados (denotada con Mo), utilice esta frmula y tome a LMO igual al lmite inferior de la clase modal; d1 como la frecuencia de la clase modal menos la frecuencia de la clase que est inmediatamente abajo de ella; d2 igual a la frecuencia de la clase modal menos la frecuencia de la clase que est inmediatamente arriba de ella, y w como el ancho del intervalo de la clase modal.

El rango es la diferencia entre los valores ms alto y ms bajo de una distribucin de frecuencias.

El rango intercuartil mide aproximadamente qu tan lejos de la mediana debemos desplazarnos a ambos lados antes de poder incluir una mitad de los valores del conjunto de datos. Para calcular este rango, divida los datos en cuatro partes iguales. Los cuartiles (Q) son los valores ms altos de cada una de esas cuatro partes. El rango intercuartil es la diferencia entre los valores del primer y el tercer cuartil (Q1 y Q3).

Esta frmula nos permite calcular la varianza de la poblacin, una medida del cuadrado de la distancia promedio entre la media y cada observacin de la poblacin. La expresin de en medio, es la definicin de 2. La ltima expresin, es matemticamente equivalente a la definicin, pero a menudo es mucho ms conveniente usarla, debido a que nos libera del clculo de las desviaciones de la media.

La desviacin estndar de la poblacin, , es la raz cuadrada de la varianza de la poblacin. Es un parmetro ms til que la varianza, debido a que se expresa en las mismas unidades que los datos (mientras que las unidades de la varianza son el cuadrado de las unidades de los datos). La desviacin estndar es siempre la raz cuadrada positiva de la varianza.

El resultado estndar de una observacin es el nmero de desviaciones estndar que la observacin se separa hacia abajo o hacia arriba de la media de la distribucin. El resultado estndar nos permite hacer comparaciones entre los elementos de distribuciones que difieren en orden de magnitud o en las unidades empleadas. Utilice la ecuacin 3-14 para encontrar el resultado estndar de una observacin de una poblacin.

Esta frmula, en cualquiera de sus formas, nos permite calcular la varianza de datos ya agrupados en una distribucin de frecuencias. En ella, f representa la frecuencia de la clase y x es el punto medio.

Tome la raz cuadrada de la varianza y obtendr la desviacin estndar de datos agrupados.

Para calcular la varianza de la muestra, utilice la misma frmula de la ecuacin 3-12, sustituyendo _ con x_ y N con n _ 1. En el captulo 7 se explica por qu utilizamos n _ l en lugar de n, para calcular la varianza de la muestra.

La desviacin estndar de la muestra es la raz cuadrada de la varianza de la muestra. Es parecida a la ecuacin 3-13, excepto que _ se sustituye por la media de la muestra x_ y N se cambia por n _ 1.

Utilice esta ecuacin para encontrar el resultado estndar de una observacin en una muestra.

El coeficiente de variacin es una medida relativa de dispersin que nos permite comparar dos distribuciones. Relaciona la desviacin estndar y la media mediante la expresin de la desviacin estndar como porcentaje de la media.

También podría gustarte