Está en la página 1de 11

ESTADSTICA

1. INTRODUCCIN: Estadstica, rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. 2. HISTORIA: Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o cosas. Hacia el ao 3000 a.C. los babilonios usaban pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola y sobre los gneros vendidos o cambiados mediante trueque. En el siglo XXXI a.C., mucho antes de construir las pirmides, los egipcios analizaban los datos de la poblacin y la renta del pas. Los libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 a.C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el 594 a.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg la realizacin de un censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descripciones verbales. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico. 3. METODOS ESTADISTICOS: La materia prima de la estadstica consiste en conjuntos de nmeros obtenidos al contar o medir elementos. Al recopilar datos estadsticos se ha de tener especial cuidado para garantizar que la informacin sea completa y correcta. El primer problema para los estadsticos reside en determinar qu informacin y en que cantidad se ha de reunir. En realidad, la dificultad al compilar un censo est en obtener el nmero de habitantes de forma completa y exacta; de la misma manera que un fsico que quiere contar el nmero de colisiones por segundo entre las molculas de un gas debe empezar determinando con precisin la naturaleza de los objetos a contar. Los estadsticos se enfrentan a un complejo problema cuando, por ejemplo, toman una muestra para un sondeo de opinin o una encuesta electoral. El seleccionar una muestra capaz de representar con exactitud las preferencias del total de la poblacin no es tarea fcil. Para establecer una ley fsica, biolgica o social, el estadstico debe comenzar con un conjunto de datos y modificarlo basndose en la experiencia. Por ejemplo, en los primeros estudios sobre crecimiento de la poblacin, los cambios en el nmero de habitantes se predecan calculando la diferencia entre el nmero de nacimientos y el

de fallecimientos en un determinado lapso. Los expertos en estudios de poblacin comprobaron que la tasa de crecimiento depende slo del nmero de nacimientos, sin que el nmero de defunciones tenga importancia. Por tanto, el futuro crecimiento de la poblacin se empez a calcular basndose en el nmero anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta que las predicciones obtenidas utilizando este mtodo no daban resultados correctos. Los estadsticos comprobaron que hay otros factores que limitan el crecimiento de la poblacin. Dado que el nmero de posibles nacimientos depende del nmero de mujeres, y no del total de la poblacin, y dado que las mujeres slo tienen hijos durante parte de su vida, el dato ms importante que se ha de utilizar para predecir la poblacin es el nmero de nios nacidos vivos por cada 1.000 mujeres en edad de procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y fallecimientos slo es til para indicar el crecimiento de poblacin en un determinado periodo de tiempo del pasado, el nmero de nacimientos por cada 1.000 habitantes slo expresa la tasa de crecimiento en el mismo periodo, y slo el nmero de nacimientos por cada 1.000 mujeres en edad de procrear sirve para predecir el nmero de habitantes en el futuro. 4. POBLACIN, INDIVIDUO, CARCTER: El primer campo de actuacin de la estadstica, como se ha visto, es la demografa. De esta ciencia ha tomado la nomenclatura (poblacin, individuo). Se llama poblacin al conjunto de todos los elementos cuyo conocimiento interesa. Cada uno de esos elementos es un individuo. Si se est estudiando el resultado de ciertos experimentos qumicos, cada uno de esos experimentos ser un individuo estadstico y el conjunto de todos los posibles experimentos en esas condiciones ser la poblacin. Cada individuo puede ser descrito mediante uno o varios caracteres. Por ejemplo, si los individuos son personas, el sexo, el estado civil, el nmero de hermanos o su estatura son caracteres. Y si el individuo es una reaccin qumica, el tiempo de reaccin, la cantidad de producto obtenido o si ste es cido o bsico sern posibles caracteres que pueden analizarse. Un carcter puede ser cuantitativo si es medible numricamente o cualitativo si no admite medicin numrica. El nmero de hermanos y la estatura son caracteres cuantitativos mientras que el sexo y el estado civil son caracteres cualitativos. Los distintos valores que puede tomar un carcter cuantitativo configuran una variable estadstica. La variable estatura, en cierta poblacin estadstica, toma valores en el intervalo 147-205; y la variable nmero de hermanos toma los valores 0, 1, 2, 3, 4, 5, 6, 7 y 8. Una variable estadstica como esta ltima es discreta, ya que slo admite valores aislados. Una variable estadstica es continua si admite todos los valores de un intervalo, como ocurre con la estatura. 5. ESTADSTICA DESCRIPTIVA: La estadstica descriptiva analiza, estudia y describe a la totalidad de individuos de una poblacin. Su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. El proceso que sigue la estadstica descriptiva para el estudio de una cierta poblacin consta de los siguientes pasos: Seleccin de caracteres dignos de ser estudiados. Mediante encuesta o medicin, obtencin del valor de cada individuo en los caracteres seleccionados. Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro de cada carcter. Representacin grfica de los resultados (elaboracin de grficas estadsticas) . Obtencin de parmetros estadsticos, nmeros que sintetizan los aspectos ms relevantes de una distribucin estadstica. 6.ESTADSTICA INFERENCIAL: La estadstica descriptiva trabaja con todos los individuos de la poblacin. La estadstica inferencial, sin embargo, trabaja con muestras, subconjuntos formados por algunos individuos de la poblacin. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin. Cmo se selecciona la muestra, cmo se realiza la inferencia, y qu grado de confianza se puede tener en ella son aspectos fundamentales de la estadstica inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadstica, probabilidad y matemticas.

Poblacin (matemticas), el conjunto de todos los individuos cuyo conocimiento es objeto de inters desde un punto de vista estadstico. Por ejemplo, si se est interesado en las ventas de los comercios de una cierta ciudad, cada comercio es un individuo, y la poblacin tambin llamada universo es el conjunto de todos los comercios de la ciudad. El estudio estadstico de una poblacin se puede realizar mediante un anlisis exhaustivo de todos sus individuos (estadstica descriptiva) o bien mediante una inferencia realizada a partir de una muestra extrada de la poblacin (estadstica inferencial). Individuo (matemticas), en estadstica, cada uno de los elementos del colectivo que es objeto de estudio. Por ejemplo, si se estn estudiando datos sobre la habitabilidad de las viviendas de una barriada, cada vivienda es un individuo estadstico. Muestra, en estadstica, conjunto de individuos extrados de una poblacin con el fin de inferir, mediante su estudio, caractersticas de toda la poblacin. Se dice que una muestra es representativa cuando, por la forma en que ha sido seleccionada, aporta garantas suficientes para realizar inferencias fiables a partir de ella. Vase Muestreo. Muestreo, en estadstica, proceso por el cual se seleccionan los individuos que formarn una muestra. Para que se puedan obtener conclusiones fiables para la poblacin a partir de la muestra, es importante tanto su tamao como el modo en que han sido seleccionados los individuos que la componen. El tamao de la muestra depende de la precisin que se quiera conseguir en la estimacin que se realice a partir de ella. Para su determinacin se requieren tcnicas estadsticas superiores, pero resulta sorprendente cmo, con muestras notablemente pequeas, se pueden conseguir resultados suficientemente precisos. Por ejemplo, con muestras de unos pocos miles de personas se pueden estimar con muchsima precisin los resultados de unas votaciones en las que participarn decenas de millones de votantes. Para seleccionar los individuos de la muestra es fundamental proceder aleatoriamente, es decir, decidir al azar qu individuos de entre toda la poblacin forman parte de la muestra. Si se procede como si de un sorteo se tratara, eligiendo directamente de la poblacin sin ningn otro condicionante, el muestreo se llama aleatorio simple o irrestrictamente aleatorio. Cuando la poblacin se puede subdividir en clases (estratos) con caractersticas especiales, se puede muestrear de modo que el nmero de individuos de cada estrato en la muestra mantenga la proporcin que exista en la poblacin. Una vez fijado el nmero que corresponde a cada estrato, los individuos se designan aleatoriamente. Este tipo de muestreo se denomina aleatorio estratificado con asignacin proporcional. Las inferencias realizadas mediante muestras seleccionadas aleatoriamente estn sujetas a errores, llamados errores de muestreo, que estn controlados. Si la muestra est mal elegida no es significativa se producen errores sistemticos no controlados. Inferencia, en estadstica, proceso por el cual se deducen (infieren) propiedades o caractersticas de una poblacin a partir de una muestra significativa. Uno de los aspectos principales de la inferencia es la estimacin de parmetros estadsticos. Por ejemplo, para averiguar la media, , de las estaturas de todos los soldados de un reemplazo, se extrae una muestra y se obtiene su media, . La media de la muestra (media muestral), , es un estimador de la media poblacional, . Si el proceso de muestreo est bien realizado (es decir, la muestra tiene el tamao adecuado y ha sido seleccionada aleatoriamente), entonces el valor de , desconocido, puede ser inferido a partir de . La inferencia siempre se realiza en trminos aproximados y declarando un cierto nivel de confianza. Por ejemplo, si en una muestra de n = 500 soldados se obtiene una estatura media = 172 cm, se puede llegar a una conclusin del siguiente tipo: la estatura media, , de todos los soldados del reemplazo est comprendida entre 171 cm y 173 cm, y esta afirmacin se realiza con un nivel de confianza de un 90%. (Esto quiere decir que se acertar en el 90% de los estudios realizados en las mismas condiciones que ste y en el 10% restante se cometer error.) Si se quiere mejorar el nivel de confianza, se deber aumentar el tamao de la muestra, o bien disminuir la precisin de la estimacin dando un tramo ms amplio que el formado por el de extremos 171, 173. Recprocamente, si se quiere aumentar la precisin en la estimacin disminuyendo el tamao del intervalo, entonces hay que aumentar el tamao de la muestra o bien consentir un nivel de confianza menor. Finalmente, si se quiere mejorar tanto la precisin como el nivel de confianza, hay que tomar una muestra suficientemente grande.

Parmetro estadstico, nmero que se obtiene a partir de los datos de una distribucin estadstica y que sirve para sintetizar alguna caracterstica relevante de la misma. Conociendo los valores de algunos parmetros, aunque se desconozcan los datos de la distribucin, se adquiere una idea suficientemente clara de ella. Los parmetros estadsticos correspondientes a distribuciones con una variable se pueden clasificar del siguiente modo: medidas de centralizacin, medidas de dispersin y medidas de posicin. Las medidas de centralizacin son parmetros estadsticos alrededor de los cuales se distribuyen los datos de la distribucin y se toman como el centro de la misma. Las ms importantes son la media, la mediana y la moda. Las medidas de dispersin son parmetros estadsticos que indican cunto se alejan del centro los valores de la distribucin. Las ms importantes son la desviacin tpica y la varianza. Las medidas de posicin sirven para indicar la proporcin de individuos de la distribucin que hay antes y despus de un determinado valor. Las ms importantes son los cuartiles y los percentiles o centiles. Ciertos parmetros estadsticos indican si la distribucin es ms o menos asimtrica (coeficiente de asimetra) y ms o menos picuda o aplastada (coeficiente de aplastamiento). Existen tambin parmetros estadsticos correspondientes a distribuciones bidimensionales (con dos variables), que sirven para indicar la relacin entre las variables: la covarianza, el coeficiente de correlacin y el coeficiente de regresin. Cuartiles, en estadstica, medidas de posicin que, junto con la mediana, sirven para separar la poblacin en cuatro porciones, cada una de ellas con la cuarta parte de los individuos. El cuartil inferior, Q1, es un valor por debajo del cual queda el 25% de la poblacin. Es, por tanto, el percentil 25: Q1 = p25. El cuartil superior, Q3, es un valor por debajo del cual queda el 75% de la poblacin. Es, por tanto, el percentil 75: Q3 = p75. La mediana sera el segundo cuartil, pero no se le suele dar este nombre. La diferencia entre los cuartiles superior e inferior es el recorrido intercuartlico. Percentil, en estadstica, parmetro que indica el porcentaje de individuos de una distribucin que tienen un valor inferior a l. Es una medida de posicin. Por ejemplo, el percentil 80, p 80, es un nmero que supera al 80% de los datos de la distribucin. Los percentiles tambin se llaman centiles.

Medidas de centralizacin:
INTRODUCCIN: Medidas de centralizacin, parmetros estadsticos que marcan, bajo distintos criterios, los valores en torno a los cuales se disponen los datos de una distribucin. Tambin se llaman medidas de tendencia central, pues entorno a ellas se disponen los elementos de las distribuciones. Las ms importantes son la media, la mediana y la moda.

La media aritmtica, promedio o, simplemente, media, de los valores x1, x2,, xn, se designa por y se obtiene as:

Por ejemplo, si las edades de 7 nios son 4, 6, 6, 7, 9, 11 y 13, la media es:

La mediana, Me, es un nmero que supera a la mitad de los valores de la distribucin y es superada por la otra mitad. Si el nmero de trminos de la distribucin es impar, la mediana es el valor del individuo que ocupa el lugar central cuando los datos estn ordenados de menor a mayor. Por ejemplo, en la distribucin de edades 4, 6, 6, 7, 9, 11, 13, la mediana es Me = 7, pues hay tres datos menores que 7 y tres mayores que 7. Si el nmero de trminos de la distribucin es par, la mediana es el valor medio de los datos centrales. As, en la distribucin 4, 6, 6, 7, 8, 9, 11, 13, los valores 7 y 8 son los centrales. La mediana es Me = 7,5. La moda, Mo, de una distribucin estadstica es el valor que ms se repite. Una distribucin puede tener ms de una moda o no tener ninguna. En la distribucin 4, 6, 6, 7, 9, 11, 13, la moda es Mo = 6. 2 : Cuando la distribucin

estadstica viene dada por una tabla de frecuencias en la cual la variable toma n valores, x1,

x2,, xn, cada uno de ellos con su correspondiente frecuencia, f1, f2,, fn, la obtencin de los
parmetros estadsticos se puede realizar muy fcilmente. 2.1MEDIA: La media se obtiene as:

Los clculos se realizan de forma muy sencilla si en la tabla de frecuencias se aade una nueva columna con los productos fixi de cada valor de la variable, xi, por la correspondiente frecuencia,

fi:

fi es la suma de los nmeros de la columna fi. fixi es la suma de los productos indicados en la columna fixi.

Por ejemplo, en la distribucin

para calcular la media se pone la tabla en forma de columna y se aade la nueva columna fixi:

La media es

= 456/85 = 5,36.

2.2MEDIANA: Para obtener la mediana a partir de una tabla de frecuencias se aade a sta la columna con las frecuencias acumuladas, fai. La mediana es el primer valor de la variable, xk, para el cual la frecuencia acumulada fak supera la mitad del nmero N = fi. Por ejemplo, en la distribucin anterior

se completa la tabla con las frecuencias acumuladas:

La mediana es Me = 5 porque la frecuencia acumulada para ese valor de la variable, fa(5) = 46, es la primera que supera a N/2 = 42,5. 2.3 MODA: Cuando la distribucin viene dada por una tabla de frecuencias, la moda es muy fcil de ver. Es el valor xi de la variable al que corresponde mayor frecuencia. En la distribucin anterior, la moda es Mo = 5, pues la frecuencia correspondiente f(5) = 21 es la mayor de todas. Medidas de dispersin INTRODUCCIN: Medidas de dispersin, parmetros estadsticos que miden cmo de diseminados se encuentran los datos de una distribucin. Los ms utilizados se refieren al grado de lejana de los datos respecto a la media y son la desviacin media, la varianza, la desviacin tpica y el coeficiente de variacin. La desviacin media, D.m., es un promedio de los valores absolutos de las desviaciones, |xi - |, de cada elemento, xi, de la distribucin respecto a su media, :

Por ejemplo, en la distribucin 4, 6, 6, 7, 9, 11, 13, cuya media es 8, la desviacin media es:

La varianza, V, es el promedio de los cuadrados de las desviaciones, (xi - )2, de cada elemento,

xi, respecto a la media, :

La frmula anterior es equivalente a esta otra:

que resulta ms cmoda de aplicar, sobre todo cuando la media, , no es un nmero entero. En la distribucin 4, 6, 6, 7, 9, 11, 13, de media 8, la varianza es:

Aplicando la segunda frmula se obtiene, obviamente, el mismo resultado:

La desviacin tpica o desviacin estndar, , es la raz cuadrada de la varianza:

La razn de ser de este parmetro es conseguir que la medida de dispersin se exprese en las mismas unidades que los datos a los que se refiere. Por ejemplo, en una distribucin de estaturas en la que los datos estn dados en centmetros (cm), la media viene dada en centmetros, pero la varianza en centmetros cuadrados (cm2). Para evitar este inconveniente se calcula su raz cuadrada, obtenindose as la desviacin tpica en centmetros. El par de parmetros formado por la media y la desviacin tpica ( , ) aporta una informacin suficientemente buena sobre la forma de la distribucin.

El coeficiente de variacin, C.V., es el cociente entre la desviacin tpica y la media de la distribucin:

Este parmetro sirve para relativizar el valor de la desviacin tpica y as poder comparar la dispersin de dos poblaciones estadsticas con gamas de valores muy discretas. Por ejemplo, si en una compaa mexicana los salarios de los empleados tienen una media
1

= 7.000 pesos y

una desviacin tpica 1 = 500 pesos y en otra empresa espaola la media de los salarios es
2

= 200.000 pesetas y la desviacin tpica 2 = 40.000 pesetas, para comparar la dispersin de

salarios se recurre al coeficiente de variacin: C.V.1 = 500/7.000 = 0,07 C.V.2 = 40.000/200.000 = 0,2

Se aprecia as que en la primera compaa los salarios tienen menor dispersin que en la segunda. Otras medidas de dispersin son el recorrido y el recorrido intercuartlico. El recorrido es la diferencia entre los valores mayor y menor de la distribucin. Indica, pues, la longitud del tramo en el que se hallan los datos. Tambin se llama rango. El recorrido intercuartlico es la diferencia, Q3 Q1 , entre el cuartil superior, Q3, y el cuartil inferior, Q1. El par de parmetros formado por la mediana, Me, y el recorrido intercuartlico, Q3 Q1, proporciona una buena informacin sobre la forma de la distribucin. 2.-CLCULO DE A PARTIR DE UNA TABLA DE FRECUENCIAS: Cuando la distribucin estadstica viene dada por una tabla de frecuencias en la que la variable toma n valores, x1, x2,, xn, cada uno de ellos con su correspondiente frecuencia, f1, f2,, fn, la obtencin de la desviacin tpica se realiza cmodamente procediendo como se explica a continuacin. A la tabla de frecuencias con las columnas xi de los datos y fi de las frecuencias, se aaden dos nuevas columnas:

La tercera columna, fixi, se obtiene multiplicando trmino a trmino los elementos de las dos primeras columnas; la cuarta columna, fixi2, se obtiene multiplicando los trminos de la primera por los de la tercera. La suma de la columna segunda proporciona el nmero de elementos de la distribucin, N: N = fi

La suma de la columna tercera permite calcular la media, :

Conocida la media, la varianza se obtiene utilizando la suma de la columna cuarta:

La desviacin tpica es la raz cuadrada de la varianza:

Por ejemplo, en la distribucin

el nmero de elementos es N = 85 y la media

= 456/85 = 5,36

Y la varianza y la desviacin tpica son: V = 2636/85 5,362 = 2,28

Desviacin tpica Desviacin tpica, en estadstica, una de las medidas de dispersin. Representa el alejamiento de una serie de nmeros de su valor medio. Se calcula a partir de todas las desviaciones individuales con respecto a la media. Un ejemplo sencillo es considerar las estaturas de un grupo de cinco nios: 1,41, 1,45, 1,50, 1,59 y 1,60 m. La media de las estaturas es 1,51 m. Las desviaciones son las diferencias con respecto a la media. No se puede utilizar una media simple de las desviaciones, porque automticamente se obtendra un valor de cero (los valores positivos y negativos se cancelan entre s), y sta es la razn por la que se recurre a un mtodo ms complejo. En la prctica, se promedian los cuadrados de las desviaciones (los cuadrados son siempre positivos), y luego se toma la raz cuadrada. La media de las desviaciones al cuadrado es 0,00564, y su raz cuadrada es 0,075. sta es la desviacin tpica, que se representa normalmente por el smbolo (sigma). Muchos ordenadores y calculadoras de bolsillo poseen procedimientos para calcularla directamente, una vez que se han introducido las series de nmeros. Otro grupo de nios podra tener alturas de 1,46, 1,48, 1,51, 1,53 y 1,57 m. La altura promedio es de nuevo 1,51 m, pero esta vez la desviacin tpica es 0,038. El segundo grupo est ms agrupado en torno a la media, y el valor menor de la desviacin tpica lo muestra con claridad.

Si en una distribucin estadstica hay n valores, representados por xi, y su media es , entonces las desviaciones son xi - , y la desviacin tpica viene dada por la frmula:

La desviacin tpica tambin se puede calcular mediante esta otra frmula, equivalente a la anterior:

Medidas de posicin INTRODUCCIN: Medidas de posicin, parmetros estadsticos que designan la proporcin de individuos de la poblacin cuyo valor es inferior a un cierto valor. Los ms importantes son los cuartiles y los percentiles. CUARTILES: Si los elementos de una distribucin ordenados de menor a mayor se dividen en cuatro porciones iguales (cada una con la cuarta parte de los individuos), los puntos que separan las distintas porciones se llaman cuartiles. El cuartil inferior, Q1, o primer cuartil, es un nmero que supera la cuarta parte de los datos y es superado por las tres cuartas partes de ellos. El cuartil superior, Q3, o tercer cuartil, supera a las tres cuartas partes de los datos y es superado por la cuarta parte. El segundo cuartil es la mediana.

PERCENTILES: Se llama percentil (o centil ) a un nmero que supera al % de los valores. Por ejemplo, si la nota de un alumno es superior a la del 87% de sus compaeros y, por tanto, es superada por el 13% de ellos, decimos que el alumno ocupa el percentil 87, y se designa mediante p87. Es claro que los cuartiles son los percentiles 25 y 75 y la mediana es el percentil 50: Q1 = p25 ; Me = p50 ; Q3 = p75

También podría gustarte