Está en la página 1de 23

Estadística

Alumnos: Wilson Cruz Mahecha


Alexis torres “chiki”
Joan Gabriel Páez
Profesor: Alarico puentes
Curso:901
Año: 2010
Índice
QUE ES ESTADISTICA PERCENTILES

ESTADISTICA DESCRIPTIVA MEDIDAS DE DISPERSION

TABLAS DE FRECUENCIA DESVIO ESTANDAR

FRECUENCIA RELATIVA Y ABSOLUTA

FRECUENCIA ABSOLUTA ACUM. Y RELATIVA ACUM.

MEDIDAS DE TENDENCIA CENTRAL

MEDIA ARITMETICA

MEDIANA

MODA

CUARTILES Y QUINTILES
que es la estadística
 La estadística: es una ciencia referente a la recolección,
análisis e interpretación de datos, ya sea para ayudar en la
resolución de la toma de decisiones o para explicar
condiciones regulares o irregulares de algún fenómeno o
estudio aplicado, de ocurrencia en forma aleatoria o
condicional.

 Es transversal a una amplia variedad de disciplinas, desde la


física hasta las ciencias sociales, desde las ciencias de la salud
hasta el control de calidad. Se usa para la toma de decisiones
en áreas de negocios o instituciones gubernamentales.
Estadística descriptiva
 La estadística a estudiar en el área la estadística
descriptiva:

 Es una gran parte de la estadística que se dedica a


analizar y representar los datos. Este análisis es muy
básico. Aunque hay tendencia a generalizar a toda la
población, las primeras conclusiones obtenidas tras un
análisis descriptivo, es un estudio calculando una serie de
medidas de tendencia central, para ver en qué medida los
datos se agrupan o dispersan en torno a un valor central.
Tablas de frecuencia
estatura EDADES
Frecuencias absoluta y relativa
 Frecuencia absoluta :  Frecuencia relativa :

 (fi), es el cociente entre la frecuencia


 De una variable estadística Xi, absoluta y el tamaño de la muestra
es el número de veces que (N). Es decir:
aparece en el estudio este  siendo el fi para todo el conjunto i. Se
valor . A mayor tamaño de la presenta en una tabla o nube de puntos
muestra, aumentará el tamaño en una distribución de frecuencias.
de la frecuencia absoluta; es
 Si multiplicamos la frecuencia relativa
decir, la suma total de todas por 100 obtendremos el porcentaje o
las frecuencias absolutas debe tanto por ciento (pi) que presentan esta
dar el total de la muestra característica respecto al total de N, es
estudiada (N). decir el 100% del conjunto.
Frecuencia absoluta acumulada y relativa
acumulada
 Frecuencia absoluta acumulada:  Frecuencia relativa
acumulada: (Fi), es el cociente
 (Ni), es el número de veces ni en la entre la frecuencia absoluta
muestra N con un valor igual o acumulada y el número total de
menor al de la variable. La última datos, N. Es decir:
frecuencia absoluta acumulada
deberá ser igual a N.

 Con la frecuencia relativa


acumulada por 100 se obtiene el
porcentaje acumulado (Pi)), que al
igual que Fi deberá de resultar al
final el 100% de N.
Medidas de tendencia central
 El próximo tema a estudiar son, las Medidas de
tendencia central:

 Al describir grupos de observaciones, con


frecuencia es conveniente resumir la información
con un solo número. Este número que, para tal fin,
suele situarse hacia el centro de la distribución de
datos se denomina medida o parámetro de
tendencia central o de centralización
Media aritmética
 En matemáticas y estadística, la media aritmética (también llamada promedio o
simplemente media) de un conjunto finito de números es igual a la suma de todos
sus valores dividida entre el número de sumandos. Cuando el conjunto es una
muestra aleatoria recibe el nombre de media muestra siendo uno de los
principales estadísticos muéstrales.

 Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la


cantidad total de la variable distribuida a partes iguales entre cada observación.

 Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen
en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a
partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir
la información de una distribución (dinero en el bolsillo) suponiendo que cada
observación (persona) tuviera la misma cantidad de la variable.
Definición
 Dados los n números a1,a2, ... , an, la media aritmética se define simplemente
como:

 Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:

 Se utiliza la letra X con una barra horizontal sobre el símbolo para representar la
media de una muestra (x), mientras que la letra µ (mi) se usa para la media
aritmética de una población, es decir, el valor esperado de una variable.
propiedades
 -. La media aritmética de un conjunto de números positivos siempre es
igual o superior a la media geométrica:

 -. La media aritmética está comprendida entre el valor máximo y el valor


mínimo del conjunto de datos:
mediana
 En el ámbito de la estadística, una mediana es el
valor de la variable que deja el mismo número de
datos antes y después que él, una vez ordenados estos.

 De acuerdo con esta definición el conjunto de datos


menores o iguales que la mediana representarán el
50% de los datos, y los que sean mayores que la
mediana representarán el otro 50% del total de datos
de la muestra. La mediana coincide con el percentil
50, con el segundo cuartil y con el quinto decil.
calculo
 Existen dos estrategias para  Datos sin agrupar:
calcular la mediana:
 Sean los datos de una muestra
 Considerando los datos en forma ordenada en orden creciente y
individual, sin agruparlos, o bien
designando la mediana como
utilizando los datos agrupados en
Me, distinguimos dos casos:
intervalos de clase. Veamos cada
una de ellas:
 a) Si n es impar, la mediana es
el valor que ocupa la posición
n+1/2 una vez que los datos
han sido ordenados (en orden
creciente o decreciente), porque
éste es el valor central. Es decir:
 Por ejemplo, si tenemos 5  b) Si n es par, la mediana es la media
aritmética de las dos observaciones
datos, que ordenados son: x1 centrales. Cuando n es par, los dos datos
= 3, x2 = 6, x3 = 7, x4 = 8, x5 = que están en el centro de la muestra
ocupan las posiciones n/2 y n/2+1
9 => es decir:

 El valor central es el tercero:


 Por ejemplo, si tenemos 6 datos, que
x 5+1/2 =x3 =7 . ordenados son: x1 = 3, x2 = 6, x3 = 7, x4
Este valor, que es la mediana = 8, x5 = 9, x6 = 10 => Hay dos valores
de ese conjunto de datos, que están por debajo del y otros dos que
quedan por encima del siguiente dato :
deja dos datos por debajo (x1,
x2) y otros dos por encima de  X 6/2 +1 = x4 = 8
él (x4,x5)
Datos agrupados:
Por tanto, la


 Al tratar con datos agrupados, si n/2 coincide con

mediana de este el valor de una frecuencia acumulada, el valor de


la mediana coincidirá con la abscisa
correspondiente. Si no coincide con el valor de
grupo de datos es ninguna abscisa, se calcula a través de semejanza
de triángulos en el histograma o polígono de

la media aritmética frecuencias acumuladas, utilizando la siguiente


equivalencia:

de estos dos datos:


 Dónde Ni y Ni − 1 son las frecuencias absolutas
acumuladas tales que Ni -1< n/2< Ni, ai − 1 y ai son
los extremos, inferior y superior, del intervalo
donde se alcanza la mediana y Me = ai − 1 es la
abscisa a calcular, la moda. Se observa que ai − ai −
1 es la amplitud de los intervalos seleccionados
para el diagrama.
moda
 En estadística, la moda es el valor con una mayor frecuencia en una distribución de datos.

 Hablaremos de una distribución bimodal de los datos cuando encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los
datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia
diremos que no hay moda.

 El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados
antes de definir la moda, se ha de definir el intervalo modal.

 La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos
partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
Medidas de posición
 Permiten conocer otros puntos característicos de la distribución que no son
los valores centrales. Entre las medidas de posición no central más
importantes están los cuantiles que son aquellos valores de la variable,
que ordenados de menor a mayor, dividen a la distribución en partes, de tal
manera que cada una de ellas contiene el mismo número de frecuencias. 6
Los tipos más importantes de cuantiles son:

 Los Cuartiles, que dividen a la distribución en cuatro partes.

 Los Quintiles, que dividen a la distribución en cinco partes.

 Los Deciles, que dividen a la distribución en diez partes.

 Los Percentiles, que dividen a la distribución en cien partes.


Cuartiles y quintiles
 Cuartiles:  Quintiles:
 Dados una serie de valores X1,X2,X3 ...Xn ordenados
en forma creciente, definimos:
 Se representan con la letra K.

 Primer cuartil (Q1) como la mediana de la primera  Es el primer quintil. Separa a la muestra
mitad de valores; dejando el 20% de los datos a su
izquierda.
 Segundo cuartil (Q2) como la propia mediana de la
serie;
 Es el segundo quintil. Es el valor que
 Tercer cuartil (Q3) como la mediana de la segunda indica que el 40% de los datos son
mitad de valores. menores.
 La diferencia entre el tercer cuartil y el primero se
conoce como rango intercuartil.
 Es el tercer quintil. Indica que el 60% de
los datos son menores que él.
 En estadística descriptiva los Cuartiles son los tres
valores que dividen al conjunto de datos ordenados  Es el cuarto quintil. Separa al 80% de los
en cuatro partes porcentualmente iguales.
datos del otro 20%.
percentiles
 Definición: Es cada uno de los 99 segmentos que tomamos al dividir una muestra o un conjunto
de elementos ordenados por cien partes de igual frecuencia.
 Se representan con la letra P.

 Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores
menores que él y el 100-i % restante son mayores.

 Es decir al referirnos a un percentil en concreto, es el valor de la variable a observar que está por
debajo del porcentaje dado.
 Así, por ejemplo el P20 es el valor o puntuación por debajo del 20% de los valores ordenados que
hemos encontrado.
 Análogamente podemos decir:

 P25 es equivalente al Q1.

 P50 es equivalente al Q2 o mediana.

 P75 es equivalente al Q3.


 Cuando los datos no están agrupados en intervalos, los Cuartiles,
así como el resto de las medidas de posición, tienen un valor claro.
Sin embargo, cuando tenemos una agrupación de los datos ya no
es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál
de los intervalos está el cuartil (quintil, decil o percentil) buscado,
pero para calcular su valor exacto necesitaremos usar una fórmula.

 Un método fácil para calcular un percentil, sería el siguiente:


Calculamos x = n*i /100 donde n es el número de elementos de la
muestra e i el percentil. El resultado de realizar esta operación da
como resultado un número real con parte entera E y parte decimal
D. Teniendo en cuenta estos 2 valores, aplicamos la siguiente
función:
Medidas de dispersión
 También llamadas medidas de variabilidad, muestran la variabilidad de
una distribución, indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos
o varían mucho entre ellos.

 Para calcular la variabilidad que una distribución tiene respecto de su


media, se calcula la media de las desviaciones de las puntuaciones
respecto a la media aritmética. Pero la suma de las desviaciones es
siempre cero, así que se adoptan dos clases de estrategias para salvar
este problema. Una es tomando las desviaciones en valor absoluto
(Desviación media) y otra es tomando las desviaciones al cuadrado
(Varianza).
Desvió estándar
 Una manera que aparece como muy natural para construir una medida de dispersión sería promediar las desviaciones de
la media, pero como vimos.

 X1-x+x2-x+ …. +Xn-1-x+Xn-x=0

 Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las
desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el nombre de desvío estándar, o
desviación típica y es representada por la siguiente fórmula:

 La desviación estándar sólo puede utilizarse en el caso de que las observaciones se hayan medido con escalas de
intervalos o razones.

 A mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto a su media. Es un valor
que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia
común, que es la media aritmética. Se entiende entonces que cuando este valor es más pequeño, las diferencias de los
valores respecto a la media, es decir, los desvíos, son menores y, por lo tanto, el grupo de observaciones es más
Gracias por la atención prestada a este proyecto del
grupo 10 de la sección 901

VIDEO SOBRE LA ESTADISTICA

También podría gustarte