Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudiantes
BLANCA SUSANA BRAVO PORTILLA
LIDA ROSERO
WILLIAM ERAZO
ANDRES LOPEZ
INTRODUCCIN
MINIMOS CUADRADOS 1
MEDIA ARITMTICA
1 Investigado en www.wikipedia .com
Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa
cada uno de los valores de la poblacin. Ya que en la mayora de los casos se trabajan con
muestras de la poblacin todas las ecuaciones que se presenten a continuacin sern
representativas para las muestras. La media aritmtica para una muestra est determinada
como
Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi)
representa cada uno de los valores observados. Esta frmula nicamente es aplicable si los
datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la
multiplicacin de los diferentes valores por la frecuencia con que se encuentren dentro de la
informacin; es decir,
Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero
de observaciones en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las
frecuencias de cada clase.
Para entender mejor este concepto vamos a suponer que hemos tomado la edad de
5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su
interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30
aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los
puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos
datos se representados en la tabla.
Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si a estos
mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando
como referencia cada uno de los valores individuales, obtendramos que la media es igual a
Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos
aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la
exactitud de los clculos, principalmente al aumentar el nmero de datos. Para evitar estos
inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores
desagrupados, aunque tiene algunos procedimientos para valores agrupados.
MEDIANA
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es
decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de
datos despus que las observaciones se han ubicado en serie ordenada. Esta medida nos indica
que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del
mismo. Para determinar la posicin de la mediana se utiliza la frmula
Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2,
5, 8, 10 y 13), la posicin de la mediana sera:
Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie,
que equivale al nmero (8). Si por el contrario contamos con un conjunto de datos que
contiene un nmero par de observaciones, es necesario promediar los dos valores medios de la
serie. Si en el ejemplo anterior le anexamos el valor 15, tendramos la serie ordenada (2, 5, 8,
10, 13 y 15) y la posicin de la mediana sera,
Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y
medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir
una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara
que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por
encima de este valor.
En conclusin la mediana nos indica el valor que separa los datos en dos fracciones
iguales con el cincuenta por ciento de los datos cada una. Para las muestras que cuentan con
un nmero impar de observaciones o datos, la mediana dar como resultado una de las
posiciones de la serie ordenada; mientras que para las muestras con un nmero par de
observaciones se debe promediar los valores de las dos posiciones centrales.
EJEMPLO DE LA MEDIANA:
4. 17,18,20,23,30,32,34,40,50
5. Me= 30
LA MODA
La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir,
si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2
quien sera la moda de los datos. Es posible que en algunas ocasiones se presente dos valores
con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos ms de dos valores, lo
que se conoce como multimodal.
En conclusin las Medidas de tendencia central, nos permiten identificar los valores ms
representativos de los datos, de acuerdo a la manera como se tienden a concentrar.
La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendra
cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el
contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las
cuales cuenta con el cincuenta por ciento de los datos. Por ltimo la Moda nos indica el valor
que ms se repite dentro de los datos.
EJEMPLO
Se realiz una encuesta en el barrio san Agustn del municipio de Mocoa en la escuela del
cabildo indgena kamsa biya. Se midieron a 35 alumnos para saber cul era la estatura ms
frecuente en los alumnos. Hallar la media, mediana y moda
1.48 1.50 1.47 1.46 1.45 1.52 1.53 1.50 1.47 1.46 1.45 1.48 1.48 1.50 1.50 1.53
1.53 1.47 1.54 1.55 1.56 1.50 1.47 1.46 1.45 1.44 1.43 1.44 1.45 1.51 1.48 1.53
1.40 1.42 1.42
Hallar la media.
X=1.40+1.42+1.42+1.43+1.44+1.44+1.45+1.45+1.45+1.46+1.46+1.46+1.47+
1.47+1.47+1.47+1.48+1.48+1.48+1.48+1.50+1.50+1.50+1.50+1.50+1.51+1.52+
1.53+1.53+1.53 +1.54+1.55+1.56
35
X=1.39
ESTATUR
Frecuenci
A
1.40
1.42
1.43
1.44
1.45
1.46
1.47
1.48
1.50
1.51
1.52
1.53
1.54
1.55
a
1
2
1
2
3
3
4
4
5
1
1
3
1
1
1.56
Total
1
35
MEDIANA
CUANTILES
Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina
la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales.
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en
intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un
nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella,
se puede dividir la distribucin en cuatro, en diez o en cien partes.
Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles,
cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la
distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta
forma una extensin de la mediana.
Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):
u
0.5
0.25, 0.75
0.1, ... , 0.99
0.01, ..., 0.99
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%)
de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por
debajo del cual quedan las tres cuartas partes (75%) de los datos.
Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos un nmero grande de
datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una
tabla de frecuencia. La frmula para el clculo de los cuartiles cuando se trata de datos
agrupados es la siguiente:
k= 1, 2,3
Dnde:
Lk = Lmite real inferior de la del cuartil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es
decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el
75% de las observaciones.
Frmula de Q1, para series de Datos agrupados:
Dnde:
Dnde:
L1 = lmite inferior de la clase que lo contiene
P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es
decir aquel valor de la variable que supera al 75% y es superado por el 25% de las
observaciones.
Frmula de Q3, para series de Datos agrupados
Dnde:
L1 = lmite inferior de la clase que lo contiene
Cuando n es impar:
Para el tercer cuartil
Cuando n es par:
Cuando n es impar:
DECILES
Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes
porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan
D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento acadmico.
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la frmula.
k= 1,2, 3,... 9
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,...,
percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la
frmula:
k= 1, 2,3,... 99
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y
nueve por ciento restante.
Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el
percentil 50 y el tercer cuartil con el percentil 75.
3. EJEMPLO
Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:
Salarios
(I. De Clases)
200-299
300-299
400-499
500-599
600-699
700-800
Como son datos agrupados, se utiliza la frmula
Siendo,
El primer cuartil:
115.5 85 = 30.75
Li = 300, Ic = 100, fi = 90
El 7 decil:
Posicin:
324.1 295 = 29.1
Li = 500, fi = 70
El percentil 30
Posicin:
138.9 85 = 53.9
fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334;
que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de los
empleados.
CONCLUSIN
Podemos concluir que este tipo de medidas nos permiten identificar y ubicar el punto (valor)
alrededor del cual se tienden a reunir los datos (Punto central). Estas medidas aplicadas a
las caractersticas de las unidades de una muestra se les denomina estimadores o estadgrafos;
mientras que aplicadas a poblaciones se les denomina parmetros o valores estadsticos de la
poblacin. Los principales mtodos utilizados para ubicar el punto central son la media, la
mediana y la moda.
del que estos datos provienen y, trata de sacar conclusiones y predicciones que ayuden al
mejor aprovechamiento del fenmeno.