Está en la página 1de 24

TRABAJO DE ESTADISTICA

Estudiantes
BLANCA SUSANA BRAVO PORTILLA
LIDA ROSERO
WILLIAM ERAZO
ANDRES LOPEZ

UNIVERSIDAD MINUTO DE DIOS


FACULTAD DE ADMINISTRACION EN SALUD OCUPACIONAL
PROGRAGRA ADMINISTRACION
MOCOA COLOMBIA
2015

LINDON OSPINA Docent

INTRODUCCIN

Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin


con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la
distribucin de datos se denomina medida o parmetro de tendencia central o de
centralizacin.

Es decir; Cuando se hace referencia nicamente a la posicin de estos parmetros dentro


de la distribucin, independientemente, de que sta est ms o menos centrada, y se habla de
estas medidas como medidas de posicin.

MINIMOS CUADRADOS 1

Mnimos cuadrados es una tcnica de anlisis numrico enmarcada dentro de


la optimizacin matemtica, en la que, dados un conjunto de pares ordenados: variable
independiente, variable dependiente, y una familia de funciones, se intenta encontrar
la funcin continua, dentro de dicha familia, que mejor se aproxime a los datos (un "mejor
ajuste"), de acuerdo con el criterio de mnimo error cuadrtico.

En su forma ms simple, intenta minimizar la suma de cuadrados de las diferencias en las


ordenadas (llamadas residuos) entre los puntos generados por la funcin elegida y los
correspondientes valores en los datos. Especficamente, se llama mnimos cuadrados
promedio (LMS) cuando el nmero de datos medidos es 1 y se usa el mtodo de descenso por
gradiente para minimizar el residuo cuadrado. Se puede demostrar que LMS minimiza el
residuo cuadrado esperado, con el mnimo de operaciones (por iteracin), pero requiere un
gran nmero de iteraciones para converger.
Desde un punto de vista estadstico, un requisito implcito para que funcione el mtodo de
mnimos cuadrados es que los errores de cada medida estn distribuidos de forma aleatoria.
El teorema de Gauss-Mrkov prueba que los estimadores mnimos cuadrticos carecen de
sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribucin
normal. Tambin es importante que los datos a procesar estn bien escogidos, para que
permitan visibilidad en las variables que han de ser resueltas (para dar ms peso a un dato en
particular, vase mnimos cuadrados ponderados).
La tcnica de mnimos cuadrados se usa comnmente en el ajuste de curvas. Muchos otros
problemas de optimizacin pueden expresarse tambin en forma de mnimos cuadrados,
minimizando la energa o maximizando la entropa.

MEDIA ARITMTICA
1 Investigado en www.wikipedia .com

Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de


calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo
cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de
uno de sus valores o a los valores extremos demasiado grandes o pequeos.
La media se define como la suma de todos los valores observados, dividido por el
nmero total de observaciones.

Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa
cada uno de los valores de la poblacin. Ya que en la mayora de los casos se trabajan con
muestras de la poblacin todas las ecuaciones que se presenten a continuacin sern
representativas para las muestras. La media aritmtica para una muestra est determinada
como

Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi)
representa cada uno de los valores observados. Esta frmula nicamente es aplicable si los
datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la
multiplicacin de los diferentes valores por la frecuencia con que se encuentren dentro de la
informacin; es decir,

Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero
de observaciones en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las
frecuencias de cada clase.
Para entender mejor este concepto vamos a suponer que hemos tomado la edad de
5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su
interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30
aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los
puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos
datos se representados en la tabla.

Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si a estos
mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando
como referencia cada uno de los valores individuales, obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos
aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la
exactitud de los clculos, principalmente al aumentar el nmero de datos. Para evitar estos
inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores
desagrupados, aunque tiene algunos procedimientos para valores agrupados.

MEDIANA

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es
decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de
datos despus que las observaciones se han ubicado en serie ordenada. Esta medida nos indica
que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del
mismo. Para determinar la posicin de la mediana se utiliza la frmula

Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2,
5, 8, 10 y 13), la posicin de la mediana sera:

Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie,
que equivale al nmero (8). Si por el contrario contamos con un conjunto de datos que
contiene un nmero par de observaciones, es necesario promediar los dos valores medios de la

serie. Si en el ejemplo anterior le anexamos el valor 15, tendramos la serie ordenada (2, 5, 8,
10, 13 y 15) y la posicin de la mediana sera,

Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y
medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir
una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara
que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por
encima de este valor.

En conclusin la mediana nos indica el valor que separa los datos en dos fracciones
iguales con el cincuenta por ciento de los datos cada una. Para las muestras que cuentan con
un nmero impar de observaciones o datos, la mediana dar como resultado una de las
posiciones de la serie ordenada; mientras que para las muestras con un nmero par de
observaciones se debe promediar los valores de las dos posiciones centrales.

EJEMPLO DE LA MEDIANA:

Hallar la mediana de las siguientes edades.


17, 18, 20, 23, 30, 32, 40, 50,34
1. Se ordena de mayor a menor
2. Si se tiene un nmero impar la mediana seria el central
3. Pero si tiene un par se suman los dos centrales y se divide por dos

4. 17,18,20,23,30,32,34,40,50
5. Me= 30

LA MODA

La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir,
si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2
quien sera la moda de los datos. Es posible que en algunas ocasiones se presente dos valores
con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos ms de dos valores, lo
que se conoce como multimodal.

En conclusin las Medidas de tendencia central, nos permiten identificar los valores ms
representativos de los datos, de acuerdo a la manera como se tienden a concentrar.
La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendra
cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el
contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las
cuales cuenta con el cincuenta por ciento de los datos. Por ltimo la Moda nos indica el valor
que ms se repite dentro de los datos.

EJEMPLO

Se realiz una encuesta en el barrio san Agustn del municipio de Mocoa en la escuela del
cabildo indgena kamsa biya. Se midieron a 35 alumnos para saber cul era la estatura ms
frecuente en los alumnos. Hallar la media, mediana y moda
1.48 1.50 1.47 1.46 1.45 1.52 1.53 1.50 1.47 1.46 1.45 1.48 1.48 1.50 1.50 1.53
1.53 1.47 1.54 1.55 1.56 1.50 1.47 1.46 1.45 1.44 1.43 1.44 1.45 1.51 1.48 1.53
1.40 1.42 1.42
Hallar la media.

X=1.40+1.42+1.42+1.43+1.44+1.44+1.45+1.45+1.45+1.46+1.46+1.46+1.47+
1.47+1.47+1.47+1.48+1.48+1.48+1.48+1.50+1.50+1.50+1.50+1.50+1.51+1.52+
1.53+1.53+1.53 +1.54+1.55+1.56
35
X=1.39

ESTATUR

Frecuenci

A
1.40
1.42
1.43
1.44
1.45
1.46
1.47
1.48
1.50
1.51
1.52
1.53
1.54
1.55

a
1
2
1
2
3
3
4
4
5
1
1
3
1
1

1.56
Total

1
35

MEDIANA

1.40, 1.42, 1.42, 1.43, 1.44, 1.44, 1.45, 1.45+1.45+1.46+1.46+1.46+1.47+


1.47+1.47+1.47+1.48+1.48+1.48+1.48+1.50+1.50+1.50+1.50+1.50+1.51+1.52+
1.53+1.53+1.53 +1.54+1.55+1.56

LOS DATOS SE PUEDEN GRAFICAR

CUANTILES
Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina
la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales.
Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en
intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un
nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella,
se puede dividir la distribucin en cuatro, en diez o en cien partes.
Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles,
cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la
distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta
forma una extensin de la mediana.
Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):
u
0.5
0.25, 0.75
0.1, ... , 0.99
0.01, ..., 0.99

CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%)

de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por
debajo del cual quedan las tres cuartas partes (75%) de los datos.
Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un nmero grande de
datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una
tabla de frecuencia. La frmula para el clculo de los cuartiles cuando se trata de datos
agrupados es la siguiente:
k= 1, 2,3
Dnde:
Lk = Lmite real inferior de la del cuartil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es
decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el
75% de las observaciones.
Frmula de Q1, para series de Datos agrupados:

Dnde:

L1 = lmite inferior de la clase que lo contiene


P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
El segundo cuartil Q2, (coincide, es idntico o similar a la mediana, Q2 = Md), es el menor
valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son
mayores que la mediana y el 50% son menores.
Frmula de Q2, para series de Datos agrupados:

Dnde:
L1 = lmite inferior de la clase que lo contiene
P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es
decir aquel valor de la variable que supera al 75% y es superado por el 25% de las
observaciones.
Frmula de Q3, para series de Datos agrupados

Dnde:
L1 = lmite inferior de la clase que lo contiene

P = valor que representa la posicin de la medida


f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del
percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil.
Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
frmulas:
El primer cuartil:
Cuando n es par:

Cuando n es impar:
Para el tercer cuartil
Cuando n es par:
Cuando n es impar:

DECILES
Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes
porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan
D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento acadmico.
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la frmula.

k= 1,2, 3,... 9
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k

Otra frmula para calcular los deciles:


El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es
superado por el 60% de las observaciones.
El quinto decil corresponde a la mediana.
El noveno decil supera al 90% y es superado por el 10% restante.
Donde (para todos):
L1 = lmite inferior de la clase que lo contiene
P = valor que representa la posicin de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Frmulas Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las siguientes
frmulas:
Cuando n es par:
Cuando n es impar:
Siendo A el nmero del decil.
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o
clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el

conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,...,
percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la
frmula:

k= 1, 2,3,... 99
Dnde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y
nueve por ciento restante.

El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es


superado por el 40% de las observaciones.

El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

Frmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
frmulas:
Para los percentiles, cuando n es par:

Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el
percentil 50 y el tercer cuartil con el percentil 75.
3. EJEMPLO
Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:
Salarios
(I. De Clases)
200-299
300-299
400-499

500-599
600-699
700-800
Como son datos agrupados, se utiliza la frmula

Siendo,

La posicin del primer cuartil.

La posicin del 7 decil.

La posicin del percentil 30.


Entonces,

El primer cuartil:
115.5 85 = 30.75
Li = 300, Ic = 100, fi = 90

El 7 decil:

Posicin:
324.1 295 = 29.1
Li = 500, fi = 70

El percentil 30
Posicin:

138.9 85 = 53.9
fi = 90

Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334;
que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de los
empleados.

CONCLUSIN

Podemos concluir que este tipo de medidas nos permiten identificar y ubicar el punto (valor)
alrededor del cual se tienden a reunir los datos (Punto central). Estas medidas aplicadas a
las caractersticas de las unidades de una muestra se les denomina estimadores o estadgrafos;
mientras que aplicadas a poblaciones se les denomina parmetros o valores estadsticos de la
poblacin. Los principales mtodos utilizados para ubicar el punto central son la media, la
mediana y la moda.

La estadstica trata en primer lugar, de acumular la masa de datos numricos provenientes


de la observacin de multitud de fenmenos, procesndolos de forma razonable. Mediante la
teora de la probabilidad analiza y explora la estructura matemtica subyacente al fenmeno

del que estos datos provienen y, trata de sacar conclusiones y predicciones que ayuden al
mejor aprovechamiento del fenmeno.

También podría gustarte