Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica 2
Estadistica 2
SUBJET MATH
2007 – 2008
GRADE: ELEVETH
TEACHER: PEDRO EMILIO PÉREZ ROMERO
CONCEPTOS BÁSICOS1
MEDIA
Promedio que quizá sea el más conocido. Se representa por x (que se
lee como “x barra” o “medid de la muestra”). La media se encuentra
sumando todos los valores de la variable x ( la suma de los valores de x
se simboliza como x ) y dividiendo entre el número de estos valores,
n.
=
X
x
n
MEDIANA
Valor de los datos que ocupa la posición central cuando los datos se
ordenan según su tamaño. Se representa por ~ x ( se lee como “x tilde” o
“mediana de la muestra”).
Procedimiento para encontrar la mediana.
Paso 1: Ordene los datos.
Paso 2: Determine la profundidad de la mediana. La profundidad
(número de posiciones a partir de cualquier extremo), o posición, se
determina con la siguiente formula:
n 1
(d) ~
x= , donde n es el número de datos de la muestra.
2
Paso 3: Determine la mediana. La mediana será la misma sin importar a
partir de cuál extremo de los datos ordenados (máximo o mínimo) se
cuente.
MODA
1
Tomado y adaptado de Estadística Elemental Lo Esencial. Jonson. R, Kuby. P, 2ª. Edición. Editorial
Thomson. 1999.
Es el valor de x que ocurre más frecuentemente. Si dos o más datos
están empatados en cuanto a mayor frecuencia (número de
ocurrencias), se dice que no hay moda.
RANGO MEDIO
Número que está exactamente a la mitad del camino entre un dato con
menor valor Mín y un dato con mayor valor Máx. Se encuentra
promediando los valores mínimo y máximo.
Mín Máx
Valor medio =
2
MEDIDAS DE DISPERSIÓN.
Una vez se ha localizado el “centro” con las medidas de tendencia
central, la investigación se dirige ahora a las medidas de dispersión. Las
medidas de dispersión incluyen el Rango, la Varianza y la Desviación
Estándar. Estos valores numéricos describen la cantidad de dispersión o
variabilidad, que se encuentra entre los datos: datos bastante agrupados
poseen valores relativamente pequeños, y datos más dispersos tienen
valores más grandes. El agrupamiento más estrecho ocurre cuando los
datos carecen de dispersión (todos los datos tienen el mismo valor),
para los cuales la medida de dispersión es cero. No hay límite respecto a
cuán dispersos pueden ser los datos; en consecuencia las medidas de
dispersión pueden ser muy grandes.
RANGO
Es la diferencia en valor entre las porciones de datos mayor (Máx) y de
menor valor (Mín):
Rango = Máx – Mín
VARANZA DE LA MUESTRA.
2
La varianza de la muestra, s , es la media de las desviaciones al
cuadrado, calculada usando como divisor a n –1.
x x
2
2
s =
n 1
donde n es el tamaño de la muestra, es decir, el número de datos que
hay en la muestra.
DESVIACIÓN ESTÁNDAR.
La desviación estándar de una muestra, S, es la raíz cuadrada positiva
de la varianza:
2
s = s
MEDIAY DESVIACIÓN ESTÁNDAR DE DISTRIBUCIONES DE
FRECUENCIAS.
Cuando los datos de la muestra están en forma de distribución de
frecuencias, podemos utilizar las siguientes fórmulas para encontrar la
media, la varianza y la desviación estándar.
Para hallar la media:
x =
xf
f
Para determinar la varianza:
xf 2
2 x f 2
s = f
f 1
ILUSTRACIÓN:
Encontrar la media, la varianza y la desviación estándar de la muestra
de 50 puntajes del examen, usando la distribución de frecuencias
agrupadas (del ejemplo ya realizado).
No. De Marca de f xf 2
Clase Clase x f
1 40 2 80 3200
2 50 2 100 5000
3 60 7 420 25200
4 70 13 910 63700
5 80 11 880 70400
6 90 11 990 89100
7 100 4 400 40000
f 50 xf 3780 x 2
f 296000
xf 2
xf 3780 2 x f
2
x =
f
=
50
75.6 ;
s = f =
f 1
37802
296600
50 10832 221.1
50 1 49
s s2 221.1 14.9
MEDIDAS DE POSICIÓN.
Las medidas de posición se usan para describir la posición que tiene un
valor de datos en relación con el resto de los datos. Dos de las medidas
de posición más conocidas son los cuarteles y los porcentiles
(percentiles).
CUARTILES.
Son los valores de la variable que dividen en cuartos a los daos
ordenados; cada conjunto de datos posee tres cuarteles. El primer
cuartil, Q1
, es un número tal que cuando mucho el 25% de los datos
mayor que Q 1
. El segundo cuartil es la media. El tercer cuartil, Q 3
,
es un número tal que cuando mucho el 75% de los datos es menor en
valor que Q 3
y cuando mucho el 25% de los datos es mayor que Q 3
.
PORCENTILES:
Son los valores de la variable que dividen a un conjunto de datos
ordenados en 100 subconjuntos iguales; cada conjunto de datos tiene 99
porcentiles. El K-ésimo porcentil, P k
, es el valor tal que cuando mucho
NOTAS
1. El primer cuartil y el 25avo porcentil son iguales;es decir
Q 1
P 25 ,también Q 3
P 75 .
CUARTIL MEDIO.
Es el valor numérico entre el primer cuartil y el tercer cuartil.
Cuartil medio =
Q Q 1 3 .
2
RESUMEN DE CINCOPUNTOS
El resumen de cinco puntos está integrado por:
1. Mín, el mínimo valor en el conjunto de datos.
2. Q 1
, el primer cuartil (también denominado 25avo porcentil).
3. ~
x , la mediana.
4. Q 3
, el tercer cuartil (también denominado 75avo porcentil).
5. Máx, el máximo valor en el conjunto de datos.
P 95
e. El resumen de 5 puntos f. Trace el diagrama de caja y
bigotes.
...
4. Con los datos obtenidos se traza el diagrama de caja y
bigotes.
TEOREMA DE CHEBYSHEV.
La porción de cualquier distribución que esté a menos de k desviaciones
1
estándar de la media es por lo menos 1 2 , donde k es cualquier
k
número positivo mayor que 1. Este teorema es válido para todas las
distribuciones de datos.
Brock M AE Lopez M T
Brand M T McGowan M AE
Crain M T Ornt M T
Feeney M T Rattan M AE
Flaniga M AE Sherman F AE
n
Hodge F AE Small F T
Holmes M T Tate M AE
Especialización
Filosofía y Administración de
Letras Empresas Tecnología
Masculin
Género o
Femenino
Especialización
Totales
Filosofía y Administración de por
Letras Empresas Tecnología Renglón
Masculin
Género o
Femenino
Totales por
columnas
Especialización Totales
Filosofía y Administración de por
Letras Empresas Tecnología Renglón
Masculin
Género o
Femenino
Totales por
columnas
Especialización Totales
Filosofía y Administración de por
Letras Empresas Tecnología Renglón
Masculin
Género o
Femenino
Totales por
columnas
Especialización
Totales
Filosofía y Administración de por
Letras Empresas Tecnología Renglón
Masculin
Género o
Femenino
Totales por
columnas
Distancia
de frenado Diseño A (n=6 Diseño B (n=6) Diseño C (n=6)
para los 37 36 33 35 40 39
tres
34 40 34 42 41 41
diseños de
banda de 38 32 38 34 40 43
rodamient
o
DIAGRAMA DE DISPERSIÓN
ILUSTRACIÓN.