Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Uni Primera Sesion
Estadistica Uni Primera Sesion
PLAN TEMATICO:
UNIDAD I: ESTADSTICA DESCRIPTIVA
INTRODUCCION
La estadstica se remonta a pocas en que los gobernantes requeran de tcnicas
para poder controlar sus propiedades y a las personas.
Posteriormente el desarrollo de los juegos de azar propici el estudio de mtodos
matemtico para su anlisis dando origen a la teora de probabilidades que hoy en
da es el sustento formal d la estadstica.
Actualmente sirve de soporte en todas las ciencias e investigacin cientfica.
Es de gran utilidad para la toma de decisiones en un entorno de incertidumbre.
IMPORTANCIA
La importancia de la estadstica en la ingeniera ha quedado manifiesta al
involucrarse en la industria con la mejora de la calidad.
Muchas compaas se han dado cuenta de que la baja calidad del producto,
manifestada en defectos de fabricacin y en la baja confiabilidad del producto
asociadas con su desempeo de campo, afectan directamente a la
productividad global, a su mercado accionario y a su posicin competitiva y, en
consecuencia, a sus ganancias. La estadstica propicia un criterio para lograr
mejoras, debido a que sus tcnicas se pueden usar para describir y comprender la
variabilidad.
En general, la variabilidad es resultado de los cambios que ocurren en las
condiciones en las cuales se hacen las observaciones. Dentro del contexto de la
manufactura, estos cambios pueden ser diferencias en los materiales de
muestras, diferencias en la forma de trabajar del agente, diferencias en las
variables del proceso, tales como temperatura, presin, o duracin del proceso,
as como diferencias en los factores ambientales, como la humedad relativa.
La variabilidad tambin ocurre debido al sistema de medida empleado. Por
ejemplo, el peso obtenido en una bscula puede depender del lugar en donde se
coloque, en el plato, el objeto por pesar.
Ramas de la estadstica
Las tcnicas estadsticas son tan diversas que los estadsticos, por lo general, las
dividen en dos grandes categoras: estadstica descriptiva y estadstica
inferencial.
Suponga que un profesor de una determinada materia calcula la calificacin
promedio de uno de sus grupos. Como la estadstica describe el desempeo del
grupo, pero no hace ninguna generalizacin acerca de los diferentes grupos.
Podemos decir que el profesor est utilizando estadstica descriptiva.
Suponga ahora que el profesor decide utilizar el promedio de calificacin obtenido
por uno de sus grupos en una unidad, para estimar la calificacin promedio del
grupo en las diez unidades del curso. El proceso de estimacin de tal promedio
sera un problema concerniente a la estadstica inferencial.
Los mtodos y las tcnicas de la inferencia estadstica se pueden utilizar tambin
en una rama de la estadstica conocida como teora de probabilidad o de
decisiones. Es de gran importancia para tomar decisiones en condiciones de
incertidumbre, cuando, por ejemplo, un fabricante de aparatos de sonido no puede
especificar precisamente la demanda de sus productos, o en una escuela se
deben asignar grupos y definir horarios sin tener el conocimiento preciso del
nmero de estudiantes que entrarn al primer grado.
Definiciones bsicas:
Estadstica: estudia los mtodos cientficos para recoger, organizar, resumir y
analizar datos, para sacar conclusiones vlidas y tomar decisiones razonables
mediante el anlisis.
Presentacin de datos.
Todos los todos los cuadros y grficos estadsticos, ya sea para una presentacin
pblica o algn informe escrito deben tener:
Un nmero de figuras, para una identificacin rpida.
Un ttulo, que describa qu se presenta como se clasifica la informacin,
cmo, qu, cundo y dnde ocurri el fenmeno.
Al pie de la figura se debe indicar la fuente de informacin (libro,
investigacin cientfica, revista boletn, etc.
Los cuadros estadsticos se clasifican segn el nmero de variables a presentar, si
solo hay una variable se les llama cuadro de frecuencia, si son dos o ms
variables se les llama cuadro de asociacin.
Ejemplo: cuadro de asociacin deporte vs baile
Los datos que se obtienen al momento de la medicin se le llaman frecuencia
absoluta u observada.
Para la construccin de tablas de frecuencia se procede de la siguiente manera:
Identificar las unidades de medidas de los datos.
Encontrar el Rango. (se recomienda ordenar los datos). Si el rango es
pequeo, podemos presentar para cada valor del rango su frecuencia.
Rango = dato mayor dato mayor.
Seleccionar el nmero K de clases. 5 15
Si K es el nmero de intervalos del mismo tamao C (Amplitud) entonces:
+
=
La ojiva apropiada para informacin que presente frecuencias mayores que el dato
que se est comparando tendr una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendr una pendiente
positiva.
5. Diagrama de barras
Semana # 2
Unidad I
Encuentro #1
media,
mediana,
moda para un conjunto de datos agrupados.
1 + 2 + 3+ +
=1
= =
1 1 + 2 2 + 3 3+ +
=1
= =
1 + 2 + 3 + +
1 1 + 2 2 + 3 3+ +
=1
= =
1 + 2 + 3 + +
1
= + ( )
1 + 2
= amplitud
= + ( 2 )
=lmite inferior de la clase de la mediana
ENCUENTRO # 2
cuartiles,
decles,
percentiles para un conjunto de datos agrupados,
diagrama de caja, interpretacin.
Objetivo: Aprende otras mediadas de posicin tanto para datos agrupados como
para datos no agrupado as como su debida interpretacin de acuerdo al anlisis
de datos dado.
CUANTILES
Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes;
los deciles, cuando dividen la distribucin en diez partes y los centiles o
percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los
deciles y los percentiles, son en cierta forma una extensin de la mediana .
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q2. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes frmulas:
El primer cuartil:
Cuando n es par:
Cuando n es impar:
Cuando n es par:
Cuando n es impar:
Datos Agrupados
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
DECILES
Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al
conjunto de datos ordenados en diez partes iguales, son tambin un caso
particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen
primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento acadmico.
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la frmula.
k= 1, 2,3,... 9
Donde:
Lk= Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk= Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes frmulas:
Cuando n es par:
Cuando n es impar:
Siendo A el nmero del decil.
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de
ubicacin o clasificacin de las personas cuando atienden caractersticas tales
como peso, estatura, etc.
Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados
en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en
cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,...
P99), ledos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan
mediante la frmula:
k= 1,2,3,... 99
Donde:
Lk = Lmite real inferior de la clase del decil k
n = Nmero de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes frmulas:
Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el nmero del percentil.
Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.
Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms
largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relacin con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Q3=(39 + 39) / 2 = 39
ANEXO
Comparar distribuciones
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22
A partir de dicha comparacin puede obtenerse bastante informacin de ambas
distribuciones.
ENCUENTRO # 1
Contenido: Formas de las distribuciones: simtricas y anti-simtricas,
medidas de dispersin: rango, varianza, desviacin estndar. Coeficiente de
variacin,
teorema de Chebyshev.
Otras medidas especiales.
Formas de distribucin
Simtricas: Cuando su curva de frecuencia es simtrica con respecto al
centro de los datos.
MEDIDAS DE DISPERSION
INTRODUCCION
Para el tratamiento de cierta enfermedad se quieren probar 3 drogas. Para
esto se seleccionan a 15 pacientes que estn en similares condiciones a 5
pacientes le aplican un tipo de droga, luego, se mide el tiempo que transcurre
hasta observar cierta manifestacin. Los resultados fueron:
60, 60, 60, 60, 60
60, 58, 61, 59, 62
40, 70, 50, 60, 80
La media para los 3 casos es 60. Entonces se podra pensar que los tratamientos
son igualmente efectivos.
Por todo esto necesitamos de una medida que nos permita comparar el grado de
dispersin de los datos con respecto al promedio.
Medidas de dispersin:
Existe otro tipo de medidas que indican la tendencia de los datos a dispersarse
respecto al valor central.
Algunas de las medidas de dispersin ms usuales son:
a) Rango, amplitud o recorrido (R)
b) Desviacin estndar (S , muestral; s , poblacional ).
c) Varianza (S , s )
d) Desviacin media (DM).
e) Coeficiente de Variacin (C. V.
Rango: es la diferencia del valor mximo y el valor mnimo de los datos.
Una desventaja del rango es que slo considera los valores extremos y no la
dispersin de los datos a nivel interno.
Desviacin media: es un promedio de las distancia de las observaciones a la
media.
=1| |
Para datos no agrupados =
=1| |
Para datos agrupados =
2
=1( )
Para datos agrupados: 2 = 1
La regla de Chebyshev
Es una regla que pone un lmite sobre la dispersin de la mayora de los datos en
torno de la media.
Teorema. Para cualquier conjunto de datos, la proporcin de datos que distan
menos de m desviaciones estndar de la media es como mnimo.
1
1
2
Dice, por ejemplo, que por lo menos 75% de las observaciones estn a menos de
m=2 desviaciones estndar de la media y por lo menos, 88.88% de las
observaciones estn a menos de m=3 desviaciones estndar de la media.
Ejemplo: Los siguientes datos son los nmeros de cras nacidas conjuntamente
para 18 parejas de ratones campestres.
365657576665554564
Calculando la media 5.33 y la desviacin estndar 1.03. Luego, la regla de
Chebyshev dice que por los menos un 75% de los datos estn contenidos en el
intervalo (3.27, 7.39) y que el intervalo 5.333x1.03=(2.24, 8.42) contiene por lo
menos un 88.88% de los datos.
( 2, + 2)