Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PLAN TEMATICO:
UNIDAD I: ESTADÍSTICA DESCRIPTIVA
INTRODUCCION
La estadística se remonta a épocas en que los gobernantes requerían de técnicas
para poder controlar sus propiedades y a las personas.
Posteriormente el desarrollo de los juegos de azar propició el estudio de métodos
matemático para su análisis dando origen a la teoría de probabilidades que hoy en
día es el sustento formal d la estadística.
Actualmente sirve de soporte en todas las ciencias e investigación científica.
Es de gran utilidad para la toma de decisiones en un entorno de incertidumbre.
IMPORTANCIA
La importancia de la estadística en la ingeniería ha quedado manifiesta al
involucrarse en la industria con la mejoría de la calidad.
Muchas compañías se han dado cuenta de que la baja calidad del producto,
manifestada en defectos de fabricación y en la baja confiabilidad del producto
asociadas con su desempeño de campo, afectan directamente a la
productividad global, a su mercado accionario y a su posición competitiva y, en
consecuencia, a sus ganancias. La estadística propicia un criterio para lograr
mejoras, debido a que sus técnicas se pueden usar para describir y comprender la
variabilidad.
En general, la variabilidad es resultado de los cambios que ocurren en las
condiciones en las cuales se hacen las observaciones. Dentro del contexto de la
manufactura, estos cambios pueden ser diferencias en los materiales de
muestras, diferencias en la forma de trabajar del agente, diferencias en las
variables del proceso, tales como temperatura, presión, o duración del proceso,
así como diferencias en los factores ambientales, como la humedad relativa.
La variabilidad también ocurre debido al sistema de medida empleado. Por
ejemplo, el peso obtenido en una báscula puede depender del lugar en donde se
coloque, en el plato, el objeto por pesar.
Ramas de la estadística
Las técnicas estadísticas son tan diversas que los estadísticos, por lo general, las
dividen en dos grandes categorías: estadística descriptiva y estadística
inferencial.
Suponga que un profesor de una determinada materia calcula la calificación
promedio de uno de sus grupos. Como la estadística describe el desempeño del
grupo, pero no hace ninguna generalización acerca de los diferentes grupos.
Podemos decir que el profesor está utilizando estadística descriptiva.
Suponga ahora que el profesor decide utilizar el promedio de calificación obtenido
por uno de sus grupos en una unidad, para estimar la calificación promedio del
grupo en las diez unidades del curso. El proceso de estimación de tal promedio
sería un problema concerniente a la estadística inferencial.
Los métodos y las técnicas de la inferencia estadística se pueden utilizar también
en una rama de la estadística conocida como teoría de probabilidad o de
decisiones. Es de gran importancia para tomar decisiones en condiciones de
incertidumbre, cuando, por ejemplo, un fabricante de aparatos de sonido no puede
especificar precisamente la demanda de sus productos, o en una escuela se
deben asignar grupos y definir horarios sin tener el conocimiento preciso del
número de estudiantes que entrarán al primer grado.
Definiciones básicas:
Estadística: estudia los métodos científicos para recoger, organizar, resumir y
analizar datos, para sacar conclusiones válidas y tomar decisiones razonables
mediante el análisis.
Presentación de datos.
Todos los todos los cuadros y gráficos estadísticos, ya sea para una presentación
pública o algún informe escrito deben tener:
Un número de figuras, para una identificación rápida.
Un título, que describa qué se presenta como se clasifica la información,
cómo, qué, cuándo y dónde ocurrió el fenómeno.
Al pie de la figura se debe indicar la fuente de información (libro,
investigación científica, revista boletín, etc.
Los cuadros estadísticos se clasifican según el número de variables a presentar, si
solo hay una variable se les llama cuadro de frecuencia, si son dos o más
variables se les llama cuadro de asociación.
Ejemplo: cuadro de asociación deporte vs baile
Los datos que se obtienen al momento de la medición se le llaman frecuencia
absoluta u observada.
Para la construcción de tablas de frecuencia se procede de la siguiente manera:
Identificar las unidades de medidas de los datos.
Encontrar el Rango. (se recomienda ordenar los datos). Si el rango es
pequeño, podemos presentar para cada valor del rango su frecuencia.
Rango = dato mayor – dato mayor.
Seleccionar el número K de clases. 5 ≤ k ≤15
Si K es el número de intervalos del mismo tamaño C (Amplitud) entonces:
Rango+1
C=
K
La ojiva apropiada para información que presente frecuencias mayores que el dato
que se está comparando tendrá una pendiente negativa (hacia abajo y a la
derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente
positiva.
5. Diagrama de barras
Semana # 2
Unidad I
Encuentro #1
media,
mediana,
N
Xi
X 3 +¿…+ X ∑i=1
X =X 1 + X 2 + =N
¿
N N
X 3+¿… +f X ∑ f i Xi
X =f 1 X 1 + f 2 X 2+ f 3 N N
= i=1 ¿
f 1 +f 2 + f 3 +…+ f n N
M 3+¿ …+ f M ∑ f i Mi
X =f 1 M 1+ f 2 M 2+ f 3 N
= i=1
N
¿
f 1+ f 2 + f 3+ …+ f n N
Moda: Es el valor que ocurre con mayor frecuencia en un conjunto de
datos. Puede no existir ser única o multimodal.
∆1
Moda=Li+ ( )
∆ 1+ ∆2
c
c= amplitud
N
Mediana=Li +
2
( )
−F a
f mediana
c
cuartiles,
decíles,
Objetivo: Aprende otras mediadas de posición tanto para datos agrupados como
para datos no agrupado así como su debida interpretación de acuerdo al análisis
de datos dado.
CUANTILES
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es
decir, en intervalos que comprenden el mismo número de valores. Cuando la
distribución contiene un número alto de intervalos o de marcas y se requiere
obtener un promedio de una parte de ella, se puede dividir la distribución en
cuatro, en diez o en cien partes.
Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes;
los deciles, cuando dividen la distribución en diez partes y los centiles o
percentiles, cuando dividen la distribución en cien partes. Los cuartiles, como los
deciles y los percentiles, son en cierta forma una extensión de la mediana .
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q2. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
El primer cuartil:
Cuando n es par:
Cuando n es impar:
Cuando n es par:
Cuando n es impar:
Datos Agrupados
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al
conjunto de datos ordenados en diez partes iguales, son también un caso
particular de los percentiles. Los deciles se denotan D 1, D2,..., D9, que se leen
primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1, 2,3,... 9
Donde:
Lk= Límite real inferior de la clase del decil k
n = Número de datos
Fk= Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales
como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados
en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en
cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,...
P99), leídos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan
mediante la fórmula:
k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
SEMANA 2
Formas de distribución
Simétricas: Cuando su curva de frecuencia es simétrica con respecto al
centro de los datos.
MEDIDAS DE DISPERSION
INTRODUCCION
Para el tratamiento de cierta enfermedad se quieren probar 3 drogas. Para
esto se seleccionan a 15 pacientes que están en similares condiciones a 5
pacientes le aplican un tipo de droga, luego, se mide el tiempo que
transcurre hasta observar cierta manifestación. Los resultados fueron:
60, 60, 60, 60, 60
60, 58, 61, 59, 62
40, 70, 50, 60, 80
La media para los 3 casos es 60. Entonces se podría pensar que los tratamientos
son igualmente efectivos.
Por todo esto necesitamos de una medida que nos permita comparar el grado de
dispersión de los datos con respecto al promedio.
Medidas de dispersión:
Existe otro tipo de medidas que indican la tendencia de los datos a dispersarse
respecto al valor central.
Algunas de las medidas de dispersión más usuales son:
a) Rango, amplitud o recorrido (R)
b) Desviación estándar (S , muestral; s , poblacional ).
c) Varianza (S² , s² )
d) Desviación media (DM).
e) Coeficiente de Variación (C. V.
Rango: es la diferencia del valor máximo y el valor mínimo de los datos.
Una desventaja del rango es que sólo considera los valores extremos y no la
dispersión de los datos a nivel interno.
Desviación media: es un promedio de las distancia de las observaciones a la
media.
n
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más
largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relación con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mínimo y máximo de la variable. Las líneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un límite de prolongación, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Q3=(39 + 39) / 2 = 39
ANEXO
Comparar distribuciones
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22
A partir de dicha comparación puede obtenerse bastante información de ambas
distribuciones.
Coeficiente de asimetría
Coeficiente de curtosis.
( Q3−Q2 )− ( Q2−Q1 )
A s= −1< A s<1
Q 3−Q 1
X́−M O
A s=
S
Interpretación del coeficiente de Pearson: los valores menores que 0 indican
asimetría negativa; los mayores, asimetría positiva y cuando sea cero, o muy
próximo a cero, simétrica. No está limitado a un rango de valores.
Acorde al tipo de variable que nos ocupa, el histograma representa la mejor opción
en la visualización de la asimetría de una variable, por otro lado, el diagrama de
caja y bigotes (boxplot) también constituye una opción válida para tal fin.
Apuntamiento (curtosis)
La regla de Chebyshev
• Es una regla que pone un límite sobre la dispersión de la mayoría de los datos en
torno de la media.