Estadistica

TRABAJO DE CONTROL ESTADISTICO DE LA PRODUCCIÓN
INTEGRANTES:
ARAMYS GARCIA LAMBIS
MARIA REYES RODELO
MARITZA GARCES SUARESZ
PROFESORA:
ZORAIDA CARRILLO
UNIVERSIDAD DEL SINÚ

CARTAGENA – BOLIVAR
1) EN QUE SITUACIONES SE UTILIZA DATOS POBLACIONALES Y
MUÉSTRALES
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o

generalizar resultados de una muestra a una población. Se estudia en particular a
un reducido número de individuos a los que tenemos acceso con la idea de poder
generalizar los hallazgos a la población de la cual esa muestra procede. Este
proceso de inferencia se efectúa por medio de métodos estadísticos basados en la
probabilidad.
La población representa el conjunto grande de individuos que deseamos estudiar y
generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que
reúne unas características determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la población
accesible y limitado sobre el que realizamos las mediciones o el experimento con la
idea de obtener conclusiones generalizables a la población). El individuo es cada
uno de los componentes de la población y la muestra. La muestra debe ser
representativa de la población y con ello queremos decir que cualquier individuo de
la población en estudio debe haber tenido la misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre
ellas podemos señalar 3:
a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva
menos tiempo.
b. Como consecuencia del punto anterior ahorraremos costes.
c. Estudiar la totalidad de los pacientes o personas con una característica
determinada en muchas ocasiones puede ser una tarea inaccesible o
imposible de realizar.
d. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos,
las observaciones y mediciones realizadas a un reducido número de
individuos pueden ser más exactas y plurales que si las tuviésemos que
realizar a una población.
e. La selección de muestras específicas nos permitirá reducir la
heterogeneidad de una población al indicar los criterios de inclusión y/o
exclusión.
2) UN DIAGRAMA DE CAJA
Es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de
datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico representativo de las distribuciones de un conjunto de datos en cuya
construcción se usan cinco medidas descriptivas de los mismos, a saber: mediana,
primer cuartil, tercer cuartil, valor máximo y valor mínimo.
Esta presentación visual, asocia las cinco medidas que suelen trabajarse de forma
individual. Presenta al mismo tiempo, información sobre la tendencia central,
dispersión y simetría de los datos de estudio. Además, permite identificar con
claridad y de forma individual, observaciones que se alejan de manera poco usual
del resto de los datos. A estas observaciones se les conoce como valores atípicos.
Es un gráfico que suministra información sobre los valores mínimo y máximo, los
cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la
simetría de la distribución.
1.-Límite superior: Es el extremo superior del bigote. Las opiniones por encima de
este límite se consideran atípicas.
2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como máximo el 75%
de las opiniones de los estudiantes.
3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos partes
iguales. De este modo, 50% de las observaciones están por debajo de la mediana
y 50% está por encima.
4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo el 25%
de las opiniones de los estudiantes
5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este
valor se consideran atípicas.
6.-Valores atípicos: Opiniones que están apartadas del cuerpo principal de datos.
Pueden representar efectos de causas extrañas, opiniones extremas o en el caso
de la tabulación manual, errores de medición o registro.
En el ejemplo: 0.5 y 3.5
• Además, se pueden considerar valores extremadamente atípicos aquellos que
exceden Q1-3 x RIC ó Q3 + 3 x RIC. De modo que, en el ejemplo:
• inferior: 7 – (3 x 2) = 1
• Superior: 9 + (3 x 2) = 15 El valor 0.5 seria atípico extremo y el 3.5 sería atípico
Utilidad
• Proporcionan una visión general de la simetría de la distribución de los datos; si la
mediana no está en el centro del rectángulo, la distribución no es simétrica.
• Son útiles para ver la presencia de valores atípicos también llamados outliers.
3) CUALES SON LOS MÉTODOS PARA AJUSTAR LAS DISTRIBUCIONES?
Como se expresó consideraremos los métodos de ajuste para tres funciones
específicas: la distribución normal, la normal logarítmica y la uniforme:
1) Comprobación de la normalidad: Del conjunto de pruebas de normalidad,
teniendo en cuenta la potencia de ellas, proponemos emplear la prueba K2 de
D’Agostino en el caso de muestras cuyo volumen sea superior a 25 datos. En
el caso de que n ≤ 25 consideramos oportuno el empleo de la prueba de
Anderson-Darling de normalidad. A continuación resumimos la metodología de
ambas pruebas.
2) Comprobación del carácter normal logarítmico de la muestra: El carácter
normal logarítmico de la muestra se puede comprobar con las mismas pruebas
propuestas para verificación de la normalidad, teniendo en cuenta que si una
muestra se ajusta a la distribución normal logarítmica, la transformación.
3) Comprobación de la uniformidad de la muestra: Para la comprobación de la
uniformidad se propone emplear la prueba modificada de Anderson-Darling
propuesta en [1]. Esta prueba consiste en lo siguiente:
•A partir de la muestra original (1) se obtiene una muestra estandarizada mediante
la expresión: vi = xi−xmin xmax−xmin (22) donde: xmin , xmax – valores mínimo y
máximo de la muestra, respectivamente.
• Se obtiene una muestra yi tal que: yi = vi ∶ vi−1 ≤ vi (23) o sea, será la misma
muestra vi ordenada de menor a mayor.
• Se calcula el estadístico A2 por la fórmula: A2 = −n − 1 n ∑ [(2i − 1)lnyi + (2(n − i)
+ 1)ln(1 − n i=1 yi)] (24)
• Si se cumple que: A2 ≤ Acrit 2 (α) (25) se asume la uniformidad de la muestra para
un nivel de significación α.
4. Percentiles
Un percentil es una de las llamadas medidas de posición no central (cuartiles,
deciles, quintiles, percentiles, etc) que se puede describir como una forma
de comparación de resultados, por ello es un concepto ampliamente utilizado en
campos como la estadística o el análisis de datos.
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99%
de los datos.
P50 coincide con la mediana.
Cá lcu lo d e lo s pe rce n t ile s
E n p rime r lu ga r b usca m o s la cla se do n de se e n cue n t ra:
, e n la t ab la d e la s f re cu en cia s a cu mu la d a s.
 Li es el límite inferior de la clase donde se encuentra el percentil.

 N es la suma de las frecuencias absolutas.
 Fi-1 es la frecuencia acumulada anterior a la clase del percentil.
 ai es la amplitud de la clase.
Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del
1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son
mayores.
 P25 = Q1.
 P50 = Q2 = mediana.
 P75 = Q3.
¿Cómo se interpretan los percentiles?
Con ayuda de un ejemplo veremos lo sencillo que es interpretar los percentiles:
 Cuando el pediatra nos dice que el niño está en el percentil 25 de

altura, significa que de cada 100 niños de su edad, 75 son más altos que nuestro
hijo y 24 serían más bajos.
 Por el contrario, si nuestro bebé en el percentil 90 de altura significa que, de
cada 100 bebés, solo hay 10 que midan más que nuestro niño, por lo que habría 89
que medirían menos.
 El percentil 50 es la media, por lo que si tu hijo se encuentra en este percentil
mide lo mismo que el 50 por ciento de los niños de su misma edad y sexo.
5) QUE ES DATO AGRUPADO Y NO AGRUPADO
DATOS AGRUPADOS:
Es cuando la muestra consta de 30 o más datos, es agrupar los datos en clases y
a partir de estas determinar las características de la muestra y la población que fue
tomada.
DATOS NO AGRUPADOS:
Datos no agrupados es el conjunto de observaciones que se presentan en su forma
original tal y como fueron recolectados, para obtener información directamente de
ellos. Los datos no agrupados es un conjunto de información si ningún orden que no
nos establece relación clara con lo que se pretende desarrollar a lo largo de un
problema, esto se soluciona mediante una tabulación que nos conduce a una tabla
de frecuencias.
6) QUE ES EL RANGO INTERCUATILICO

El rango intercuartílico es una medida de variabilidad adecuada cuando la medida
de posición central empleada ha sido la mediana. Se define como la diferencia
entre el tercer cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3 - Q1. A la mitad
del rango intercuartil se le conoce como desviación cuartil (DQ), es afectada muy
poco por cuentas extremas. Esto lo hace una buena medida de dispersión para
distribuciones sesgadas: DQ = RQ/2= (Q3 - Q1)/2.
Se usa para construir los diagramas de caja y bigote (box plots) que sirven para
visualizar la variabilidad de una variable y comparar distribuciones de la misma
variable; además de ubicar valores extremos
7) QUE ES UN RANGO INTERPERCENTILICO

El rango intercuartílico es una medida de variabilidad adecuada cuando la medida
de posición central empleada ha sido la mediana. Se define como la diferencia entre
el tercer cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3 - Q1. A la mitad del
rango intercuartil se le conoce como desviación cuartil (DQ), es afectada muy poco
por cuentas extremas. Esto lo hace una buena medida de dispersión para
distribuciones sesgadas: DQ = RQ/2= (Q3 - Q1)/2.
Se usa para construir los diagramas de caja y bigote (box plots) que sirven para
visualizar la variabilidad de una variable y comparar distribuciones de la misma
variable; además de ubicar valores extremos.1
8) QUE ES UNA CURTOSIS O APUNTAMIENTO Y COMO SE HALLA LA
CURTOSIS
A curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o
achatada está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera
que a mayor grado de curtosis, más escarpada (o apuntada) será la forma de la
curva.
La curtosis se mide promediando la cuarta potencia de la diferencia entre cada

elemento del conjunto y la media, dividido entre la desviación típica elevado
también a la cuarta potencia. Sea el conjunto X=(x1, x2,…, xN), entonces el
coeficiente de curtosis será:
En la fórmula se resta 3 porque es la curtosis de una distribución Normal.

Entonces la curtosis valdrá 0 para la Normal, tomándose a ésta como referencia.
Cuando los datos están agrupados o agrupados en intervalos, la fórmula
del coeficiente de curtosis se convierte en:
Tipos de curtosis
ANUNCIOS
Las curvas se pueden clasificar en tres grupos según el signo de su curtosis, es
decir, según la forma de la distribución:
 Leptocúrtica: la Curtosis>0. Los datos están muy concentrados en la media,
siendo una curva muy apuntada.
 Mesocúrtica: la Curtosis=0. Distribución normal.
 Platicúrtica: la Curtosis<0. Muy poca concentración de datos en la media,
presentando una forma muy achatada.

Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica

Cargado por

Copyright:

Formatos disponibles

TRABAJO DE CONTROL ESTADISTICO DE LA PRODUCCIÓN

UNIVERSIDAD DEL SINÚ

Cuando se realiza un estudio de investigación, se pretende generalmente inferir o

Cá lcu lo d e lo s pe rce n t ile s

E n p rime r lu ga r b usca m o s la cla se do n de se e n cue n t ra:

 Li es el límite inferior de la clase donde se encuentra el percentil.

 Cuando el pediatra nos dice que el niño está en el percentil 25 de

5) QUE ES DATO AGRUPADO Y NO AGRUPADO

6) QUE ES EL RANGO INTERCUATILICO

7) QUE ES UN RANGO INTERPERCENTILICO

La curtosis se mide promediando la cuarta potencia de la diferencia entre cada

En la fórmula se resta 3 porque es la curtosis de una distribución Normal.

También podría gustarte