Estadística

1.
EN QUE SITUACIONES SE UTILIZA DATOS POBLACIONALES Y

MUÉSTRALES
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar

resultados de una muestra a una población. Se estudia en particular a un reducido número de
individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la
población de la cual esa muestra procede. Este proceso de inferencia se efectúa por medio de
métodos estadísticos basados en la probabilidad.
La población representa el conjunto grande de individuos que deseamos estudiar y
generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas
características determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la población accesible y
limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener
conclusiones generalizables a la población). El individuo es cada uno de los componentes de
la población y la muestra. La muestra debe ser representativa de la población y con ello
queremos decir que cualquier individuo de la población en estudio debe haber tenido la
misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas
podemos señalar 3:
a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
b.Como consecuencia del punto anterior ahorraremos costes.
c. Estudiar la totalidad de los pacientes o personas con una característica determinada
en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.
d.Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las
observaciones y mediciones realizadas a un reducido número de individuos
pueden ser más exactas y plurales que si las tuviésemos que realizar a una
población.
e. La selección de muestras específicas nos permitirá reducir la heterogeneidad de
una población al indicar los criterios de inclusión y/o exclusión.
2. UN DIAGRAMA DE CAJA
es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está
compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico representativo de las distribuciones de un conjunto de datos en cuya
construcción se usan cinco medidas descriptivas de los mismos, a saber: mediana, primer
cuartil, tercer cuartil, valor máximo y valor mínimo.
Esta presentación visual, asocia las cinco medidas que suelen trabajarse de forma individual.
Presenta al mismo tiempo, información sobre la tendencia central, dispersión y simetría de
los datos de estudio. Además, permite identificar con claridad y de forma individual,
observaciones que se alejan de manera poco usual del resto de los datos. A estas
observaciones se les conoce como valores atípicos. Es un gráfico que suministra información
sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la
existencia de valores atípicos y la simetría de la distribución.
1.-Límite superior: Es el extremo superior del bigote. Las opiniones por encima de este límite
se consideran atípicas.
2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como máximo el 75% de las
opiniones de los estudiantes.
3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos partes iguales.
De este modo, 50% de las observaciones están por debajo de la mediana y 50% está por
encima.
4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo el 25% de las
opiniones de los estudiantes
5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este valor
se consideran atípicas.
6.-Valores atípicos: Opiniones que están apartadas del cuerpo principal de datos. Pueden
representar efectos de causas extrañas, opiniones extremas o en el caso de la tabulación
manual, errores de medición o registro.
En el ejemplo: 0.5 y 3.5
• Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1-
3 x RIC ó Q3 + 3 x RIC. De modo que, en el ejemplo:
• inferior: 7 – (3 x 2) = 1
• superior: 9 + (3 x 2) = 15 El valor 0.5 seria atípico extremo y el 3.5 sería atípico Utilidad
• Proporcionan una visión general de la simetría de la distribución de los datos; si la mediana
no está en el centro del rectángulo, la distribución no es simétrica.
• Son útiles para ver la presencia de valores atípicos también llamados outliers.
3.CUALES SON LOS MÉTODOS PARA AJUSTAR LAS DISTRIBUCIONES
Como se expresó consideraremos los métodos de ajuste para tres funciones específicas: la
distribución normal, la normal logarítmica y la uniforme:
1 Comprobación de la normalidad: Del conjunto de pruebas de normalidad, teniendo en
cuenta la potencia de ellas, proponemos emplear la prueba K2 de D’Agostino en el caso de
muestras cuyo volumen sea superior a 25 datos. En el caso de que n ≤ 25 consideramos
oportuno el empleo de la prueba de Anderson-Darling de normalidad. A continuación
resumimos la metodología de ambas pruebas.
2 Comprobación del carácter normal logarítmico de la muestra: El carácter normal logarítmico de
la muestra se puede comprobar con las mismas pruebas propuestas para verificación de la
normalidad, teniendo en cuenta que si una muestra se ajusta a la distribución normal logarítmica,
la transformación.
3Comprobación de la uniformidad de la muestra: Para la comprobación de la uniformidad se

propone emplear la prueba modificada de Anderson-Darling propuesta en [1]. Esta prueba
consiste en lo siguiente:
• A partir de la muestra original (1) se obtiene una muestra estandarizada mediante la
expresión: vi = xi−xmin xmax−xmin (22) donde: xmin , xmax – valores mínimo y
máximo de la muestra, respectivamente.
• Se obtiene una muestra yi tal que: yi = vi ∶ vi−1 ≤ vi (23) o sea, será la misma
muestra vi ordenada de menor a mayor.
• Se calcula el estadístico A2 por la fórmula: A2 = −n − 1 n ∑ [(2i − 1)lnyi + (2(n −
i) + 1)ln(1 − n i=1 yi)] (24)
• Si se cumple que: A2 ≤ Acrit 2 (α) (25) se asume la uniformidad de la muestra para
un nivel de significación α.
4. Percentiles
Un percentil es una de las llamadas medidas de posición no central (cuartiles, deciles,
quintiles, percentiles, etc) que se puede describir como una forma de comparación de
resultados, por ello es un concepto ampliamente utilizado en campos como la estadística o
el análisis de datos.
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
C ál cul o de l os percent i l es
En pri m er l ugar bus cam os l a cl as e dond e se encu ent ra:
, en l a t abl a de l as f recuen ci as a cum ul a das.
L i es el l í m i t e i nferi or de l a cl as e donde se encuent ra el p er cent i l .

N es l a sum a de l as frecu enci as absol ut a s.
F i - 1 es l a fre cuenci a acum ul ada ant eri or a l a cl ase d el per cen t i l .
a i es l a am pl i t ud de l a cl ase.
Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del 1 al 99.
El i % de la muestra son valores menores que él y el 100-i % restante son mayores.
 P25 = Q1.
 P50 = Q2 = mediana.
 P75 = Q3.
¿Cómo se interpretan los percentiles?
Con ayuda de un ejemplo veremos lo sencillo que es interpretar los percentiles:
 Cuando el pediatra nos dice que el niño está en el percentil 25 de altura, significa
que de cada 100 niños de su edad, 75 son más altos que nuestro hijo y 24 serían más bajos.
 Por el contrario, si nuestro bebé en el percentil 90 de altura significa que, de cada
100 bebés, solo hay 10 que midan más que nuestro niño, por lo que habría 89 que medirían
menos.
 El percentil 50 es la media, por lo que si tu hijo se encuentra en este percentil mide
lo mismo que el 50 por ciento de los niños de su misma edad y sexo.
5) QUE ES DATO AGRUPADO Y NO AGRUPADO
DATOS AGRUPADOS:
Es cuando la muestra consta de 30 o más datos, es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y la población que fue tomada.
DATOS NO AGRUPADOS:
Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal
y como fueron recolectados, para obtener información directamente de ellos. Los datos no
agrupados es un conjunto de información si ningún orden que no nos establece relación clara
con lo que se pretende desarrollar a lo largo de un problema, esto se soluciona mediante una
tabulación que nos conduce a una tabla de frecuencias.
6) QUE ES EL RANGO INTERCUATILICO

El rango intercuartílico es una medida de variabilidad adecuada cuando la medida de
posición central empleada ha sido la mediana. Se define como la diferencia entre el tercer
cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3 - Q1. A la mitad del rango intercuartil
se le conoce como desviación cuartil (DQ), es afectada muy poco por cuentas extremas.
Esto lo hace una buena medida de dispersión para distribuciones sesgadas: DQ = RQ/2=
(Q3 - Q1)/2.
Se usa para construir los diagramas de caja y bigote (box plots) que sirven para visualizar la
variabilidad de una variable y comparar distribuciones de la misma variable; además de
ubicar valores extremos
7) QUE ES UN RANGO INTERPERCENTILICO (PORFAVOR BUSCAR ESTE NO LO

PUDE ENCONTRAR)
.

Estadística

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística

Cargado por

Copyright:

Formatos disponibles

1.

EN QUE SITUACIONES SE UTILIZA DATOS POBLACIONALES Y

Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar

3Comprobación de la uniformidad de la muestra: Para la comprobación de la uniformidad se

En pri m er l ugar bus cam os l a cl as e dond e se encu ent ra:

, en l a t abl a de l as f recuen ci as a cum ul a das.

L i es el l í m i t e i nferi or de l a cl as e donde se encuent ra el p er cent i l .

5) QUE ES DATO AGRUPADO Y NO AGRUPADO

6) QUE ES EL RANGO INTERCUATILICO

7) QUE ES UN RANGO INTERPERCENTILICO (PORFAVOR BUSCAR ESTE NO LO

También podría gustarte