Documentos de Académico
Documentos de Profesional
Documentos de Cultura
POBLACIONES Y MUESTRAS
DEFINICIONES:
1- Muestra: subconjunto de una población de mayor tamaño (la cual pretende que sirva como
representación de la población)
2- Población: conjunto de todos los individuos o elementos que cumplen ciertas características
3- Universo: total de la población (sin que cumplan alguna característica)
4- Parámetro: pronostico numérico que reúne cierta información de la población (inaccesible). Se
representa con letras griegas (las letras romanas se emplean para representar un valor
estadístico)
5- Estadístico: función matemática obtenida a partir de los datos provenientes de la muestra, que
nos permite hablar de los parámetros
6- Carácter: propiedad o característica que tienen los elementos de una población. Pueden ser:
a. Cualitativos: no se les puede asignar un valor numérico (color de pelo)
b. Cuantitativos: se les puede asignar un número. Se divide en:
i. Discretos: solo pueden tomar valores concretos. Entre dos valores no existen
más valores (solo los números naturales)
ii. Continuos: entre dos posibles valores existen infinitos (en todos los números
reales)
Variables: sistema para representar los caracteres. El tipo de variable se elige según el tipo de carácter
que representa. Pueden ser:
1. cualitativas: se les puede asignar un número, pero no tiene valor numérico (color de pelo)
a. nominales: permite realizar operaciones de igualdad y desigualdad (ser rubio no es
igual que ser moreno)
i. dicotómicas: solo pueden adoptar dos valores (¿¿¿¿vivo o muerto????)
ii. politómicas: pueden tomar más de dos valores (color de pelo)
b. ordinales: pueden establecer relaciones de superioridad, pero sin asignar un número.
Permiten hacer operaciones de igualdad y desigualdad, y de ordenación (posición de
los hijos)
2. cuantitativas: se les puede asignar un número y tiene significado
a. discretas: solo puede tomar valores concretos. Entre dos valores no existen más
valores (número de hijos)
b. continuas: entre dos posibles valores existen infinitos (números reales)
ESTADISTICOS ESTADÍSTICOS
ESCALA DE
OP. MATEMÁTICA OP. LÓGICAS DESCRIPTIVOS ASOCIACIÓN
MEDIDA
APLICABLES APLICABLES
Establecer
-Frecuencias Coeficiente de
Nominal Clasificación igualdad o
-Moda contingencia
desigualdad
Determinar lo
-Mediana
Ordinal Ordenación mayor, menor, o Correlación lineal
-Percentiles
igual
Igualdad o Determinar la
desigualdad de igualdad o -Media aritmética
De intervalo Correlación lineal
las distancias diferencia de -Desviación típica
entre valores intervalo
Establecimiento
-Media aritmética
de proporciones o Establecer
De razón o -Media
de razones entre igualdad de Correlación lineal
proporción geométrica
los valores de la razones
-Media armónica
variable
Bioestadística
DATOS TRUNCADOS
Aproximación por truncamiento: se eliminan las cifras que están a la derecha de la unidad a la que
debemos truncar. Al aproximar de esta manera los datos no serán exactos.
REPRESENTACIONES GRÁFICAS
- establecen las frecuencias como una proporción de un círculo que sería el total.
La frecuencia es directamente proporcional al área. Se usa para variables
cualitativas nominales.
- No se puede utilizar para variables ordinales porque en su representación se
pierde el orden de las categorías
DIAGRAMAS DE BARRAS: 6
4
- Se levantan columnas de altura proporcional a la frecuencia sobre un eje
2
horizontal en el que se indican las distintas categorías 0
- Es el gráfico indicado para variables cualitativas ordinales y para Serie 1 Serie 2
cuantitativas discretas Columna1
HISTOGRAMA:
- Representación de la frecuencia que aparecen una variable en un grupo
- No tiene barras ni huecos, aquí los rectángulos se encuentran solapados
debido a que representa variables cuantitativas continuas
POLÍGONOS DE FRECUENCIAS: 3
Serie 1
GRÁFICO DE TALLO Y HOJA:
- Elementos:
o Rectángulo o caja:
Anchura: la que se desee
Altura: siendo el primer cuartil la base y el tercer cuartil la superficie
o La línea horizontal de dentro de la caja es la mediana (valor que deja a la mitad de
los individuos por encima y a la otra mitad por abajo)
o Bigote superior: prolongación de la caja que termina en valor absoluto que sea
igual o inferior al tercer cuartil más dos veces el rango intercuartílico
Rango intercuartílico: cuartil 3º - cuartil 1º
rango intercuartílico: 40 – 15 = 25
o Bigote inferior: termina con el valor absoluto que sea igual o superior al primer
cuartil menos 1,5 veces el rango intercuartílico
Mínimo valor posible para el bigote inferior: 15 – 37,5 = -22,5
Como no es posible en este ejemplo fumar una cantidad negativa de
cigarros al día, se elige al individuo inmediatamente superior (8 cigarros
al día)
o Los periféricos o outliers son aquellos valores que quedan más allá de los
extremos de los bigotes. Puede deberse a un error o corresponder a un individuo
con un valor realmente raro.
6
GRÁFICO DE PARETO 5
4
3
- Organiza datos de tal forma que estos queden en orden
2
descendente (izquierda a derecha) y separados por barras 1
- Permite asignar un orden de prioridades 0
Categoría Categoría Categoría Categoría
- Las barras marcan la frecuencia absoluta y las líneas son las 1 2 3 4
frecuencias acumuladas Serie 1 Serie 2 Serie 3
GRÁFICO DE PARETO
Estiman cual es el valor más típico o representativo de una muestra. Son el elemento indispensable de
cualquier estadística descriptiva.
MEDIA ARITMÉTICA
- Suma de todos los valores (Xi) dividida por el número de observaciones (n)
- En la población se expresa como µ, y en la muestra como X
- Desventaja: muy sensible a los valores extremos (especialmente si la muestra no es
grande)
media=
∑ xi
n
MEDIA GEOMÉTRICA
media geométrica= √ X 1 x X 2 x X 3 x Xn
n
MEDIA ARMÓNICA
- Se calcula dividiendo el número de observaciones por la suma del inverso de cada valor
- Se utiliza mucho en farmacología
- Se dice que tanto la media geométrica como la armónica son estimadores de tendencia
central más robustos que la media aritmética, esto significa que se dejan influir menos por
los valores raros o extremos
n
media armónica=
1
∑ ( xi )
Bioestadística
MEDIA PONDERADA
- Se calcula al valorar de distinto modo cada uno de los datos, dando más valor a unos que
otros
media ponderada=
∑ (wi x xi)
∑ ( wi)
MEDIANA
- Valor central del conjunto ordenado de observaciones (el valor que deja a la mitad de las
observaciones por debajo y a la mitad por encima)
- Ventaja: no es demasiado sensible a los valores extremos
- Inconveniente: no se usan todos los valores observados para calcularla sino solo el valor
central o los valores centrales
MODA
- El valor que más veces aparece. La distribución según este puede ser:
o Unimodal: tiene un solo valor más frecuente
o Bimodal: tiene dos valores más frecuentes
o Multimodal: tiene más de dos valores que presentan la frecuencia máxima
MEDIDAS DE DISPERSIÓN
VARIANZA
- Mide la dispersión de los datos: en qué medida están juntos o separados del valor central.
Tiene la siguiente expresión para las muestras:
s2=
∑ (Xi−X )2
n−1
o En vez de usar n como denominador, usamos n-1
o Este denominador se denomina grado de libertad (¿??)
o Para la población se sustituye s2 por σ2
σ
2
=
∑ (Xi−μ)
2
N
- La varianza no es muy adecuada para describir cual es la variabilidad de unos datos: ya que
se encuentra expresada en otras unidades que los datos originales.
- La varianza está en unidades al cuadrado y esto dificulta su interpretación directa
- Por este motivo se debe buscar otro estadístico de dispersión que este en las mismas
unidades que la media: esa es la desviación estándar
s(muestral)=
√ ∑ (Xi−media)2
n−1
σ ( poblacional )=√ ∑ ¿ ¿ ¿ ¿
- Si se suma o se resta una cantidad constante a todos los datos, la media se incrementará o
disminuirá en esa cantidad: pero la desviación estándar no cambiará
- La desviación estándar tiene las mismas unidades de medida que los datos originales
- Cuando los datos observados en una variable siguen una distribución que se parece a la
normal, podemos asumir que el 95% de los valores se situaran en el espacio comprendido
por la media +/- dos veces la desviación estándar
- Para juzgar si una variable es más dispersa que otra, sería equivocado comparar
directamente la desviación típica de ambas
- No es adecuado porque el resultado dependerá de las unidades de medida de cada
variable: por eso para comparar la dispersión de diversas variables se usa el coeficiente de
variación
o Coef de variación = desviación típica/media x 100 = s / x x 100
- Es una variable que no puede tomar valores negativos, intuiremos que su distribución es
asimétrica (asimetría positiva) cuando el coeficiente de variación sea superior de 50%
¿???????
ERROR ESTÁNDAR
RANGO O AMPLITUD
MEDIDAS DE FORMA
ASIMETRÍA
Expresa lo distante de la media que cada observación en unidades de desviación estándar. Sus valores
óptimos en una función normal son pequeños o nulos. Las distribuciones pueden ser:
CURTOSIS O APUNTAMIENTO
Bioestadística
Indica como de apuntada está una distribución. Para que la distribución sea normal no debe ser
grande. Se divide en:
CUANTILES
Son medidas de posición que indican que puesto tiene un determinado valor de una variable, ya que
dividen el conjunto ordenado de los datos en grupos con la misma cantidad de individuos.
Pueden ser:
1. Percentiles:
- Expresa la proporción de los datos que queda por debajo del valor que nos interesa
- Asi si decimos que un niño esta en el 80 de peso para su edad: significa que el 80% de los
niños de su edad pesan menos
- Para expresar pesos y edad se emplean mucho
- Tiene 99 cortes
- La mediana coincide con el 2º, 5º, y 50º percentil
- Se calcula:
2. Tertiles:
- Son los puntos de la distribución que dividen está en 3 iguales (2 cortes)
3. Cuartiles:
- Son los puntos de la distribución que dividen esta en cuatro partes iguales
- Los cuartiles coinciden con los 25, 50, 75 y 100
- Tiene tres cortes
4. Deciles:
- Son los puntos que dividen la distribución en 10 partes
- Tiene 9 cortes
DEFINICIONES
PROPORCIÓN: una razón en la cual los elementos del numerador están incluidos en el denominador.
Se utiliza como estimación de la probabilidad de la probabilidad de un evento. El rango es de 0 a 1.
RAZÓN: es un cociente entre una variable y otra. Por ejemplo, la razón de masculinidad seria “x”
hombres por cada “x” mujeres: hombres/mujeres
ODD: cociente entre las veces que se da una circunstancia y las que no se da (p.ej: probabilidad de sacar
un 1 al tirar un dado entre la probabilidad de no obtenerlo)
INCIDENCIA: proporción de sujetos que enferman dentro de un grupo de sujetos que no estaba
enfermo al principio de la observación
Descriptivos
- Media: aritmética,
geométrica, y
Tendencia Decentiles
armónica Posición: n-tiles
central Percentiles
- Moda
- Mediana
- desviación media
Asimetría
- desviación típica
Dispersión Forma Curtosis o
- rango o amplitud
apuntamiento
- rango intercuántico
- La frecuencia: describe cuantas veces aparece un determinado valor para una variable
- Distinguimos varios tipos:
o Frecuencia simple: frecuencia del grupo del cual hablamos
Frecuencia absoluta (ni): contabiliza el número de individuos para cada
modalidad
Frecuencia relativa (fi): calcula el numero de individuos de cada
modalidad y lo divide por el total de individuos
o Frecuencia acumulada: suma los valores de cada modalidad
Frecuencia absoluta acumulada (Ni): se trata de la suma de los valores de
la frecuencia absoluta
Frecuencia relativa acumulada (Fi): se entiende como la frecuencia
absoluta acumulada dividida por el total de individuos
o Frecuencia válida: es aquella que solo tiene en cuenta aquellos elementos de los
que tenemos datos válidos (no tiene en cuenta los missing data)
Bioestadística