Informe de Lectura

Informe de lectura
Medidas de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio
miden el grado de dispersión de los valores de la variable. Dicho en otros términos
las medidas de dispersión pretenden evaluar en qué medida los datos difieren
entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten
describir un conjunto de datos entregando información acerca de su posición y su
dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se
encuentran ordenados en una tabla estadística diremos que se encuentran
“agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”.
Media
La medida de tendencia central más conocida y utilizada es la media aritmética o
promedio aritmético. Se representa por la letra griega µ cuando se trata del
promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del
promedio de la muestra. Es importante destacar que µ es una cantidad fija
mientras que el promedio de la muestra es variable puesto que diferentes
muestras extraídas de la misma población tienden a tener diferentes medias. La
media se expresa en la misma unidad que los datos originales: centímetros, horas,
gramos, etc.
Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo
será:
Estos cálculos se pueden simbolizar:

Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la
segunda observación y así sucesivamente. En general, con “n” observaciones, Yi
representa el valor de la i-ésima observación. En este caso el promedio está dado
por:
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la diferencia entre el

valor del dato y la media:
Una propiedad interesante de la media aritmética es que la suma de las

desviaciones es cero.
La mediana
La media aritmética no siempre es representativa de una serie estadística. Para
complementarla, se utiliza un valor numérico conocido como mediana o valor
central.
Dado un conjunto de valores ordenados, su mediana se define como un valor
numérico tal que se encuentra en el centro de la serie, con igual número de
valores superiores a él que inferiores. Normalmente, la mediana se expresa como
Me.
La mediana es única para cada grupo de valores. Cuando el número de valores
ordenados (de mayor a menor, o de menor a mayor) de la serie es impar, la
mediana corresponderá al valor que ocupe la posición (n + 1)/2 de la serie.
Si el número de valores es par, ninguno de ellos ocupará la posición central.

Entonces, se tomará como mediana la media aritmética entre los dos valores
centrales.
Moda
La moda se define, para un conjunto de datos, como el valor más frecuente, es
decir, el valor que más veces se repite. Si se trabaja con los datos del ejemplo;
54, 55,64, 64,69, 71,73, 74,75, 75,76, 78, 80, 82, 90
Se observa que dos datos se repiten exactamente el mismo número de veces y

representan la mayor frecuencia observada y son: 64 y 75 kg. Por tanto, se
dispondría de dos valores para la moda:
Mo = {64,75}
Este resultado evidencia que la moda no tiene por qué ser única para un conjunto
de datos.
Media geométrica
Se define la media geométrica como la raíz n-ésima de los productos de todos los
valores de la variable o bien como la raíz n-ésima de los productos de los valores
xi elevados a sus correspondientes frecuencias absolutas fi. Donde n es el tamaño
de la muestra.
Suele utilizarse cuando los valores de la variable siguen una progresión
geométrica. También para promediar porcentajes, tasas, nº índices, etc., siempre
que nos vengan dados en porcentajes.
Medidas de dispersión
Las medidas de tendencia central ofrecen una idea aproximada de
comportamiento de una serie estadística. No obstante, no resultan suficientes para
expresar sus características: una misma media puede provenir de valores
cercanos a la misma o resultar de la confluencia de datos estadísticos
enormemente dispares. Para conocer en qué grado las medidas de tendencia
central son representativas de la serie, se han de complementar con medidas de
dispersión como la varianza o la desviación típica.
Rango o recorrido
La medida más sencilla y visualmente intuitiva para cuantificar la dispersión de los
datos es el rango y se obtendrá calculando la distancia entre el mayor y el menor
valor observado. Ejemplo 1-1 se tendrá que:
R= Xmáx - Xmin = 90 - 54 = 36
Luego el rango de valores observados muestra una distancia de 36 kg entre el

menor y el mayor valor observado. La obtención del rango es sencilla, sin
embargo, en su construcción solo intervienen dos de los datos observados, que,
además, son los más extremos. Esto tiene como consecuencia que el rango será
una medida extremadamente sensible a observaciones extremas y que no tiene
en cuenta gran parte de la información disponible.
Coeficiente de variación
La desviación típica proporcionaba una medida resumen de las distancias de cada
dato a la media (desviaciones) en las mismas unidades que la variable original y,
por tanto, depende de dichas unidades de medida. ¿Son comparables las
desviaciones típicas de dos conjuntos de datos? ¿Puede afirmarse, en general,
que a mayor desviación típica mayor dispersión?
La respuesta es que esto solo es posible si los conjuntos de datos que se
pretenden comparar tienen la misma media.
Desviación estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos con respecto a la media. Mientras mayor sea la
desviación estándar, mayor será la dispersión de los datos.
El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación
estándar de una población, mientras que s se utiliza para representar la desviación
estándar de una muestra. La variación que es aleatoria o natural de un proceso se
conoce comúnmente como ruido. La desviación estándar se puede utilizar para
establecer un valor de referencia para estimar la variación general de un proceso.
Considere el ejemplo siguiente. Los administradores dan seguimiento al tiempo de
egreso de los pacientes tratados en las áreas de urgencia de dos hospitales.
Aunque los tiempos de egreso promedio son aproximadamente iguales (35
minutos), las desviaciones estándar son significativamente diferentes. La
desviación estándar del hospital 1 es de aproximadamente 6. En promedio, el
tiempo para dar de alta a un paciente se desvía de la media (línea discontinua)
aproximadamente 6 minutos. La desviación estándar del hospital 2 es de
aproximadamente 20. En promedio, el tiempo para dar de alta a un paciente se
desvía de la media (línea discontinua) aproximadamente 20 minutos.
Hospital 1 Hospital 2
Percentiles
Los percentiles o cuantiles son valores de la variable no superados por un
determinado porcentaje de observaciones o datos (equivalentemente, también
puede definirse como el valor superado por el resto). Así, el percentil de orden k
para un conjunto de datos será el valor de la variable no superado por el k% de las
observaciones. Si se trabaja con los datos del ejemplo 1-3
 En un estudio se obtuvo información sobre el peso (en kg) de un grupo de
15 individuos que se relacionan a continuación:
64, 54, 82, 76, 75, 90, 64, 55, 71, 69, 73, 78, 74, 80, 75,
los percentiles de orden 30 y 70 serán los valores de peso no superados por el 30
y 70% de las observaciones.
Indicadores de prevalencia
La prevalencia examina casos existentes, mientras que la incidencia examina

casos nuevos.
En una población de 10000 personas, se informa de que 500 personas sufren
determinada enfermedad. ¿Cuál sería en ese caso la prevalencia de la
enfermedad en esa población?
Esta fórmula nos ofrecerá la información en forma de porcentaje. Dividiendo 500

entre 10000 y multiplicando el resultado por 100 (para convertirlo en un
porcentaje), descubrimos que se ha visto afectada un 5% de la población. Así que,
en este caso, la prevalencia de la enfermedad en nuestra población es del 5%.
En lugar de expresar la prevalencia en forma de porcentaje, también podemos
describirla como el número de personas afectadas en una población de tamaño
estándar, por ejemplo 1000 personas. Entonces el cálculo sería:
Eso significa que de cada 1000 pacientes, 50 de ellos han desarrollado la

enfermedad.
Frecuencia absoluta
La frecuencia absoluta es un tipo de frecuencia estadística que es utilizada en una
investigación para determinar el número de veces que se repite un valor.
Esta se representa con las letras ni ó fi y es utilizada en la estadística descriptiva
para saber las características y cuántas de estas se repiten en una muestra.
Además, la suma de las frecuencias absolutas obtenidas es igual al total de datos
analizados, que está representado por N.
 Una consultora decide realizar una investigación en una oficina acerca de la
cantidad de hijos que poseen sus empleados, luego de realizar la pregunta
a 20 empleados las respuestas son las siguientes:
0,2,2,0,3,1,1,2,3,1,0,2,3,4,3,4,2,0,1,2
En consecuencia tenemos N = 20 (cantidad de empleados evaluados) y Xi
= variable
Hijos Frecuencia absoluta (fi) aleatoria.
0 4
1 4
2 6
3 4
4 2
∑ 20
Proporción
Es el cociente del número de veces que se presenta un valor o característica con
respecto al total de la muestra de la variable en estudio. Por ejemplo: en un
estudio médico sobre el Alzheimer se examinaron 280 mujeres y 220 hombres,
entonces se puede notar que:
Proporción (mujeres) = 280/500 = 0,56

Proporción (hombres) = 220/500 = 0,44
Es importante aclarar que las proporciones, se relacionan con las frecuencias

relativas simples; su rango, va desde cero hasta uno (ambos inclusive), en otras
palabras, el campo de existencia de las proporciones se encuentra en el intervalo
[0,1] y la sumatoria de las proporciones es igual a uno.
La fórmula general de proporciones (Pi) es:
Pi= xi
n
Razón
Razón (muestral): es la relación entre dos fenómenos independientes, el rango es
de cero a infinito positivo. Por ejemplo: en un Hospital existen mil pacientes y un
total de cincuenta médicos, por lo cual se tiene una razón de 1000/50=20, en otras
palabras en el Hospital por cada médico existen 20 pacientes.
La fórmula de razones (ri) es:
ri=xi
n
Tasa
Es la rapidez de cambio de un fenómeno, se obtiene mediante el cociente del

número de veces que ocurre la situación investigada en un lugar y lapso de tiempo
determinado, entre la población en estudio, multiplicada por una potencia de 10,
su rango es de cero a infinito positivo. Entonces las tasas se hallan:
Cabe agregar que, las tasas que se refieren a toda la población se llaman crudas,
mientras que las tasas que se refieren solo a una parte de la población se
denominan específicas.
Las tasas más comunes son:
 Tasas de mortalidad: riesgo de morir.
 Tasas de morbilidad: riesgo de contraer determinada enfermedad.
 Tasas de natalidad: miden el crecimiento de las poblaciones.
 Tasas de letalidad: miden la gravedad de las enfermedades.
Intervalo de confianza
Un intervalo de confianza es una técnica de estimación utilizada en inferencia
estadística que permite acotar un par o varios pares de valores, dentro de los
cuales se encontrará la estimación puntual buscada (con una determinada
probabilidad).
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una
media muestral (uno superior y otro inferior). Estos valores van a acotar un rango
dentro del cual, con una determinada probabilidad, se va a localizar el parámetro
poblacional.
Intervalo de confianza = media + margen de error
Pensemos en una población de 4 millones de personas. ¿Podríamos saber el

gasto medio en consumo por hogar de esa población? En principio sí.
Simplemente tendríamos que hacer una encuesta entre todos los hogares y
calcular la media. Sin embargo, seguir ese proceso sería tremendamente
laborioso y complicaría bastante el estudio.
Ante situaciones así, se hace más factible seleccionar una muestra estadística.
Por ejemplo, 500 personas. Y sobre dicha muestra, calcular la media. Aunque
seguiríamos sin saber el verdadero valor poblacional, podríamos suponer que este
se va a situar cerca del valor muestral. A esa media le sumamos el margen de
error y tenemos un valor del intervalo de confianza. Por otro lado, le restamos a la
media ese margen de error y tendremos otro valor. Entre esos dos valores estará
la media poblacional.
Probabilidad estadística
En primera instancia se entiende como la posibilidad que existe de que un
determinado hecho probable realmente suceda. Ese hecho puede finalmente
suceder, o no suceder.
En este caso se define a la probabilidad como el estudio y medición cuantitativa de
que un determinado hecho suceda o se produzca. Para ello se determinan ciertos
presupuestos del contexto, sus posibles combinaciones y además se hace uso de
la disciplina de la estadística. En este caso las probabilidades suelen ser
representados en número mayores a cero e inferiores a uno o en fracciones.
En conclusión, el intervalo de confianza no sirve para dar una estimación puntual
del parámetro poblacional, si nos va a servir para hacernos una idea aproximada
de cuál podría ser el verdadero de este. Nos permite acotar entre dos valores en
dónde se encontrará la media de la población.
El cálculo de un intervalo de confianza depende principalmente de los siguientes

factores:
 Tamaño de la muestra seleccionada: Dependiendo de la cantidad de datos

que se hayan utilizado para calcular el valor muestral, este se acercará más
o menos al verdadero parámetro poblacional.
 Nivel de confianza: Nos va a informar en qué porcentaje de casos nuestra
estimación acierta. Los niveles habituales son el 95% y el 99%.
 Margen de error de nuestra estimación: Este se denomina como alfa y nos
informa de la probabilidad que existe de que el valor poblacional esté fuera
de nuestro intervalo.
 Lo estimado en la muestra (media, varianza, diferencia de medias…): De
esto va a depender el estadístico pivote para el cálculo del intervalo.
Teoría
La teoría de la probabilidad, que experimentó un gran desarrollo a partir del
estudio de los juegos de azar, tratará de cuantificar la incertidumbre que rodea a
un suceso dada la imposibilidad de predecir con exactitud el resultado del
fenómeno aleatorio del que proviene y constituirá la herramienta necesaria para
extraer conclusiones sobre determinadas características de interés de una
población, a partir de los datos de una muestra (inferencia estadística).
La teoría de probabilidades se ocupa de asignar un cierto número a cada posible
resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar
dichos resultados y saber si un suceso es más probable que otro.
 Suceso
Es cada uno de los resultados posibles de una experiencia aleatoria.
Ejemplos:
Al lanzar una moneda salga cara.
Al lanzar un dado se obtenga 4.
 Espacio muestral
Es el conjunto de todos los posibles resultados de una experiencia
aleatoria, lo representaremos por E (o bien por la letra griega \Omega).
Ejemplos:
Espacio muestral de una moneda: E=\left \{ C,X \right \}
Espacio muestral de un dado: E=\left \{ 1,2,3,4,5,6 \right \}
 Suceso aleatorio
Suceso aleatorio es cualquier subconjunto del espacio muestral.
Ejemplos:
Al tirar un dado un suceso sería salir par
Al tirar dos monedas un suceso sería sacar dos caras
REGLA DE LAPLACE
Si bien es cierto que un fenómeno aleatorio se caracteriza por la imposibilidad de

predecir su resultado de antemano, es posible cuantificar el grado de
incertidumbre que rodea un suceso determinado de forma que puede establecerse
si existen resultados del fenómeno aleatorio o sucesos más probables que otros.
Por ejemplo, si se consideran los datos del ejemplo 1-5 y se extrae un individuo al
azar de los 150 observados, no se puede asegurar con certeza el grupo
sanguíneo al que pertenecerá pero sí se puede afirmar que existen más
posibilidades (probabilidades) de que pertenezca al grupo O que al grupo AB,
puesto que son muchos más individuos los pertenecientes al primer grupo. De
hecho podría calcularse una medida de probabilidad de pertenencia a cada uno de
los dos grupos considerados de la siguiente forma:
Probabilidad (O) 61/150 = 0, 407 ;Probabilidad (AB) 8/150 = 0, 053
Métodos
En el estudio de la probabilidad pueden ser identificados tres tipos de métodos.
 El primero es llamado el método de distribución binominal. En este caso es

posible obtener dos resultados, los mismos son independientes y
excluyentes entre sí. Por ejemplo si se lanza una moneda puedo obtener
cara o cruz, al obtener cara no puedo obtener cruz y viceversa.
 El segundo método es llamado de multiplicación. En este caso se determina

una probabilidad de varios eventos que son independientes entre sí, es
decir que los resultados obtenidos no tendrán influencia en los demás
resultados.
 El último método es el de la suma o regla de adición. En este caso la

posibilidad de que suceda un evento específico es equivalente a la
sumatoria de las probabilidades particulares. Esta regla se da bajo la
condición que los eventos sean excluyentes entre sí.
Normalidad estadística en medicina
La normalidad, en medicina, es un concepto con un fuerte componente

estadístico. Es normal que nuestra altura sea tal o cual a una determinada edad
porque la mayoría de las personas sanas tienen tal o cual altura en dicha edad.
Por ello, es evidente que esa normalidad depende de variables al margen de la
salud: etnia, hábitos alimenticios o incluso algunos rituales culturales (como la
costumbre de anillar el cuello de las adolescentes en algunas culturas) pueden
influir en la altura sin que estemos ante circunstancias patológicas. Por ello, a la
hora de evaluar si una determinada medición, o prueba diagnóstica, o constante
vital es normal, los sanitarios evalúan varios aspectos. Entre ellos, hay tres que
son especialmente relevantes: la intención de la medición, el contexto en el que ha
sido recogido, y la evolución del mismo.
La talla: es el parámetro fundamental para enjuiciar el crecimiento en longitud pero

es menos sensible que el peso a las deficiencias nutricionales; por eso sólo se
afecta en las carencias prolongadas, sobre todo si se inician en los primeros años
de la vida. Se utiliza para evaluar el crecimiento y desarrollo en los niños,
mediante la comparación con estándares obtenidos en estudios realizados en
poblaciones de niños saludables y normales. Se utilizan comparaciones referidas
a: talla/edad, peso/talla
En los adultos la talla se utiliza para calcular otros índices importantes de

valoración
como: IMC, Índice creatinina, requerimientos calóricos, la superficie corporal
(calcular
dosis de fármacos)
El peso y principalmente los cambios de peso pueden ser considerados como una
herramienta de screening, es uno de los mejores parámetros para valorar el
estado nutricional
de un individuo, es un indicador global de la masa corporal, fácil de obtener y
reproductible.
Presión arterial
En general se consideran valores normales de la tensión alta o sistólica todos
aquellos que oscilan entre 10 y 14 cm de Hg. En el caso de la tensión baja o
diastólica los valores normales deben estar entre 6 y 9 cm de Hg. Se consideran
valores idóneos cuando la sistólica no supera los 12 cm de Hg y la diastólica es
inferior a 9 cm de Hg.
Hay numerosos factores que influyen sobre los valores de la presión arterial,
siendo la edad uno de los más importantes. Conforme pasan los años los valores
de las personas van siendo más altos, esto se debe sobre todo a que los vasos
sanguíneos de las arterias pierden elasticidad

Informe de Lectura

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Informe de Lectura

Cargado por

Copyright:

Formatos disponibles

Informe de lectura

Medidas de tendencia central

Estos cálculos se pueden simbolizar:

De aquí se desprende la fórmula definitiva del promedio:

Desviaciones: Se define como la desviación de un dato a la diferencia entre el

Una propiedad interesante de la media aritmética es que la suma de las

Si el número de valores es par, ninguno de ellos ocupará la posición central.

54, 55,64, 64,69, 71,73, 74,75, 75,76, 78, 80, 82, 90

Se observa que dos datos se repiten exactamente el mismo número de veces y

Luego el rango de valores observados muestra una distancia de 36 kg entre el

La prevalencia examina casos existentes, mientras que la incidencia examina

Esta fórmula nos ofrecerá la información en forma de porcentaje. Dividiendo 500

Eso significa que de cada 1000 pacientes, 50 de ellos han desarrollado la

Proporción (mujeres) = 280/500 = 0,56

Es importante aclarar que las proporciones, se relacionan con las frecuencias

La fórmula de razones (ri) es:

Es la rapidez de cambio de un fenómeno, se obtiene mediante el cociente del

Intervalo de confianza = media + margen de error

Pensemos en una población de 4 millones de personas. ¿Podríamos saber el

El cálculo de un intervalo de confianza depende principalmente de los siguientes

 Tamaño de la muestra seleccionada: Dependiendo de la cantidad de datos

Si bien es cierto que un fenómeno aleatorio se caracteriza por la imposibilidad de

Probabilidad (O) 61/150 = 0, 407 ;Probabilidad (AB) 8/150 = 0, 053

En el estudio de la probabilidad pueden ser identificados tres tipos de métodos.

 El primero es llamado el método de distribución binominal. En este caso es

 El segundo método es llamado de multiplicación. En este caso se determina

 El último método es el de la suma o regla de adición. En este caso la

La normalidad, en medicina, es un concepto con un fuerte componente

La talla: es el parámetro fundamental para enjuiciar el crecimiento en longitud pero

En los adultos la talla se utiliza para calcular otros índices importantes de

También podría gustarte