Documentos de Académico
Documentos de Profesional
Documentos de Cultura
BIOESTADÍSTICA
ISBN: 978-99973-45-09-3
Primera Edición
-2-
VISIÓN DE LA UNIVERSIDAD
MISIÓN DE LA UNIVERSIDAD
-1-
BIOESTADÍSTICA
OBJETIVOS DE LA UNIVERSIDAD
Estimado(a) estudiante:
El texto que entrego en tus manos es el fruto del trabajo intelectual de tu docente de la UCEBOL, quien
ha puesto su mejor empeño en la planificación de los procesos de enseñanza para brindarte una
educación de la más alta calidad. Este documento te servirá de guía para que organices mejor tus
procesos de aprendizaje y los hagas mucho más productivos. Esperando que sepas apreciarlo y cuidado.
-4-
DEDICATORIA
Al Rector Dr. Soo Hyun Chung por ser la persona que incentivo la elaboración de los textos.
-2-
ii
-6-
-3-
BIOESTADÍSTICA
INTRODUCCIÓN
Resulta sencillo reseñar un texto que uno mismo coordinó; sin embargo, esperamos que
el presente documento logre captar la atención en torno a un contenido que poco a poco
se ha convertido en motivo de nuestro interés académico y profesional, que también nos
general en cuanto a la importancia de la publicación del texto como tal, y asimismo se hace
un recuento de los diferentes trabajos que se han desarrollado a lo largo de la materia.
Esperamos motivar el interés y el intercambio de ideas con los temas y, aunque sin duda
hay carencias y fallas que nos comprometen a superar trabajos futuros.
BIOESTADÍSTICA
BIOESTADÍSTICA
-1-
BIOESTADÍSTICA
-2-
ÍNDICE
UNIDAD I CONCEPTOS BÁSICOS DE BIOESTADÍSTICA Y SU APLICACIÓN A LAS
CIENCIAS MÉDICAS
UNIDAD II
ESTUDIO EN BIOMEDICINA – ESTADÍSTICA DESCRIPTIVA – PROBABILIDAD
1. ESTUDIO EN BIOMEDICINA................................................................... 19
1.1 Población y muestra................................................................................. 19
1.2 Métodos de muestreo............................................................................... 20
1.3 Tipos de estudio....................................................................................... 21
1.4 Estudios observacionales......................................................................... 21
1.5 Estudios experimentales.......................................................................... 21
1.6 Tipos de variables.................................................................................... 21
1.7 Estadística descriptiva univariable........................................................... 22
1.8 Tablas de frecuencias............................................................................... 24
1.9 Parámetros estadísticos de tendencia central, dispersión y posición...... 24
1.10 Estadística descriptiva bivariable............................................................. 25
1.11 Riesgo relativo.......................................................................................... 25
1.12 Concepto de probabilidad......................................................................... 26
1.13 Algebra de probabilidades........................................................................ 26
1.14 Probabilidad condicionada....................................................................... 27
1.15 Teorema de Bayes................................................................................... 28
1.16 Distribución de probabilidad..................................................................... 28
BIOESTADÍSTICA
BIOESTADÍSTICA
-3-
UNIDAD III
ORGANIZACIÓN DE INFORMACIÓN – PRESENTACIÓN DE INFORMACIÓN –
MEDIDAS DE TENDENCIA CENTRAL
1. ORGANIZACIÓN DE INFORMACIÓN....................................................... 35
1.1 Ordenamiento de datos............................................................................. 35
1.2 Cuadro de frecuencias absolutas.............................................................. 36
1.3 Tabla de frecuencia absoluta y relativa...................................................... 36
1.4 Histograma – Polígono de frecuencia........................................................ 37
1.5 Ojiva – diagrama de sectores.................................................................... 37
1.6 Media aritmética para datos tabulados y sin tabular.................................. 38
1.7 Propiedades – Media aritmética ponderada – mediana para datos tabulados
Y no tabulados........................................................................................... 39
1.8 Moda – otras medidas de tendencias central............................................ 44
1.9 Rango – Varianza – Desviaciones típica – coeficiente de variación.......... 46
1.10 Asimetría – Tipos de asimetría – coeficiente de asimetría – curtosis –
Coeficiente de curtosis – tipo de curvas de acuerdo al coeficiente de
curtosis...................................................................................................... 50
UNIDAD IV PROBABILIDADES-VARIABLE ALEATORIA-DISTRIBUCIONES
PROBADISTICAS-TEORIA DE LA ESTIMACIÓN- PRUEBA DE HIPOTESIS
1. PROBABILIDADES................................................................................... 55
1.1 Cuál es la escala de la probabilidad......................................................... 56
1.2 Que significa “Y” en probabilidad.............................................................. 56
1.3 Cómo se calcula la probabilidad de un evento......................................... 56
1.4 Qué es la teoría de la probabilidad........................................................... 56
1.5 Que mide la probabilidad.......................................................................... 57
1.6 Que es y cómo se calcula la probabilidad................................................ 57
1.7 Que es la probabilidad de un evento........................................................ 57
1.8 Cómo se calcula la probabilidad............................................................... 57
1.9 Tipos de variables aleatoria..................................................................... 58
1.10 Que es un experimento aleatoria............................................................. 58
1.11 Que es el espacio muestral asociado a un experimento......................... 59
BIOESTADÍSTICA
-4-
BIOESTADÍSTICA
BIOESTADÍSTICA
2. DISTRIBUCIONES.................................................................................. 70
2.1 Distribución binomial puntual o Bernoulli................................................. 70
2.2 Distribución hipergeométrica................................................................... 71
2.3 Distribución normal Estándar................................................................... 72
2.4 Distribución de Ji cuadrada..................................................................... 72
2.5 Distribución de pequeñas muestras......................................................... 73
2.6 Estimación puntual y por intérvalos......................................................... 74
2.7 Conceptos de parámetros y estadísticos................................................. 74
2.8 Intervalos de confianza por la medida poblacional y su interpretación.... 75
2.9 Intervalos de confianza por la varianza poblacional y su interpretación.. 76
3. HIPÓTESIS ESTADÍSTICOS................................................................... 77
3.1 Hipótesis Estadística............................................................................... 77
3.2 Hipótesis nula y alternativa...................................................................... 77
3.3 Error tipo I y tipo II................................................................................... 79
3.4 Tipos de prueba de hipótesis................................................................... 79
3.5 Pasos para realizar una prueba de hipótesis........................................... 80
3.6 Prueba de hipótesis para la media.......................................................... 80
3.7 Prueba de la hipótesis para la varianza................................................... 81
-5-
BIOESTADÍSTICA
UNIDAD I
CONCEPTOS BASICOS DE BIOESTADISTICA Y SU
APLICACIÓN A LAS CIENCIAS MÉDICAS
1. CONCEPTOS ESTADISTICOS BASICOS EN EL CONTEXTO BIOMEDICO.
Las ciencias de la salud, al encuadrarse dentro de las ciencias fácticas, tienen por objeto el estudio de
un conjunto de sucesos o fenómenos implícitos en el concepto de salud.
La bioestadística es una disciplina científica que se encarga de la aplicación del análisis estadístico a
diferentes cuestiones vinculadas a la biología. Puede decirse que la bioestadística es un área o una
especialización de la estadística, la ciencia dedicada al estudio cuantitativo de todo tipo de variables.
-6-
BIOESTADÍSTICA
La estadística Univariable ofrece técnicas de uso frecuente para procesar información cuando se
investiga un único evento, o varios eventos de manera independiente. Estas técnicas son muy diversas
y cada una amerita un procedimiento especial. En este sentido, una de las necesidades fundamentales
de toda persona que decide dedicarse a la investigación es la preparación relacionada con los criterios
de selección, aplicación e interpretación de las diversas técnicas de análisis en estadística,
especialmente del análisis Univariable.
-7-
BIOESTADÍSTICA
Análisis simultaneo de más de dos variables. Dependencia: analiza una o más variables dependientes a
través dos o más variables independiente, para explicar un fenómeno y realizar un análisis como base
de una predicción. Las técnicas son la regresión múltiple y el análisis de varianza.
Es una rama de las matemáticas y una herramienta que estudia usos y análisis provenientes de una
muestra representativa de datos, que busca explicar las correlaciones y dependencias de un fenómeno
físico o natural, de ocurrencia en forma aleatoria o condicional.
-8-
BIOESTADÍSTICA
La estadística descriptiva utilizada para describir y recurrir al conjunto de datos obtenidos por el
investigador. La estadística inferencial permite al investigador deducir si las relaciones, diferencias en
una o varias muestras, pueden ocurrir en una población, de donde fue extraído la o las muestras.
Encargada de la organización, resumen, presentación de los datos en tablas y gráficos, y del cálculo de
medidas numéricas que permitan estudiar los aspectos más importantes de los datos.
-9-
BIOESTADÍSTICA
Técnicas para hacer generalizaciones (a la población) o tomar decisiones en base a la información parcial
(muestra) obtenida mediante técnicas descriptivas. La selección de una técnica estadística apropiada la
determina el diseño de investigación, los datos recogidos, y la hipótesis.
Estadística
Muestreo Inferencial
La estadística resulta fundamental para conocer el comportamiento de ciertos eventos, por lo que ha
adquirido un papel clave en la investigación. Se usa como un valioso auxiliar y en los diferentes campos
del conocimiento y en las variadas ciencias. Es un lenguaje que permite comunicar información basada
en datos cuantitativos.
Es tan importante que casi no existe actividad humana en que no esté involucrada la Estadística. Las
decisiones más importantes de nuestra vida se toman con base en la aplicación de la Estadística.
Pongamos algunos ejemplos.
SIGNIFICATIVO
- 10 -
BIOESTADÍSTICA
- 11 -
BIOESTADÍSTICA
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones. Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra.
Es la parte de la estadística que se aplica en cualquier otra rama externa a ella, como psicología,
medicina, sociología, historia, biología, mercadotecnia, etc. Los parámetros poblacionales son estimados
mediante funciones denominadas “estimadores” o “estadísticos”.
- 12 -
ACTIVIDADES ACADÉMICAS DE LA UNIDAD I
La bioestadística es una
disciplina científica que se Sobre el objetivo de la
encarga de la aplicación del bioestadística.
análisis estadístico a diferentes -----------------------------------------
cuestiones vinculadas a la ---------------------------------------------
biología. -----------------------------------------
---------------------------------------------
-----------------------------------------
---------------------------------------------
-----------------------------------------
---------------------------------------------
-----------------------------------------
-------------------------------
-----------------------------------------
---------------------------------------------
-----------------------------------------
---------------------------------------
-----------------------------------------
---------------------------------------------
---------------------------------
----------------------------------------
-----------------------------------------
-------------------------------------------
------------------------------------------
-------------------------------------------
2.- Mencione los conceptos correctos de cada tipo de estadística:
Estadística Estadística Estadística Estadística
Estadística Bivariable Multivariable Descriptiva
Univariable
Permite al Establece relación o Análisis Utilizada
investigador Ofrece técnicas de asociación entre dos simultaneo de para
deducir si las uso frecuente para variables y mide su más de dos describir y recurrir
relaciones pueden procesar intensidad. variables. al conjunto de
ocurrir en una información cuando datos obtenidos
población. se investiga un único por el
evento, o varios
investigador.
eventos de manera
independiente.
VERDADERO FALSO
VERDADERO FALSO
UNIDAD II
ESTUDIOS EN BIOMEDICINA - ESTADÍSTICA
DESCRIPTIVA - PROBABILIDAD
1. Estudios en biomedicina.
Los estudios provenientes de las ciencias sociales son fundamentales para los médicos y los enfermeros.
Este hecho no es bien comprendido y hace que el ideal de interdisciplinaridad no sea real en buena parte
de las investigaciones biomédicas. Por ello considero que es fundamental la transformación de los
procesos de investigación.
Los beneficios que reporta el conocimiento social para el ámbito de las ciencias de la salud y del cuidado
son indudables. Ahora bien, no todos los científicos biomédicos lo tienen claro o lo ven con esta claridad.
¡La estadística se ocupa de los métodos y procedimientos para recoger clasificar! resumir! ¡hallar
regularidades y analizar los datos! siempre y cuando la variabilidad e incertidumbre sea una causa
intrínseca de los mismos- así como de realizar inferencias a partir de ellos! con la finalidad de ayudar a
la toma de decisiones y en su caso formular predicciones
- 18 -
BIOESTADÍSTICA
La muestra es una parte de la población, la cual se selecciona con el propósito de obtener información,
ya que población es demasiado grande para ser estudiada en su totalidad. Debe ser representativo.
- 19 -
BIOESTADÍSTICA
Los métodos de muestreo se conforman en correspondencia con los tipos de muestras que se necesitan
seleccionar. En el muestreo probabilístico, todos los individuos de la población pueden formar parte de
la muestra. Por lo tanto, es el tipo de
muestreo que debemos utilizar en
nuestras investigaciones, por ser
riguroso y científico.
Pueden ser descriptivos o analíticos. Cuando es descriptivos describen una o más características de una
población dada. Y cuando es analítico evalúan la presencia de asociación entre dos o más variables.
Un ejemplo de un estudio observacional es uno que explora la asociación entre fumar y el cáncer de
pulmón. Este tipo de estudio usa una encuesta para recopilar observaciones sobre el área de interés y
- 20 -
BIOESTADÍSTICA
luego realiza un análisis estadístico. En este caso, los investigadores recogerían observaciones de
fumadores y no fumadores, tal vez a través de un estudio de corte, y luego buscaron el número de casos
de cáncer de pulmón en cada grupo. Un estudio de casos y controles es otro tipo de estudio observacional
en el que las personas con y sin el resultado de interés (por ejemplo, cáncer de pulmón) están invitados
a participar y se recopilan sus historiales.
Finalmente, se seguirá examinando el conjunto de datos en los análisis secundarios, para sugerir nuevas
hipótesis para el estudio futuro.
Una variable estadística es el conjunto de valores que puede tomar cierta característica de la población
sobre la que se realiza el estudio estadístico y sobre la que es posible su medición. Estas variables
pueden ser: la edad, el peso, las notas de un examen, los ingresos mensuales, las horas de sueño de
un paciente en una semana, el precio medio del alquiler en las viviendas de un barrio de una ciudad, etc.
Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición existen dos
tipos de variables:
Las variables cualitativas, son las variables que pueden tomar como valores cualidades o categorías,
se pueden clasificar según sigan una jerarquía o un orden determinado.
Las variables cuantitativas, son las variables que toman valores numéricos, se clasifican en el número
de valores que puede tomar la variable. Las variables se pueden clasificar también según si son
independientes o dependientes:
Variable independiente: Es una variable que su valor no depende de otra variable. La variable
independiente suele representarse en las gráficas en el eje de abscisas (x).
- 21 -
BIOESTADÍSTICA
Variable dependiente: Es una variable cuyos valores dependen de los valores que tome otra variable.
Se representa en el eje de ordenadas y en una función puede haber combinación de los dos tipos. Por
ejemplo, el capital invertido por una federación de una especialidad atlética de un país ante un
campeonato deportivo (variable independiente cuantitativa) y las medallas obtenidas (variable
dependiente cualitativa).
El investigador utiliza estas variables en el estudio estadístico con el fin de con el de encontrar alguna
causalidad de ciertas variables sobre las variables objetivo del estudio.
- 22 -
BIOESTADÍSTICA
- 23 -
BIOESTADÍSTICA
1. En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la variable
en el conjunto de datos.
2. En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y las
frecuencias absolutas acumuladas.
3. Las columnas cuarta y quinta contienen la las frecuencias relativas y las frecuencias relativas
acumuladas.
4. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima), representando la
frecuencia relativa y la frecuencia relativa acumulada como tanto por cien. Estos porcentajes se
obtienen multiplicando las dos frecuencias por cien.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo,
las medidas de dispersion dicen hasta que punto estas medidas de tendencia central son representativas
como sintesis de la informacion.
Las medidas de dispersion cuantifican la separacion, la dispersion, la variabilidad de los valores de la
distribucion respecto al valor central.
- 24 -
BIOESTADÍSTICA
Una vez descritos los datos, nos puede interesar saber como se relacionan unas variables con otras,
para saber como se presentan juntas dos o mas caracteristicas de un fenomeno.
Queremos saber, por tanto, si dos variables estan relacionadas y varian de modo que cambian la una
en relacion con la otra.
Ejemplo:
Saber si existe relacion entre el nivel socioeconomico y la compra de diarios de informacion general.
Saber si existe relacion entre la edad y el consumo de diarios gratuitos de informacion general.
- 25 -
BIOESTADÍSTICA
Concepto de probabilidad
La probabilidad es simplemente qué tan posible es que ocurra un evento determinado. Cuando no
estamos seguros del resultado de un evento, podemos hablar de la probabilidad de ciertos resultados:
qué tan común es que ocurran. Al análisis de los eventos gobernados por la probabilidad se le llama
estadística.
(Métodos Estadísticos. Un enfoque interdisciplinario. 2da. Edic. Edit. Trillas. México, D.F. LEVIN, I.R.
1988.)
- 26 -
BIOESTADÍSTICA
La teoría de probabilidades es una rama de las matemáticas que se centra en el análisis de lo esperables
que pueden ser un conjunto de sucesos, útil para estimular posibles comportamientos promedios de la
naturaleza, asi como la economía o el mundo de los juegos de azar.
Aplicadas a un espacio muestral, definimos como algebra que define tres operaciones, la unión, la
intersección y la negación, bajo las cuales el espacio muestral es cerrado.
- 27 -
BIOESTADÍSTICA
- 28 -
BIOESTADÍSTICA
La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso
definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra.
(Métodos Estadísticos. Un enfoque interdisciplinario. 2da. Edic. Edit. Trillas. México, D.F. LEVIN, I.R.
1988.)
- 29 -
ACTIVIDADES ACADÉMICAS DE LA UNIDAD II
La distribución de
probabilidad de una Sobre el Teorema de Bayes.
variable aleatoria es una -------------------------------------------
función que asigna a cada ------------------------------------------------
-------------------------------------------
suceso definido sobre la ------------------------------------------------
variable aleatoria la -------------------------------------------
probabilidad de que dicho ------------------------------------------- ------------------------------------------------
suceso ocurra. ------------------------------------------------
-------------------------------------------
-------------------------------------------- ------------------------------------------------
------------------------------------------------
----------------------------------------
------------------------------------------------
-------------------------------------------
------------------------------------------------
-------------------------------------------
------------------------------------------------
-------------------------------------------
------------------------------------------------
2.- Concepto de probabilidad.
“La probabilidad es una rama de las matemáticas que se centra en el análisis de lo esperables que
pueden ser un conjunto de sucesos, útil para estimular posibles comportamientos promedios de la
naturaleza, así como la economía o el mundo de los juegos de azar”.
VERDADERO FALSO
3.- Mencione los conceptos correctos de cada tipo de parámetros estadísticos:
“La tabla de frecuencia es una tabla que muestra la distribución de los datos mediante sus frecuencias.
Se utiliza para variables cuantitativas o cualitativas.
La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que se presentan
numéricamente las características de la distribución de un conjunto de datos o muestra”.
VERDADERO FALSO
VERDAERO VERDAERO
FALSO FALSO
UNIDAD III
ORGANIZACIÓN DE INFORMACIÓN – PRESENTACIÓN DE
INFORMACIÓN - MEDIDAS DE TENDENCIA CENTRAL
1. ORGANIZACIÓN DE INFORMACION.
Luego de tomar la información necesaria en la investigación que se sigue, se obtiene una gran cantidad
de datos que requieren ser interpretados y sobre los cuales se busca concluir algo específico. Para esto
se debe depurar y clasificar la información aplicando técnicas adecuadas.
La organización y el resumen de la información son dos procesos distintos que se desarrollan por
separado. La organización hace referencia al arreglo de los datos en un formato lógico para su
interpretación. En cambio, el resumen implica la condensación de varias mediciones en una forma
compacta, ya sea gráfica o numéricamente. De ahí que se tome primero la forma de organizar la
información tomada en una investigación estadística.
- 35 -
BIOESTADÍSTICA
Es el procedimiento en el cual se agrupan los registros en orden definido, con el fin de facilitar la búsqueda
de datos ordenados en secuencia, el cual puede ser numérico, alfabético o incluso alfanumérico,
ascendente o descendente.
- 36 -
BIOESTADÍSTICA
La distribución o tabla de frecuencias es una tabla de los datos estadísticos con sus correspondientes
frecuencias, dónde: Frecuencia absoluta: el número de veces que aparece un valor, se representa con
donde el subíndice representa cada uno de los valores.
- 37 -
BIOESTADÍSTICA
Una ojiva se utiliza para representar la frecuencia acumulada. Similar al polígono de frecuencia, se forma
o se construye uniendo los puntos más altos de cada columna, pero de un histograma que representa
las frecuencias acumuladas.
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para
las variables cualitativas.
Se calcula sumando todos los productos de marca clase con la frecuencia absoluta respectiva y su
resultado dividido por el número total de datos.
EJEMPLO:
[13, 22, 31, 40, 49, 58, 67, 76, 85, 94]
X = 13 + 22 + 31 + 40 + 49 + 58 + 67 + 76 + 85 + 94 / 10
X = 535 / 10
X = 53,5 es la media aritmética
EJEMPLO:
- 38 -
BIOESTADÍSTICA
X = 21 + 22 + 23 + 23 + 24 + 28 + 30 / 7 X =
171 / 7 = 24,42 24 años, 5 meses, 4 días.
EJEMPLO:
A un conjunto de 5 números cuya media es 7,31 se le añaden los números 4,47 y 10,15. Cuál es la media
del nuevo conjunto de números.
EJEMPLO:
X = 4.105 / 50 = 82,10
1.7 Propiedades – Media aritmética ponderada – Mediana para datos tabulados y no tabulados.
Ejemplo:
De acuerdo a los siguientes datos observados: 50, 80, 55, 75, 65 Calcular
la media de edad.
Media aritmética X = 50 + 55 + 65 + 75 + 80 / 5
X = 325 / 5
- 39 -
BIOESTADÍSTICA
X = 65
Ejemplo:
De acuerdo a los siguientes datos observados: 18, 28, 25, 20, 24, 19, 21, 20, 18, 19, 21 Calcular
la media de edad.
Media aritmética X = 18 + 18 + 19 + 19 + 20 + 20 + 21 + 21 + 24 + 25 + 28 / 11
X = 233 / 11
X = 21,18 21 años, 2 meses, 5 días
Ejemplo:
Media aritmética X = 3 + 8 + 8 + 8 + 9 + 9 + 9 + 18 /
8 X = 72 / 8 X = 9 9 años
Ejemplo:
De acuerdo a los siguientes datos observados: 12, 23, 9, 17, 7, 22, 15 Calcular
la media de edad.
Media aritmética X = 7 + 9 + 12 + 15 + 17 + 22 + 23 /
7 X = 105 / 7 X = 15 15 años
Ejemplo:
En un aula de estudiantes, existen 7 estudiantes con 18 años cumplidos, 8 estudiantes con 19 años
cumplidos, 10 estudiantes con 20 años cumplidos y 15 estudiantes con 21 años cumplidos. Calcular la
media de edad del aula de estudiantes.
Ejemplo:
- 40 -
BIOESTADÍSTICA
En un aula de estudiantes, existen 2 estudiantes con 30 años cumplidos, 10 estudiantes con 18 años
cumplidos, 3 estudiantes con 20 años cumplidos y 15 estudiantes con 19 años cumplidos. Calcular la
media de edad del aula de estudiantes.
Ejemplo:
De acuerdo a los siguientes datos observados: 10, 20, 15, 40, 50, 90, 70, 30 Calcular
la media de edad.
Media aritmética X = 10 + 15 + 20 + 30 + 40 + 50 + 70 + 90 / 8
X = 325 / 8
X = 40,625 40 años, 7 meses, 15 días.
Ejemplo:
En un aula de estudiantes, existen 3 estudiantes con 17 años cumplidos, 10 estudiantes con 35 años
cumplidos, 2 estudiantes con 18 años cumplidos y 13 estudiantes con 40 años cumplidos. Calcular la
media de edad del aula de estudiantes.
Ejemplo:
Determinar la media aritmética de la edad en la siguiente aula: 23, 24, 19, 20, 21, 22, 23, 19
- 41 -
BIOESTADÍSTICA
- 42 -
BIOESTADÍSTICA
- 43 -
BIOESTADÍSTICA
Ejemplo:
Ahora determinamos el número que queda en el centro de la muestra, en este problema los datos son
impares. Me = 5
Ejemplo:
4 + 5 / 2 = 4,5
Me = 4,5
Ejemplo:
Ejemplo:
Observamos que la muestra es par, por lo que sumaremos los dos números centrales y lo dividiremos
entre dos
Me = 4 + 6 / 2 = 5 es la mediana
Ejemplo:
- 44 -
BIOESTADÍSTICA
Ejemplo:
= 14 + 18 / 2 = 32 / 2 = 16 es la mediana.
Ejemplo:
De acuerdo a los siguientes datos observados: 10, 18, 12, 40, 50, 90, 70, 30
Me = 30 + 40 / 2
Me = 70 / 2
Me = 35 años
Ejemplo:
De acuerdo a los siguientes datos observados: 147, 72, 180, 360, 522, 324
Me = 180 + 324 / 2
Me = 504 / 2
Me = 252
- 45 -
BIOESTADÍSTICA
En estadística, la moda es el valor con mayor frecuencia en una distribución de datos. Se hablará de
una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es
decir, dos datos que tengan la misma frecuencia absoluta máxima.
La moda es el valor que tiene mayor frecuencia absoluta. Se puede hallar la moda para variables
cualitativas y cuantitativas. Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa
frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
Ejemplo:
Basándose en la premisa de que la moda equivale al valor más repetido en una muestra, y observando
esta correlación de números: 4, 3, 2, 7, 7, 7, 9, 5, 9, 9, 1, 9
Ejemplo:
- 46 -
BIOESTADÍSTICA
Encontramos una muestra Bimodal ya que los números 6 y 9 tienen las frecuencias más altas y se
repiten las mismas veces.
Ejemplo:
A = 2, 3, 4, 4, 5, 6, 6, 6, 7, 9}
C = 5, 6, 7, 7, 9, 11, 11, 13
Ejemplo:
Bimodal = 6 y 9
El rango se define como la diferencia entre el valor máximo y mínimo del conjunto de datos. En forma
compacta: R = Xmax – Xmin
- 47 -
BIOESTADÍSTICA
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística.
La desviación típica o estándar es la raíz cuadrada de la varianza, es decir, la raíz cuadrada de la media
de los cuadrados de las puntuaciones de desviación.
- 48 -
BIOESTADÍSTICA
- 49 -
BIOESTADÍSTICA
Ejemplo:
Media aritmética X = 5 + 5 + 6 + 8 + 9 + 10 /6
X = 43 / 6
X = 7,16
(5 – 7,16)2 + (5 – 7,16)2 + (6 – 7,16)2 + (8 – 7,16)2 + (9 – 7,16)2 + (10 – 7,16)2 4,66 + 4,66
+ 1,34 + 0,70 + 3,38 + 8,06
22,8
S = raíz cuadrada 22,8 / 5 S = 2,16
Ejemplo:
Calcular la desviación estándar de acuerdo a los siguientes datos: 4, 8, 12, 16, 20, 24
Media aritmética X = 4 + 8 + 12 + 16 + 20 + 24 /6
X = 84 / 6
X = 14
(4 – 14)2 + (8 – 14)2 + (12 – 14)2 + (16 – 14)2 + (20 – 14)2 + (24 – 14)2
100 + 36 + 4 + 4 + 36 + 100
280
S = raíz cuadrada 280/ 5
S= 7,48
Ejemplo:
Calcular la desviación estándar de acuerdo a los siguientes datos: 15, 15, 17, 19, 21 Media aritmética X
= 15 + 15 + 17 + 19 + 21 /5
X = 87 / 5
X = 17,4
(15 – 17,4)2 + (15 – 17,4)2 + (17 – 17,4)2 + (19 – 17,4)2 + (21 – 17,4)2
5,76 + 5,76 + 0,16 + 2,56 + 12,96 27,2
Ejemplo:
Calcular la desviación estándar de acuerdo a los siguientes datos: 15, 30, 45, 60, 75 Media aritmética X
= 15 + 30 + 45 + 60 + 75 /5
X = 225 / 5
X = 45
(15 – 45)2 + (30 – 45)2 + (45 – 45)2 + (60 – 45)2 + (75 – 45)2
900 + 225 + 0 + 225 + 900 2250
- 50 -
BIOESTADÍSTICA
Ejemplo:
Calcular la desviación estándar de acuerdo a los siguientes datos: 20, 20, 40, 60, 80 Media aritmética X
= 20 + 20 + 40 + 60 + 80 /5
X = 220 / 5
X = 44
(20 – 44)2 + (20 – 44)2 + (40 – 44)2 + (60 – 44)2 + (80 – 44)2
576 + 576 + 16 + 256 + 1296 2720
Ejemplo:
Calcular la desviación estándar de acuerdo a los siguientes datos: 35, 35, 40, 45
Media aritmética X = 35 + 35 + 40 + 45 /4
X = 155 / 4
X = 38,75
Las medidas de asimetría son indicadores que permiten establecer el grado de simetría (o asimetría) que
presenta una distribución de probabilidad de una variable aleatoria sin tener que hacer su representación
gráfica. Como eje de simetría consideramos una recta paralela al eje de ordenadas que pasa por la media
de la distribución. Si una distribución es simétrica, existe el mismo número de valores a la derecha que
a la izquierda de la media, por tanto, el mismo número de desviaciones con signo positivo que con signo
negativo. Decimos que hay asimetría positiva (o a la derecha) si la “cola” a la derecha de la media es
más larga que la de la izquierda, es decir, si hay valores más separados de la media a la derecha.
Diremos que hay asimetría negativa (o a la izquierda) si la “cola” a la izquierda de la media es más larga
que la de la derecha, es decir, si hay valores más separados de la media a la izquierda.
- 51 -
BIOESTADÍSTICA
Existen tres tipos de curva de distribución según su asimetría: Asimetría negativa: la cola de la
distribución se alarga para valores inferiores a la media. Simétrica: hay el mismo número de elementos
a izquierda y derecha de la media.
El coeficiente de asimetría, cuando al trazar una vertical, en el diagrama de barras o histogramas, de una
variable, según sea discreta o continua, por el valor de la media, esta vertical, se transforma en eje de
simetría, decimos que la distribución es simétrica.
- 52 -
BIOESTADÍSTICA
- 53 -
BIOESTADÍSTICA
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a mayor grado
de Curtosis, más escarpada (o apuntada) será la forma de la curva.
- 54 -
ACTIVIDADES ACADÉMICAS DE LA UNIDAD III
Es el procedimiento en el cual
se agrupan los registros en Sobre la frecuencia absoluta.
orden definido, con el fin de ------------------------------------------
facilitar la búsqueda de datos ------------------------------------------
ordenados en secuencia, el ------------------------------------------
------------------------------------------
cual puede ser numérico, ------------------------------------------
alfabético o incluso ------------------------------------------
alfanumérico, ascendente o ------------------------------------------
descendente. ------------------------------------------
------------------------------------------
------------------------------------------
------------------------------------------
------------------------------------------
------------------------------------------
------------------------------------------
-----------------------------------
---------------------------
------------------------------------------
-----------------------------------------
------------------------------------------
-----------------------------------------
2.- Concepto de Histograma
“Para representar frecuencias de una variable aleatoria continua se usan histogramas. En el eje de las
abscisas se representan los valores de la variable clasificados según intervalos de clase y en la
ordenada, la frecuencia de datos en cada intervalo de clase”
VERDADERO FALSO
VERDADERO VERDADERO
FALSO FALSO
- 56 -
BIOESTADÍSTICA
------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------
UNIDAD IV
PROBABILIDADES – VARIABLE ALEATORIA –
DISTRIBUCIONES PROBABILÍSTICAS –
TEORÍA DE LA ESTIMACIÓN - PRUEBA DE HIPÓTESIS
1. PROBABILIDADES.
Las probabilidades constituyen una rama de las matemáticas que se ocupa de medir o determinar
cuantitativamente la posibilidad de que un suceso o experimento produzca un determinado resultado. La
probabilidad está basada en el estudio de la combinatoria y es fundamento necesario de la estadística. La
probabilidad es una medida de la certidumbre asociada a un suceso o evento futuro y suele expresarse
como un número entre 0 y 1 (o entre 0 % y 100 %).
La Probabilidad como una rama de las matemáticas que mide cuantitativamente la posibilidad de que un
experimento produzca un determinado resultado, y la Estadística como ciencia formal que estudia la
recolección, análisis e interpretación de datos de una muestra.
- 57 -
BIOESTADÍSTICA
Ejemplo:
Hallar la probabilidad de que al lanzar al aire dos monedas salgan dos caras:
P(2c) = 1 /2 . 1 / 2 = = 1 / 4
- 58 -
BIOESTADÍSTICA
Hallar la probabilidad de que al lanzar al aire dos monedas salgan una cara y una cruz: P(1c
1x) = 1 / 2. 1 / 2 + 1 / 2. 1 / 2 = 1 / 2
“Y” contra “Ó” en probabilidades. En probabilidades, hay mucha diferencia entre las palabras “y” y “ó.”
“Y” significa que el resultado satisface ambas condiciones al mismo tiempo. “Ó” significa que el
resultado satisface una u otra condición, o ambas al mismo tiempo.
Calcular la probabilidad de un evento aleatorio único. Define los eventos y los resultados posibles. La
probabilidad es la posibilidad de que suceda uno o más eventos dividida por el número de resultados
posibles. Supongamos que intentas calcular la probabilidad de sacar un tres con un dado de seis lados.
Por ejemplo: la probabilidad mide la posibilidad de que salga “cara” cuando lanzamos una moneda, o
la posibilidad de que salga 5 cuando lanzamos un dado. Llamamos sucesos a los posibles resultados de
una acción que depende del azar. Distinguimos 3 tipos de sucesos: Suceso posible: es un resultado que
se puede dar.
Calcular la probabilidad de personas menor o igual a 22 años. Persona mayor o igual a 20 años.
Divide el número de eventos por el número de resultados posibles. Esto te da la probabilidad de que
ocurra un evento único. En el caso de sacar un tres con el dado, el número de eventos es uno (sólo hay
un tres en todos los dados), y el número de resultados posibles es seis.
Ejemplo:
Hallar la probabilidad de que al azar extraer de una urna una bola que no sea naranja, sabiendo
de que se encuentran 9 bolas azules, 7 bolas verdes y 12 bolas naranjas.
P(par) = 3 / 6 = 0,5
Busca la probabilidad de que, al lanzar un dado al aire, salga un número mayor que cuatro.
P(>4) = 2 / 6 = 1 / 3 = 0,333
- 60 -
BIOESTADÍSTICA
Una urna tiene 8 bolas rojas, 5 amarillas, y 7 verdes. Se extrae una al azar y se busca la probabilidad de
que sea roja.
P(roja) = 8 / 20 = 0,4
Una urna tiene 8 bolas rojas, 5 amarillas, y 7 verdes. Se extrae una al azar y se busca la probabilidad de
que sea verde.
Una urna tiene 8 bolas rojas, 5 amarillas, y 7 verdes. Se extrae una al azar y se busca la probabilidad de
que sea amarillo.
P(amarilla) = 5 / 20 = 0,25
Una urna tiene 8 bolas rojas, 5 amarillas, y 7 verdes. Se extrae una al azar y se busca la probabilidad de
que no sea amarillo.
Es cualquier proceso o acción que genera observaciones y que puede ser repetible. Un experimento
aleatorio es aquel que, bajo el mismo conjunto aparente de condiciones iniciales, puede presentar
resultados diferentes, es decir, no se puede predecir o reproducir el resultado exacto de cada experiencia
particular.
- 61 -
BIOESTADÍSTICA
Es el conjunto de todos los resultados posibles del experimento aleatorio. Por ejemplo, si el experimento
consiste en lanzar dos monedas, el espacio muestral es el conjunto (cara, cara), (cara, cruz), (cruz, cara),
(cruz, cruz). En el ejemplo, el suceso de sacar cara en el primer lanzamiento, (cara, cara); (cara, cruz),
Una variable aleatoria es una función que asigna un valor, usualmente numérico, al resultado de un
experimento aleatorio.
Una variable aleatoria puede concebirse como un valor numérico que está afectado por el azar. Dada
una variable aleatoria no es posible conocer con certeza el valor que tomará esta al ser medida o
determinada, aunque sí se conoce que existe una distribución de probabilidad asociada al conjunto de
valores posibles. Por ejemplo, en una epidemia de cólera, se sabe que una persona cualquiera puede
enfermar o no (suceso), pero no se sabe cuál de los dos sucesos va a ocurrir. Solamente se puede decir
que existe una probabilidad de que la persona enferme.
- 62 -
BIOESTADÍSTICA
Ejemplo:
P(A) = 6 / 8
P(B) = 5 / 8
P© = 1 / 8
Ejemplo:
Media aritmética
X = 23 + 28 + 22 + 21 + 24 + 38 / 6
X = 156 / 6
X = 26
- 63 -
BIOESTADÍSTICA
Ejemplo:
El valor esperado de una variable aleatoria es igual al promedio ponderado de los valores que esta puede
asumir.
La varianza de las variables aleatorias, por lo tanto, consiste en una medida vinculada a su dispersión.
Se trata de la esperanza del cuadrado de la desviación de esa variable considerada frente su media y se
mide en una unidad diferente.
La desviación típica es una medida del grado de dispersión de los datos con respecto al valor promedio.
Dicho de otra manera, la desviación estándar es simplemente el “promedio” o variación esperada con
respecto a la media aritmética.
Por ejemplo, las tres poblaciones (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7.
Sus desviaciones estándar poblacionales son 7, 5 y 1, respectivamente. La tercera población tiene una
desviación mucho menor que las otras dos porque sus valores están más cerca de 7.
La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación
estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un
grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de
vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia
medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto
es coherente, ya que las mediciones caen fuera del rango de valores en el cual sería razonable esperar
que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de
ubicación central; muestra la agrupación de los datos alrededor de un valor central (la media o promedio).
La desviación estándar es una medida de dispersión para variables de razón (ratio o cociente) y de
- 64 -
BIOESTADÍSTICA
intervalo. Es una medida (cuadrática) de lo que se apartan los datos de su media, y por tanto, se mide
en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central,
sino que necesitamos conocer también la desviación que representan los datos en su distribución, con
objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e
interpretarlos para la toma de decisiones.
Ejemplo:
X = 21 + 22 + 23 + 23 + 24 + 28 + 30 / 7
X = 171 / 7 = 24,42 24 años, 5 meses, 4 días.
Segundo paso determinar la variación de los datos observados con la media aritmética elevada al
cuadrado.
(21 – 24,42)2 + (22 – 24,42)2 + (23 – 24,42)2 + (23 – 24,42)2 + (24 – 24,42)2 + (28 – 24,42)2 + (30 –
24,42)2
Tercer paso determinar la desviación estándar.
- 65 -
BIOESTADÍSTICA
Ejemplo:
(12 - 16)2 + (12 – 16)2 + (14 – 16)2 + (14 -16)2 + (16 – 16)2 + (18 – 16)2 + (20 – 16)2 + (22 – 16)2
= 16 +16 + 4 + 4 + 0 + 4 + 16 + 36
= 96
= 96 / 7 = 13,71
S = 3,70
El Rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los
datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos
están los datos (sin considerar la afectación de los valores extremos). Por ejemplo, para una serie de
datos de carácter cuantitativo, como lo es la estatura medida en centímetros.
Ejemplo:
- 66 -
BIOESTADÍSTICA
Calcular la desviación media y la desviación estándar, de acuerdo a los siguientes datos estadísticos:
13, 17, 21, 25, 29
Media aritmética X = 13 + 17 + 21 + 25 + 29 / 5
X = 105 / 5
X = 21
/13 – 21/ + /17 – 21/ + /21 – 21/ + /25 – 21/ + /29 – 21/
/-8/ + /-4/ + /0/ + /4/ + /8/
8+4+0+4+8
24
Dm = 24 / 5
Dm = 4,8
(13 – 21)2 + (17 – 21)2 + (21 – 21)2 + (25 – 21)2 + (29 – 21)2
64 + 16 + 0 + 16 + 64
160
S = raíz cuadrada 160 / 4
S = 6,32
Ejemplo:
Calcular el coeficiente de variación, de acuerdo a los siguientes datos estadísticos: 25, 25, 30, 35, 40
Media aritmética X = 25 + 25 + 30 + 35 + 40 / 5
X = 155 / 5
X = 31
(25 – 31)2 + (25 – 31)2 + (30 – 31)2 + (35 – 31)2 + (40 – 31)2
36 + 36 + 1 + 16 + 81
170
S = raíz cuadrada 170 / 4
S = 6,51
CV = 6,51 / 31.100
CV = 21,02% BAJA DISPERSION.
Ejemplo:
Calcular el coeficiente de variación, de acuerdo a los siguientes datos estadísticos: 25, 35, 45, 55, 65
Media aritmética X = 25 + 35 + 45 + 55 + 65 / 5
X = 225 / 5
X = 45
(25 – 45)2 + (35 – 45)2 + (45 – 45)2 + (55 – 45)2 + (65 – 45)2
400 + 100 + 0 + 100 + 400 1000
S = raíz cuadrada 1000 / 4
- 67 -
BIOESTADÍSTICA
S = 15,81
CV = 15,81 / 45.100
CV = 35,13% BAJA DISPERSION.
Ejemplo:
Calcular el coeficiente de variación, de acuerdo a los siguientes datos estadísticos: 200, 400, 600, 800
X = 2000 / 4
X = 500
(200 – 500)2 + (400 – 500)2 + (600 – 500)2 + (800 – 500)2
90.000 + 10.000 + 10.000 + 90.000
200.000
S = raíz cuadrada 200.000 / 3
S = 258,19
CV = 258,19 / 500.100
CV = 51,64% ALTA DISPERSION, DEBIDO A UN MAYOR RANGO ENTRE DATOS.
Ejemplo:
X = 19 + 21 + 23 + 25 + 26 + 27 + 29 + 31 / 8
X = 201 / 8 = 25,125
(19 – 25,12)2 + (21 – 25,12)2 + (23 – 25,12)2 + (25 – 25,12)2 + (26 – 25,12)2 + (27 – 25,12)2 + (29 –
25,12)2
+ (31 – 25,12)2
37,51 + 17,01 + 4,51 + 0,01 + 0,76 + 3,51 + 15,01 + 34,51
112,83
16,11
S = 4,01
CVA = 4,01 / 25,125 X 100
CVA = 15,96%
PRIMERO DETERMINO LA MEDIA ARITMETICA
X = 15 + 20 + 23 + 25 + 29 + 30 + 36 + 40 / 8
X = 218 / 8
X = 27,25
- 68 -
BIOESTADÍSTICA
(15 – 27,25)2 + (20 – 27,25)2 + (23 – 27,25)2 + (25 – 27,25)2 + (29 – 27,25)2 + (30 – 27,25)2 + (36 – 27
,25)2 + (40 – 27,25)2
150,06 + 52,56 + 18,06 + 5,06 + 3,06 + 7,56 + 76,56 + 162,56
475,48 / 7
67,92
S = 8,24
CVB = 8,24 / 27,25 X 100 CVB
= 30,23%
Ejemplo:
X = 290 / 4
X = 72,5
(35 – 72,5)2 + (60 – 72,5)2 + (85 – 72,5)2 + (110 – 72,5)2
1406,25 + 156,25 + 156,25 + 1406,25
3125
S = raíz cuadrada 3125 / 3
S = 32,27
CV = S / media aritmética. 100
CV = 32,27 / 72,5 . 100 CV =
44,51% baja dispersión.
Ejemplo:
Media aritmética X = 30 + 32 + 34 + 36 /4
X = 132 / 4
X = 33
(30 – 33)2 + (32 – 33)2 + (34 – 33)2 + (36 – 33)2
9+1+1+9
20
S =√(20/3)
S = 2,58
CV = S / media aritmética. 100
- 69 -
BIOESTADÍSTICA
Ejemplo:
Calcular la desviación media de los siguientes datos observados: 15, 20, 17, 19, 15
x = 15 + 15 + 17 + 19 + 20 / 5
X = 86 / 5
X = 17,2
Dm = valor absoluto x – x / n
(15 – 17,2) + (15 – 17,2) + (17 – 17,2) + (19 – 17,2) + (20 – 17,2)
2,2 + 2,2 + 0,2 + 1,8 + 2,8
9,2
Dm = 9,2 / 5 Dm =
1,84
Ejemplo:
Calcular el coeficiente de variación de la siguiente muestra: 30, 30, 32, 32, 34, 34, 36, 36
Media aritmética X = 30 + 30 + 32 + 32 + 34 + 34 + 36 + 36 /8
X = 264 / 8
X = 33
(30 – 33)2 + (30 – 33)2 + (32 – 33)2 + (32 – 33)2 + (34 – 33)2 + (34 – 33)2 + (36 – 33)2 + (36 – 33)2 9 +
9+1+1+1+1+9+9
40
S = raíz cuadrada 40 / 7
S = 2,39
CV = 2,39 / 33 CV =
7,24%
Ejemplo:
Calcular el coeficiente de variación de los siguientes datos estadísticos: 400, 1000, 1600, 2100
- 70 -
BIOESTADÍSTICA
Una variable aleatoria es una función que asigna un valor, usualmente numérico, al resultado de un
experimento aleatorio.
Una variable aleatoria puede concebirse como un valor numérico que está afectado por el azar. Dada
una variable aleatoria no es posible conocer con certeza el valor que tomará esta al ser medida o
determinada, aunque sí se conoce que existe una distribución de probabilidad asociada al conjunto de
valores posibles. Por ejemplo, en una epidemia de cólera, se sabe que una persona cualquiera puede
enfermar o no (suceso), pero no se sabe cuál de los dos sucesos va a ocurrir. Solamente se puede decir
que existe una probabilidad de que la persona enferme.
Ejemplo:
P(B) = 5 / 8
P© = 1 / 8
Ejemplo:
Calcular la probabilidad de que, al sacar una bola al azar de una urna, que sea verde, cuando existen 23
bolas naranjas, 27 bolas moradas, 34 bolas rojas y 16 bolas verdes. Luego calcular que no sea naranja
y que no sea morada.
Ejemplo:
Calcular la probabilidad de que, al sacar una bola al azar de una urna, que no sea amarilla, cuando
existen 8 bolas rojas, 10 bolas amarillas, 4 bolas verdes. Luego calcular que no sea verde.
Ejemplo:
Calcular la probabilidad de personas menor o igual a 22 años. Persona mayor o igual a 20 años.
Ejemplo:
Calcular la probabilidad de que, al sacar una bola al azar de una urna, que no sea amarilla, cuando
existen 70 bolas rojas, 85 bolas verdes, 98 bolas café, 120 bolas azul, 139 bolas blanca, 7 bolas amarillas.
Luego calcular que no sea roja; y que no sean blancas.
- 72 -
BIOESTADÍSTICA
Calcular la probabilidad de que, al sacar una bola al azar de una urna, que no sea azul, cuando existen
20 bolas rojas, 40 bolas verdes, 60 bolas azul. Luego calcular que no sea roja.
Ejemplo:
Media aritmética X = 24 + 24 + 25 + 26 + 26 + 27 + 30 / 7
X = 182 / 7
X = 26
(24 – 26)2 + (24 – 26)2 + (25 – 26)2 + (26 – 26)2 + (26 – 26)2 + (27 – 26)2 + (30 – 26)2
4 + 4 + 1 + 0 + 0 + 1 + 16 = 26
S = raíz cuadrada 26 / 6
S = 2,08
CV = 2,08 / 26. 100
CV = 8% BAJA DISPERSION
P (p mayor o igual a 26) = 4 / 7 = 0,5714 = 57,14%
P (p no menor o igual a 24) = 1 – 5 / 7 = 0,2857 = 28,57%
2. DISTRIBUCIONES
Podemos servirnos de los resultados de un número fijo de lanzamientos de una moneda como ejemplo
de un proceso de Bernoulli. Este proceso lo describimos así:
1. Cada ensayo (cada lanzamiento, en nuestro caso) tiene sólo dos resultados posibles:
lado A o lado B, sí o no, éxito o fracaso.
2. La probabilidad del resultado de cualquier ensayo (lanzamiento) permanece fija con el
tiempo. Tratándose de una moneda la probabilidad de que salga del lado A sigue
siendo de 0.5 en cada lanzamiento, cualquiera que sea el número de veces que la
moneda sea arrojada.
3. Los ensayos son estadísticamente independientes, es decir, el resultado de un
lanzamiento no afecta al de cualquier otro lanzamiento.
- 73 -
BIOESTADÍSTICA
Cada proceso de Bernoulli tiene su propia probabilidad característica. Pongamos el caso en que siete
décimas partes de las personas que solicitaron cierto tipo de empleo pasaron la prueba. Diremos
entonces que la probabilidad característica fue de 0.7 pero podemos describir los resultados de la prueba
como un proceso de Bernoulli sólo si tenemos la seguridad de que la proporción de los que fueron
aprobados permaneció constante con el tiempo.
Desde luego, la otra característica del proceso de Bernoulli también deberá ser satisfecha. Cada prueba
deberá arrojar tan sólo dos resultados (éxito o fracaso= y los resultados de las pruebas habrán de ser
estadísticamente independientes.
La distribución hipergeométrica es una distribución discreta que modela el número de eventos en una
muestra de tamaño fijo cuando usted conoce el número total de elementos en la población de la cual
proviene la muestra. Cada elemento de la muestra tiene dos resultados posibles (es un evento o un no
evento).
- 74 -
BIOESTADÍSTICA
Se muestra el procedimiento para transformar una distribución normal en una distribución normal
estandarizada. A partir de los valores de una variable x, se crea una nueva variable z. La variable z es
el valor de x menos la media, dividido por la desviación estándar.
La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el valor cero,
μ = 0, y por desviación típica la unidad, σ =1. Su función de densidad es: Su gráfica es: La probabilidad
de la variable X dependerá del área del recinto sombreado en la figura.
En realidad, la distribución ji-cuadrada es la distribución muestral de s2. O sea que, si se extraen todas
las muestras posibles de una población normal y a cada muestra se le calcula su varianza, se obtendrá
la distribución muestral de varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico X2. Si
se elige una muestra de tamaño n de una población normal con varianza , el estadístico:
Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de libertad y
se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada está dado por:
- 75 -
BIOESTADÍSTICA
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor (n-3) = (gl-
2).
Es una distribución de probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño.
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el parámetro
desconocido de la población. Al valor usado se le llama estimador.
- 76 -
BIOESTADÍSTICA
En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse
del estudio de una variable estadística.
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución
estadística. Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por
una gráfica. ... Las medidas de centralización son: MEDIA ARITMÉTICA La media es el valor promedio
de la distribución.
Se distingue entonces entre parámetros y estadísticos. Mientras que un parámetro es una función de
los datos de la población, el estadístico lo es de los datos de una muestra. De este modo pueden
definirse la media muestral, la varianza muestral o cualquier otro parámetro de los vistos más arriba.
- 77 -
BIOESTADÍSTICA
El intervalo de confianza es la aplicación de la regla mágica por excelencia a esta distribución de las
medias. La regla mágica la tienes explicada en este post. Recuerda que es solo aplicable a histogramas
en forma de campana de Gauss
Corresponde a un rango de valores, cuya distribución es normal y en el cual se encuentra, con alta
probabilidad, el valor real de una determinada variable.
Así, un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra el valor real
de un parámetro con 95% de certeza.
Un intervalo de confianza es una técnica de estimación utilizada en estadística inferencial que permite
acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada
(con una determinada probabilidad).
Una estimación del intervalo de confianza es un rango de números, llamado intervalo, construido
alrededor de la estimación puntual. El intervalo de confianza se construye de manera que la
probabilidad del parámetro de la población se localice en algún lugar dentro del intervalo conocido.
- 78 -
BIOESTADÍSTICA
Si tenemos una muestra de tamaño n tomada de una población normal, podemos obtener un intervalo
de confianza del nivel dado (90%, 95%, 99%, etc) para la varianza sabiendo que el valor de chi cuadrada
es para este caso:
(n – 1)S2 / σ2
3. HIPÓTESIS ESTADÍSTICOS
- 79 -
BIOESTADÍSTICA
Una hipótesis estadística es una proposición o supuesto sobre los parámetros de una o más
poblaciones. Es importante recordar que las hipótesis siempre son proposiciones sobre la población o
distribución bajo estudio, no proposiciones sobre la muestra.
Se les denomina así a los supuestos (hipótesis) realizados con respecto a un parámetro o estadístico
(media, proporción, entre otros). En este paso se definen dos tipos de hipótesis: Ho: Hipótesis nula.
H1: Hipótesis alterna (de la cual se sospecha pudiera ser cierta, es planteada por el investigador).
Las hipótesis nula y alternativa son dos enunciados mutuamente excluyentes acerca de una población.
Una prueba de hipótesis utiliza los datos de la muestra para determinar si se puede rechazar la hipótesis
nula.
La hipótesis nula indica que un parámetro de población (tal como la media, la desviación estándar, etc.)
es igual a un valor hipotético. La hipótesis nula suele ser una afirmación inicial que se basa en análisis
previos o en conocimiento especializado.
La hipótesis alternativa indica que un parámetro de población es más pequeño, más grande o diferente
del valor hipotético de la hipótesis nula. La hipótesis alternativa es lo que usted podría pensar que es
cierto o espera probar que es cierto.
- 80 -
BIOESTADÍSTICA
- 81 -
BIOESTADÍSTICA
En un estudio de investigación, el error de tipo I también denominado error de tipo alfa o falso positivo,
es el error que se comete cuando el investigador rechaza la hipótesis nula siendo esta verdadera en la
población.
Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La probabilidad de
cometer un error de tipo II es β, que depende de la potencia de la prueba. Puede reducir el riesgo de
cometer un error de tipo II al asegurarse de que la prueba tenga suficiente potencia. Para ello, asegúrese
de que el tamaño de la muestra sea lo suficientemente grande como para detectar una diferencia práctica
cuando está realmente exista.
La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero de acuerdo con
la evidencia proporcionada por los datos de la muestra. Con base en los datos de muestra, la prueba
determina si se puede rechazar la hipótesis nula. Usted utiliza el valor p para tomar esa decisión.
Pruebas de hipótesis para una varianza Es un procedimiento para juzgar si una propiedad que se supone
cumple una población estadística es compatible con lo observado en una muestra de dicha población en
- 83 -
BIOESTADÍSTICA
este caso la varianza, para ello formularemos dos Hipótesis (llamada “Hipótesis Nula”) y (llamada
“Hipótesis Alternativa”), con ellas realizaremos una o más pruebas, para tratar de encontrar cual
deberíamos rechazar.
- 84 -
ACTIVIDADES ACADÉMICAS DE LA UNIDAD IV
VERDADERO FALSO
VERDADERO FALSO
VERDAERO VERDAERO
FALSO FALSO
6.- ¿Qué es una distribución normal estándar?
------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------------------------------------------------
BIBLIOGRAFIA
BERENSON, M.L. y D.M. LEVIN. Estadística para Administración y Economía. Conceptos y aplicaciones.
Edit Interamericana. México. MOYA, C.R. y G. S.A. 1988. Probabilidad e Inferencia Estadística. 2da Edic.
Edit. San Marcos. Lima, Perú. MOYA, C.R. 1992. Estadística Descriptiva. Conceptos y Aplicaciones. Edit.
San Marcos. Lima, Perú
CHAO, L.L. 1993. Estadística para Ciencias Administrativas. 3ra Edic. Edit. McGraw-Hill. Bogotá,
Colombia.INFANTE, G.S. y G. P. ZARATE DE LARA. 1990. Métodos Estadísticos. Un enfoque
interdisciplinario. 2da. Edic. Edit. Trillas. México, D.F. LEVIN, I.R. 1988. Estadística para Administradores.
2da. Edic. Edit. Prentice-Hall Hispanoamericana S.A. México. NORMAN, R.G. y D. L. STREINER. 1996.
Bioestadística. Edit. Mosby/Doyma Libros, S.A. Madrid, España. SPIEGEL, R. M. 1991. Estadística. 2da.
Edic. Edit. McGraw-Hill. México.
MENDENHALL, W. and J.E. REINMUTH. 1971. Statistics for Management and Economics. 3ra Edic.
Edit Duxbury Press. U.S.A. Cualquier libro de estadística.
- 87 -
Se terminó de imprimir en enero del 2019 en los talleres de Imprenta Gráfica el Sur
Barrio Antofagasta N° 100 Teléfono 78490034
- 92 -