Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Índice
PRESENTACIÓN ........................................................................................................................................ - 1 -
ESTADÍSTICAS ..................................................................................................................................................... 0
Estadística Paramétrica ............................................................................................................................. 0
Estadística Descriptiva ............................................................................................................................... 0
CORRELACIÓN .................................................................................................................................................... 1
VARIABLES ......................................................................................................................................................... 1
Operacionalización de variables ................................................................................................................ 1
Medición de variables ................................................................................................................................ 2
EJERCICIOS......................................................................................................................................................... 4
POBLACIÓN ........................................................................................................................................................ 5
MUESTRA .......................................................................................................................................................... 5
DISEÑO MUESTRAL ............................................................................................................................................. 5
PROBLEMAS DE EJEMPLO...................................................................................................................................... 6
EJERCICIOS......................................................................................................................................................... 7
TIPOS DE DISEÑO DE MUESTREO ............................................................................................................................. 8
Muestreo al azar aleatorio o probabilístico ............................................................................................... 8
Muestreo al azar aleatorio ordenado ........................................................................................................ 8
Muestreo al azar aleatorio ordenado sistematizado ................................................................................. 8
Muestreo por conglomerado o agrupamiento .......................................................................................... 8
Muestreo Estratificado .............................................................................................................................. 8
DISEÑO DEL CUESTIONARIO ................................................................................................................................... 8
CARACTERÍSTICAS DEL ENCUESTADOR ...................................................................................................................... 9
RECURSOS POR ORDEN JERÁRQUICO........................................................................................................................ 9
YA UNA VEZ HECHA LA ENCUESTA: .......................................................................................................................... 9
1.-Acopio .................................................................................................................................................... 9
2.-Ordenar ascendentemente los datos obtenidos .................................................................................... 9
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIN AGRUPAR ...................................................................................... 9
3.- Media aritmética .................................................................................................................................. 9
4.- Moda .................................................................................................................................................. 10
5.- Mediana.............................................................................................................................................. 10
6.- Rango o amplitud total ....................................................................................................................... 10
7.- División del rango en grupos, clases o intervalos ............................................................................... 10
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS ..................................................................................... 10
Media aritmética ..................................................................................................................................... 10
Moda........................................................................................................................................................ 10
Mediana ................................................................................................................................................... 11
EJERCICIO ........................................................................................................................................................ 11
MEDIDAS DE DISPERSIÓN PARA DATOS SIN AGRUPAR ................................................................................................ 12
I
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
.................................................................................................................................................................. 23
PROBABILIDAD .......................................................................................................................................... 23
X2 CHI CUADRADA...................................................................................................................................... 25
CORRELACIÓN ............................................................................................................................................ 33
ANEXOS .......................................................................................................................................................A
COCIENTE T ....................................................................................................................................................... E
TABLA DE X2 .......................................................................................................................................................F
COCIENTE Z ....................................................................................................................................................... G
GLOSARIO ................................................................................................................................................ - 1 -
A B C ............................................................................................................................................................- 1 -
D ..................................................................................................................................................................- 2 -
E ..................................................................................................................................................................- 3 -
II
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
F H ...............................................................................................................................................................- 4 -
I L M .............................................................................................................................................................- 5 -
N ..................................................................................................................................................................- 6 -
P ..................................................................................................................................................................- 7 -
R S T U V .......................................................................................................................................................- 8 -
BIBLIOGRAFÍA: .............................................................................................................................................A
III
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Presentación
Para quienes estudian por primera vez estadística, incluso para aquellos que ya han tomado algún
curso, deben saber que es una materia sin mayores dificultades para ser abordada. Él tener que
aplicar ciertas fórmulas para lograr y presentar los resultados sobre los cuales se podrán hacer
análisis más objetivos, es agradable y sencillo, porque es muy fácil referir sucesos (medibles), y
expresarlos cuantitativamente.
Y como se mencionó con anterioridad, hacer el acopio o la recolección de los datos, mismos que
para su mejor análisis e interpretación se tienen que organizar, ordenándolos en continuo
ascendente y presentándolos en tablas o en gráficas estadísticas, que facilitará la síntesis de
información y la interpretación de los resultados, porque plasmar numéricamente las
investigaciones con el uso de la estadística es la forma más adecuada y fácil, tanto para presentar,
como para leer, interpretar y analizar los fenómenos cuantificables y así con mayor facilidad poder
obtener ciertas conclusiones, observaciones, alternativas o propuestas, situación que depende
más de la postura del investigador ante la realidad que de la estadística, ya que no condiciona a la
teoría sino que esta es un imprescindible instrumento que bien utilizado te sirve de mucho apoyo
para realizar tus análisis.
Aún resulta para ti más sencillo y fácil saber que no hablamos de la estadística en abstracto ni en
términos muy generales, sino que haremos referencia a la estadística aplicada tanto a la
psicología, como a la medicina, a la educación, etc. por lo que a través de ejemplos prácticos y
comunes a estas carreras del área de la salud, las asignaturas de estadística serán más gratas y
aceptables.
- 1-
Conceptos Básicos
Estadísticas
Aplican dos definiciones:
Es un instrumento de apoyo a la teoría que sirve para recopilar los datos mediante un adecuado
diseño muestral, para ordenarlos y organizarlos en tablas o en gráficas estadísticas, mismas que
facilitan los análisis y nos ayudan a obtener relativas conclusiones con bases más sólidas;
además, sobre la base del conocimiento, de nuestra muestra podremos inferir comportamientos
de la población con niveles o grados de confianza menores al 100%, y hacer si se requiere,
comparaciones entre el comportamiento de varias muestras.
Pasos de la Estadística
Estadística Paramétrica
Es la que requiere que los elementos que integran las muestras contengan elementos parámetros o
medibles ejemplo; (edad, peso, nivel de ingresos, grado educativo, etc.)
Estadística Descriptiva
Incluye la obtención, presentación y descripción de los datos. Sirve como un instrumento de apoyo para
describir claramente los sucesos o fenómenos del comportamiento de la población, o del universo de
estudio, a través de gráficas o tablas. Esto es en la que piensa la mayoría de las personas al decir
“estadística”.
0
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Correlación
Es una asociación existente entre dos variables donde una de las variables por lo general “X” es
independiente y la otra por lo general “Y” es dependiente. Se mide de 0 a 1, siendo uno el más alto nivel
de correlación.
Variables
Partimos de que es una propiedad o característica del sujeto, cosa o elemento que se estudia, el cual
puede variar en la medición de un sujeto a otro.
La variable se aplica a un grupo de personas u objetos, los cuales pueden adquirir diversos valores
respecto a la variable. Si tenemos la variable “z” esta va a adquirir un valor para la investigación científica
cuando pueden ser relacionadas con otras (formar parte de una hipótesis o una teoría).
Por ejemplo: En una investigación sobre diabetes, “Hábitos de alimentación de los diabéticos que
acuden a la Unidad Médica Familiar 89 del Instituto Mexicano del Seguro Social” el problema señala las
variables principales (concentración de glucosa en sangre por consumo de alimentos).
La identificación de las variables de estudio es sumamente importante, tal vez tanto como haber hecho
una buena identificación del problema; sin embargo, no basta con identificarlas; es necesario definir en
forma más precisa que es lo que se va a estudiar y cómo se va a entender cada término a fin de evitar
confusiones o ambigüedades, ejemplo; ¿Qué es lo que entendemos por fumador?, fumar 10 cigarrillos
por día, por semana, por mes, por año etc.
Operacionalización de variables
La operacionalización de una variable consiste en llevar la variable de un nivel abstracto a un plano más
concreto y su función básica es precisar al máximo el significado que se le otorga a una variable en un
determinado estudio. Hermida plantea que operacionalizar las variables significa explicar cómo se van a
medir. La operacionalización es una de las tareas más difíciles del proceso de investigación; de gran
importancia pues tendrá repercusiones en todos los momentos siguientes, razón por la que se le debe de
prestar mucha atención, como la edad, el ingreso económico, los años de escolaridad, el número de
hijos. Estas son variables simples cuya comprensión es más fácil.
Es evidente que cada persona tiene una conceptualización diferente de lo que es el significado de estos
términos o características y que si tratamos de hacer la medición de estas variables antes de haberlas
conceptualizado y definido claramente, al final tendríamos información poco válida y poco confiable.
1
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Dimensiones
(variables
Definición Indicadores
Variable contenidas en la
conceptual Definición operacional
definición
conceptual)
Sencilla Años cumplidos
Ninguna De 1 a 99 o más
Edad de la persona
Tiempo medido en horas y minutos que
Accesibilidad
tarda una persona para trasladarse de
geográfica
Mayor o menor su domicilio al centro de salud
Compleja
posibilidad de Cantidad de dinero que gasta para
Accesibilidad
tomar contacto Accesibilidad recibir la atención.
a los
con los servicios económica Disponibilidad económica para cubrir el
servicios de
de salud para gasto.
salud
recibir asistencia Conocimientos sobre la atención que se
Accesibilidad
da en el centro de salud.
cultural
Percepción del problema de salud.
Medición de variables
Una vez definidas las variables de tal forma que faciliten la observación empírica es necesario considerar
el tipo de medición que debe realizarse para lograr lo planteado en la investigación. Antes de discutir
cuestiones relacionadas con la medición, es necesario conocer algunos aspectos generales de ésta, tales
como su naturaleza, niveles, escalas, alcances y su relación con la validez y confiabilidad.
Al hablar de variables y los valores que éstas pueden tomar, la clasificación puede hacerse en términos
de categorías o de valores numéricos que las variables asumen en una escala.
Siegel indica que “la medición se refiere generalmente a la asignación de números a las observaciones,
de modo que los números sean susceptibles de análisis por medio de manipulaciones y operaciones de
acuerdo con ciertas reglas. La relación con los objetos que se están observando y los números es tan
directa que mediante la manipulación de los números se obtiene nueva información acerca de los
objetos”.
En resumen, medición se refiere a la cualificación o cuantificación de una variable para un estudio dado.
En consecuencia, las variables se clasifican según la capacidad o nivel en que permiten medir los objetos,
es decir, que la característica más común o básica de una variable es la de diferenciar entre la presencia
o ausencia de la propiedad que ella enuncia. La clasificación básica de las variables es la que permite
asignar distintos valores cualitativos o cuantitativos para los diferentes fenómenos bajo estudio.
Cuando se habla de una variable cualitativa se refiere al hecho de que ésta no puede ser medida en
términos de la cantidad de la propiedad presente, sino que solo se determina la presencia o ausencia de
ella (ejemplo: sexo, ocupación, religión, procedencia, estado civil); y no es posible asignarles un mayor o
menor peso a las categorías, lo único que se puede hacer es clasificarlas.
2
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Las variables de corte cuantitativo son aquellas cuya magnitud puede ser medida en términos numéricos.
Esto es, que los valores de los fenómenos se encuentran distribuidos a lo largo de una escala (ejemplo:
edad, peso, talla, escolaridad, debido a que) y se les puede asignar un mayor o menor peso a cada una
de ellas. Estas a su vez pueden dividirse en discontinuas y continuas, según su unidad de medición; es
decir si se pueden fraccionar como la temperatura (36.5, 36.8) o en su defecto la medición en por medio
de número completos (número de hijos).
Con respecto a las escalas de medición, las variables pueden clasificarse en cuatro clases:
Escala nominal: es el nivel más elemental de medición y consiste en clasificar los objetos de
estudio según las categorías de una variable. Ejemplo: estado marital que se clasifica así: soltero,
casado, viudo, divorciado, unión libre. Esta clasificación solo nombra los indicadores de la
variable pero no representa ninguna jerarquización, dado que todos los indicadores se
encuentran al mismo nivel.
Escala ordinal: Este tipo de escala se utiliza para clasificar los objetos, hechos o fenómenos en
forma jerárquica, según el grado que posea una característica determinada, sin proporcionar
información sino la magnitud de las diferencias entre los casos así clasificados. Ejemplo: tipo de
higiene (con la siguiente escala: excelente, buena, regular, mala).En este caso se refleja distancia
entre una y otra categoría, o cuánto es mayor una en comparación con la otra.
Escala de intervalo: Es la que clasifica a la variable de acuerdo a un rango numérico. Este tipo de
escala de intervalos mide las variables cuantitativas, siendo igual la distancia entre dos puntos o
valores de un continuo. Sin embargo el punto cero es arbitrario y convencional, por lo que no se
pueden establecer razones o proporciones, ni comparar dos escalas sin definir el mismo punto
de partida. Las variables de inteligencia, rendimiento académico y temperatura, debido a que el
punto cero es arbitrario; tomando como ejemplo la temperatura, se puede decir que el cero no
representa la ausencia de calor; sin embargo, la distancia entre cualesquiera de los dos puntos
de la escala es igual, o sea, que el cambio de temperatura entre 36° y 37°C es igual al cambio
entre 40° y 41°C. Al medir temperatura, no se puede decir que 20°C es el doble de 10°C. Esto
debido a que cuando el termómetro marca 0 grados; en realidad la temperatura es de 273
grados. Por esto solo podemos decir que una temperatura de 20 grados es 10 grados más que
una de 10.
Escala de proporción razón: Este tipo de escala constituye el nivel más alto de medición para las
variables cuantitativas; contiene las características de una escala de intervalo con la ventaja
adicional de poseer el cero absoluto, lo cual permite determinar la proporción conocida de
valores de la escala. El peso, la talla y número de alumnos son ejemplos de variables de razón o
proporción, en las que el cero representa la nulidad o ausencia de lo que se estudia. Por esta
propiedad de la escala se puede establecer razones tales como se dan en el variable peso, en la
cual se dice que un peso de 50 libras es el doble de uno de 25 kilos, o uno de 100 kilos es 4 veces
mayor que uno de 25.
Nominal
Cualitativa o atributo
Ordinal
Variable
Discreta
Cuantitativa o numérica
Continua
3
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Ejercicios
1. Según la definición de la estadística como la ciencia de “recolectar,
describir e interpretar datos”, escribe una oración que describa cada una
de las tres actividades estadísticas.
4
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Diseño Muestral
Población
Colección o conjunto de individuos, objetos o eventos cuyas propiedades serán analizadas.
Muestra
Subconjunto de la población, parte de la totalidad de un conjunto de datos.
Entre más grande es el universo, la muestra debe ser más representativa, es decir a
mayor muestra, mayor confiabilidad.
Diseño Muestral
Son todos los elementos que se contemplan para obtener una muestra representativa evitando en lo
posible sesgos (falso, mentira), mismo que está integrado por:
Tamaño de la muestra
Errores de muestreo
Tipo de muestreo
Diseño del cuestionario
Errores de no muestreo Capacitación de encuestadores
Recursos
𝑁(𝑟)
𝑛=
(𝑁 − 1)𝐷 + 𝑟
𝑟 = 𝑝. 𝑞
𝑝+𝑞 =1
𝐵2
𝐷=
4
n = tamaño de la muestra
5
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
0.24. Cuando se desconoce el valor de la varianza se maneja p=0.5 (la mayor varianza posible), por lo
tanto q=0.5 pues 𝑝 + 𝑞 = 1 y despejando tenemos que 𝑞 = 1 − 𝑝 por lo que 𝑞 = 1 − 0.5 = 0.5
B = Porcentaje de error de muestreo o complemento del nivel o grado de confianza, se obtiene restando
al 100% el grado de confianza a utilizar. Por ejemplo, si el nivel de confianza requerido es del 98%, B =
0.02, pues 100% - 98% = 2% que expresado decimalmente es 0.02.
Problemas de Ejemplo
Ejemplo 1
(0.05)2 0.0025
𝐷= = = 0.000625
4 4
𝑟 = (0.5)(0.5) = 0.25
(3′930,160)(0.25) 982,540
𝑛= = = 399.96
(3’930,159)(0.000625) + 0.25 2456.60
Redondeando, n = 400
Ejemplo 2
N = 3’930,160
Grado de confianza = 98%, por lo que B=0.02
(0.02)2 0.0004
𝐷= = = 0.0001
4 4
𝑟 = (0.5)(0.5) = 0.25
(3′930,160)(0.25) 982,540
𝑛= = = 2,498.39
(3’930,159)(0.0001) + 0.25 393.27
Redondeando, n = 2,498 = 2500
Ejemplo 3
De una población de aspirantes al Bachillerato General a la U. de G. que en número son 13,220, obtener
el tamaño de la muestra con un nivel de confianza del 98% y 95%
N = 13,220
Grado de confianza = 95%, por lo que B=0.05
(0.05)2 0.0025
𝐷= = = 0.000625
4 4
6
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
𝑟 = (0.5)(0.5) = 0.25
(13,220)(0.25) 3305
𝑛= = = 388.37
(13,219)(0.000625) + 0.25 8.51
Redondeando, n = 388
(0.02)2 0.0004
𝐷= = = 0.0001
4 4
𝑟 = (0.5)(0.5) = 0.25
(13,220)(0.25) 3305
𝑛= = = 2105.10
(13,219)(0.0001) + 0.25 1.57
Redondeando, n = 2105
Ejercicios
Realiza los siguientes ejercicios:
7
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Muestreo Estratificado
Sigue un orden, sistema y agrupamiento, pero afirma que la población no es homogénea sino
heterogénea, por lo tanto se deben considerar en la muestra estratos de la población. Ejemplo:
Hombres/mujeres, nivel económico o clase social, niveles de estudio, etc.
El muestreo que sea elegido o que se vaya a realizar debe de seguir un orden, un
sistema, un agrupamiento, y/o estratos, pero con previa y plena justificación del
porqué se está eligiendo este tipo o tipos de muestreo.
8
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
7. La mayoría de preguntas deben ser cerradas y si es posible utilizar claves, opciones de abanico.
Las claves son utilizadas para preguntas abiertas, cuando una letra representa las convicciones
de las personas sin que éstas se den cuenta, sólo el encuestador.
8. Desde el diseño del cuestionario se deben también diseñar los elementos del vaciado.
9. Las preguntas no debe empezar con SI o NO.
10. Ninguna pregunta debe inducir a la respuesta, ni hacerse en forma de negación, tampoco
comenzar con, Verdad que...
11. Se recomienda iniciar por preguntas sencillas y luego las relativamente más complicadas, esto va
de acuerdo con la intimidad o grado de dificultad de la pregunta.
162
𝑥̅ = = 12.46
13
Redondeando obtenemos que 𝑥̅ = 12.5
9
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
4.- Moda
Es el dato predominante o el que tiene la frecuencia más alta
Moda = 8
5.- Mediana
Es el dato que está en medio de todos los datos, estando ordenados previamente. La fórmula para
𝑛+1
obtenerla es 𝑀𝑑 = 2
13 + 1
𝑀𝑑 = = 7° 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
2
Esto significa que el número en la 7° posición de los datos ordenados es la mediana, o sea, el número 12
𝑟 = 18 − 7 + 1 = 12
Frecuencia (F).- Es la cantidad (en este caso) de personas que hay en cada intervalo.
Marca de clase (X).- Es igual a punto medio de cada clase, que es igual al límite inferior más límite
𝐿𝑖+𝐿𝑠
superior entre dos, 𝑋=
2
Media aritmética
∑(𝐹𝑋)
𝑥̅ = 𝑛
145
𝑥̅ = 13
= 11.15
Moda
𝑑1(𝑐)
𝑀𝑜𝑑𝑎 = 𝐿 +
𝑑1 + 𝑑2
L = límite inferior de la clase modal (es decir, la clase con mayor frecuencia)
10
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Mediana
((𝑛⁄2) − 𝐹)(𝑐)
𝑀𝑑 = 𝐿 +
𝐹𝑚
L = límite inferior de la clase mediana (es decir, la clase que contiene al elemento mediano de la
distribución).
((13⁄2) − 5)(4) 6
𝑀𝑑 = 11 + = 11 + = 13
3 3
Ejercicio
Acopio o recolección de datos:
19, 19, 19, 20, 18, 22, 18, 18, 18, 19, 19, 19, 19, 20, 21, 23, 22, 17, 18, 18, 20, 18, 20, 19,
19, 19, 19, 18, 18, 18, 25
1. Media aritmética
2. Moda
3. Mediana
4. Rango o amplitud total
11
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Personas atendidas por congestión alcohólica en el mes de enero de 2001 en la Cruz Roja de
Guadalajara.
Acopio de datos:
16,21,20,40,30,19,25,28,30,28,50,12,47,35,32,45,19,22,46,32,52,42,22,46,30,32.
Moda = 30 y 32
𝑛+1
Mediana = 2
Md = 27/2 = 13.5° posición, se toman los datos de la posición 13 y 14 y se promedian,
esto sería (30 + 30) / 2 = 30 La mediana es 30.
Desviación Media (D.M.) Es igual a la sumatoria de diferencias entre la media aritmética y cada uno de
los datos, dividida a su vez entre el total de datos.
∑(𝑥̅ − 𝑥)
𝐷. 𝑀. =
𝑛
(241)
𝐷. 𝑀. = = 9.27
26
Varianza (S2) Es el cuadrado de la sumatoria de las diferencias de cada dato y la media aritmética,
dividido entre la suma total de personas menos uno.
2
∑(𝑥̅ − 𝑥)2
𝑆 =
𝑛−1
3,235
𝑆2 = = 129.4
25
12
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
∑(𝑥̅ − 𝑥)2
𝑆=√
𝑛−1
3,235
𝑆=√ = √129.4 = 11.375
25
𝑆
Error estándar (𝑆𝑥̅ ) 𝑆𝑥̅ =
√𝑛−1
11.375
𝑆𝑥̅ = = 2.275
√25
Desviación Media (D.M.) Es igual a la sumatoria de diferencias entre la media aritmética y la marca de
clase de cada grupo multiplicada por su respectiva frecuencia, dividida a su vez entre el total de datos.
∑(𝑥̅ − 𝑋)𝐹
𝐷. 𝑀. =
𝑛
(13.5)(9) + (0.5)(9) + (14.5)(8) 242
𝐷. 𝑀. = = = 9.31
26 26
Varianza (S2) Es el cuadrado de la sumatoria de las diferencias de cada marca de clase y la media
aritmética, multiplicada por su respectiva frecuencia, dividido entre la suma total de personas menos
uno.
∑((𝑥̅ − 𝑋)2 𝐹)
𝑆2 =
𝑛−1
(13.52 )(9) + (0.52 )(9) + (14.52 )(8) 1,640.25 + 2.25 + 1,682
𝑆2 = = = 132.98
25 25
Desviación estándar (S)
∑((𝑥̅ −𝑥)2 𝐹)
𝑆=√
𝑛−1
3,324.5
𝑆=√ = √132.98 = 11.53
25
13
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Preguntas de unidad
1. ¿Qué es un marco muestral?
2. Una muestra aleatoria puede ser difícil de obtener. ¿Por qué?
3. ¿Por qué la muestra aleatoria es tan importante en estadística?
4. ¿Por qué la guía telefónica no puede ser un marco muestral representativo?
5. Selecciones realizó una encuesta preguntando al lector “¿Qué es lo más
embarazoso que les ha sucedido en la escuela?”
a. ¿Qué clase de método de muestreo es este?
b. ¿Es probable que los resultados sean sesgados? Explique.
Inferencia Estadística
Inferir es conocer el comportamiento de la población o universo con niveles de confianza menores al
100% a partir del conocimiento de la muestra.
14
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
90% k = 1.68
95% k = 1.96
99% k = 2.58
Cociente Z
Para determinar el grado de confianza de que la media aritmética se encuentre entre dos límites dados a
partir de la media aritmética y error estándar de una muestra.
̅
𝑥−𝜇 ̅
𝑥1 −𝜇 ̅
𝑥2 −𝜇
𝑍= 𝑍1 = y 𝑍2 =
𝑆𝑥̅ 𝑆𝑥̅ 𝑆𝑥̅
Z= grado de confianza de que la media aritmética de la población se encuentre entre 𝑥1 y 𝑥2 , 𝑍1 +
𝑍2 = 𝑍, tomando como positivos todos los valores
Z1 = grado de confianza de que la media aritmética de la población se encuentre entre 𝑥1 y 𝑥̅ (el resultado obtenido
se busca en la tabla Z, y el número decimal que ahí marcase se debe transformar a porcentaje y ese será el grado
de confianza)
Z2 = grado de confianza de que la media aritmética de la población se encuentre entre 𝑥2 y 𝑥̅ (el resultado obtenido
se busca en la tabla Z, y el número decimal que ahí marcase se debe transformar a porcentaje y ese será el grado
de confianza)
𝑥1 y 𝑥2 = límites superior e inferior entre los cuales pudiera encontrarse la media aritmética de la población
𝜇̅ = en este caso haremos el supuesto que sabemos que es falso, pero necesario de que ̅𝜇 = 𝑥̅
𝑆𝑥̅ = error estándar de la muestra
Problemas ejemplo
Entre que limites o que rango se encuentra la media aritmética (M) de la población entre un nivel o
grado de confianza del 90%, 95% y 99%.
𝑥̅ = 29.3
90%=1.68
95%=1.96
99%=2.58
𝑥̅ =29.3
15
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
𝑆𝑥̅ = 1.91
90%
95%
99%
Determina el nivel o grado de confianza si afirmamos que la media de la población se encuentra entre los
siguientes límites:
Entre 27 y 31 años
̅
𝑥1 −𝜇 27−29.3 2.3
𝑍1 = = = = 1.2Consultando la tabla de valores “Z” = 38.49%
𝑆𝑥̅ 1.91 1.91
̅
𝑥2 −𝜇 31−29.3 1.7
𝑍2 = = = = .89 Consultando la tabla de valores “Z” = 31.33%
𝑆𝑥̅ 1.91 1.91
Entre 26 y 32 años
̅
𝑥1 −𝜇 26−29.3 3.3
𝑍1 = = = = 1.72 = 45.73%
𝑆𝑥̅ 1.91 1.91
̅
𝑥2 −𝜇 32−29.3 2.7
𝑍2 = = = = 1.41 = 42.07%
𝑆𝑥̅ 1.91 1.91
Σ=87.80%
̅
𝑥1 −𝜇 26.5−29.3 2.8
𝑍1 = = = = 1.46 = 42.79%
𝑆𝑥̅ 1.91 1.91
̅
𝑥2 −𝜇 31.5−29.3 2.2
𝑍2 = = = = 1.15 = 37.39%
𝑆𝑥̅ 1.91 1.91
16
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Σ=80.18%
En las gráficas de barras, se debe presentar un eje “X” que es el mayor y un eje “Y”. En el
primero, 25 van las frecuencias y en el eje horizontal van los intervalos de
edades. 20
15
10
5
0
0-12 13-25 26-39 40-53
Para el polígono de frecuencia se encuentran y se señalan los puntos en el cruce de marca de clase de
cada intervalo, y su respectiva frecuencia y se unen los puntos.
17
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Los resultados pueden anotarse dentro o fuera de la gráfica y ésta puede estar a colores, con su
correspondiente indicador.
Preguntas de unidad
1. Las gráficas de barras e histogramas no son la misma cosa, explique y
ejemplifique sus similitudes y diferencias.
2. Desarrolle una tabla de datos de un tema y realice las siguientes actividades:
a. Hacer una gráfica de acuerdo a los datos
b. ¿Por qué eligió este tipo de gráfica?
c. Calcule las medidas de dispersión y centralización que se hayan
visto en esta unidad.
3. Seleccione el mejor tipo de gráfica para los siguientes ejemplos:
a. Temperatura de pacientes con gripe
b. Edad de alumnos fumadores
c. Porcentaje de robos por zonas en Guadalajara
18
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Sirve y se utiliza para conocer el comportamiento semejante o diferente entre las muestras, pero con
niveles de confianza menores al 100%, por lo general 95% y 99%. Usualmente se plantea la Hipótesis
nula al iniciar el problema (Ho)
Hipótesis nula: Ho
Siempre afirma que las muestras comparadas actúan de manera semejante ante una situación específica
comparada y con un nivel o grado de confianza que se preestablece desde el principio. Por lo general se
plantea al principio, con su nivel o grado de confianza.
Cuando se realiza la prueba estadística y las desviaciones son mayores que la que establece la tabla de
grados de libertad, en ese momento esta se invalida y se plantea la hipótesis alternativa (Hi), conocida
también como hipótesis de investigación.
Hipótesis alternativa: Hi
La hipótesis alternativa a firma que las muestras actúan o se comportan de manera diferente ante una
situación comparada; esto comprobado en el mismo nivel o grado de confianza que se establece al
principio, desde que planteamos la hipótesis nula.
Cuando las diferencias si son significativas por “f” el resultado, o porque estas rebasen lo establecido por
grados de libertad, se plantea la hipótesis alternativa o de investigación (Hi) que afirma que las muestras
comparadas, sí son diferentes, es decir que no son semejantes.
Grado de Libertad
Se toma de 2 muestras a comparar y posteriormente cuando ya se obtenga el resultado se tendrá que
auxiliar de la tabla de valores críticos de t, para saber el resultado y poder ser comparado con el
resultado del cociente t: 𝑔𝑙 = (𝑛 − 1) + (𝑛 − 1)
Pasos a seguir:
Cociente T
Prueba paramétrica, para conocer el comportamiento entre dos muestras ante una situación común.
Fórmula general:
𝑥̅ − 𝑦̅
𝑡=
𝑆𝑥̅ 𝑦̅𝑑𝑖𝑓
19
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Ejemplo:
1. Se requiere saber si la condición bajo la cual se hace la acción de donar es o no influenciada por
la condición bajo la cual se haga; para ello se observan dos grupos de donadores, uno integrado
por ocho donadores conocidos, y otro por nueve donadores anónimos. Realizar al 95% de
confianza.
X= Conocidos
Y=desconocidos
Ho= “La actitud caritativa de los donadores no se ve influenciada por la condición bajo la cual se haga o
se done”
X X2 Y Y2
5 25 3 9
3 9 5 25
8 64 8 64
7 49 2 4
2 4 1 1
9 81 3 9
7 64 2 4
6 36 4 16
3 9
Sumatoria 47 332 31 141
Promedio 5.875 41.5 3.44 15.67
𝑔𝑙 = (𝑛 − 1) + (𝑛 − 1)
𝑔𝑙 = (8 − 1) + (9 − 1)
𝑔𝑙 = 15 Tabla T = 1.753
∑ 𝑥2 332
𝑆𝑥 = √ − 𝑥̅ 2 = √ − (5.87)2 = √41.5 − 34.46 = √7.04 = 2.65
𝑛 8
∑ 𝑦2 141
𝑆𝑦 = √ − 𝑦̅ 2 = √ − (3.44)2 = √15.67 − 11.83 = √3.84 = 1.96
𝑛 9
20
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
f) Sacar el cociente T
El límite máximo que se había sacado era de 1.753, si se rebasa se anula la Ho y se plantea la Hi. El
resultado es 2.23, mayor a comparación de 1.753, por lo tanto se rechaza la Ho y se establece la Hi.
Hi= “La actitud de los donadores sí se ve influenciada por la condición bajo la cual se done, comprobado
con un nivel o grado de confianza del 95%, es decir los donadores conocidos son más caritativos que los
anónimos”.
2. Se someten varios niños a terapia para la depresión infantil, se les da el mismo tratamiento y se
separan en niños y niñas; ambos grupos se observan desde el primer día para ver cuánto se
tardan en recuperarse. Realizar al 95% de confianza.
X=Niñas
Y=Niños
Ho= “El sexo de los niños no influye en el tiempo de recuperación por una depresión infantil”.
X X2 Y Y2
4 16 7 49
6 36 2 4
5 25 1 1
3 9 4 16
7 49 1 1
2.5 6.25 2 4
8 64 3 9
7 49
Sumatoria 42.5 254.25 20 84
Promedio 5.31 31.78 2.86 12
𝑔𝑙 = (𝑛 − 1) + (𝑛 − 1)
𝑔𝑙 = (8 − 1) + (7 − 1)
21
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
𝑔𝑙 = 13 Tabla T = 1.77
∑ 𝑥2 254.25
𝑆𝑥 = √ − 𝑥̅ 2 = √ − (5.31)2 = √31.78 − 28.2 = √3.58 = 1.89
𝑛 8
∑ 𝑥2 84
𝑆𝑥 = √ − 𝑥̅ 2 = √ − (2.86)2 = √12 − 8.18 = √3.82 = 1.95
𝑛 7
22
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Probabilidad
La “posibilidad” no es medible y la “probabilidad” puede medirse con cierto grado de confianza.
Entonces la probabilidad es una posibilidad medible. Se basa en dos cosas:
Y= No guardan reposo
X= Si guardan reposo
X X2 Y Y2
4 2
2 8
3.5 6
2.5 9
6 5
4 4
5 6
Sumatoria
Promedio
Ho= El hecho de mantener reposo o no, después de sufrir una fractura de 2do
grado no influye con el tiempo de recuperación. Comprobar o rechazar dicha
hipótesis con un grado de confianza del 95%.
esperados.
Ejemplos:
89 90 91 92 93 94 98 96 97 98
SI NO NO NO SI NO SI NO NO SI
𝑆𝐸
=1
𝑆𝑂
23
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
𝑆𝐸 Á𝑔𝑢𝑖𝑙𝑎 1
= = = Hay un 50% de probabilidad de que caiga Águila al lanzar una moneda
𝑆𝑃 Á𝑔𝑢𝑖𝑙𝑎 𝑜 𝑆𝑒𝑙𝑙𝑜 2
𝑆𝐸 3 1
= = = Hay un 16.67% de que caiga 3 al lanzar el dado
𝑆𝑃 1,2,3,4,5 ó 6 6
Probabilidad conjunta
Es igual a la multiplicación de las probabilidades individuales.
Ejemplo:
1
Probabilidad del 3 en el dado =
6
1
Probabilidad de águila en la moneda =
2
1 1 1
Probabilidad Conjunta = (
6
) (2) = 12
2. En una baraja de 52 cartas, en la que se tienen 4 cartas del mismo tipo (ejemplo 4 reyes), ¿Cuál
es la probabilidad de sacar un rey, sin meter el rey sacar un as, y sin meter ni el rey ni el as sacar
otro rey?
4
Sacar un rey =
52
4
Sacar el as sin meter el rey =
51
3
Sacar otro rey sin meter el rey ni el as =
50
4 4 3 48 2
Probabilidad Conjunta = (
52
) (51) (50) = 132600
=
5525
¿Y cuál es la probabilidad de que lo anterior no suceda?
48 47 47 106032 4418
( )( )( ) = = = 99.98%
52 51 50 132600 5525
24
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
X2 Chi Cuadrada
Es una prueba estadística no paramétrica que solo requiere que los elementos que integran las muestras
contengan alguna característica en común, por ejemplo hombres y mujeres, universitarios y no
universitarios.
Características:
Fórmula Directa:
2
𝑁(𝐴𝐷 − 𝐵𝐶)2
𝑥 =
(A + B)(A + C)(B + D)(C + D)
Ejemplo:
Se requiere saber si la actitud política e ideológica de los padres influye o no respecto a la elección del
método de crianza para educar a sus hijos. Para ello observamos dos muestras: la primera integrada por
20 papás conservadores, y la segunda por 21 liberales.
c=Columnas r=Renglones
Método de Crianza Conservadores Liberales
Flexible (A) 5 (B) 14
Rígido (C) 15 (D) 7
Ho= “La actitud política e ideológica de los padres no influye respecto al método de crianza para educar a
sus hijos”
𝑔𝑙 = (𝑐 − 1)(𝑟 − 1)
𝑔𝑙 = (2 − 1)(2 − 1)
𝑔𝑙 = (1)(1) = 1 Tabla x2 =3.841
𝑁(𝐴𝐷 − 𝐵𝐶)2
𝑥2 =
(A + B)(A + C)(B + D)(C + D)
2
5+15 + 14 + 7([5][7] − [14][15])2
𝑥 =
(5 + 14)(5 + 15)(14 + 7)(15 + 7)
41(35 − 210)2
𝑥2 =
(19)(20)(21)(22)
41(−175)2
𝑥2 =
175560
1255625
𝑥2 = = 7.15
175560
25
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
El límite máximo que se había sacado era de 3.841, si se rebasa se anula la Ho y se plantea la Hi. El
resultado es 7.15, mayor a 3.841, por lo tanto se rechaza la Ho y se establece la Hi.
Hi= “La actitud política e ideológica de los padres influye respecto a la elección del método de crianza
para educar a sus hijos, comprobado con un nivel o grado de confianza del 95%, es decir los liberales
tienden a ser más flexibles que los conservadores, éstos últimos son más rígidos”.
Prueba de la mediana
La mediana es el valor de la variable que deja el mismo número de datos antes y después que él al estar
ordenados, ya sea en forma ascendente o descendente.
Ejemplo:
1. Ordenar
3,3,5,6,7,8,9,11,12,12,14,15,17,21,22
3. Plantear la Hipótesis
Ho= “El nerviosismo mostrado entre hombres y mujeres es muy semejante cuando se les somete a una
prueba en la que miden el tiempo que pueden permanecer cantando.”
𝑔𝑙 = (𝑐 − 1)(𝑟 − 1)
𝑔𝑙 = (2 − 1)(2 − 1)
𝑔𝑙 = (1)(1) = 1 Tabla de X2 = 3.84
2
∑ (𝑓𝑜 − 𝑓𝑒)2
𝑥 =
𝑓𝑒
𝐹𝑜 = 5, 3, 2, 5
(𝑇𝑀𝑅)(𝑇𝑀𝐶)
𝐹𝑒 =
𝑁
27
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Ejercicio:
1. Se quiere saber si el uso de protección por trabajadores de obras públicas
marca una diferencia en el número de accidentes, con respecto a los que no
lo usan.
M1 M2
19 10
6 12
Situación M1 M2
Sin accidentes 20 14
Con accidentes
7 6
leves
Con accidentes
5 14
graves
28
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Características:
No se requiere que la muestra sea muy grande
Se plantea desde un principio la Ho con su nivel o grado de confianza
Fórmula:
12 2
𝑋2𝑟 = ( ∑ [∑ 𝑟𝑖] ) − 3𝑁(𝑘 + 1)
3𝑁(𝑘 + 1)
En donde N = Muestra total, ri = Rango infinito, y k = Número de condiciones bajo la cual se mide la
muestra.
Ejemplo:
Se requiere saber si existe o no relación entre el nivel de violencia percibido por los niños y su grado de
hostilidad manifiesta, para ello hemos diseñado un test psicométrico en tres versiones semejantes. De
los resultados se interpretarán en base a lo siguiente:
Ho= El nivel percibido de violencia de los niños no influye respecto a la hostilidad manifiesta. Esto
afirmado con un nivel de confianza del 95%.
𝑔𝑙 = 𝑘 − 1
12
𝑋2𝑟 = ( [1285.94]) − 120
120
𝑋 2 𝑟 = ( 0.1 [1285.94]) − 120
𝑋 2 𝑟 = ( 128.59) − 120
𝑋 2 𝑟 = 8.59
Podemos notar que el resultado es mayor al obtenido por grados de libertad, por lo tanto se rechaza la
Ho y se establece Hi: Si influye el grado violencia percibida por los niños y su hostilidad manifiesta en
ellos con un 95% de grado de confianza.
Ejercicio:
X 1D R1 2 R2 3D R3
D
A 12 1 1 2 8 3
0
B 8 3 1 1.5 10 1.5
0
C 13 2 1 2 13 2
3
D 10 1 8 2 7 3
E 9 1 7 2 6 3
F 3 1 2 2 1 3
G 5 1 3 2 2 3
H 10 1 9 2 8 3
I 9 1 8 2 6 3
J 8 1 6 2 4 3
∑R1=13 ∑R2=19.5 ∑R3=27.
5
30
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Fórmula:
2
12 ∑ 𝑟𝑖
𝐻=( ∑[ ] ) − 3(𝑁 + 1)
𝑁(𝑁 − 1) 𝑛
Ejemplo:
Se requiere saber si hay o no relación entre la edad de las personas y la facilidad o dificultad para que
estas obtengan un empleo de base. Para ello observamos tres grupos diferenciados por la edad.
Ho= La edad no influye respecto a la facilidad o dificultad para que estas personas obtengan un empleo
de base. Afirmado con un grado o nivel de confianza del 95%
𝑔𝑙 = 𝑘 − 1
𝑔𝑙 = 3 − 1 = 2 En base a la tabla X = 5.991
2
2
12 ∑ 𝑟𝑖
𝐻=( ∑[ ] ) − 3(𝑁 + 1)
𝑁(𝑁 − 1) 𝑛
12 63.52 992 142.52
𝐻=( [( )+( )+( )]) − 3(25 + 1)
25(25 − 1) 8 9 8
12
𝐻=( [504.03 + 1089 + 2538.28]) − 3(26)
25(24)
12
𝐻=( [4131.31]) − 78
600
31
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
( 0.02 [4131.31]) − 78
𝐻 = 82.62 − 78 = 4.62
Observamos que el resultado obtenido es menor al que sacamos con el grado de libertad, por lo que la
Ho se respeta: = La edad no influye respecto a la facilidad o dificultad para que estas personas obtengan
un empleo de base.
Ejercicio:
Se quiere saber influye la edad para que los medicamentos tengan un mejor
efecto y tengan un tiempo de saneamiento diferente. Todo esto ante un mismo
tratamiento.
G1= adolescentes
G2= jóvenes
G3= adultos
G1 R1 G2 R2 G3 R3
5 5 10 11.5 2 2
7 8.5 17 19 22 26
21 24 21 24 25 28
3 3 30 30 18 20
4 4 20 22 23 27
6 6.5 13 16.5 11 13.5
7 8.5 9 10 13 16.5
10 11.5 6 6.5 1 1
12 15 11 13.5 29 29
19 21 15 18 40 31
∑R1=107 ∑R2=171 21 24
∑R3=218
Ho= No influye la edad para que las personas que sufren una enfermedad en
común con un mismo tratamiento tarden diferente tiempo en recuperarse, esto
con un nivel o grado de confianza de 95%
32
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Correlación
Relación existente entre 2 variables donde una, por lo general “x”, es la variable independiente a “y”
que es la variable dependiente. También nos sirve para medir la correlación o la relación existente entre
dos muestras, sirve para predecir o estimar el comportamiento de la variable dependiente Y, en relación
del conocimiento de la variable X independiente.
No obstante, saber si existe una asociación entre las variables, lo importante es que esta puede ser
medible por la “R” Pearson. Ejemplo a mayor estatura mayor peso, a mayor grado de estudios mayor
nivel de ingresos, etc.
Fórmula de correlación:
∑ 𝑥 2 − 𝑥̅ 2
σ= √
𝑛
Fórmula de la R de Pearson:
Σ(𝑧𝑥)(𝑧𝑦)
𝑅=
𝑁
Ejemplo:
“A mayor grado de estudios de los papás, mayor grado de estudios de los hijos”
x x² Zx Y y² Zy (Zx)(Zy)
10 100 -0.07 12 144 -0.23 0.01
6 36 -0.79 9 81 -0.86 0.67
3 9 -1.33 15 225 -0.38 0.50
6 36 -0.79 6 36 -1.43 1.16
15 225 0.82 12 144 -0.23 -0.18
20 400 1.72 22 484 1.84 3.16
13 169 0.46 16 256 0.84 0.27
S=73 S=975 S=92 S=1370 S=4.59
𝑥̅ =10.42 𝑦̅=13.14
(𝑧𝑥)(𝑧𝑦) 4.59
𝑅= = 𝑅= = 0.66
𝑁 7
En base al resultado anterior tenemos que existe para esta muestra un 0.66% de correlación entre papás
e hijos.
33
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Ecuación de Regresión
Sirve para conocer o saber el valor estimado de “y” en base al valor a “x”. Esta entrada estadística no
paramétrica sirve o se utiliza para conocer el comportamiento de dos o más muestras en una situación
común a ambas.
Fórmula:
Ejercicio:
Inventar una medida para ver la frecuencia del estrés. Estrés de los hijos en
relación a estrés de los padres, tomando de referencia al primogénito.
X X² Zx Y Y² zy (zx)(zy)
5 25 +-1.40 8 68 -1.05
17 289 +-.28 3 169 .04
23 529 1.12 20 400 .5
6 36 -1.26 8 64 -1.05
16 256 .14 14 196 -.27
13 169 .28 18 324 .24
25 62 2.05 32 1024 1.40
S=
𝑠𝑦 𝑠𝑦
𝑋 = (𝑟 [ ] 𝑦) − (𝑟 [ ] 𝑥̅ ) + 𝑦̅
𝑠𝑥 𝑠𝑥
𝑠𝑦 𝑠𝑦
𝑌 = (𝑟 [ ] 𝑥) − (𝑟 [ ] 𝑥̅ ) + 𝑦̅
𝑠𝑥 𝑠𝑥
34
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Ejercicio:
35
Anexos
Cuestionario de Bioestadísticas
1. Desarrolla o explica las características que integran el diseño muestral.
Se encuentra integrado por errores de muestreo y errores de no muestreo.
A
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
7. ¿Qué es la muestra?
Es una parte de la población que contiene teóricamente las mismas características de la población
que se desea estudiar. Sus medidas reciben el nombre de estadísticos.
B
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Rango, o amplitud total: Es la distancia que existente entre el dato mayor y el dato menor.
Desviación estándar: Es igual a la raíz cuadrada de la varianza.
Error estándar: Es igual a la desviación estándar entre la raíz cuadrada de n menos uno.
18. ¿Qué es ó en qué consiste la utilización de los niveles de confianza preestablecidos del
90%, 95% y 99%?
24. ¿Cuales son los tipos de errores en los que no debemos caer?
Error uno, rechazar una hipótesis nula cuando esta tiene o debería ser aceptada y el error dos,
aceptar una hipótesis como valida o verdadera cuando esta debió haber sido rechazada.
C
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Es una asociación existente entre dos variables en donde por lo general X es la variable
independiente y la Y es la variable dependiente.
D
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Tablas Estadísticas
Cociente T
Gl 90% ó 0.10 95% ó 0.05 97.5% ó 0.025 99% ó 0.01 99.5% ó 0.005
1 3.078 6.314 12.706 31.821 63.657
2 1.886 2.920 4.303 6.965 9.925
3 1.638 2.353 3.182 4.541 5.841
4 1.533 2.132 2.776 3.747 4.604
5 1.476 2.015 2.571 3.365 4.032
6 1.440 1.943 2.447 3.143 3.707
7 1.415 1.895 2.365 2.998 3.499
8 1.397 1.860 2.306 2.896 3.355
9 1.383 1.833 2.262 2.821 3.250
10 1.372 1.812 2.228 2.764 3.169
11 1.363 1.796 2.201 2.718 3.106
12 1.356 1.782 2.179 2.681 3.055
13 1.350 1.771 2.160 2.650 3.012
14 1.345 1.761 2.145 2.624 2.977
15 1.341 1.753 2.131 2.602 2.947
16 1.337 1.746 2.120 2.583 2.921
17 1.333 1.740 2.110 2.567 2.898
18 1.330 1.734 2.101 2.552 2.878
19 1.328 1.729 2.093 2.539 2.861
20 1.325 1.725 2.086 2.528 2.845
21 1.323 1.721 2.080 2.518 2.831
22 1.321 1.717 2.074 2.508 2.819
23 1.319 1.714 2.069 2.500 2.807
24 1.318 1.711 2.064 2.492 2.797
25 1.316 1.708 2.060 2.485 2.787
26 1.315 1.706 2.056 2.479 2.779
27 1.314 1.703 2.052 2.473 2.771
28 1.313 1.701 2.048 2.467 2.763
29 1.311 1.699 2.045 2.462 2.756
30 1.310 1.697 2.042 2.457 2.750
40 1.303 1.684 2.021 2.423 2.704
60 1.296 1.671 2.000 2.390 2.660
120 1.289 1.658 1.960 2.326 2.617
ºº 1.282 1.645 1.960 2.326 2.576
E
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Tabla de X2
gl X2 X .0252 X .052 X .902 X .952 X .9752 X .992 X .9952
1 .0000393 .000982 .00393 2.706 3.841 5.024 6.635 7.879
2 .0100 .0506 .103 4.605 5.991 7.378 9.210 10.597
3 .0717 .216 .352 6.251 7.815 9.348 11.345 12.838
4 .207 .484 .711 7.779 9.488 11.143 13.277 14.860
5 .412 .831 1.145 9.236 11.070 12.832 15.086 16.750
6 .676 1.237 1.635 10.645 12.592 14.449 16.812 18.548
7 .989 1.690 2.167 12.017 14.067 16.013 18.475 20.278
8 1.344 2.180 2.733 13.362 15.507 17.535 20.090 21.955
9 1.735 2.700 3.325 14.684 16.919 19.023 21.666 23.589
10 2.156 3.247 3.940 15.987 18.307 20.483 23.209 25.188
11 2.603 3.816 4.575 17.275 19.675 21.920 24.725 26.757
12 3.074 4.404 5.226 18.549 21.026 23.336 26.217 28.300
13 3.565 5.009 5.892 19.812 22.362 24.736 27.688 29.819
14 4.075 5.629 6.571 21.064 23.685 26.119 29.141 31.319
15 4.601 6.212 7.261 22.307 24.996 27.488 30.578 32.801
16 5.142 6.908 7.962 23.542 26.296 28.845 32.000 34.267
17 5.697 7.564 8.672 24.769 27.587 30.191 33.409 35.718
18 6.265 8.231 9.390 25.989 28.869 31.526 34.805 37.156
19 6.844 8.907 10.117 27.204 30.144 32.852 36.191 38.582
20 7.434 9.591 10.851 28.412 31.410 34.170 37.566 39.997
21 8.034 10.283 11.591 29.615 32.671 35.479 38.932 41.401
22 8.643 10.982 12.338 30.813 33.924 36.781 40.289 42.796
23 9.260 11.688 13.091 32.007 35.172 38.076 41.638 44.181
24 9.886 12.401 13.848 33.196 36.415 39.364 42.982 45.558
25 10.520 13.120 14.611 34.382 37.652 40.646 44.314 46.928
26 11.160 13.844 15.379 35.563 38.885 41.923 45.642 48.290
27 11.808 14.573 16.151 36.741 40.113 43.194 46.963 49.645
28 12.461 15.308 16.928 37.916 41.337 44.461 48.278 50.993
29 13.121 16.047 17.708 39.087 42.557 45.722 49.588 52.336
30 13.787 16.791 18.493 40.256 43.773 46.979 50.892 53.672
35 17.192 20.5669 22.465 46.059 49.802 53.203 57.342 60.275
40 20.707 24.433 26.509 51.805 55.758 59.342 63.691 66.766
45 24.311 28.366 30.612 57.505 61.656 65.410 69.957 73.166
50 27.991 32.357 34.764 63.167 67.505 71.420 76.154 79.490
60 35.535 40.482 43.188 74.397 79.082 83.298 88.379 91.952
70 43.275 48.758 51.739 85.527 90.531 95.023 100.425 104.215
80 51.172 57.153 60.391 96.578 101.879 106.629 112.329 116.321
90 59.196 65.647 69.126 107.565 113.145 118.136 124.116 128.299
100 67.328 74.222 77.929 118.498 124.342 129.561 135.807 140.169
F
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Cociente Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2518 .2549
0.7 .2580 .2612 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133
0.9 .3159 .3186 .3112 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4014
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4709
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.9 .4981 .4982 .4983 .4983 .4984 .4984 .4985 .4985 .4986 .4986
G
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
GUIA DE EXAMEN
1. Expón de manera clara la importancia de explicar el resultado.
9. Describe las características y el uso del análisis de varianza en 2 o más direcciones por
rango de Friedman.
10. Describe las características y el uso del análisis de varianza en una dirección de la prueba
de Kruskal Wallis.
r= 0.81
Ox= 4
Oy= 2
x= 15
y= 14
x= 3 y 23.
12. Explica en qué consisten los llamados errores de no muestreo del diseño muestral.
13. Ante una población estimada de 25,000 personas, y una varianza desconocida; encuentra
los tamaños de muestra a 4 niveles o grados de confianza de 95%, 96%, 97% y 98%.
Nunca consideres el estudio como una obligación, sino como una oportunidad
para penetrar en el bello y maravilloso mundo del saber.
H
Glosario
A
Al Azar o Aleatorio: Son todos aquellos eventos fortuitos o productos de la suerte.
Amplitud de variación: Se considera como el dato mayor menos el dato menor de todo el
conjunto de datos considerados en toda la muestra, si consideramos al dato menor de la muestra
y al dato mayor entonces la amplitud de variación estará determinada como:
𝐴 = 𝑙0 − 𝑙𝑛
Amplitud de clase: Se considera la amplitud que deben tener las clases consideradas para realizar
un estudio estadístico. Para n datos con k clases se determina que la amplitud de clase es igual a:
𝑘
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =
𝐴
B
Biología Matemática o Biomatemática: Área interdisciplinaria de estudios que se enfoca en
moldeamiento de los procesos biológicos utilizando técnicas matemáticas. Tiene grandes
aplicaciones teóricas y prácticas en la investigación biológica.
C
Clase: Subdivisión de escala de datos
Carácter estadístico: Es la propiedad que permite clasificar a los individuos de una población
estadística, puede haber de dos tipos:
Cuantitativos: Aquellos datos que se pueden medir o expresarse mediante un número sin
tener que recurrir a la frecuencia con que ocurren.
Cualitativos: Aquellos datos que no se pueden medir.
- 1-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Cartogramas: Son gráficos en los que se puede agrupar para una misma clase diferentes
frecuencias, por lo que se hace apropiado su uso cuando se desea analizar diferentes resultados
obtenidos, con diferentes frecuencias pero con una misma clase.
Censo: En el caso particular en que la muestra sea del mismo tamaño que la población el estudio
estadístico se conoce como censo.
Correlación: Cuando dos fenómenos sociales, físicos o biológicos crecen o decrecen de forma
simultánea y proporcional debido a factores externos, se dice que los fenómenos están
positivamente correlacionados. Si uno crece en la misma proporción que el otro decrece, los dos
fenómenos están negativamente correlacionados. El grado de correlación se calcula aplicando un
coeficiente de correlación a los datos de ambos fenómenos. Una correlación positiva perfecta
tiene un coeficiente + 1, y para una correlación negativa perfecta es -1. La ausencia de correlación
da como coeficiente 0. Por ejemplo, el coeficiente 0.89 indica una correlación positiva grande, -
0.76 es una correlación negativa grande y 0.13 es una correlación positiva pequeña.
Cuartiles: Son valores de la variable que dividen los datos ordenados en cuartos; cada conjunto de
datos tiene tres cuartiles. El primer cuartil, Q1, es un número tal que a lo sumo 25% de datos son
menores en valor que Q1y a lo suma 75% son mayores. El segundo cuartil es la mediana. El tercer
cuartil, Q3, es un número tal que a lo sumo 75% de los datos son menores en valor que Q3 y a lo
sumo 25% son mayores.
Cuartil medio: El valor número que está al centro entre el primer cuartil y el tercer cuartil:
𝑄1 + 𝑄3
𝐶𝑢𝑎𝑟𝑡𝑖𝑙 𝑚𝑒𝑑𝑖𝑜 =
2
Curva Normal: La forma prevista de la distribución normal.
D
Dato: Valor de la variable asociada a un elemento de una población o muestra. Este valor puede
ser un número, una palabra o un símbolo.
Datos: Son el conjunto de valores que se obtienen de la variable a partir de cada uno de los
elementos que pertenecen a la muestra.
Datos aleatorios: Es la obtención de datos realizada a partir de una población a los cuales no se les
ha dado ninguna prioridad.
Dato estadístico: Los datos que se considera participan en el estudio estadístico se conoce como
datos estadísticos, más concretamente, se consideran como los valores que se pueden obtenerse
de la observación para formar la muestra.
Desviación Media: Es la media aritmética de las desviaciones desde la media en valores absoluto.
- 2-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
desviación es (𝑥1 − 𝑥 )2 . La varianza es la medida del cuadro de las desviaciones. Por último, la
desviación típica, representada por la letra griega sigma (ς), es la raíz cuadrada de la varianza, y se
calcula de la siguiente manera:
2 (∑ x)2
√∑ x − N
ς=
N
Si la desviación típica es pequeña, los datos están agrupados cerca de la media; si es grande, están
muy dispersos.
Diagramas de barras: Se utiliza para representar datos cualitativos y cuantitativos, con datos de
tipo discreto. En el eje x se representan los datos ordenados en clases mientras que en el eje y se
pueden representar frecuencias absolutas o relativas.
Distribución: Es el patrón de variabilidad que presentan los datos de una variable. La distribución
exhibe la frecuencia de cada valor de la variable.
Distribuciones de frecuencias: Se le conoce con este nombre al conjunto de clases que aparecen
con su frecuencia correspondiente, generalmente mediante una tabla estadística.
Diagrama de sectores: Este tipo de diagramas puede ser de dos tipo, se puede considerar una
figura geométrica en la que la información se distribuye dentro de la figura como puede ser una
dona o un anillo en el que cada porción dentro de la figura representa la información porcentual
del total de datos. La segunda opción es la utilización de pasteles en los que una porción del pastel
determinada por sectores individuales la información para ese sector específico.
Dicotomía: Se entiende como el proceso de categorizar a una variable en sus dos posibles valores
en contraposición que puede tomar la misma en estudio de una población.
DISEÑO MUESTRAL: Es el procedimiento que nos garantiza que una muestra es realmente
representativa de la población y esta integrado por tamaño de la muestra, por el tipo de
muestreo, por un diseño adecuado del cuestionario, la acertada capacitación de los encuestadores
y los recursos, éstos son todos los elementos que se contemplan para obtener una muestra
representativa evitando en lo posible sesgos (falso, mentira), mismo que está integrado por:
Elementos de muestreo y elementos de no muestreo.
E
Entrevista y Encuesta: Son métodos de recolección de datos, la entrevista es una serie de
preguntas realizadas personalmente y la encuesta es llevada a cabo generalmente a través de
algún formulario que la persona debe llenar.
Estadística: Ciencia de las matemáticas encargada del estudio del comportamiento de una
población mediante un estudio cuyo propósito es hacer inferencias a partir de un subconjunto de
datos, llamado muestra, tomados de ella.
- 3-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Estadística inferencial o inductiva: Sirve extrapolar los resultados obtenidos en el análisis de los
datos y a partir de ello predecir acerca de la población, con un margen de confianza conocido. Se
apoya fuertemente mediante el cálculo de probabilidades.
Estadígrafo: Término utilizado para designar a la persona dedicada a las tareas propias de la
estadística, aunque en ocasiones también es frecuente que se utilice para designar a la variable
que define una distribución estadística, de esta forma es común escuchar el término estadígrafo
de prueba.
Experimento aleatorio: Experimento en el que existen diferencias de una muestra a otra, cuyas
muestras pese ha ser de una misma población son diferentes.
Eventos dependientes: eventos que no son independientes. Esto es, el suceso de un evento no
tiene efecto sobre la probabilidad de que ocurra el otro evento.
Eventos mutuamente excluyentes: eventos no vacíos definidos en el espacio muestral con cada
evento excluyendo que ocurra el otro. En otras palabras, son eventos que no comparten
elementos comunes.
F
Frecuencia: Número de veces en que se repite un dato.
H
Hipótesis: Una Hipótesis Estadística a un enunciado respecto a una población y usualmente es un
enunciado respecto a uno a más parámetros de la población.
Ejemplo: El promedio de notas de los alumnos del Área Ciencias de la Educación, se espera que
para el año 2.000 sea significativamente mayor al actual.
- 4-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Hipótesis Nula: Pone en duda el efecto de una variables experimental hasta que se determina el
efecto como una diferencia significativa y no como resultado del azar.
Histogramas: Los histogramas de frecuencias son gráficas que representan un conjunto de datos
que se emplean para representar datos de una variable cuantitativa. En el eje horizontal o de las
abscisas se representan los valores tomados por la variable, en el caso de que los valores
considerados sean continuos la forma de representar los valores es mediante intervalos de un
mismo tamaño llamados clases. En el eje vertical se representan los valores de las frecuencias de
los datos. Las barras que se levantan sobre la horizontal y hasta una altura que representa la
frecuencia. Un punto importante en el manejo de la información bajo el uso de histogramas es el
hecho de poder comparar, bajo un proceso en control, que a medida que se crecen las clase tiene
aproximadamente la forma de una campana centrada, es la de una de las distribuciones mas
importantes conocidas como frecuencia normal o gaussiana.
I
Inferencia: Término utilizado para indicar la predicción hecha acerca de una población.
Intervalo de Clase: Pequeña sección de la escala según la cual se agrupan las puntuaciones de una
distribución de frecuencia. Tamaño o rango de la Clase.
L
Límites del intervalo: Son los valores extremos que tiene el intervalo de clase, inferior y superior,
entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
M
Marco muestral: Es una lista, o conjunto, de los elementos que pertenecen a la población de la
cual se toma la muestra.
Media Aritmética Ponderada: A veces asociamos con los números X1, X2, X3, .. Xk ciertos factores
peso (o pesos) W1, W2, W3, .. WK dependientes de la relevancia asignada a cada número. En tal
caso,
𝑥1 + 𝑥2 + 𝑥3 + 𝑘𝑥𝑛 ∑𝑁 𝑗−1 𝑥𝑗 ∑𝑥
𝑥̅ = = =
𝑁 𝑁 𝑁
Se llama la media aritmética ponderada con pesos f1, f2, ..., fk.
- 5-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
distribuidos por todo el rango. Una medida de la dispersión es la diferencia entre dos percentiles,
por lo general entre el 25 y el 75. El percentil r es un número tal que un r por ciento de los datos
son menores o iguales que r. En particular, los percentiles 25 y 75 se denominan cuartiles inferior y
superior respectivamente. La desviación típica es otra medida de la dispersión, pero más útil que
los percentiles, pues está definida en términos aritméticos como se explica a continuación.
Moda: Es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda
puede no existir, e incluso no ser única en caso de existir.
Muestras probabilísticas: son aquellas en las que los elementos a seleccionar se obtienen con
base a la probabilidad. Cada elemento de una población tiene cierta probabilidad de ser elegido
como parte de la muestra.
N
Nivel de significación: El rechazo o aceptación de una hipótesis nula, se basa sobre algún nivel de
significación como criterio. Una diferencia se denomina significativa cuando la distancia entre dos
medias muestrales señala una diferencia verdadera entre los parámetros de las poblaciones de las
que se sacaron las muestras.
Niveles de Medición:
Nivel de Medición Nominal: Se tienen dos o más categorías de variables, donde dichas
categorías carecen de orden de jerarquía. Por ejemplo el número asignado a cada jugador
de un equipo de fútbol.
- 6-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Nivel de Medición Ordinal: Se tienen varias categorías, pero además mantienen un orden
de mayor a menor. Por ejemplo: Nombrar la posición de los equipos en un campeonato de
fútbol.
Nivel de Medición por Intervalos: Además de haber o orden y jerarquía entre categorías,
se establecen intervalos iguales en la medición. Por ejemplo: Nombrar la posición y el
puntaje que obtuvo un equipo en un campeonato de fútbol.
Nivel de Medición de Razón: Además de tenerse todas las categorías del nivel de
intervalos Por ejemplo: El equipo Campeón de un torneo de fútbol obtuvo mayor puntaje,
pero no fue el mejor equipo en la temporada.
Normalidad: Se puede hablar de normalidad en una distribución de datos, cuando las medidas de
tendencia central (media, mediana y moda) coinciden en su valor. Lo cual origina gráficamente
una curva simétrica, donde su eje de simetría es el punto donde coinciden las tres medidas de
tendencia central.
P
Parámetro: valor numérico que resume todos los datos de una población completa.
Percentiles: son los valores de la variable que dividen un conjunto de datos clasificados en 100
subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil, Pk, es un
valor tal que a lo sumo k% de los datos son menores en valor que P k y a lo sumo (100-k)% de los
datos son mayores.
Población: es conjunto de elementos que tiene características comunes, al menos una. Por
ejemplo, una población es el grupo de estudiantes de un país.
- 7-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
necesaria cuando desean destacarse las variables de tendencia central, como son media, modas y
medianas.
Probabilidad: Es una posibilidad medible que se basa en los sucesos esperados en relación a las
observaciones de sucesos anteriores; o se basa también en sucesos esperados en relación a los
sucesos posibles.
Ejemplo: Una moneda puede caer águila o sello. Si esperamos que caiga águila el procedimiento es
el siguiente:
A = águila S = sello Suceso esperado: A (se espera que salga águila al lanzar la moneda) Suceso
posible A ó S ½ = .5 = 50 % (es como razonamos para saber la probabilidad de que caiga águila)
Promedio de datos: Es la cantidad que se obtiene al sumar el conjunto de datos que intervienen
en la muestra entre el total de datos, este también es conocido como media aritmética o
simplemente media.
R
Rango: Es la diferencia en valor entre los datos de valor más alto, H, y los datos de valor más bajo,
L:
Rango= valor alto -- valor bajo
Rango= H -- L
Rango medio: es el número que está exactamente a la mitad entre el dato de valor más bajo, L, y
el dato de valor más alto, H. Se encuentra al promediar los valores bajo y alto.
𝑉𝑎𝑙𝑜𝑟 𝑏𝑎𝑗𝑜+𝑉𝑎𝑙𝑜𝑟 𝑎𝑙𝑡𝑜
Rango medio:
2
𝐿+𝐻
Rango medio=
2
Rango de intercuartil: Es la diferencia entre los cuartiles primero y tercero. Es el rango de 50%
central de los datos.
Recorrido de una distribución: Es la diferencia que existe entre el valor máximo del conjunto de
datos y su valor mínimo.
S
Síndrome: Conjunto de signos, síntomas y características que permiten inferir sobre un evento.
Status: Palabra latina que significa situación, posición, estado. Asociada con el origen etimológico
de la palabra estadística.
T
Tamaño de muestra: El número de elementos que intervienen dentro de la elección de la muestra
extraída de una población.
- 8-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
Tendencia: Es el comportamiento que presentan una serie de datos en base a un valor definido de
tomar una posición muy estrecha con éste valor.
U
Umbral: Considera la entrada o el paso a cualquier otro estado de un evento. Es todo lo que gira
alrededor de las medidas de tendencia central.
V
Validez: Es la calidad de credibilidad que se le da a un instrumento de medición o de recolección
de información. Existen tres tipos de validez:
Validez de contenido, referente al contenido programático del instrumento.
Validez Predictiva, referente a la ocurrencia de uno o varios eventos en el futuro,
partiendo de un dato.
Validez de constructo, referente a la capacidad del instrumento para medir su capacidad o
limitaciones.
Variabilidad: Se entiende como el rango recorrido que toma una variable en un estudio cualquiera
en determinado intervalo.
Variable: es una característica de interés relacionada con cada elemento individual de una
población o muestra.
Variable aleatoria: es una variable que toma un valor numérico único para cada uno de los
resultados del espacio muestral de un experimento de probabilidad.
Variable nominal: es una variable cualitativa que caracteriza (describe o identifica) a un elemento
de una población. Para los datos resultantes de una variable nominal, las operaciones aritméticas
no sólo carecen de sentido sino que tampoco se puede asignar un orden a las categorías.
Variable ordinal: es una variable cualitativa que presenta una posición, o clasificación, ordenada.
Variable discreta: es una variable cuantitativa que puede asumir un número contable (o finito) de
valores. Intuitivamente, la variable discreta puede asumir los valores correspondientes a puntos
aislados a lo largo de un intervalo de recta. Es decir, entre dos valores cualesquiera siempre hay un
hueco.
Variable continua: es una variable cuantitativa que puede asumir una cantidad incontable de
valores. Intuitivamente, la variable continua puede asumir cualquier valor a lo largo de un
intervalo de recta, incluyendo cualquier valor posible entre dos variables determinadas.
- 9-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA
- 10 -
Bibliografía:
Johnson, Robert, Kubi, Patricia, Estadística elemental: lo esencial, Editorial CengageLearning,
Décima edición, 2008