Está en la página 1de 62

Bioestadísticas

AUTOR: OSCAR ARTURO HERRERA ESTRADA

Agradecimientos a los alumnos que ayudaron en el desarrollo de esta obra.


UNIVERSIDAD DE GUADALAJARA | CENTRO UNIVERSITARIO DE CIENCIAS DE LA SALUD
DEPARTAMENTO DE DISCIPLINAS FILOSÓFICAS METODOLÓGICAS E INSTRUMENTALES
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Índice
PRESENTACIÓN ........................................................................................................................................ - 1 -

¿PERO QUÉ ES LA ESTADÍSTICA? ..........................................................................................................................- 1 -

CONCEPTOS BÁSICOS ................................................................................................................................... 0

ESTADÍSTICAS ..................................................................................................................................................... 0
Estadística Paramétrica ............................................................................................................................. 0
Estadística Descriptiva ............................................................................................................................... 0
CORRELACIÓN .................................................................................................................................................... 1
VARIABLES ......................................................................................................................................................... 1
Operacionalización de variables ................................................................................................................ 1
Medición de variables ................................................................................................................................ 2
EJERCICIOS......................................................................................................................................................... 4

DISEÑO MUESTRAL ...................................................................................................................................... 5

POBLACIÓN ........................................................................................................................................................ 5
MUESTRA .......................................................................................................................................................... 5
DISEÑO MUESTRAL ............................................................................................................................................. 5
PROBLEMAS DE EJEMPLO...................................................................................................................................... 6
EJERCICIOS......................................................................................................................................................... 7
TIPOS DE DISEÑO DE MUESTREO ............................................................................................................................. 8
Muestreo al azar aleatorio o probabilístico ............................................................................................... 8
Muestreo al azar aleatorio ordenado ........................................................................................................ 8
Muestreo al azar aleatorio ordenado sistematizado ................................................................................. 8
Muestreo por conglomerado o agrupamiento .......................................................................................... 8
Muestreo Estratificado .............................................................................................................................. 8
DISEÑO DEL CUESTIONARIO ................................................................................................................................... 8
CARACTERÍSTICAS DEL ENCUESTADOR ...................................................................................................................... 9
RECURSOS POR ORDEN JERÁRQUICO........................................................................................................................ 9
YA UNA VEZ HECHA LA ENCUESTA: .......................................................................................................................... 9
1.-Acopio .................................................................................................................................................... 9
2.-Ordenar ascendentemente los datos obtenidos .................................................................................... 9
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS SIN AGRUPAR ...................................................................................... 9
3.- Media aritmética .................................................................................................................................. 9
4.- Moda .................................................................................................................................................. 10
5.- Mediana.............................................................................................................................................. 10
6.- Rango o amplitud total ....................................................................................................................... 10
7.- División del rango en grupos, clases o intervalos ............................................................................... 10
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS ..................................................................................... 10
Media aritmética ..................................................................................................................................... 10
Moda........................................................................................................................................................ 10
Mediana ................................................................................................................................................... 11
EJERCICIO ........................................................................................................................................................ 11
MEDIDAS DE DISPERSIÓN PARA DATOS SIN AGRUPAR ................................................................................................ 12

I
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS ................................................................................................. 13


CAMPANA DE GAUSS O CURVA NORMAL ................................................................................................................ 14
PREGUNTAS DE UNIDAD...................................................................................................................................... 14

INFERENCIA ESTADÍSTICA .......................................................................................................................... 14

INFERIR MEDIA ARITMÉTICA DE UNA POBLACIÓN ...................................................................................................... 14


COCIENTE Z ..................................................................................................................................................... 15
PROBLEMAS EJEMPLO ........................................................................................................................................ 15

CARACTERÍSTICAS DE TABLAS Y GRÁFICAS ESTADÍSTICAS .......................................................................... 17

FORMAS DE PRESENTAR LOS DATOS ...................................................................................................................... 17


PREGUNTAS DE UNIDAD...................................................................................................................................... 18

PLANTEAMIENTO DEL PROBLEMA Y PRUEBA DE HIPÓTESIS....................................................................... 19

HIPÓTESIS NULA: HO ......................................................................................................................................... 19


HIPÓTESIS ALTERNATIVA: HI ................................................................................................................................ 19
GRADO DE LIBERTAD.......................................................................................................................................... 19
COCIENTE T ..................................................................................................................................................... 19
ERRORES EN LOS QUE NO DEBEMOS CAER............................................................................................................... 20

.................................................................................................................................................................. 23

PROBABILIDAD .......................................................................................................................................... 23

PROBABILIDAD CONJUNTA .................................................................................................................................. 24

X2 CHI CUADRADA...................................................................................................................................... 25

PRUEBA DE LA MEDIANA ..................................................................................................................................... 26

ANÁLISIS DE VARIANZA EN DOS O MÁS DIRECCIONES POR RANGOS DE FRIEDMAN .................................. 29

ANÁLISIS DE VARIANZA EN UNA DIRECCIÓN POR RANGOS DE KRUSKAL WALLIS ....................................... 31

CORRELACIÓN ............................................................................................................................................ 33

ECUACIÓN DE REGRESIÓN ......................................................................................................................... 34

ANEXOS .......................................................................................................................................................A

CUESTIONARIO DE BIOESTADÍSTICAS ...........................................................................................................A

TABLAS ESTADÍSTICAS ................................................................................................................................. E

COCIENTE T ....................................................................................................................................................... E
TABLA DE X2 .......................................................................................................................................................F
COCIENTE Z ....................................................................................................................................................... G

GUIA DE EXAMEN ........................................................................................................................................H

GLOSARIO ................................................................................................................................................ - 1 -

A B C ............................................................................................................................................................- 1 -
D ..................................................................................................................................................................- 2 -
E ..................................................................................................................................................................- 3 -

II
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

F H ...............................................................................................................................................................- 4 -
I L M .............................................................................................................................................................- 5 -
N ..................................................................................................................................................................- 6 -
P ..................................................................................................................................................................- 7 -
R S T U V .......................................................................................................................................................- 8 -

BIBLIOGRAFÍA: .............................................................................................................................................A

III
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Presentación
Para quienes estudian por primera vez estadística, incluso para aquellos que ya han tomado algún
curso, deben saber que es una materia sin mayores dificultades para ser abordada. Él tener que
aplicar ciertas fórmulas para lograr y presentar los resultados sobre los cuales se podrán hacer
análisis más objetivos, es agradable y sencillo, porque es muy fácil referir sucesos (medibles), y
expresarlos cuantitativamente.

La estadística en síntesis es un imprescindible instrumento de apoyo en la investigación, y debe


estar anticipada por un adecuado diseño metodológico.

¿Pero qué es la estadística?


La estadística es el lenguaje universal de las ciencias. Eso explica la necesidad de saber emplear
correctamente su metodología, lo cuál va a permitir la obtención precisa de los datos. Estos
métodos incluyen:

1. Definir cuidadosamente la situación


2. Obtención de datos
3. Resumen exacto y preciso de los datos
4. Obtención y comunicación de las conclusiones principales.

Cualquiera que sea el universo, con la adecuada aplicación de la estadística se estará en la


posibilidad de realizar un representativo diseño muestral, de acuerdo a los requerimientos de la
investigación y los recursos de que se dispone, como los son el recurso del tiempo, el recurso
humano, el material, el presupuesto, etc. (Tema especial donde analizaremos desde la adecuada
elaboración del cuestionario, lo mismo la aplicación de las encuestas, el tipo y tamaño de la
muestra con su nivel o grado de confianza preestablecido).

Y como se mencionó con anterioridad, hacer el acopio o la recolección de los datos, mismos que
para su mejor análisis e interpretación se tienen que organizar, ordenándolos en continuo
ascendente y presentándolos en tablas o en gráficas estadísticas, que facilitará la síntesis de
información y la interpretación de los resultados, porque plasmar numéricamente las
investigaciones con el uso de la estadística es la forma más adecuada y fácil, tanto para presentar,
como para leer, interpretar y analizar los fenómenos cuantificables y así con mayor facilidad poder
obtener ciertas conclusiones, observaciones, alternativas o propuestas, situación que depende
más de la postura del investigador ante la realidad que de la estadística, ya que no condiciona a la
teoría sino que esta es un imprescindible instrumento que bien utilizado te sirve de mucho apoyo
para realizar tus análisis.

Aún resulta para ti más sencillo y fácil saber que no hablamos de la estadística en abstracto ni en
términos muy generales, sino que haremos referencia a la estadística aplicada tanto a la
psicología, como a la medicina, a la educación, etc. por lo que a través de ejemplos prácticos y
comunes a estas carreras del área de la salud, las asignaturas de estadística serán más gratas y
aceptables.

- 1-
Conceptos Básicos
Estadísticas
Aplican dos definiciones:

 Ciencia que se encarga de obtener, describir e interpretar los datos. 77

 Es un instrumento de apoyo a la teoría que sirve para recopilar los datos mediante un adecuado
diseño muestral, para ordenarlos y organizarlos en tablas o en gráficas estadísticas, mismas que
facilitan los análisis y nos ayudan a obtener relativas conclusiones con bases más sólidas;
además, sobre la base del conocimiento, de nuestra muestra podremos inferir comportamientos
de la población con niveles o grados de confianza menores al 100%, y hacer si se requiere,
comparaciones entre el comportamiento de varias muestras.

Pasos de la Estadística

1. Elección del tema


2. Delimitar el tema
3. Justificación
4. Planteamiento del problema ¿Qué quiero saber?
5. Objetivos (tanto generales como particulares o específicos)
6. Marco teórico o antecedentes, a través de la investigación bibliográfica
7. Estudio de campo por medio de un adecuado diseño muestral
8. Análisis, interpretación y presentación de los datos en tablas y/o graficas estadísticas

Estadística Paramétrica
Es la que requiere que los elementos que integran las muestras contengan elementos parámetros o
medibles ejemplo; (edad, peso, nivel de ingresos, grado educativo, etc.)

Estadística Descriptiva
Incluye la obtención, presentación y descripción de los datos. Sirve como un instrumento de apoyo para
describir claramente los sucesos o fenómenos del comportamiento de la población, o del universo de
estudio, a través de gráficas o tablas. Esto es en la que piensa la mayoría de las personas al decir
“estadística”.

Requiere, que los elementos que integran las muestras sean


medibles, y a partir del conocimiento de la muestra inferimos el
Paramétrica
comportamiento de la totalidad del universo de estudio pero
Estadística con niveles o grados de confianza menores al 100%.
Descriptiva Requiere, que los elementos que integran las muestras sean
No medibles, y a partir del conocimiento de la muestra inferimos el
Paramétrica comportamiento de la totalidad del universo de estudio pero
con niveles o grados de confianza menores al 100%.

0
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Estadística Paramétrica Inferencial


Requiere que las muestras contengan elementos paramétricos, y a partir del conocimiento de la muestra
inferimos comportamientos de la totalidad del universo de estudio o de la población, con niveles o
grados de confianza menores al 100%.

Correlación
Es una asociación existente entre dos variables donde una de las variables por lo general “X” es
independiente y la otra por lo general “Y” es dependiente. Se mide de 0 a 1, siendo uno el más alto nivel
de correlación.

Variables
Partimos de que es una propiedad o característica del sujeto, cosa o elemento que se estudia, el cual
puede variar en la medición de un sujeto a otro.

Ejemplos: sexo, religión, escolaridad, edad, aprendizaje, inteligencia, etc.

La variable se aplica a un grupo de personas u objetos, los cuales pueden adquirir diversos valores
respecto a la variable. Si tenemos la variable “z” esta va a adquirir un valor para la investigación científica
cuando pueden ser relacionadas con otras (formar parte de una hipótesis o una teoría).

En investigación, la identificación de variables inicia desde el momento en que se define el problema a


investigar y se formulan los objetivos. Este proceso continua cuando se trabaja en la construcción del
marco teórico; momento en que se identifican las variables que se relacionan con el problema de estudio
y en que se conceptualizan las mismas.

Por ejemplo: En una investigación sobre diabetes, “Hábitos de alimentación de los diabéticos que
acuden a la Unidad Médica Familiar 89 del Instituto Mexicano del Seguro Social” el problema señala las
variables principales (concentración de glucosa en sangre por consumo de alimentos).

La identificación de las variables de estudio es sumamente importante, tal vez tanto como haber hecho
una buena identificación del problema; sin embargo, no basta con identificarlas; es necesario definir en
forma más precisa que es lo que se va a estudiar y cómo se va a entender cada término a fin de evitar
confusiones o ambigüedades, ejemplo; ¿Qué es lo que entendemos por fumador?, fumar 10 cigarrillos
por día, por semana, por mes, por año etc.

Operacionalización de variables
La operacionalización de una variable consiste en llevar la variable de un nivel abstracto a un plano más
concreto y su función básica es precisar al máximo el significado que se le otorga a una variable en un
determinado estudio. Hermida plantea que operacionalizar las variables significa explicar cómo se van a
medir. La operacionalización es una de las tareas más difíciles del proceso de investigación; de gran
importancia pues tendrá repercusiones en todos los momentos siguientes, razón por la que se le debe de
prestar mucha atención, como la edad, el ingreso económico, los años de escolaridad, el número de
hijos. Estas son variables simples cuya comprensión es más fácil.

Es evidente que cada persona tiene una conceptualización diferente de lo que es el significado de estos
términos o características y que si tratamos de hacer la medición de estas variables antes de haberlas
conceptualizado y definido claramente, al final tendríamos información poco válida y poco confiable.

1
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Ejemplo de la operacionalización de una variable sencilla y una compleja:

Dimensiones
(variables
Definición Indicadores
Variable contenidas en la
conceptual Definición operacional
definición
conceptual)
Sencilla Años cumplidos
Ninguna De 1 a 99 o más
Edad de la persona
Tiempo medido en horas y minutos que
Accesibilidad
tarda una persona para trasladarse de
geográfica
Mayor o menor su domicilio al centro de salud
Compleja
posibilidad de Cantidad de dinero que gasta para
Accesibilidad
tomar contacto Accesibilidad recibir la atención.
a los
con los servicios económica Disponibilidad económica para cubrir el
servicios de
de salud para gasto.
salud
recibir asistencia Conocimientos sobre la atención que se
Accesibilidad
da en el centro de salud.
cultural
Percepción del problema de salud.

Medición de variables
Una vez definidas las variables de tal forma que faciliten la observación empírica es necesario considerar
el tipo de medición que debe realizarse para lograr lo planteado en la investigación. Antes de discutir
cuestiones relacionadas con la medición, es necesario conocer algunos aspectos generales de ésta, tales
como su naturaleza, niveles, escalas, alcances y su relación con la validez y confiabilidad.

Según Escalante, medición es la clasificación de casos o situaciones y sus propiedades, de acuerdo a


ciertas reglas lógicas.

Al hablar de variables y los valores que éstas pueden tomar, la clasificación puede hacerse en términos
de categorías o de valores numéricos que las variables asumen en una escala.

Siegel indica que “la medición se refiere generalmente a la asignación de números a las observaciones,
de modo que los números sean susceptibles de análisis por medio de manipulaciones y operaciones de
acuerdo con ciertas reglas. La relación con los objetos que se están observando y los números es tan
directa que mediante la manipulación de los números se obtiene nueva información acerca de los
objetos”.

En resumen, medición se refiere a la cualificación o cuantificación de una variable para un estudio dado.
En consecuencia, las variables se clasifican según la capacidad o nivel en que permiten medir los objetos,
es decir, que la característica más común o básica de una variable es la de diferenciar entre la presencia
o ausencia de la propiedad que ella enuncia. La clasificación básica de las variables es la que permite
asignar distintos valores cualitativos o cuantitativos para los diferentes fenómenos bajo estudio.

Cuando se habla de una variable cualitativa se refiere al hecho de que ésta no puede ser medida en
términos de la cantidad de la propiedad presente, sino que solo se determina la presencia o ausencia de
ella (ejemplo: sexo, ocupación, religión, procedencia, estado civil); y no es posible asignarles un mayor o
menor peso a las categorías, lo único que se puede hacer es clasificarlas.

2
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Las variables de corte cuantitativo son aquellas cuya magnitud puede ser medida en términos numéricos.
Esto es, que los valores de los fenómenos se encuentran distribuidos a lo largo de una escala (ejemplo:
edad, peso, talla, escolaridad, debido a que) y se les puede asignar un mayor o menor peso a cada una
de ellas. Estas a su vez pueden dividirse en discontinuas y continuas, según su unidad de medición; es
decir si se pueden fraccionar como la temperatura (36.5, 36.8) o en su defecto la medición en por medio
de número completos (número de hijos).

Con respecto a las escalas de medición, las variables pueden clasificarse en cuatro clases:

 Escala nominal: es el nivel más elemental de medición y consiste en clasificar los objetos de
estudio según las categorías de una variable. Ejemplo: estado marital que se clasifica así: soltero,
casado, viudo, divorciado, unión libre. Esta clasificación solo nombra los indicadores de la
variable pero no representa ninguna jerarquización, dado que todos los indicadores se
encuentran al mismo nivel.
 Escala ordinal: Este tipo de escala se utiliza para clasificar los objetos, hechos o fenómenos en
forma jerárquica, según el grado que posea una característica determinada, sin proporcionar
información sino la magnitud de las diferencias entre los casos así clasificados. Ejemplo: tipo de
higiene (con la siguiente escala: excelente, buena, regular, mala).En este caso se refleja distancia
entre una y otra categoría, o cuánto es mayor una en comparación con la otra.
 Escala de intervalo: Es la que clasifica a la variable de acuerdo a un rango numérico. Este tipo de
escala de intervalos mide las variables cuantitativas, siendo igual la distancia entre dos puntos o
valores de un continuo. Sin embargo el punto cero es arbitrario y convencional, por lo que no se
pueden establecer razones o proporciones, ni comparar dos escalas sin definir el mismo punto
de partida. Las variables de inteligencia, rendimiento académico y temperatura, debido a que el
punto cero es arbitrario; tomando como ejemplo la temperatura, se puede decir que el cero no
representa la ausencia de calor; sin embargo, la distancia entre cualesquiera de los dos puntos
de la escala es igual, o sea, que el cambio de temperatura entre 36° y 37°C es igual al cambio
entre 40° y 41°C. Al medir temperatura, no se puede decir que 20°C es el doble de 10°C. Esto
debido a que cuando el termómetro marca 0 grados; en realidad la temperatura es de 273
grados. Por esto solo podemos decir que una temperatura de 20 grados es 10 grados más que
una de 10.
 Escala de proporción razón: Este tipo de escala constituye el nivel más alto de medición para las
variables cuantitativas; contiene las características de una escala de intervalo con la ventaja
adicional de poseer el cero absoluto, lo cual permite determinar la proporción conocida de
valores de la escala. El peso, la talla y número de alumnos son ejemplos de variables de razón o
proporción, en las que el cero representa la nulidad o ausencia de lo que se estudia. Por esta
propiedad de la escala se puede establecer razones tales como se dan en el variable peso, en la
cual se dice que un peso de 50 libras es el doble de uno de 25 kilos, o uno de 100 kilos es 4 veces
mayor que uno de 25.

Nominal
Cualitativa o atributo
Ordinal
Variable
Discreta
Cuantitativa o numérica
Continua

3
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Ejercicios
1. Según la definición de la estadística como la ciencia de “recolectar,
describir e interpretar datos”, escribe una oración que describa cada una
de las tres actividades estadísticas.

2. Menciona dos variables cualitativas y dos cuantitativas relacionadas con


los clientes de una tienda departamental que abrió recientemente

3. Identifica las siguientes expresiones como ejemplos de variables


continuas, ordinales, discretas o nominales.
a. Una encuesta de electores registrados donde se preguntaba a qué
candidato dan su apoyo.
b. El tiempo necesario para que sane una herida cuando se aplica un
nuevo medicamento
c. El número de receptores de televisión en un hogar.
d. La distancia que viaja un balón de futbol cuando es pateado por
las alumnas universitarias de primer año.
e. El número de páginas impresas que se procesan en la impresora
de una computadora.

4
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Diseño Muestral
Población
Colección o conjunto de individuos, objetos o eventos cuyas propiedades serán analizadas.

Muestra
Subconjunto de la población, parte de la totalidad de un conjunto de datos.

Entre más grande es el universo, la muestra debe ser más representativa, es decir a
mayor muestra, mayor confiabilidad.

Diseño Muestral
Son todos los elementos que se contemplan para obtener una muestra representativa evitando en lo
posible sesgos (falso, mentira), mismo que está integrado por:

Tamaño de la muestra
Errores de muestreo
Tipo de muestreo
Diseño del cuestionario
Errores de no muestreo Capacitación de encuestadores
Recursos

El tamaño de la muestra depende del tamaño de la población y del nivel o grado de


confianza.

𝑁(𝑟)
𝑛=
(𝑁 − 1)𝐷 + 𝑟
𝑟 = 𝑝. 𝑞
𝑝+𝑞 =1
𝐵2
𝐷=
4
n = tamaño de la muestra

N = No significa el total elementos de la población o universo, sino el total exacto o aproximado de


elementos de la población que reúnen las características para ser encuestados

p = Varianza de la población. Varianza de la población es igual al porcentaje de la variable principal de


estudio, ejemplo: Si en una población la variable principal de estudio son las mujeres y éstas representan
el 60%, entonces 𝑝 = 0.6 por lo tanto 𝑞 = 0.4, obteniendo que 𝑝 × 𝑞 = (0.6)(0.4) = 0.24, siendo 𝑟 =

5
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

0.24. Cuando se desconoce el valor de la varianza se maneja p=0.5 (la mayor varianza posible), por lo
tanto q=0.5 pues 𝑝 + 𝑞 = 1 y despejando tenemos que 𝑞 = 1 − 𝑝 por lo que 𝑞 = 1 − 0.5 = 0.5

B = Porcentaje de error de muestreo o complemento del nivel o grado de confianza, se obtiene restando
al 100% el grado de confianza a utilizar. Por ejemplo, si el nivel de confianza requerido es del 98%, B =
0.02, pues 100% - 98% = 2% que expresado decimalmente es 0.02.

Problemas de Ejemplo

Ejemplo 1

N = 3’930,160 personas que integran el universo de estudio


Grado de confianza = 95%, por lo que B=0.05

(0.05)2 0.0025
𝐷= = = 0.000625
4 4
𝑟 = (0.5)(0.5) = 0.25
(3′930,160)(0.25) 982,540
𝑛= = = 399.96
(3’930,159)(0.000625) + 0.25 2456.60
Redondeando, n = 400

Ejemplo 2

N = 3’930,160
Grado de confianza = 98%, por lo que B=0.02

(0.02)2 0.0004
𝐷= = = 0.0001
4 4
𝑟 = (0.5)(0.5) = 0.25
(3′930,160)(0.25) 982,540
𝑛= = = 2,498.39
(3’930,159)(0.0001) + 0.25 393.27
Redondeando, n = 2,498 = 2500

Ejemplo 3

De una población de aspirantes al Bachillerato General a la U. de G. que en número son 13,220, obtener
el tamaño de la muestra con un nivel de confianza del 98% y 95%

N = 13,220
Grado de confianza = 95%, por lo que B=0.05

(0.05)2 0.0025
𝐷= = = 0.000625
4 4

6
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

𝑟 = (0.5)(0.5) = 0.25
(13,220)(0.25) 3305
𝑛= = = 388.37
(13,219)(0.000625) + 0.25 8.51
Redondeando, n = 388

Grado de confianza = 98%, por lo que B=0.02

(0.02)2 0.0004
𝐷= = = 0.0001
4 4
𝑟 = (0.5)(0.5) = 0.25
(13,220)(0.25) 3305
𝑛= = = 2105.10
(13,219)(0.0001) + 0.25 1.57
Redondeando, n = 2105

Ejercicios
Realiza los siguientes ejercicios:

1. N = 100,000; Nivel de confianza = 98%; r = se desconoce


2. N = 100,000; Nivel de confianza = 95%; r = se desconoce
3. N = 100,000; Nivel de confianza = 95%; P =.3
4. N = 400; Nivel de confianza = 95%; r = se desconoce

7
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Tipos de diseño de muestreo


Para seleccionar una muestra para una encuesta, es necesario un marco muestral. Esto es una lista o
conjunto de elementos pertenecientes a la población del cual se extrae la muestra.

Muestreo al azar aleatorio o probabilístico


Considera que todos los elementos de la población tienen la misma probabilidad de ser elegidos como
parte de la muestra. Ejemplo: las primeras 385 personas que nos encontremos las encuestamos.

Muestreo al azar aleatorio ordenado


Considera que todos los elementos de la población tienen la misma probabilidad de ser elegidos como
parte de la muestra, pero con un orden. Ejemplo: de cada 5 personas, una sí y cuatro no.

Muestreo al azar aleatorio ordenado sistematizado


Todos los elementos tienen la misma probabilidad de ser elegidos, pero con un orden y un sistema.
Ejemplo: el primero, el de en medio y el último de la lista de cada grupo del CUCS.

Muestreo por conglomerado o agrupamiento


Todos los elementos tienen la misma probabilidad de ser elegidos siguiendo un orden, un sistema, pero
es correspondiente o exclusivo de un tipo de población. Ejemplo: una escuela, una colonia, aficionados a
algún espectáculo, la gente de un tianguis, etc.

Muestreo Estratificado
Sigue un orden, sistema y agrupamiento, pero afirma que la población no es homogénea sino
heterogénea, por lo tanto se deben considerar en la muestra estratos de la población. Ejemplo:
Hombres/mujeres, nivel económico o clase social, niveles de estudio, etc.

El muestreo que sea elegido o que se vaya a realizar debe de seguir un orden, un
sistema, un agrupamiento, y/o estratos, pero con previa y plena justificación del
porqué se está eligiendo este tipo o tipos de muestreo.

Diseño del cuestionario


1. Todo cuestionario en un principio es piloto, hasta que se defina que ya está aprobado, después
de un breve ensayo o de la aplicación de un pequeño muestreo.
2. Todo cuestionario debe llevar encabezado a manera de presentación, de explicar el propósito,
los objetivos o la intención.
3. Debe captar los datos generales del encuestado, como; sexo, edad, escolaridad, etc., a excepción
los datos que lo identifiquen como; el nombre, el domicilio de los encuestados, su correo
electrónico, etc. esto para evitar que se inhiban.
4. Debe estar basado en el planteamiento inicial del problema.
5. No debe tener preguntas de más ni de menos. Sólo las que se requieran.
6. El lenguaje debe ser común (no corriente ni científico, es decir sin tecnicismos.

8
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

7. La mayoría de preguntas deben ser cerradas y si es posible utilizar claves, opciones de abanico.
Las claves son utilizadas para preguntas abiertas, cuando una letra representa las convicciones
de las personas sin que éstas se den cuenta, sólo el encuestador.
8. Desde el diseño del cuestionario se deben también diseñar los elementos del vaciado.
9. Las preguntas no debe empezar con SI o NO.
10. Ninguna pregunta debe inducir a la respuesta, ni hacerse en forma de negación, tampoco
comenzar con, Verdad que...
11. Se recomienda iniciar por preguntas sencillas y luego las relativamente más complicadas, esto va
de acuerdo con la intimidad o grado de dificultad de la pregunta.

Características del encuestador


 Preferentemente que el encuestador sea el propio investigador, pero si no que el ayudante
tenga la instrucción adecuada, sobre todo que tenga ética.
 Es importante que el encuestador tenga presente las características de los encuestados.
 Debe de manejar un lenguaje común
 Adaptarse al horario
 Tener buen carácter y una posición neutral, pero sobre todo mucha ética.

Recursos por orden jerárquico


 El Recurso del Tiempo
 El Recurso Humano
 El Recurso Económico
 El Recurso Material

Ya una vez hecha la encuesta:


1.-Acopio
De una muestra se seleccionaron 13 personas con un padecimiento similar pero poco común, cuyas
edades diferentes oscilan entre los 7 y 18 años; los resultados fueron los siguientes:

7, 15, 18, 16, 17, 8, 13, 10, 8, 8, 12, 18, 12

2.-Ordenar ascendentemente los datos obtenidos


7, 8, 8, 8, 10, 12, 12, 13, 15, 16, 17, 18, 18

Medidas de tendencia central para datos sin agrupar


3.- Media aritmética
∑𝑥
Es la suma de todas las edades entre el total de datos, su fórmula es 𝑥̅ =
𝑛

162
𝑥̅ = = 12.46
13
Redondeando obtenemos que 𝑥̅ = 12.5

9
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

4.- Moda
Es el dato predominante o el que tiene la frecuencia más alta

Moda = 8

5.- Mediana
Es el dato que está en medio de todos los datos, estando ordenados previamente. La fórmula para
𝑛+1
obtenerla es 𝑀𝑑 = 2

13 + 1
𝑀𝑑 = = 7° 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
2
Esto significa que el número en la 7° posición de los datos ordenados es la mediana, o sea, el número 12

6.- Rango o amplitud total


Es la distancia existente entre el dato menor y el dato mayor más uno. Su fórmula es 𝑟 = 𝐿𝑠 − 𝐿𝑖 + 1

𝑟 = 18 − 7 + 1 = 12

7.- División del rango en grupos, clases o intervalos


Los grupos deben ser del mismo tamaño, pueden ser los grupos que queramos o consideremos
necesarios. Si el rango no es divisible, podemos sumarle una unidad para volverlo divisible.

Frecuencia (F) Marca de clase (X) FX


7-10 5 8.5 42.5
11-14 3 12.5 25
15-18 5 15.5 77.5

Frecuencia (F).- Es la cantidad (en este caso) de personas que hay en cada intervalo.

Marca de clase (X).- Es igual a punto medio de cada clase, que es igual al límite inferior más límite
𝐿𝑖+𝐿𝑠
superior entre dos, 𝑋=
2

Medidas de tendencia central para datos agrupados

Media aritmética
∑(𝐹𝑋)
𝑥̅ = 𝑛
145
𝑥̅ = 13
= 11.15

Moda
𝑑1(𝑐)
𝑀𝑜𝑑𝑎 = 𝐿 +
𝑑1 + 𝑑2
L = límite inferior de la clase modal (es decir, la clase con mayor frecuencia)

d1 = frecuencia de la clase modal menos frecuencia de la clase anterior

10
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

d2 = frecuencia de la clase modal menos frecuencia de la siguiente clase.

c = amplitud del intervalo de clase o tamaño de clase.


(5)(4) 20
𝑀𝑜𝑑𝑎1 = 7 + =7+ = 10.86
(5 + (5 − 3)) 7
(5 − 3)(4) 8
𝑀𝑜𝑑𝑎2 = 15 + = 15 + = 16.14
(5 − 3) + (5) 7

Mediana
((𝑛⁄2) − 𝐹)(𝑐)
𝑀𝑑 = 𝐿 +
𝐹𝑚
L = límite inferior de la clase mediana (es decir, la clase que contiene al elemento mediano de la
distribución).

n = número de observaciones en el conjunto de datos, o total de los datos.

F = suma de las frecuencias de las clases anteriores a la clase mediana.

Fm = frecuencia de la clase mediana

c = amplitud del intervalo de clase o tamaño de clase.

((13⁄2) − 5)(4) 6
𝑀𝑑 = 11 + = 11 + = 13
3 3

Ejercicio
Acopio o recolección de datos:

19, 19, 19, 20, 18, 22, 18, 18, 18, 19, 19, 19, 19, 20, 21, 23, 22, 17, 18, 18, 20, 18, 20, 19,
19, 19, 19, 18, 18, 18, 25

Obtén los siguientes datos:

1. Media aritmética
2. Moda
3. Mediana
4. Rango o amplitud total

11
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Medidas de dispersión para datos sin agrupar


Datos en los que nos basaremos:

Personas atendidas por congestión alcohólica en el mes de enero de 2001 en la Cruz Roja de
Guadalajara.

Acopio de datos:

16,21,20,40,30,19,25,28,30,28,50,12,47,35,32,45,19,22,46,32,52,42,22,46,30,32.

Total de atendidos por congestión alcohólica = 26

Datos ordenados: 12,16,19,19,20,21,22,22,25,28,28,30,30,30,32,32,32,35,40,42,45,46,46,47,50,52.

Medidas de tendencia central para datos sin agrupar:

Moda = 30 y 32
𝑛+1
Mediana = 2
Md = 27/2 = 13.5° posición, se toman los datos de la posición 13 y 14 y se promedian,
esto sería (30 + 30) / 2 = 30 La mediana es 30.

Media aritmética es la suma de las edades entre el número de personas atendidas.

x = 821/26 = 31.57 redondeado a 32 el promedio de edad.

Las medidas de dispersión se obtienen a partir de la media aritmética

Desviación Media (D.M.) Es igual a la sumatoria de diferencias entre la media aritmética y cada uno de
los datos, dividida a su vez entre el total de datos.
∑(𝑥̅ − 𝑥)
𝐷. 𝑀. =
𝑛
(241)
𝐷. 𝑀. = = 9.27
26
Varianza (S2) Es el cuadrado de la sumatoria de las diferencias de cada dato y la media aritmética,
dividido entre la suma total de personas menos uno.

2
∑(𝑥̅ − 𝑥)2
𝑆 =
𝑛−1
3,235
𝑆2 = = 129.4
25

Desviación estándar (S)

12
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

∑(𝑥̅ − 𝑥)2
𝑆=√
𝑛−1

3,235
𝑆=√ = √129.4 = 11.375
25
𝑆
Error estándar (𝑆𝑥̅ ) 𝑆𝑥̅ =
√𝑛−1

11.375
𝑆𝑥̅ = = 2.275
√25

Medidas de dispersión para datos agrupados


De los mismos datos del subtema anterior se obtiene que el rango = 52-12 + 1= 41, siendo 41 indivisible
aumentamos la edad máxima a 53 para obtener un rango de 42 y poder dividir en 3 intervalos de 14
personas, quedando agrupados de la siguiente manera:

Grupo Frecuencia (F) Marca de clase (X) FX


12-25 9 12 + 25/2 = 18.5 166.5
26-39 9 26 + 39/2 = 32.5 292.5
40-53 8 40 + 53/2 = 46.5 372

Desviación Media (D.M.) Es igual a la sumatoria de diferencias entre la media aritmética y la marca de
clase de cada grupo multiplicada por su respectiva frecuencia, dividida a su vez entre el total de datos.
∑(𝑥̅ − 𝑋)𝐹
𝐷. 𝑀. =
𝑛
(13.5)(9) + (0.5)(9) + (14.5)(8) 242
𝐷. 𝑀. = = = 9.31
26 26
Varianza (S2) Es el cuadrado de la sumatoria de las diferencias de cada marca de clase y la media
aritmética, multiplicada por su respectiva frecuencia, dividido entre la suma total de personas menos
uno.

∑((𝑥̅ − 𝑋)2 𝐹)
𝑆2 =
𝑛−1
(13.52 )(9) + (0.52 )(9) + (14.52 )(8) 1,640.25 + 2.25 + 1,682
𝑆2 = = = 132.98
25 25
Desviación estándar (S)

∑((𝑥̅ −𝑥)2 𝐹)
𝑆=√
𝑛−1

3,324.5
𝑆=√ = √132.98 = 11.53
25

13
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Error estándar (𝑆𝑥̅ )


𝑆
𝑆𝑥̅ =
√𝑛 − 1
11.53
𝑆𝑥̅ = = 2.3
√25

Campana de Gauss o curva normal


Lepticúrtica Curva normal Plasticúrtica

12-------------------------52 12----------------------52 12-----------------------52

Mayoría de datos centrados Distribución normal Datos muy dispersos

Preguntas de unidad
1. ¿Qué es un marco muestral?
2. Una muestra aleatoria puede ser difícil de obtener. ¿Por qué?
3. ¿Por qué la muestra aleatoria es tan importante en estadística?
4. ¿Por qué la guía telefónica no puede ser un marco muestral representativo?
5. Selecciones realizó una encuesta preguntando al lector “¿Qué es lo más
embarazoso que les ha sucedido en la escuela?”
a. ¿Qué clase de método de muestreo es este?
b. ¿Es probable que los resultados sean sesgados? Explique.

Inferencia Estadística
Inferir es conocer el comportamiento de la población o universo con niveles de confianza menores al
100% a partir del conocimiento de la muestra.

Inferir media aritmética de una población


Para determinar la media aritmética de la población a partir de la media aritmética y error estándar de
una muestra, con cierto grado de confianza.

𝜇̅ = 𝑥̅ ± (𝑆𝑥̅ )(𝑘)  𝜇̅1 = 𝑥̅ − (𝑆𝑥̅ )(𝑘) y 𝜇̅ 2 = 𝑥̅ + (𝑆𝑥̅ )(𝑘)

μ̅ = Media aritmética de la 𝐩𝐨𝐛𝐥𝐚𝐜𝐢ó𝐧


μ̅1 = límite inferior que delimita a la media de la población

14
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

μ̅2 = límite superior que delimita a la media de la población


x̅ = Media aritmética de la muestra
Sx̅ = Error estándar de la muestra
k = constante dada por el grado de confianza con el que se determinarán los límites mayor y menor entre
los cuales se encontrará la media de la población

Constantes preestablecidas para estos niveles o grados de confianza

 90%  k = 1.68
 95%  k = 1.96
 99%  k = 2.58

Cociente Z
Para determinar el grado de confianza de que la media aritmética se encuentre entre dos límites dados a
partir de la media aritmética y error estándar de una muestra.
̅
𝑥−𝜇 ̅
𝑥1 −𝜇 ̅
𝑥2 −𝜇
𝑍=  𝑍1 = y 𝑍2 =
𝑆𝑥̅ 𝑆𝑥̅ 𝑆𝑥̅
Z= grado de confianza de que la media aritmética de la población se encuentre entre 𝑥1 y 𝑥2 , 𝑍1 +
𝑍2 = 𝑍, tomando como positivos todos los valores
Z1 = grado de confianza de que la media aritmética de la población se encuentre entre 𝑥1 y 𝑥̅ (el resultado obtenido
se busca en la tabla Z, y el número decimal que ahí marcase se debe transformar a porcentaje y ese será el grado
de confianza)

Z2 = grado de confianza de que la media aritmética de la población se encuentre entre 𝑥2 y 𝑥̅ (el resultado obtenido
se busca en la tabla Z, y el número decimal que ahí marcase se debe transformar a porcentaje y ese será el grado
de confianza)

𝑥1 y 𝑥2 = límites superior e inferior entre los cuales pudiera encontrarse la media aritmética de la población

𝜇̅ = en este caso haremos el supuesto que sabemos que es falso, pero necesario de que ̅𝜇 = 𝑥̅
𝑆𝑥̅ = error estándar de la muestra

Problemas ejemplo
Entre que limites o que rango se encuentra la media aritmética (M) de la población entre un nivel o
grado de confianza del 90%, 95% y 99%.

𝑥̅ = 29.3

Valores constantes para niveles o grados de confianza preestablecidos.

90%=1.68

95%=1.96

99%=2.58

𝑥̅ =29.3

15
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

𝑆𝑥̅ = 1.91

 90%

𝜇̅1 = 𝑥̅ + (𝑆𝑥̅ )(𝑘) = 29.3 + (1.91)(1.68) =29.3 + 3.2086 = 32.5086

𝜇̅ 2 = 𝑥̅ − (𝑆𝑥̅ )(𝑘) = 29.3 - (1.91)(1.68) = 29.3 - 3.2086 = 26.0914

 95%

𝜇̅1 = 𝑥̅ + (𝑆𝑥̅ )(𝑘) =29.3 + 1.91 (1.96) =29.3 +3.7436 = 33.0436

𝜇̅ 2 = 𝑥̅ − (𝑆𝑥̅ )(𝑘) =29.3 - (1.91) (1.96) =29.3 - 3.7436 = 25.5564

 99%

𝜇̅1 = 𝑥̅ + (𝑆𝑥̅ )(𝑘) =29.3 + (1.91)(2.58) =29.3+4.9278 = 34.2536

𝜇̅ 2 = 𝑥̅ − (𝑆𝑥̅ )(𝑘) =29.3 - (1.91)(2.58) =29.3 -4.9278 = 24.3722

Determina el nivel o grado de confianza si afirmamos que la media de la población se encuentra entre los
siguientes límites:

 Entre 27 y 31 años

̅
𝑥1 −𝜇 27−29.3 2.3
𝑍1 = = = = 1.2Consultando la tabla de valores “Z” = 38.49%
𝑆𝑥̅ 1.91 1.91
̅
𝑥2 −𝜇 31−29.3 1.7
𝑍2 = = = = .89 Consultando la tabla de valores “Z” = 31.33%
𝑆𝑥̅ 1.91 1.91

Nivel de confianza Σ=69.82%

Acudir a la tabla de valores Z que se encuentra casi al final de éstos apuntes.

 Entre 26 y 32 años

̅
𝑥1 −𝜇 26−29.3 3.3
𝑍1 = = = = 1.72 = 45.73%
𝑆𝑥̅ 1.91 1.91
̅
𝑥2 −𝜇 32−29.3 2.7
𝑍2 = = = = 1.41 = 42.07%
𝑆𝑥̅ 1.91 1.91

Σ=87.80%

 Entre 26.5 y 31.5 años

̅
𝑥1 −𝜇 26.5−29.3 2.8
𝑍1 = = = = 1.46 = 42.79%
𝑆𝑥̅ 1.91 1.91
̅
𝑥2 −𝜇 31.5−29.3 2.2
𝑍2 = = = = 1.15 = 37.39%
𝑆𝑥̅ 1.91 1.91

16
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Σ=80.18%

Características de tablas y gráficas estadísticas


 Encabezado: contenido de los datos (de qué hablan los datos, víctimas, edades)
 Localidad: Zona centro de Guadalajara.
 Fecha o periodo: 2010
 Fuente: ¿cómo o de dónde obtuvimos los datos?, Y puede ser directa cuando nos constan los
datos de la encuesta e indirecta, de una agencia, un libro, revista, periódico, etc.

Formas de presentar los datos


Gráfica de barras, histograma, polígono de frecuencia y gráfica de pastel (o pay).

NÚMERO DE PERSONAS ENCUESTADAS EN LA ZONA CENTRO DEL MUNICIPIO DE GUADALAJARA, (POR


EDADES) DE QUIENES POR CAUSA DE ALGUNA ENFERMEDAD SE VIERON OBLIGADAS A FALTAR A SU
TRABAJO O ESCUELA POR LO MENOS UN DÍA, EN EL ÚLTIMO MES
(ENCUESTA REALIZADA EN AGOSTO DE 2014)

En las gráficas de barras, se debe presentar un eje “X” que es el mayor y un eje “Y”. En el
primero, 25 van las frecuencias y en el eje horizontal van los intervalos de
edades. 20
15
10
5
0
0-12 13-25 26-39 40-53

Para el polígono de frecuencia se encuentran y se señalan los puntos en el cruce de marca de clase de
cada intervalo, y su respectiva frecuencia y se unen los puntos.

En la gráfica de pastel 360º son


equivalentes al 100% por lo que se divide la frecuencia de cada intervalo entre el total de datos y el
resultado se multiplica por 360º

22/ 43 = .5116 X 360 = 183.6

17
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

12/ 43 = .2790 X 360 = 97.2

09/ 43 = .2090 X 360 = 72

Total = 360° grados

Los resultados pueden anotarse dentro o fuera de la gráfica y ésta puede estar a colores, con su
correspondiente indicador.

Fuente: Directa, por medio encuesta

f = Frecuencia fa = Frecuencia fr = Frecuencia


Intervalos
absoluta acumulada relativa
12-25 22 22 22/43
26-39 12 34 12/43
40-53 9 43 9/43

Preguntas de unidad
1. Las gráficas de barras e histogramas no son la misma cosa, explique y
ejemplifique sus similitudes y diferencias.
2. Desarrolle una tabla de datos de un tema y realice las siguientes actividades:
a. Hacer una gráfica de acuerdo a los datos
b. ¿Por qué eligió este tipo de gráfica?
c. Calcule las medidas de dispersión y centralización que se hayan
visto en esta unidad.
3. Seleccione el mejor tipo de gráfica para los siguientes ejemplos:
a. Temperatura de pacientes con gripe
b. Edad de alumnos fumadores
c. Porcentaje de robos por zonas en Guadalajara

18
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Planteamiento del problema y prueba de hipótesis

Sirve y se utiliza para conocer el comportamiento semejante o diferente entre las muestras, pero con
niveles de confianza menores al 100%, por lo general 95% y 99%. Usualmente se plantea la Hipótesis
nula al iniciar el problema (Ho)

Hipótesis nula: Ho
Siempre afirma que las muestras comparadas actúan de manera semejante ante una situación específica
comparada y con un nivel o grado de confianza que se preestablece desde el principio. Por lo general se
plantea al principio, con su nivel o grado de confianza.

Cuando se realiza la prueba estadística y las desviaciones son mayores que la que establece la tabla de
grados de libertad, en ese momento esta se invalida y se plantea la hipótesis alternativa (Hi), conocida
también como hipótesis de investigación.

Hipótesis alternativa: Hi
La hipótesis alternativa a firma que las muestras actúan o se comportan de manera diferente ante una
situación comparada; esto comprobado en el mismo nivel o grado de confianza que se establece al
principio, desde que planteamos la hipótesis nula.

Cuando las diferencias si son significativas por “f” el resultado, o porque estas rebasen lo establecido por
grados de libertad, se plantea la hipótesis alternativa o de investigación (Hi) que afirma que las muestras
comparadas, sí son diferentes, es decir que no son semejantes.

Grado de Libertad
Se toma de 2 muestras a comparar y posteriormente cuando ya se obtenga el resultado se tendrá que
auxiliar de la tabla de valores críticos de t, para saber el resultado y poder ser comparado con el
resultado del cociente t: 𝑔𝑙 = (𝑛 − 1) + (𝑛 − 1)

Pasos a seguir:

1. Se plantea la hipótesis, como se mencionó, se establece la nula al principio


2. Establecer grado de libertad, estos determinan la diferencia máxima permitida

Cociente T
Prueba paramétrica, para conocer el comportamiento entre dos muestras ante una situación común.

Características: Se utiliza para muestras grandes y para muestras chicas

 Se puede aplicar a muestras de igual o de diferente tamaño


 Sirve para comparar 2 muestras
 Es una prueba paramétrica
 Se plantea desde el principio la Hipótesis nula (Ho) con su nivel o grado de confianza

Fórmula general:
𝑥̅ − 𝑦̅
𝑡=
𝑆𝑥̅ 𝑦̅𝑑𝑖𝑓
19
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Errores en los que no debemos caer


1. Aceptar una hipótesis nula como válida cuando las diferencias si son significativas.
2. Rechazar una hipótesis nula cuando las diferencias no son significativas.

Ejemplo:

1. Se requiere saber si la condición bajo la cual se hace la acción de donar es o no influenciada por
la condición bajo la cual se haga; para ello se observan dos grupos de donadores, uno integrado
por ocho donadores conocidos, y otro por nueve donadores anónimos. Realizar al 95% de
confianza.

X= Conocidos
Y=desconocidos

a) Plantear la Hipótesis, se aconseja la nula

Ho= “La actitud caritativa de los donadores no se ve influenciada por la condición bajo la cual se haga o
se done”
X X2 Y Y2
5 25 3 9
3 9 5 25
8 64 8 64
7 49 2 4
2 4 1 1
9 81 3 9
7 64 2 4
6 36 4 16
3 9
Sumatoria 47 332 31 141
Promedio 5.875 41.5 3.44 15.67

b) Establecer los grados de libertad

𝑔𝑙 = (𝑛 − 1) + (𝑛 − 1)
𝑔𝑙 = (8 − 1) + (9 − 1)

𝑔𝑙 = 15  Tabla T = 1.753

c) Obtener la desviación estándar

∑ 𝑥2 332
𝑆𝑥 = √ − 𝑥̅ 2 = √ − (5.87)2 = √41.5 − 34.46 = √7.04 = 2.65
𝑛 8

∑ 𝑦2 141
𝑆𝑦 = √ − 𝑦̅ 2 = √ − (3.44)2 = √15.67 − 11.83 = √3.84 = 1.96
𝑛 9

20
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

d) Obtener el error estándar

𝑆 2.65 2.65 2.65


𝑆𝑥̅ = = = = =1
√𝑛 − 1 √8 − 1 √7 2.65
𝑆 1.96 1.96 1.96
𝑆𝑦̅ = = = = = 0.69
√𝑛 − 1 √9 − 1 √8 2.83
e) Obtener el error estándar de la diferencia

𝑆𝑑𝑖𝑓𝑥̅ 𝑦̅ = √𝑆𝑥̅ 2 + 𝑆𝑦̅ 2 = √(1)2 + (0.69)2 = √1 + 0.48 = √1.48 = 1.22

f) Sacar el cociente T

𝑥̅ − 𝑦̅ 5.87 − 3.44 2.43


𝑡= = = = 1.99
𝑆𝑑𝑖𝑓𝑥̅ 𝑦̅ 1.22 1.22

El límite máximo que se había sacado era de 1.753, si se rebasa se anula la Ho y se plantea la Hi. El
resultado es 2.23, mayor a comparación de 1.753, por lo tanto se rechaza la Ho y se establece la Hi.

Hi= “La actitud de los donadores sí se ve influenciada por la condición bajo la cual se done, comprobado
con un nivel o grado de confianza del 95%, es decir los donadores conocidos son más caritativos que los
anónimos”.

2. Se someten varios niños a terapia para la depresión infantil, se les da el mismo tratamiento y se
separan en niños y niñas; ambos grupos se observan desde el primer día para ver cuánto se
tardan en recuperarse. Realizar al 95% de confianza.
X=Niñas
Y=Niños

Ho= “El sexo de los niños no influye en el tiempo de recuperación por una depresión infantil”.

X X2 Y Y2
4 16 7 49
6 36 2 4
5 25 1 1
3 9 4 16
7 49 1 1
2.5 6.25 2 4
8 64 3 9
7 49
Sumatoria 42.5 254.25 20 84
Promedio 5.31 31.78 2.86 12

𝑔𝑙 = (𝑛 − 1) + (𝑛 − 1)
𝑔𝑙 = (8 − 1) + (7 − 1)

21
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

𝑔𝑙 = 13  Tabla T = 1.77

∑ 𝑥2 254.25
𝑆𝑥 = √ − 𝑥̅ 2 = √ − (5.31)2 = √31.78 − 28.2 = √3.58 = 1.89
𝑛 8

∑ 𝑥2 84
𝑆𝑥 = √ − 𝑥̅ 2 = √ − (2.86)2 = √12 − 8.18 = √3.82 = 1.95
𝑛 7

𝑆 1.89 1.89 1.89


𝑆𝑥̅ = = = = = 0.71
√𝑛 − 1 √8 − 1 √7 2.65
𝑆 1.95 1.95 1.95
𝑆𝑦̅ = = = = = 0.80
√𝑛 − 1 √7 − 1 √6 2.45

𝑆𝑑𝑖𝑓𝑥̅ 𝑦̅ = √𝑆𝑥̅ 2 + 𝑆𝑦̅ 2 = √(0.71)2 + (0.80)2 = √0.5 + 0.64 = √1.14 = 1.07


𝑥̅ − 𝑦̅ 5.31 − 2.86 2.45
𝑡= = = = 2.29
𝑆𝑑𝑖𝑓𝑥̅ 𝑦̅ 1.07 1.07
El límite máximo que se había sacado era de 1.77, si se rebasa se anula la Ho y se plantea la Hi. El
resultado es 2.29, mayor a comparación de 1.77, por lo tanto se rechaza la Ho y se establece la Hi. Hi=
“La recuperación a una depresión infantil por parte de los niños sí se ve influenciada por su sexo,
comprobado con un nivel o grado de confianza del 95%, es decir las niñas tienden a recuperarse más
lentamente que los niños”.

22
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Probabilidad
La “posibilidad” no es medible y la “probabilidad” puede medirse con cierto grado de confianza.
Entonces la probabilidad es una posibilidad medible. Se basa en dos cosas:

a) Observación de hechos o sucesos anteriores en relación a los esperados.


b) En los
sucesos
posibles
Ejercicio: en base
a los
Se quiere saber si influye el hecho de que una persona guarde reposo o no guarde
reposo, en el tiempo de recuperación después de haber sufrido una fractura de
2do grado.

Y= No guardan reposo
X= Si guardan reposo
X X2 Y Y2
4 2
2 8
3.5 6
2.5 9
6 5
4 4
5 6
Sumatoria
Promedio

Ho= El hecho de mantener reposo o no, después de sufrir una fractura de 2do
grado no influye con el tiempo de recuperación. Comprobar o rechazar dicha
hipótesis con un grado de confianza del 95%.

esperados.

SE= suceso esperado


SO= suceso observado
SP= suceso posible

Ejemplos:

1. Probabilidad de lluvia el 16 de junio de 1999 en base a la observación de los 16 de junio de los


últimos 10 años anteriores.

89 90 91 92 93 94 98 96 97 98
SI NO NO NO SI NO SI NO NO SI

𝑆𝐸
=1
𝑆𝑂

23
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

La suma de que SI llueva o que NO llueva es el 100%, es decir = 1.


𝑆𝐸 𝑆𝑖 4
= = = Hay un 40% de probabilidad de que SI llueva
𝑆𝑂 10 10
𝑆𝐸 𝑁𝑜 6
= = = Hay un 60% de probabilidad de que NO llueva
𝑆𝑂 10 10
𝑆𝐸
2. Probabilidad de que caiga un lado u otro de una moneda. En este caso se utilizará , ya que
𝑆𝑃
no contamos con casos observados y nos basamos en los únicos resultados posibles.

𝑆𝐸 Á𝑔𝑢𝑖𝑙𝑎 1
= = = Hay un 50% de probabilidad de que caiga Águila al lanzar una moneda
𝑆𝑃 Á𝑔𝑢𝑖𝑙𝑎 𝑜 𝑆𝑒𝑙𝑙𝑜 2

3. Probabilidad de que caiga cierta cara de un dado al lanzarlo.

𝑆𝐸 3 1
= = = Hay un 16.67% de que caiga 3 al lanzar el dado
𝑆𝑃 1,2,3,4,5 ó 6 6

Probabilidad conjunta
Es igual a la multiplicación de las probabilidades individuales.

Ejemplo:

1. ¿Cuál es la probabilidad de que al lanzar un dado y una moneda simultáneamente caiga un 3 en


el dado y águila en la moneda?

1
Probabilidad del 3 en el dado =
6
1
Probabilidad de águila en la moneda =
2
1 1 1
Probabilidad Conjunta = (
6
) (2) = 12
2. En una baraja de 52 cartas, en la que se tienen 4 cartas del mismo tipo (ejemplo 4 reyes), ¿Cuál
es la probabilidad de sacar un rey, sin meter el rey sacar un as, y sin meter ni el rey ni el as sacar
otro rey?

4
Sacar un rey =
52
4
Sacar el as sin meter el rey =
51
3
Sacar otro rey sin meter el rey ni el as =
50
4 4 3 48 2
Probabilidad Conjunta = (
52
) (51) (50) = 132600
=
5525
¿Y cuál es la probabilidad de que lo anterior no suceda?
48 47 47 106032 4418
( )( )( ) = = = 99.98%
52 51 50 132600 5525

24
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

X2 Chi Cuadrada
Es una prueba estadística no paramétrica que solo requiere que los elementos que integran las muestras
contengan alguna característica en común, por ejemplo hombres y mujeres, universitarios y no
universitarios.

Características:

 No requiere que las muestras sean de gran tamaño.


 No requiere muestras de igual tamaño
 Se debe plantear desde el principio la Ho con su nivel o grado de confianza.

Fórmula Directa:

2
𝑁(𝐴𝐷 − 𝐵𝐶)2
𝑥 =
(A + B)(A + C)(B + D)(C + D)
Ejemplo:

Se requiere saber si la actitud política e ideológica de los padres influye o no respecto a la elección del
método de crianza para educar a sus hijos. Para ello observamos dos muestras: la primera integrada por
20 papás conservadores, y la segunda por 21 liberales.

c=Columnas r=Renglones
Método de Crianza Conservadores Liberales
Flexible (A) 5 (B) 14
Rígido (C) 15 (D) 7

Ho= “La actitud política e ideológica de los padres no influye respecto al método de crianza para educar a
sus hijos”

𝑔𝑙 = (𝑐 − 1)(𝑟 − 1)
𝑔𝑙 = (2 − 1)(2 − 1)
𝑔𝑙 = (1)(1) = 1  Tabla x2 =3.841

𝑁(𝐴𝐷 − 𝐵𝐶)2
𝑥2 =
(A + B)(A + C)(B + D)(C + D)

2
5+15 + 14 + 7([5][7] − [14][15])2
𝑥 =
(5 + 14)(5 + 15)(14 + 7)(15 + 7)
41(35 − 210)2
𝑥2 =
(19)(20)(21)(22)
41(−175)2
𝑥2 =
175560
1255625
𝑥2 = = 7.15
175560

25
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

El límite máximo que se había sacado era de 3.841, si se rebasa se anula la Ho y se plantea la Hi. El
resultado es 7.15, mayor a 3.841, por lo tanto se rechaza la Ho y se establece la Hi.

Hi= “La actitud política e ideológica de los padres influye respecto a la elección del método de crianza
para educar a sus hijos, comprobado con un nivel o grado de confianza del 95%, es decir los liberales
tienden a ser más flexibles que los conservadores, éstos últimos son más rígidos”.

Prueba de la mediana
La mediana es el valor de la variable que deja el mismo número de datos antes y después que él al estar
ordenados, ya sea en forma ascendente o descendente.

Ejemplo:

Se convoca a los estudiantes de Psicología a un concurso de aficionado al canto con un jurado de


expertos con temas alusivos al amor. Para ello se medirá tiempo que los participantes estén dispuestos a
estar cantando; a menor tiempo cantado es igual a mayor nerviosismo turbaciones; a mayor tiempo
cantado menor nerviosismo.

X= hombres =3’, 9’, 12’, 17’, 21’, 14’, 22’


Y= mujeres =15’, 3’, 5’.8’, 7’, 6’, 12’, 11’

1. Ordenar
3,3,5,6,7,8,9,11,12,12,14,15,17,21,22

2. El elemento mediana significa sobre


𝑛 + 1 15 + 1 16
= = =8
2 2 2
El resultado nos indica la posición de la mediana, en este caso es el número 11

Posición de los datos X Y


Sobre la Mediana 5 3
Bajo la Mediana 2 5

3. Plantear la Hipótesis

Ho= “El nerviosismo mostrado entre hombres y mujeres es muy semejante cuando se les somete a una
prueba en la que miden el tiempo que pueden permanecer cantando.”

4. Establecer el grado de libertad

𝑔𝑙 = (𝑐 − 1)(𝑟 − 1)
𝑔𝑙 = (2 − 1)(2 − 1)
𝑔𝑙 = (1)(1) = 1  Tabla de X2 = 3.84

5. Utilizar Fórmula Directa de X2

𝑁(𝐴𝐷 − 𝐵𝐶)2 5 + 3 + 2 + 5([5][5] − [3][2])2 15(25 − 6)2 15(19)2


𝑥2 = = = =
(𝐴 + 𝐵)(𝐴 + 𝐶)(𝐵 + 𝐷)(𝐶 + 𝐷) (5 + 3)(5 + 2)(3 + 5)(2 + 5) (8)(7)(8)(7) 3136
15(361) 5415
= = = 1.727
3136 3136
26
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

6. Utilizar fórmula general de X2

2
∑ (𝑓𝑜 − 𝑓𝑒)2
𝑥 =
𝑓𝑒
𝐹𝑜 = 5, 3, 2, 5
(𝑇𝑀𝑅)(𝑇𝑀𝐶)
𝐹𝑒 =
𝑁

27
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Ejercicio:
1. Se quiere saber si el uso de protección por trabajadores de obras públicas
marca una diferencia en el número de accidentes, con respecto a los que no
lo usan.

M1=trabajadores que usan protección


M2=trabajadores que no usan protección

M1 M2
19 10
6 12

Ho= No existe diferencia significativa en el número de accidentes ocurridos en


personas que por el uso o carencia de medidas de seguridad con relación al número
de accidentes. Resolver con un nivel o grado de confianza de 95%

2. Se requiere saber si existe una diferencia significativa en el número de


trabajadores que no sufren y sufren accidentes (los cuales pueden ser:
leves, graves), donde se distinguen dos grupos de trabajadores: uno que usa
protección y otro grupo que no usa protección.

M1= trabajadores que usan protección


M2= trabajadores que no usan protección

Situación M1 M2
Sin accidentes 20 14
Con accidentes
7 6
leves
Con accidentes
5 14
graves

Ho= no existe diferencia significativa en el número de accidentes marcada por el


uso de protección o carencia de la misma. Resolver con un nivel o grado de
confianza de 95%.

28
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Análisis de varianza en dos o más direcciones por rangos de Friedman


Este análisis de Varianza sirve o se utiliza cuando se requiere comprobar si una muestra sufre cambios o
no, significativos ante dos o más direcciones.

Características:
 No se requiere que la muestra sea muy grande
 Se plantea desde un principio la Ho con su nivel o grado de confianza

Fórmula:
12 2
𝑋2𝑟 = ( ∑ [∑ 𝑟𝑖] ) − 3𝑁(𝑘 + 1)
3𝑁(𝑘 + 1)
En donde N = Muestra total, ri = Rango infinito, y k = Número de condiciones bajo la cual se mide la
muestra.
Ejemplo:

Se requiere saber si existe o no relación entre el nivel de violencia percibido por los niños y su grado de
hostilidad manifiesta, para ello hemos diseñado un test psicométrico en tres versiones semejantes. De
los resultados se interpretarán en base a lo siguiente:

20=nada de hostilidad 40=hostilidad medio 60=máxima hostilidad manifiesta

Violencia Baja R1 Violencia R2 Violencia alta R3


Mediana
A 30 3 35 2 40 1
B 35 3 40 2 45 1
C 50 1 35 3 40 2
D 25 3 30 2 35 1
E 20 3 25 2 30 1
F 25 3 30 1.5 30 1.5
G 35 3 40 2 45 1
H 40 1 30 3 35 2
I 30 3 35 2 40 1
J 25 3 30 2 35 1
∑R1=26 ∑R2=21.5 ∑R3=12.5

Ho= El nivel percibido de violencia de los niños no influye respecto a la hostilidad manifiesta. Esto
afirmado con un nivel de confianza del 95%.

𝑔𝑙 = 𝑘 − 1

𝑔𝑙 = 3 − 1 = 2  En base a la tabla X2 = 5.99


12 2
𝑋2𝑟 = ( ∑ [∑ 𝑟𝑖] ) − 3𝑁(𝑘 + 1)
3𝑁(𝑘 + 1)
12
𝑋2𝑟 = ( [(26)2 + (21.3)2 + (12.5)2 ]) − 3[10](3 + 1)
3(10)(3 + 1)
12
𝑋2𝑟 = ( [676 + 453.69 + 156.25]) − 30(4)
(30)(4)
29
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

12
𝑋2𝑟 = ( [1285.94]) − 120
120
𝑋 2 𝑟 = ( 0.1 [1285.94]) − 120
𝑋 2 𝑟 = ( 128.59) − 120
𝑋 2 𝑟 = 8.59
Podemos notar que el resultado es mayor al obtenido por grados de libertad, por lo tanto se rechaza la
Ho y se establece Hi: Si influye el grado violencia percibida por los niños y su hostilidad manifiesta en
ellos con un 95% de grado de confianza.

Ejercicio:

Se requiere saber si existe una diferencia significativa en el tiempo de


recuperación de unos pacientes sometidos a un tratamiento con 3 dosis
diferentes.

X 1D R1 2 R2 3D R3
D
A 12 1 1 2 8 3
0
B 8 3 1 1.5 10 1.5
0
C 13 2 1 2 13 2
3
D 10 1 8 2 7 3
E 9 1 7 2 6 3
F 3 1 2 2 1 3
G 5 1 3 2 2 3
H 10 1 9 2 8 3
I 9 1 8 2 6 3
J 8 1 6 2 4 3
∑R1=13 ∑R2=19.5 ∑R3=27.
5

Ho= No hay diferencia significativa en la dosis con respecto a los días de


recuperación, esto con un nivel o grado de libertad del 95%

30
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Análisis de varianza en una dirección por rangos de Kruskal Wallis


Características:
 Esta prueba no paramétrica se utiliza para conocer si dos o más muestras actúan de manera
semejante o diferente ante una situación común.
 No requiere muestras de gran tamaño
 No se requiere que sean iguales
 Se plantea la Hipótesis nula desde el principio.

Fórmula:
2
12 ∑ 𝑟𝑖
𝐻=( ∑[ ] ) − 3(𝑁 + 1)
𝑁(𝑁 − 1) 𝑛

En donde N = Muestra total, ri = Rango infinito, n = Cantidad de elementos de cada muestra, y k =


Número de condiciones bajo la cual se mide la muestra.

Ejemplo:

Se requiere saber si hay o no relación entre la edad de las personas y la facilidad o dificultad para que
estas obtengan un empleo de base. Para ello observamos tres grupos diferenciados por la edad.

Adultos R1 Adultos R1 Adultos R1


Jóvenes Medianos Seniles
15 16 4 3 1 1
3 2 14 15 17 17
5 4 27 22 11 12
6 5 21 19.5 29 23
10 10 18 8 31 24
11 12 13 4 26 21
7 6 11 12 40 25
9 8.5 8 7 21 19.5
∑R1=63.5 9 8.5 ∑R3=142.5
∑R2=99

Ho= La edad no influye respecto a la facilidad o dificultad para que estas personas obtengan un empleo
de base. Afirmado con un grado o nivel de confianza del 95%

𝑔𝑙 = 𝑘 − 1
𝑔𝑙 = 3 − 1 = 2 En base a la tabla X = 5.991
2

2
12 ∑ 𝑟𝑖
𝐻=( ∑[ ] ) − 3(𝑁 + 1)
𝑁(𝑁 − 1) 𝑛
12 63.52 992 142.52
𝐻=( [( )+( )+( )]) − 3(25 + 1)
25(25 − 1) 8 9 8
12
𝐻=( [504.03 + 1089 + 2538.28]) − 3(26)
25(24)
12
𝐻=( [4131.31]) − 78
600

31
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

( 0.02 [4131.31]) − 78
𝐻 = 82.62 − 78 = 4.62
Observamos que el resultado obtenido es menor al que sacamos con el grado de libertad, por lo que la
Ho se respeta: = La edad no influye respecto a la facilidad o dificultad para que estas personas obtengan
un empleo de base.

Ejercicio:

Se quiere saber influye la edad para que los medicamentos tengan un mejor
efecto y tengan un tiempo de saneamiento diferente. Todo esto ante un mismo
tratamiento.

G1= adolescentes
G2= jóvenes
G3= adultos

G1 R1 G2 R2 G3 R3
5 5 10 11.5 2 2
7 8.5 17 19 22 26
21 24 21 24 25 28
3 3 30 30 18 20
4 4 20 22 23 27
6 6.5 13 16.5 11 13.5
7 8.5 9 10 13 16.5
10 11.5 6 6.5 1 1
12 15 11 13.5 29 29
19 21 15 18 40 31
∑R1=107 ∑R2=171 21 24
∑R3=218

Ho= No influye la edad para que las personas que sufren una enfermedad en
común con un mismo tratamiento tarden diferente tiempo en recuperarse, esto
con un nivel o grado de confianza de 95%

32
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Correlación
Relación existente entre 2 variables donde una, por lo general “x”, es la variable independiente a “y”
que es la variable dependiente. También nos sirve para medir la correlación o la relación existente entre
dos muestras, sirve para predecir o estimar el comportamiento de la variable dependiente Y, en relación
del conocimiento de la variable X independiente.

No obstante, saber si existe una asociación entre las variables, lo importante es que esta puede ser
medible por la “R” Pearson. Ejemplo a mayor estatura mayor peso, a mayor grado de estudios mayor
nivel de ingresos, etc.

Fórmula de correlación:

∑ 𝑥 2 − 𝑥̅ 2
σ= √
𝑛

Fórmula de la R de Pearson:
Σ(𝑧𝑥)(𝑧𝑦)
𝑅=
𝑁
Ejemplo:

“A mayor grado de estudios de los papás, mayor grado de estudios de los hijos”

x x² Zx Y y² Zy (Zx)(Zy)
10 100 -0.07 12 144 -0.23 0.01
6 36 -0.79 9 81 -0.86 0.67
3 9 -1.33 15 225 -0.38 0.50
6 36 -0.79 6 36 -1.43 1.16
15 225 0.82 12 144 -0.23 -0.18
20 400 1.72 22 484 1.84 3.16
13 169 0.46 16 256 0.84 0.27
S=73 S=975 S=92 S=1370 S=4.59
𝑥̅ =10.42 𝑦̅=13.14

∑ 𝑥 2 − 𝑥̅ 2 975 − (10.42)2 975 − 108.58 866.42


σ𝑥 = √ =√ =√ =√ = √123.77 = 11.13
𝑛 7 7 7

∑ 𝑦 2 − 𝑦̅ 2 1370 − (13.14)2 1370 − 172.66 1197.84


σ𝑦 = √ =√ =√ =√ = √171.05 = 13.08
𝑛 7 7 7

(𝑧𝑥)(𝑧𝑦) 4.59
𝑅= = 𝑅= = 0.66
𝑁 7
En base al resultado anterior tenemos que existe para esta muestra un 0.66% de correlación entre papás
e hijos.

33
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Ecuación de Regresión
Sirve para conocer o saber el valor estimado de “y” en base al valor a “x”. Esta entrada estadística no
paramétrica sirve o se utiliza para conocer el comportamiento de dos o más muestras en una situación
común a ambas.

Fórmula:

Ejercicio:

Inventar una medida para ver la frecuencia del estrés. Estrés de los hijos en
relación a estrés de los padres, tomando de referencia al primogénito.

X X² Zx Y Y² zy (zx)(zy)
5 25 +-1.40 8 68 -1.05
17 289 +-.28 3 169 .04
23 529 1.12 20 400 .5
6 36 -1.26 8 64 -1.05
16 256 .14 14 196 -.27
13 169 .28 18 324 .24
25 62 2.05 32 1024 1.40
S=

𝑠𝑦 𝑠𝑦
𝑋 = (𝑟 [ ] 𝑦) − (𝑟 [ ] 𝑥̅ ) + 𝑦̅
𝑠𝑥 𝑠𝑥
𝑠𝑦 𝑠𝑦
𝑌 = (𝑟 [ ] 𝑥) − (𝑟 [ ] 𝑥̅ ) + 𝑦̅
𝑠𝑥 𝑠𝑥

34
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Ejercicio:

En base a los resultados obtenidos en el ejercicio de correlación y R de Pearson,


realizar las ecuaciones de regresión para X y Y, cuando X=12 y Y=27

35
Anexos
Cuestionario de Bioestadísticas
1. Desarrolla o explica las características que integran el diseño muestral.
Se encuentra integrado por errores de muestreo y errores de no muestreo.

 Errores de muestreo: Tamaño de la muestra y tipo de muestreo.


 Errores de no muestreo: Capacitación de encuestadores, diseño de cuestionario y
recursos
 Tamaño de la muestra: Tipo de población y nivel o grado de confianza.
 Tipos de muestreo: Al azar aleatorio, al azar aleatorio ordenado, al azar aleatorio
sistematizado, por conglomerado, muestreo estratificado y muestreo combinado.

2. Desarrolla y explica de que elementos depende el tamaño de la muestra.


Depende del tamaño de la población pero más del nivel o grado de confianza.

3. Desarrolla cada uno de los tipos de muestreo.


 Al azar aleatorio: Todos los elementos de la población tienen la misma probabilidad de ser
elegido como parte de la muestra.
 Al azar aleatorio ordenado: Es igual al anterior pero lleva un orden.
 Al azar aleatorio ordenado sistematizado: Es igual al anterior pero con un sistema.
 Muestro por conglomerado o agrupamiento: Igual al anterior pero con la característica de
la que el grupo encuestado sea específico.
 Muestreo estratificado: Es igual al anterior pero afirma que como la población no es
homogénea sino heterogénea se deben considerar lo diversos estratos de la misma y de
ser posible en proporción a la población.

4. Enuncia por lo menos nueve características del cuestionario.


1) Debe tener encabezado
2) No debe tener una pregunta más, ni una pregunta menos de las que se requieran.

A
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

3) Debe estar basado en el planteamiento del problema.


4) Debe estar integrado por preguntas cerradas.
5) Debe contener algunas preguntas abiertas.
6) Todo cuestionario es piloto hasta que se pruebe que esta bien elaborada.
7) Las preguntas deben de ser claras, precisas, cortas, con lenguaje estándar.
8) Ninguna pregunta debe negar, ni inducir a la repuesta.
9) La secuencia de las preguntas debe ser de la más sencilla a la más complicada.

5. Desarrolla en que consiste la capacitación de los encuestadores.


Deben conocer el contenido de la investigación, deben tener ética. Es importante considerar el
tiempo, los recursos humanos, el material y los recursos financieros.

6. ¿Por qué es importante considerar los recursos en la encuesta?


Porque sin ellos no se puede realizar ninguna actividad.

7. ¿Qué es la muestra?
Es una parte de la población que contiene teóricamente las mismas características de la población
que se desea estudiar. Sus medidas reciben el nombre de estadísticos.

8. ¿Qué es estadística en relación a la teoría?


Es un instrumento de apoyo que sirve para describirla, representar los datos, hacer análisis más
concretos, para obtener conclusiones con mejores bases y que además con el conocimiento de la
muestra podemos inferir comportamiento de poblaciones.

9. Desarrolla las características de la estadística descriptiva


Son actividades estadísticas encaminadas a describir cuantitativamente una serie de personas,
lugares o cosas.

10. Desarrolla el concepto de estadística descriptiva inferencial.


No se puede inferir algo que ya está descrito

11. Desarrolla la estadística paramétrica descriptiva.


Es aquella estadística paramétrica medible que podemos representar en tablas o gráficas
estadísticas

12. Desarrolla lo que es inferencia estadística.


Es conocer el comportamiento de la población en base al conocimiento del comportamiento de la
muestra pero con niveles de confianza menores al 100 %.

13. Desarrolla lo que son las medidas de tendencia central.


 Media aritmética: También se le llama media. Es la medida de tendencia central que se
encuentra con más frecuencia; se calcula sumando lo valores para los cuales se desea la
media y dividiendo el resultado por el número de valores que entran en la suma.
 Mediana: Es aquel valor que se encuentra en la mitad de una muestra o población cuyos
valores están ordenados, en orden de magnitud (significa el lugar).
 Moda: Es el valor que aparece con mayor frecuencia en un grupo de datos.

B
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

14. Desarrolla el concepto de las medidas de dispersión o variabilidad.


Son medidas en que los valores individuales se desvían de la media aritmética.

 Rango, o amplitud total: Es la distancia que existente entre el dato mayor y el dato menor.
 Desviación estándar: Es igual a la raíz cuadrada de la varianza.
 Error estándar: Es igual a la desviación estándar entre la raíz cuadrada de n menos uno.

15. ¿Qué es probabilidad?


Es una posibilidad medible que se basa en la observación de los hechos o sucesos anteriores en
relación a los sucesos esperados (Tiene una base o fundamento).

16. ¿Qué es probabilidad conjunta?


Es la multiplicación de las probabilidades individuales.

17. ¿Qué es probabilidad condicional?


Es la probabilidad conjunta que además depende de los sucesos anteriores.

18. ¿Qué es ó en qué consiste la utilización de los niveles de confianza preestablecidos del
90%, 95% y 99%?

19. ¿Para qué sirve la utilización del cociente Z?


Es el nivel de confianza requerido para generalizar los resultados hacia toda la población.

20. ¿En qué condiciones o para qué se utiliza el cociente T o T de estudio?


Para conocer el comportamiento de dos muestras ante una situación común a ambas.

21. ¿Qué es una prueba de hipótesis?


Es comprobar sistemáticamente nuestras hipótesis acerca de la naturaleza de la realidad social,
aún aquellas que parezcan lógicas, verdaderas o evidentes por si mismas.

22. ¿Qué es una hipótesis nula?


La que nos afirma que dos o más muestras se comportan de manera semejante ante una situación
común a ambas. Esto con niveles o grados de confianza de 95 y 99 %, por lo tanto la hipótesis nula
niega diferencias de comportamiento significativa entre las muestras.

23. ¿Qué es una hipótesis alternativa?


Se formula cuando la hipótesis nula es desechada y nos afirma (dos o más muestras actúan de
manera diferente ante está situación en común) con el mismo nivel o grado de confianza
planteado desde la hipótesis nula.

24. ¿Cuales son los tipos de errores en los que no debemos caer?
Error uno, rechazar una hipótesis nula cuando esta tiene o debería ser aceptada y el error dos,
aceptar una hipótesis como valida o verdadera cuando esta debió haber sido rechazada.

25. ¿Que es una correlación?

C
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Es una asociación existente entre dos variables en donde por lo general X es la variable
independiente y la Y es la variable dependiente.

26. Desarrolla lo que es una ecuación de regresión.


Se utiliza para un problema de predicción múltiple en la que entran las tres variables, es decir, de
esa ecuación de regresión múltiple: se puede predecir un valor X para toda persona. La correlación
entre estos valores predichos (X1) y los obtenidos (X1). Esta es otra interpretación de un
coeficiente de correlación múltiple.

27. Desarrolla la estadística no paramétrica.


Es la estadística que no requiere sólo elementos paramétricos o medibles, sólo requiere que los
elementos se integren en las muestras que tengan una característica en común.

28. Desarrolla lo que es chi cuadrada.


Esta entrada estadística no paramétrica sirve o se utiliza para conocer el comportamiento de dos
o más muestras en una situación común a ambas.

29. ¿Qué importancia tiene explicar adecuadamente el resultado?


Para conocer con mayor exactitud el comportamiento de la población con relación a un tema o
problema determinado.

30. Características que considero de un cuestionario para entrevista.


 Brevedad
 Claridad
 Concisa
 Opción Múltiple
 Tema en específico
 Coherente
 Con un diseño adecuado para obtener resultados concretos.
 Que no contenga sesgos es decir, que no este manipulado.

D
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Tablas Estadísticas
Cociente T
Gl 90% ó 0.10 95% ó 0.05 97.5% ó 0.025 99% ó 0.01 99.5% ó 0.005
1 3.078 6.314 12.706 31.821 63.657
2 1.886 2.920 4.303 6.965 9.925
3 1.638 2.353 3.182 4.541 5.841
4 1.533 2.132 2.776 3.747 4.604
5 1.476 2.015 2.571 3.365 4.032
6 1.440 1.943 2.447 3.143 3.707
7 1.415 1.895 2.365 2.998 3.499
8 1.397 1.860 2.306 2.896 3.355
9 1.383 1.833 2.262 2.821 3.250
10 1.372 1.812 2.228 2.764 3.169
11 1.363 1.796 2.201 2.718 3.106
12 1.356 1.782 2.179 2.681 3.055
13 1.350 1.771 2.160 2.650 3.012
14 1.345 1.761 2.145 2.624 2.977
15 1.341 1.753 2.131 2.602 2.947
16 1.337 1.746 2.120 2.583 2.921
17 1.333 1.740 2.110 2.567 2.898
18 1.330 1.734 2.101 2.552 2.878
19 1.328 1.729 2.093 2.539 2.861
20 1.325 1.725 2.086 2.528 2.845
21 1.323 1.721 2.080 2.518 2.831
22 1.321 1.717 2.074 2.508 2.819
23 1.319 1.714 2.069 2.500 2.807
24 1.318 1.711 2.064 2.492 2.797
25 1.316 1.708 2.060 2.485 2.787
26 1.315 1.706 2.056 2.479 2.779
27 1.314 1.703 2.052 2.473 2.771
28 1.313 1.701 2.048 2.467 2.763
29 1.311 1.699 2.045 2.462 2.756
30 1.310 1.697 2.042 2.457 2.750
40 1.303 1.684 2.021 2.423 2.704
60 1.296 1.671 2.000 2.390 2.660
120 1.289 1.658 1.960 2.326 2.617
ºº 1.282 1.645 1.960 2.326 2.576

E
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Tabla de X2
gl X2 X .0252 X .052 X .902 X .952 X .9752 X .992 X .9952
1 .0000393 .000982 .00393 2.706 3.841 5.024 6.635 7.879
2 .0100 .0506 .103 4.605 5.991 7.378 9.210 10.597
3 .0717 .216 .352 6.251 7.815 9.348 11.345 12.838
4 .207 .484 .711 7.779 9.488 11.143 13.277 14.860
5 .412 .831 1.145 9.236 11.070 12.832 15.086 16.750
6 .676 1.237 1.635 10.645 12.592 14.449 16.812 18.548
7 .989 1.690 2.167 12.017 14.067 16.013 18.475 20.278
8 1.344 2.180 2.733 13.362 15.507 17.535 20.090 21.955
9 1.735 2.700 3.325 14.684 16.919 19.023 21.666 23.589
10 2.156 3.247 3.940 15.987 18.307 20.483 23.209 25.188
11 2.603 3.816 4.575 17.275 19.675 21.920 24.725 26.757
12 3.074 4.404 5.226 18.549 21.026 23.336 26.217 28.300
13 3.565 5.009 5.892 19.812 22.362 24.736 27.688 29.819
14 4.075 5.629 6.571 21.064 23.685 26.119 29.141 31.319
15 4.601 6.212 7.261 22.307 24.996 27.488 30.578 32.801
16 5.142 6.908 7.962 23.542 26.296 28.845 32.000 34.267
17 5.697 7.564 8.672 24.769 27.587 30.191 33.409 35.718
18 6.265 8.231 9.390 25.989 28.869 31.526 34.805 37.156
19 6.844 8.907 10.117 27.204 30.144 32.852 36.191 38.582
20 7.434 9.591 10.851 28.412 31.410 34.170 37.566 39.997
21 8.034 10.283 11.591 29.615 32.671 35.479 38.932 41.401
22 8.643 10.982 12.338 30.813 33.924 36.781 40.289 42.796
23 9.260 11.688 13.091 32.007 35.172 38.076 41.638 44.181
24 9.886 12.401 13.848 33.196 36.415 39.364 42.982 45.558
25 10.520 13.120 14.611 34.382 37.652 40.646 44.314 46.928
26 11.160 13.844 15.379 35.563 38.885 41.923 45.642 48.290
27 11.808 14.573 16.151 36.741 40.113 43.194 46.963 49.645
28 12.461 15.308 16.928 37.916 41.337 44.461 48.278 50.993
29 13.121 16.047 17.708 39.087 42.557 45.722 49.588 52.336
30 13.787 16.791 18.493 40.256 43.773 46.979 50.892 53.672
35 17.192 20.5669 22.465 46.059 49.802 53.203 57.342 60.275
40 20.707 24.433 26.509 51.805 55.758 59.342 63.691 66.766
45 24.311 28.366 30.612 57.505 61.656 65.410 69.957 73.166
50 27.991 32.357 34.764 63.167 67.505 71.420 76.154 79.490
60 35.535 40.482 43.188 74.397 79.082 83.298 88.379 91.952
70 43.275 48.758 51.739 85.527 90.531 95.023 100.425 104.215
80 51.172 57.153 60.391 96.578 101.879 106.629 112.329 116.321
90 59.196 65.647 69.126 107.565 113.145 118.136 124.116 128.299
100 67.328 74.222 77.929 118.498 124.342 129.561 135.807 140.169

F
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Cociente Z
Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2518 .2549
0.7 .2580 .2612 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133
0.9 .3159 .3186 .3112 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4014
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4709
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.9 .4981 .4982 .4983 .4983 .4984 .4984 .4985 .4985 .4986 .4986

G
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

GUIA DE EXAMEN
1. Expón de manera clara la importancia de explicar el resultado.

2. De manera amplia, describe el concepto de Estadística.

3. Describe el concepto de población y el de muestra.

4. Resuelve: (Medidas de tendencia central, Medidas de desviación y dispersión, Graficar). –


16, 18, 25, 24, 31, 19, 32, 17, 18, 33, 18 -.

5. Describe las características y uso del Cociente T.

6. Explica con ejemplos en qué consiste el planteamiento o la prueba de hipótesis.

7. Explica en qué consiste el uso de la x2 (Chi cuadrada) como prueba no paramétrica.

8. Explica las características y el uso de la prueba de la mediana de x2 (Chi cuadrada).

9. Describe las características y el uso del análisis de varianza en 2 o más direcciones por
rango de Friedman.

10. Describe las características y el uso del análisis de varianza en una dirección de la prueba
de Kruskal Wallis.

11. Resuelve: Estima el valor de “y” con base en la ecuación de regresión.

r= 0.81
Ox= 4
Oy= 2
x= 15
y= 14
x= 3 y 23.
12. Explica en qué consisten los llamados errores de no muestreo del diseño muestral.

13. Ante una población estimada de 25,000 personas, y una varianza desconocida; encuentra
los tamaños de muestra a 4 niveles o grados de confianza de 95%, 96%, 97% y 98%.

Nunca consideres el estudio como una obligación, sino como una oportunidad
para penetrar en el bello y maravilloso mundo del saber.

Albert Einstein (1879-1955) Científico alemán nacionalizado estadounidense.

H
Glosario
A
Al Azar o Aleatorio: Son todos aquellos eventos fortuitos o productos de la suerte.

Aleatoriamente: Actividades o métodos producidos o llevados a cabo simulando un


comportamiento al azar.

Amplitud de variación: Se considera como el dato mayor menos el dato menor de todo el
conjunto de datos considerados en toda la muestra, si consideramos al dato menor de la muestra
y al dato mayor entonces la amplitud de variación estará determinada como:
𝐴 = 𝑙0 − 𝑙𝑛
Amplitud de clase: Se considera la amplitud que deben tener las clases consideradas para realizar
un estudio estadístico. Para n datos con k clases se determina que la amplitud de clase es igual a:
𝑘
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =
𝐴

B
Biología Matemática o Biomatemática: Área interdisciplinaria de estudios que se enfoca en
moldeamiento de los procesos biológicos utilizando técnicas matemáticas. Tiene grandes
aplicaciones teóricas y prácticas en la investigación biológica.

C
Clase: Subdivisión de escala de datos

Carácter estadístico: Es la propiedad que permite clasificar a los individuos de una población
estadística, puede haber de dos tipos:

 Cuantitativos: Aquellos datos que se pueden medir o expresarse mediante un número sin
tener que recurrir a la frecuencia con que ocurren.
 Cualitativos: Aquellos datos que no se pueden medir.

- 1-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Cartogramas: Son gráficos en los que se puede agrupar para una misma clase diferentes
frecuencias, por lo que se hace apropiado su uso cuando se desea analizar diferentes resultados
obtenidos, con diferentes frecuencias pero con una misma clase.

Censo: En el caso particular en que la muestra sea del mismo tamaño que la población el estudio
estadístico se conoce como censo.

Correlación: Cuando dos fenómenos sociales, físicos o biológicos crecen o decrecen de forma
simultánea y proporcional debido a factores externos, se dice que los fenómenos están
positivamente correlacionados. Si uno crece en la misma proporción que el otro decrece, los dos
fenómenos están negativamente correlacionados. El grado de correlación se calcula aplicando un
coeficiente de correlación a los datos de ambos fenómenos. Una correlación positiva perfecta
tiene un coeficiente + 1, y para una correlación negativa perfecta es -1. La ausencia de correlación
da como coeficiente 0. Por ejemplo, el coeficiente 0.89 indica una correlación positiva grande, -
0.76 es una correlación negativa grande y 0.13 es una correlación positiva pequeña.

Cuartiles: Son valores de la variable que dividen los datos ordenados en cuartos; cada conjunto de
datos tiene tres cuartiles. El primer cuartil, Q1, es un número tal que a lo sumo 25% de datos son
menores en valor que Q1y a lo suma 75% son mayores. El segundo cuartil es la mediana. El tercer
cuartil, Q3, es un número tal que a lo sumo 75% de los datos son menores en valor que Q3 y a lo
sumo 25% son mayores.

Cuartil medio: El valor número que está al centro entre el primer cuartil y el tercer cuartil:
𝑄1 + 𝑄3
𝐶𝑢𝑎𝑟𝑡𝑖𝑙 𝑚𝑒𝑑𝑖𝑜 =
2
Curva Normal: La forma prevista de la distribución normal.

D
Dato: Valor de la variable asociada a un elemento de una población o muestra. Este valor puede
ser un número, una palabra o un símbolo.

Datos: Son el conjunto de valores que se obtienen de la variable a partir de cada uno de los
elementos que pertenecen a la muestra.

Datos aleatorios: Es la obtención de datos realizada a partir de una población a los cuales no se les
ha dado ninguna prioridad.

Dato estadístico: Los datos que se considera participan en el estudio estadístico se conoce como
datos estadísticos, más concretamente, se consideran como los valores que se pueden obtenerse
de la observación para formar la muestra.

Desviación: Diferencia entre un valor y otro valor medio o típico.

Desviación Media: Es la media aritmética de las desviaciones desde la media en valores absoluto.

Desviación Típica: La desviación de un elemento del conjunto es su diferencia con respecto a la


medida; por ejemplo, en sucesión x1, x2, ..., xn la desviación de x1 es 𝑥1 − 𝑥, y el cuadrado de la

- 2-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

desviación es (𝑥1 − 𝑥 )2 . La varianza es la medida del cuadro de las desviaciones. Por último, la
desviación típica, representada por la letra griega sigma (ς), es la raíz cuadrada de la varianza, y se
calcula de la siguiente manera:
2 (∑ x)2
√∑ x − N
ς=
N
Si la desviación típica es pequeña, los datos están agrupados cerca de la media; si es grande, están
muy dispersos.

Diagramas de barras: Se utiliza para representar datos cualitativos y cuantitativos, con datos de
tipo discreto. En el eje x se representan los datos ordenados en clases mientras que en el eje y se
pueden representar frecuencias absolutas o relativas.

Distribución: Es el patrón de variabilidad que presentan los datos de una variable. La distribución
exhibe la frecuencia de cada valor de la variable.

Distribuciones de frecuencias: Se le conoce con este nombre al conjunto de clases que aparecen
con su frecuencia correspondiente, generalmente mediante una tabla estadística.

Distribución acumulativa de frecuencia: Distribución de frecuencia que parea las frecuencias


acumulativas con valores de la variable.

Diagrama de sectores: Este tipo de diagramas puede ser de dos tipo, se puede considerar una
figura geométrica en la que la información se distribuye dentro de la figura como puede ser una
dona o un anillo en el que cada porción dentro de la figura representa la información porcentual
del total de datos. La segunda opción es la utilización de pasteles en los que una porción del pastel
determinada por sectores individuales la información para ese sector específico.

Dicotomía: Se entiende como el proceso de categorizar a una variable en sus dos posibles valores
en contraposición que puede tomar la misma en estudio de una población.

DISEÑO MUESTRAL: Es el procedimiento que nos garantiza que una muestra es realmente
representativa de la población y esta integrado por tamaño de la muestra, por el tipo de
muestreo, por un diseño adecuado del cuestionario, la acertada capacitación de los encuestadores
y los recursos, éstos son todos los elementos que se contemplan para obtener una muestra
representativa evitando en lo posible sesgos (falso, mentira), mismo que está integrado por:
Elementos de muestreo y elementos de no muestreo.

E
Entrevista y Encuesta: Son métodos de recolección de datos, la entrevista es una serie de
preguntas realizadas personalmente y la encuesta es llevada a cabo generalmente a través de
algún formulario que la persona debe llenar.

Estadística: Ciencia de las matemáticas encargada del estudio del comportamiento de una
población mediante un estudio cuyo propósito es hacer inferencias a partir de un subconjunto de
datos, llamado muestra, tomados de ella.

- 3-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Estadística inferencial o inductiva: Sirve extrapolar los resultados obtenidos en el análisis de los
datos y a partir de ello predecir acerca de la población, con un margen de confianza conocido. Se
apoya fuertemente mediante el cálculo de probabilidades.

Estadística descriptiva o deductiva: Se construye a partir de los datos y la inferencia sobre la


población no se puede realizar, al menos con una confianza determinada, la representación de la
información obtenida de los datos se representa mediante el uso de unos cuantos parámetros,
tablas y algunas graficas planteadas de tal forma que den importancia los mismos datos a través
de parámetros que caractericen la distribución.

Estadístico: Unidad de medida referente a la muestra. Se le llama estadístico también a la persona


que trabaja con la estadística.

Estadígrafo: Término utilizado para designar a la persona dedicada a las tareas propias de la
estadística, aunque en ocasiones también es frecuente que se utilice para designar a la variable
que define una distribución estadística, de esta forma es común escuchar el término estadígrafo
de prueba.

Estratos: Subdivisiones del total de la población en sub poblaciones.

Experimento: es una actividad planeada cuyos resultados producen un conjunto de datos.

Experimento aleatorio: Experimento en el que existen diferencias de una muestra a otra, cuyas
muestras pese ha ser de una misma población son diferentes.

Eventos dependientes: eventos que no son independientes. Esto es, el suceso de un evento no
tiene efecto sobre la probabilidad de que ocurra el otro evento.

Eventos mutuamente excluyentes: eventos no vacíos definidos en el espacio muestral con cada
evento excluyendo que ocurra el otro. En otras palabras, son eventos que no comparten
elementos comunes.

F
Frecuencia: Número de veces en que se repite un dato.

Frecuencia Acumulada: Es el número de estudiantes con calificaciones iguales o menores que el


rango de cada intervalo sucesivo. (Frecuencia)

Frecuencia Relativa: Es la proporción entre la frecuencia de un intervalo y el número total de


datos.

H
Hipótesis: Una Hipótesis Estadística a un enunciado respecto a una población y usualmente es un
enunciado respecto a uno a más parámetros de la población.

Ejemplo: El promedio de notas de los alumnos del Área Ciencias de la Educación, se espera que
para el año 2.000 sea significativamente mayor al actual.

- 4-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Hipótesis Nula: Pone en duda el efecto de una variables experimental hasta que se determina el
efecto como una diferencia significativa y no como resultado del azar.

Histogramas: Los histogramas de frecuencias son gráficas que representan un conjunto de datos
que se emplean para representar datos de una variable cuantitativa. En el eje horizontal o de las
abscisas se representan los valores tomados por la variable, en el caso de que los valores
considerados sean continuos la forma de representar los valores es mediante intervalos de un
mismo tamaño llamados clases. En el eje vertical se representan los valores de las frecuencias de
los datos. Las barras que se levantan sobre la horizontal y hasta una altura que representa la
frecuencia. Un punto importante en el manejo de la información bajo el uso de histogramas es el
hecho de poder comparar, bajo un proceso en control, que a medida que se crecen las clase tiene
aproximadamente la forma de una campana centrada, es la de una de las distribuciones mas
importantes conocidas como frecuencia normal o gaussiana.

I
Inferencia: Término utilizado para indicar la predicción hecha acerca de una población.

Inferencia Estadística: Es aplicar resultados de estudios de una muestra a la poblaciones y emitir


juicios o conclusiones sobre esa población en general.

Intervalo de Clase: Pequeña sección de la escala según la cual se agrupan las puntuaciones de una
distribución de frecuencia. Tamaño o rango de la Clase.

L
Límites del intervalo: Son los valores extremos que tiene el intervalo de clase, inferior y superior,
entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.

M
Marco muestral: Es una lista, o conjunto, de los elementos que pertenecen a la población de la
cual se toma la muestra.

Media Aritmética: La media de un conjunto de N números, X1, X2, X3, .. XN. S

Media Aritmética Ponderada: A veces asociamos con los números X1, X2, X3, .. Xk ciertos factores
peso (o pesos) W1, W2, W3, .. WK dependientes de la relevancia asignada a cada número. En tal
caso,
𝑥1 + 𝑥2 + 𝑥3 + 𝑘𝑥𝑛 ∑𝑁 𝑗−1 𝑥𝑗 ∑𝑥
𝑥̅ = = =
𝑁 𝑁 𝑁
Se llama la media aritmética ponderada con pesos f1, f2, ..., fk.

Mediana: La mediana de un conjunto de números ordenados en magnitud es o el valor central o la


media de los dos valores centrales.

Medidas de la Dispersión: Normalmente la estadística también se ocupa de la dispersión de la


distribución, es decir, si los datos aparecen sobre todo alrededor de la media o si están

- 5-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

distribuidos por todo el rango. Una medida de la dispersión es la diferencia entre dos percentiles,
por lo general entre el 25 y el 75. El percentil r es un número tal que un r por ciento de los datos
son menores o iguales que r. En particular, los percentiles 25 y 75 se denominan cuartiles inferior y
superior respectivamente. La desviación típica es otra medida de la dispersión, pero más útil que
los percentiles, pues está definida en términos aritméticos como se explica a continuación.

Medidas de Tendencia Central: Un promedio es un valor típico o representativo de un conjunto


de datos. tales valores suelen situarse hacia al centro del conjunto de datos ordenados por
magnitud. Una vez que los datos han sido reunidos y tabulados, comienza el análisis con el objeto
de calcular un número único, que represente o resuma todos los datos. Dado que por lo general la
frecuencia de los intervalos centrales es mayor que el resto, este número se suele denominar valor
o medida de la tendencia central.

Método de muestreo sesgado: produce valores que difieren sistemáticamente de la población


que está siendo muestreada. Un método de muestreo no-sesgado es quel que no está sesgado.

Moda: Es el valor que ocurre con mayor frecuencia; es decir, el valor más frecuente. La moda
puede no existir, e incluso no ser única en caso de existir.

Modelos Matemáticos: Un modelo matemático es una representación ideal (en la forma de un


sistema, proposición, fórmula o ecuación) de un fenómeno físico, biológico o social. Así, un dado
teórico perfectamente equilibrado, que se puede lanzar de forma aleatoria en un modelo
matemático de un dado real.

Muestra: es un subconjuntos de datos tomados de la población, cuya finalidad es la de realizar


inferencias acerca de la población a partir del comportamiento de sus elementos. Es claro que si la
muestra es un subconjunto de la población entonces la muestra tendrá un número menor de
elementos.

Muestras probabilísticas: son aquellas en las que los elementos a seleccionar se obtienen con
base a la probabilidad. Cada elemento de una población tiene cierta probabilidad de ser elegido
como parte de la muestra.

N
Nivel de significación: El rechazo o aceptación de una hipótesis nula, se basa sobre algún nivel de
significación como criterio. Una diferencia se denomina significativa cuando la distancia entre dos
medias muestrales señala una diferencia verdadera entre los parámetros de las poblaciones de las
que se sacaron las muestras.

Niveles de Medición:

 Nivel de Medición Nominal: Se tienen dos o más categorías de variables, donde dichas
categorías carecen de orden de jerarquía. Por ejemplo el número asignado a cada jugador
de un equipo de fútbol.

- 6-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

 Nivel de Medición Ordinal: Se tienen varias categorías, pero además mantienen un orden
de mayor a menor. Por ejemplo: Nombrar la posición de los equipos en un campeonato de
fútbol.
 Nivel de Medición por Intervalos: Además de haber o orden y jerarquía entre categorías,
se establecen intervalos iguales en la medición. Por ejemplo: Nombrar la posición y el
puntaje que obtuvo un equipo en un campeonato de fútbol.
 Nivel de Medición de Razón: Además de tenerse todas las categorías del nivel de
intervalos Por ejemplo: El equipo Campeón de un torneo de fútbol obtuvo mayor puntaje,
pero no fue el mejor equipo en la temporada.

Normalidad: Se puede hablar de normalidad en una distribución de datos, cuando las medidas de
tendencia central (media, mediana y moda) coinciden en su valor. Lo cual origina gráficamente
una curva simétrica, donde su eje de simetría es el punto donde coinciden las tres medidas de
tendencia central.

P
Parámetro: valor numérico que resume todos los datos de una población completa.

Percentiles: son los valores de la variable que dividen un conjunto de datos clasificados en 100
subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil, Pk, es un
valor tal que a lo sumo k% de los datos son menores en valor que P k y a lo sumo (100-k)% de los
datos son mayores.

Pictogramas: El pictograma consiste en la utilización de símbolos utilizados para representar un


conjunto de datos, en el caso de la representación de datos individuales a través de barras hemos
utilizado los pictogramas, sin embargo en áreas específicas convendría analizar el conjunto de
datos.

Pirámides de población: Este gráfico se construye utilizando pirámides para construir la


representación de los datos bajo cierta clase, la diferencia de información considerada entre cada
clase será dada por el tamaño de la pirámide. En ocasiones la frecuencia de cada clase se coloca en
el extremo superior de cada clase, sin embargo también, al igual que en las anteriores puede
resultar útil colocar información, como el porcentaje de información en la punta de cada pirámide.

Población: es conjunto de elementos que tiene características comunes, al menos una. Por
ejemplo, una población es el grupo de estudiantes de un país.

En el caso particular de la estadística la población constituye el objeto de estudio, es decir, la


población es el conjunto de individuos o entes que constituyen el objeto de estudio sobre el que
se desea predecir un comportamiento a partir del estudio.

Polígono de frecuencias: Representaciones gráficas alternativas al histograma de frecuencias.


Estos se construyen a partir de los puntos medios de cada clase. La utilización de los puntos
medios o marcas de clase son llevados al escenario gráfico mediante la utilización de los polígonos
de frecuencias. Se construye uniendo los puntos medios de cada clase localizados en las tapas
superiores de los rectángulos utilizados en los histogramas de las gráficas. Su utilidad se hace

- 7-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

necesaria cuando desean destacarse las variables de tendencia central, como son media, modas y
medianas.

Probabilidad: Es una posibilidad medible que se basa en los sucesos esperados en relación a las
observaciones de sucesos anteriores; o se basa también en sucesos esperados en relación a los
sucesos posibles.
Ejemplo: Una moneda puede caer águila o sello. Si esperamos que caiga águila el procedimiento es
el siguiente:
A = águila S = sello Suceso esperado: A (se espera que salga águila al lanzar la moneda) Suceso
posible A ó S ½ = .5 = 50 % (es como razonamos para saber la probabilidad de que caiga águila)

Promedio de datos: Es la cantidad que se obtiene al sumar el conjunto de datos que intervienen
en la muestra entre el total de datos, este también es conocido como media aritmética o
simplemente media.

R
Rango: Es la diferencia en valor entre los datos de valor más alto, H, y los datos de valor más bajo,
L:
Rango= valor alto -- valor bajo
Rango= H -- L

Rango medio: es el número que está exactamente a la mitad entre el dato de valor más bajo, L, y
el dato de valor más alto, H. Se encuentra al promediar los valores bajo y alto.
𝑉𝑎𝑙𝑜𝑟 𝑏𝑎𝑗𝑜+𝑉𝑎𝑙𝑜𝑟 𝑎𝑙𝑡𝑜
Rango medio:
2
𝐿+𝐻
Rango medio=
2
Rango de intercuartil: Es la diferencia entre los cuartiles primero y tercero. Es el rango de 50%
central de los datos.

Rechazo: Es la acción de descartar en un estudio estadístico lo propuesto en la hipótesis


planteada.

Recorrido de una distribución: Es la diferencia que existe entre el valor máximo del conjunto de
datos y su valor mínimo.

S
Síndrome: Conjunto de signos, síntomas y características que permiten inferir sobre un evento.

Status: Palabra latina que significa situación, posición, estado. Asociada con el origen etimológico
de la palabra estadística.

T
Tamaño de muestra: El número de elementos que intervienen dentro de la elección de la muestra
extraída de una población.

- 8-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

Tendencia: Es el comportamiento que presentan una serie de datos en base a un valor definido de
tomar una posición muy estrecha con éste valor.

U
Umbral: Considera la entrada o el paso a cualquier otro estado de un evento. Es todo lo que gira
alrededor de las medidas de tendencia central.

V
Validez: Es la calidad de credibilidad que se le da a un instrumento de medición o de recolección
de información. Existen tres tipos de validez:
 Validez de contenido, referente al contenido programático del instrumento.
 Validez Predictiva, referente a la ocurrencia de uno o varios eventos en el futuro,
partiendo de un dato.
 Validez de constructo, referente a la capacidad del instrumento para medir su capacidad o
limitaciones.

Variabilidad: Se entiende como el rango recorrido que toma una variable en un estudio cualquiera
en determinado intervalo.

Variable: es una característica de interés relacionada con cada elemento individual de una
población o muestra.

Variable aleatoria: es una variable que toma un valor numérico único para cada uno de los
resultados del espacio muestral de un experimento de probabilidad.

Variable cualitativa, de atributos, o categórica: es una variable que clasifica o describe a un


elemento de una población.

Variable cuantitativa o numérica: es aquella que cuantifica un elemento de una población.

Variable nominal: es una variable cualitativa que caracteriza (describe o identifica) a un elemento
de una población. Para los datos resultantes de una variable nominal, las operaciones aritméticas
no sólo carecen de sentido sino que tampoco se puede asignar un orden a las categorías.

Variable ordinal: es una variable cualitativa que presenta una posición, o clasificación, ordenada.

Variable discreta: es una variable cuantitativa que puede asumir un número contable (o finito) de
valores. Intuitivamente, la variable discreta puede asumir los valores correspondientes a puntos
aislados a lo largo de un intervalo de recta. Es decir, entre dos valores cualesquiera siempre hay un
hueco.

Variable continua: es una variable cuantitativa que puede asumir una cantidad incontable de
valores. Intuitivamente, la variable continua puede asumir cualquier valor a lo largo de un
intervalo de recta, incluyendo cualquier valor posible entre dos variables determinadas.

Varianza: Cuadrado de la desviación típica (s 2), también notada s.

- 9-
BIOESTADÍSTICAS UNIVERSIDAD DE GUADALAJARA

- 10 -
Bibliografía:
Johnson, Robert, Kubi, Patricia, Estadística elemental: lo esencial, Editorial CengageLearning,
Décima edición, 2008

Ponterio et Valdes, Glosario, 2006, http://www.cortland.edu/flteach/stats/glos-sp.html (vi:


10/10/2010)

Glosario de términos, COORDINACIÓN DE INNOVACIÓN EDUCATIVA, 15 de julio de 2010,


http://dieumsnh.qfb.umich.mx/estadistica/glosario.htm (vi: 10/10/2010)

También podría gustarte