Está en la página 1de 20

ESTADÍSTICA CUANTITATIVA

INFERENCIA ESTADISTICA: “ Es el procedimiento por medio del cual se


llega a una conclusión acerca de una población con base en los resultados
que se obtienen de una muestra extraída de esa población”.

MUESTRA ALEATORIA SIMPLE: “Si extraemos una muestra de tamaño n de


una población de tamaño N, de manera que cada muestra posible de
tamaño n tenga la misma probabilidad de ser seleccionada, la muestra se
llama muestra aleatoria simple”.

MUESTREO CON REEMPLAZO Y SIN REEMPLAZO: “En el muestreo con


reemplazo cada elemento de la población esta disponible para cada
selección. En el muestreo sin reemplazo el elemento seleccionado para
muestreo, se separa de la población, por lo que no estara disponible para
selecciones subsecuentes de la misma población”.
•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a.
Edición. 2005. Capitulos 1 y 2. Págs. 1-55.
ESTADISTICA DESCRIPTIVA

ORGANIZACIÓN DE DATOS

DATOS CRUDOS: “Cuando se hacen las mediciones sobre entidades de una


población (muestra), los valores resultantes están disponibles para el
investigador como una masa de datos desorganizados y se les llama “crudos” y
es improbable que estos datos proporcionen alguna información hasta que
sean puestos en algún orden”.

MEDIDAS DESCRIPTIVAS: “La organización y el procesamiento de datos es el


cálculo de un número individual que de alguna manera incluye información
importante acerca de los datos que sirvieron para calcularlo. A estos números
individuales utilizados para describir datos se les llama medidas descriptivas”.

•Bioestadística. Wayne W. Daniel. Edit. Limusa


Wiley. 4a. Edición. 2005. Capitulos 1 y 2. Págs.
1-55.
Arreglo Ordenado:
Es el primer paso para organizar datos y consiste en
colocar en una lista de valores de un grupo (población
o muestra) en orden de magnitud de menor a mayor
valor.

La computadora no necesita que el usuario haga un arreglo ordenado antes de


meter los datos para construir la distribución de frecuencias y para hacer otros
análisis.

•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005. Capitulos 1
y 2. Págs. 1-55.
DATOS AGRUPADOS: La agrupación de datos facilita el
cálculo de porcentajes y promedios y resume la información.
Para agrupar un conjunto de observaciones se debe
seleccionar un conjunto de intervalos contiguos que no se
traslapen, para que cada valor en el conjunto de
observaciones, pueda ser puesto en uno y solo uno de los
intervalos (intervalos de clase).
Para determinar cuantos intervalos se deben incluir en una
agrupación de datos, es importante tener el conocimiento de
los datos y el objetivo que se persigue.
Empiricamente se considera que no deben ser menos de 6 ni mas de 15. Pueden ser
determinados por los precedentes como las tabulaciones anuales. (fórmula de Sturges
k=1+3.322(log10 n) El número de intervalos de clase determinado por esta regla deberá
incrementarse o disminuirse por conveniencia.
•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005. Capitulos 1
y 2. Págs. 1-55.
AMPLITUD DE INTERVALOS DE CLASE: Los intervalos de
clase deben ser de la misma amplitud.
La amplitud(w) se determina dividiendo el rango (R) entre
el número de intervalos de clase(k).
Rango es la diferencia entre la observación más pequeña y
la mas grande dentro del conjunto de datos.
Ecuación:
w = R/k
Generalmente los intervalos de clase se almacenan de menor a mayor. Es decir, el primer
intervalo de clase contiene las mediciones más pequeñas y el último intervalos contiene
las mediciones mas grandes.

•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005. Capitulos 1
y 2. Págs. 1-55.
FRECUENCIAS RELATIVAS

Son la proporción de valores que caen dentro de un intervalo de clase en


particular. Se obtiene dividiendo el número de valores en un intervalo de
clase particular entre el número total de valores. Al multiplicar el
resultado de esta operación por 100 se obtiene el porcentaje de valores
que cae dentro del intervalo de clase correspondiente.
A la proporción de valores que caen dentro de un intervalo de clase se le
conoce como frecuencia relativa de ocurrencias en ese intervalo.
Para determinar la frecuencia de valores que caen dentro de 2 o más
intervalos de clase, se obtiene la suma del número de valores que caen
dentro de los intervalos de clase correspondientes.
Para conocer la frecuencia relativa de ocurrencia de valores que caen
dentro de 2 o más intervalos de clase, se suman las frecuencias relativas
respectivas.
•Bioestadística. Wayne W. Daniel. Edit. Limusa
Wiley. 4a. Edición. 2005. Capitulos 1 y 2. Págs. 1-55.
Distribuciones de: frecuencia, frecuencia acumulada, frecuencia relativa y
frecuencia relativa acumulada de las edades de 169 sujetos previamente ordenados
y agrupados.

Intervalos de Frecuencia Frecuencia Frecuencia Frecuencia


clase acumulada relativa relativa
acumulada
10-19 4 4 .0237 .0237
20-29 66 70 .3905 .4142
30-39 47 117 .2781 .6923
40-49 36 153 .2130 .9053
50-59 12 165 .0710 .9763
60-69 4 169 .0237 1.0000

Total 169 1.0000

•Bioestadística. Wayne W. Daniel. Edit. Limusa


Wiley. 4a. Edición. 2005. Capitulos 1 y 2. Págs.
1-55.
HISTOGRAMA:
Es la representación a través de un tipo especial
de gráfica de barras de la distribución de
frecuencias o frecuencias relativas.
Para su construcción se colocan los valores de la
variable respectiva sobre el eje horizontal y las
frecuencias o frecuencias relativas en el eje
vertical. Las barras del histograma deben ser
adyacentes, y es necesario tomar en cuenta los
limites correctos de los intervalos de clase para
evitar la separación de barras en la gráfica.
•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005. Capitulos 1 y 2. Págs. 1-55.
POLIGONO DE FRECUENCIA:
Es la representación gráfica de una distribución de frecuencias.
Para construirlos se hace una marca arriba en el punto medio de
cada intervalo de clase representado sobre el eje horizontal de
la gráfica; la altura con respecto al eje horizontal de una marca
dada, corresponde a la frecuencia del intervalos de clase. Al unir
las marcas mediante líneas rectas se obtiene el polígono de
frecuencia.
El polígono cae sobre el eje horizontal en los extremos en los
puntos que corresponderían a los puntos medios en caso de
haber una celda adicional en cada extremo del histograma
correspondiente.

•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005. Capitulos 1 y 2. Págs.
1-55.
ESTADISTICA DESCRIPTIVA:
Medidas de Tendencia central:
“Una medida descriptiva calculada a partir de los datos de una
muestra se llama estadística”.
“Una medida descriptiva calculada a partir de los datos de una
población se llama parámetro”.
“En las medidas de tendencia central únicamente un valor del
conjunto de datos se considera como el representativo del todo.
Conllevan información respecto al valor promedio de un
conjunto de valores”.
Las tres medidas de tendencia central de uso más frecuente son
la media, la moda y la mediana.
•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005.
Capitulos 1 y 2. Págs. 1-55.
MEDIA ARITMETICA:
Es el “promedio” que se obtiene de un conjunto de datos.
La media se obtiene sumando todos los valores en una
población o muestra y dividiendo entre el número de valores
sumados.
Propiedades de la media:
1.- Es única
2.- Simplicidad
3.- Los valores extremos influyen sobre la media, y en algunos
casos pueden distorsionarla tanto que llega a ser indeseable
como medida de tendencia central
•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición.
2005. Capitulos 1 y 2. Págs. 1-55.
MEDIANA:
Es el valor que divide al conjunto en dos partes iguales, de
forma que el número de valores mayores o iguales a la
mediana, es igual al número de valores menores o iguales a
ésta.
Si el número de valores es impar, la mediana es el valor
medio o central, siempre y cuando todas las variables sean
arregladas en orden de magnitud.
Si el número de valores es par, existen dos valores medios.
En tal caso la mediana corresponde a la media de esos dos
valores centrales.
(Impar:11 datos + 1/2= 6 (mediana es el número 6 dentro del conjunto).
(Par: 12 datos + 1/2= 6.5 (mediana es el número entre el 6 y 7 del conjunto)

•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición.


2005. Capitulos 1 y 2. Págs. 1-55.
PROPIEDADES DE LA MEDIANA:
1.- Es única.
2.- Simplicidad.
3.- Los valores extremos no tienen efectos
importantes sobre la mediana.

•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a.


Edición. 2005. Capitulos 1 y 2. Págs. 1-55.
MODA:
La moda de un conjunto de valores es aquel valor
que ocurre con mayor frecuencia. Si todos los
valores son diferentes no hay moda. Un conjunto de
valores puede tener mas de una moda.
Se puede utilizar para describir datos cualitativos.
(diagnóstico más frecuente, durante un tiempo y hospital determinado etc.-
diagnóstico modal-).

•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición.


2005. Capitulos 1 y 2. Págs. 1-55.
MEDIDAS DE DISPERSION.

Concepto: La dispersión de un conjunto de observaciones, se


refiere a la variedad que muestran éstas. Informa respecto a la
cantidad total de variabilidad presente en el conjunto de datos.
Si todos los valores son iguales no hay dispersión. Si no todos
son iguales, entonces existe dispersión.
La magnitud de la dispersión es pequeña cuando los valores,
aunque diferentes, son cercanos entre sí.
Otros términos sinónimos de dispersión son: variación,
expansión y dispersión.

•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005.


Capitulos 1 y 2. Págs. 1-55.
RANGO O INTERVALO DE VARIACION:
Es la diferencia entre el valor más pequeño y el más grande en
un conjunto de observaciones.
VARIANZA:
“Cuando los valores de un conjunto de observaciones se
encuentran ubicados cerca de su media, la dispersión es menor
que cuando están esparcidos”. La medición de la dispersión de
valores alrededor de su media se efectúa mediante lo que se
conoce como varianza”.
La varianza se obtiene restando la media de cada uno de los
valores individuales, las diferencias se elevan al cuadrado y
después se suman entre sí. Esta suma de desviaciones elevadas
al cuadrado, se divide entre el tamaño de la muestra menos 1,
para obtener la variancia de la muestra.
• Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005. Capitulos 1 y 2. Págs. 1-55.
DESVIACION ESTÁNDAR:
Es una medida que describe qué tanto cada
medición se aleja del promedio.
La variancia representa unidades al cuadrado
por lo que no expresa la dispersión en términos
de la unidades originales.
Para obtener la medida de dispersión en
unidades originales, simplemente se obtiene la
raíz cuadrada de la variancia. El resultado se
llama desviación estándar.
•Bioestadística. Wayne W. Daniel. Edit. Limusa Wiley. 4a. Edición. 2005. Capitulos 1
y 2. Págs. 1-55.
INTERVALO DE CONFIANZA (IC)

Es el intervalo de valores que


probablemente contenga el valor real de
la población.
Los valores inferiores y superiores se
llaman Límites de confianza.
IC al 95% significa que se confía que el
valor obtenido es real en el 95% de la
población.
Rango: La cifra menor y la mayor de los
datos muestrales.
ERROR ESTÁNDAR

Da una estimación del grado en el que la


media muestral varía de la media de la
población.
Se calcula con base en la desviación
estándar:
EE = DE/√n