Está en la página 1de 47

Unidad 1

Estadísticas descriptivas
1.1 Conceptos básicos: estadística,
población, muestra y tipos de datos

Estadística
Disciplina que se ocupa de:
Glucosa en ayuno >125 mg/dl, Glucosa: >199 mg/dl
 la recolección,
 organización,
 resumen
 análisis de datos
 la obtención de inferencias a partir de un volumen de datos cuando
se examina solo una parte de estos.
Porque es necesaria la Bioestadística
 El Departamento de Alimentos y Medicina está realizando la prueba final de
un nuevo medicamento que cura el cáncer de próstata en 80% de los casos en
que es administrado, con sólo 2% de incidencia de efectos secundarios no
deseables.
 El cáncer de próstata es la segunda causa de mortalidad humana y
actualmente no existe una cura. El director de Investigación debe decidir si
recomienda el medicamento para su uso general; hará la recomendación sólo
en el caso de tener la certeza al 99% de que no habrá diferencias
significativas entre los efectos secundarios no deseables en las pruebas
clínicas y los que se ocasionarían por el uso generalizado del medicamento.
Áreas en que puede dividirse la
estadística: Planificación de la investigación

datos apropiadamente recolectados o registrados


 Diseño: Planeamiento y desarrollo de investigaciones.
seleccionar un conjunto razonable de datos que
 Descripción: Resumen y exploración de datos. esté relacionado con el problema de interés
 Inferencia: Hacer predicciones o generalizaciones acerca de
características de una población en base a la información de una
muestra de la población.

Presentar
Los métodos losde
datos de modo nos
la inferencia tal que sobresalga
permiten su el valor de una
proponer
estructuradesconocida (estimación) o decidir entre dos teorías
cantidad
contrapuestas
Resumirlos en cuál
uno odedosellas explica
números quemejor los datos
caractericen el observados
(test de hipótesis).
conjunto totalmente
ESTADÍSTICA DESCRIPTIVA

 Es aquel método matemático que tiene como objetivo recoger,


clasificar, desarrollar y resumir un grupo de datos recogidos.
 Los datos pueden visualizarse mediante medidas numéricas, gráficos o
incluso tablas.
 Encargada de realizar un resumen y describir que características o
cualidades posee cada elemento
 ayudan a comprender la estructura de los datos y detectar un patrón
de comportamiento mediante graficos de sencilla realización e
interpretación
ESTADÍSTICA INFERENCIAL (INDUCTIVA)

 De los datos muestrales que se analizan, se pueden realizar


previsiones y predicciones que engloben a todo un grupo o población
tomando como muestra una pequeña parte de la misma.
Los resultados que se obtienen a través de medios como la investigación,
el estudio y análisis se infieren o extrapolan y así crear una previsión más
inclusiva.
De forma general…..

“los datos son números, que los números contienen


información y que el propósito de la estadística es investigar
y evaluar la naturaleza y el significado de esa información”

Los datos son generalmente imperfectos en el sentido


que aún cuando posean información útil no nos cuentan
la historia completa.
Datos

 Datos son hechos/informaciones y cifras que se recogen,


analizan y resumen para su presentación e interpretación.
Se puede definir a los datos como números.
 A todos los datos reunidos para un determinado estudio se les llama conjunto
de datos para el estudio.
 Las dos clases de números que se utilizan en estadística son números que
resultan de la toma de medidas, y aquellos que resultan del proceso de
conteo.
Fuentes de datos

 Registros rutinarios: provenientes de algún tipo de organizaci6n


(hospital con pacientes, los registros contables de la institución ).
 Encuesta. si los datos para contestar una pregunta no están
disponibles a partir de los registros, la fuente lógica puede ser una
encuesta. Por ejemplo, obtener información respecto a Ia forma de
transporte que utiliza el paciente para visitar la clínica.
 Fuentes externas. Los datos necesarios para responder a una
pregunta pueden ya existir como informes publicados, bancos de
datos disponibles o en la literatura de investigación.
Se puede encontrar con que alguien mas ya planteo la misma pregunta y
que la respuesta que obtuvo puede aplicarse a la situación
 Experimentación. Frecuentemente, los datos necesarios para
responder una pregunta están disponibles solo como resultado de la
experimentación.
Ej. Se quiere saber que estrategia es mejor para maximizar el
seguimiento de las indicaciones medicas por parte del paciente. Se
podría conducir un experimento en el que se prueben diferentes
estrategias para motivar el cumplimiento del tratamiento en distintos
pacientes.
Clasificación

 Los datos cualitativos comprenden etiquetas o nombres que se usan


para identificar un atributo de cada elemento.
Los datos cualitativos emplean la escala nominal o la ordinal y pueden
ser numéricos o no.
Si la variable es cualitativa, el análisis estadístico es bastante limitado.
Escala nominal y ordinal
 Nominal: En este nivel de medición se establecen categorías
distintivas que no implican un orden específico.
Escala nominal y ordinal
 Ordinal: Se establecen categorías con dos o más niveles que
implican un orden inherente entre si. Es cuantitativa porque
permite ordenar a los eventos en función de la mayor o menor
posesión de un atributo o característica.

Totalmente de acuerdo
__ De acuerdo
__ Indiferente
__ En desacuerdo
__ Totalmente en desacuerdo
 Los datos cuantitativos requieren valores numéricos que indiquen
cuánto o cuántos.
Los datos cuantitativos se obtienen usando las escalas de medición de
intervalo o de razón.
Cuando se tienen variables cuantitativas, los datos se pueden sumar y
luego dividir entre el número de observaciones para calcular el valor
promedio.
Hay más alternativas para el análisis estadístico cuando se tienen datos
cuantitativos.
Datos continuos y discretos

 Continuos (datos de campo, no discretos o de superficie): cualquier


valor y/o número puede tomar cualquier valor en un rango
especificado, sin una escala lo suficientemente sensible para hacer las
distinciones necesarias y que podría continuar por siempre.

 Discretos (discontinuos, categóricos): Valor y/o número que


únicamente pueden tomar uno de dos valores, por ejemplo, hombre o
mujer, muerto o vivo, positivo o negativo. Tiene límites conocidos y
definibles
ORGANIZACIÓN DE DATOS

 El resultado de una medición es la siguiente:


 El resultado de la organización de los datos:

Se puede disponer la información de tal forma que resulte fácil responder a


preguntas que se han planteado
 ¿Cuántas personas fueron encuestadas? Solución: 150
 ¿Cuál fue la respuesta más frecuente? Solución: 5 (40 datos)
Población

 Es una colección de entidades que puede estar compuesta de


animales, maquinas, plantas ó células, etc.
Una población de entidades se define como la colección mas grande de
entidades de interés en un momento particular.
Las poblaciones se determinan o definen con base en el campo de
interés.
Las poblaciones pueden ser finitas ó infinitas. Si una población de
valores consiste en un numero fijo de esos valores, se dice que la
población es finita. Si, por otra parte, una población consiste en una
sucesión interminable de valores, entonces es una población infinita.
Muestra

 Una muestra puede definirse simplemente como una parte de una


población.

Suponga que una población se compone de los pesos de todos los niños
inscritos en el sistema de educación primaria del estado, y se escoge
para el análisis solo una fracción de los niños; entonces se tiene
únicamente una parte de la población, es decir, se tiene una muestra.
Parámetros y estadísticos

 Un parámetro se define como cualquier resumen de los


elementos de una población, mientras que el resumen de
los elementos de una muestra se conoce como
estadístico.

Parámetro: promedio de las presiones sanguíneas de todos los estudiantes de la


universidad, la mediana de las presiones sanguíneas de todos los hombres por POBLACIÓN
arriba de 65 años de edad, que alguna vez tomarán el medicamento contra la
hipertensión
Estadístico: promedio de las presiones sanguíneas de los estudiantes de un grupo
MUESTRA
en particular de esa universidad, la mediana de las presiones sanguíneas de los 50
hombres que participaron en el estudio sería un estadístico
VARIABLE

 Cualquier característica de la unidad de observación que interese


registrar, la que en el momento de ser registrada puede ser
transformada en un número.

Sexo, lugar nacimiento, edad, presión arterial sistólica son variables (describen)
su sexo (M o F), su lugar de nacimiento, su edad (28, 35), etc. son los valores que
estas variables toman para esta persona.
Variables dependientes y independientes

 Cuando se diseña una investigación, se intenta estudiar de qué modo


una o más variables condicionantes (variables independientes)
afectan a una o más variables de interés (variables dependientes).
Medidas de tendencia central (medidas de
localización o posición)
Posibilidad de condensar datos por medio de un solo número
Un valor del conjunto de datos se considera como el representativo del todo.
Las medidas de tendencia central conllevan informaci6n respecto al valor
promedio de un conjunto de valores.

 Media aritmética: "promedio“ o media. La media se obtiene sumando


todos los valores en una población ó muestra y dividiendo entre el número
de valores sumados.
media de la población media de la muestra
Propiedades de la media:

 Es única. Para un conjunto de datos existe una y sólo una media


aritmética.
 Simplicidad. EI calculo y comprensión de la media aritmética son
sencillos.
 Puesto que todos y cada uno de los valores en el conjunto de datos
entran en el cálculo de la media, esta es afectada por cada valor
 La mediana La mediana de un conjunto finito de valores es aquel
valor que divide al conjunto en dos partes iguales, de forma que el
numero de valores mayores o iguales a la mediana es igual al numero
de valores menores o iguales a esta.

 Si el numero de valores es impar, la mediana es el valor medio o central


siempre y cuando todas las variables sean arregladas en orden de magnitud.
 Cuando el numero de valores en el conjunto es par no existe un valor medio
único, sino que existen dos valores medios. En tal caso, la mediana
corresponde a la media de esos dos valores centrales, cuando todos los
valores son arreglados en orden de magnitud.
Propiedades de la mediana

 Es única. Al igual que en el caso de la media, existe solamente una


mediana para un conjunto de datos.
 Simplicidad. Es muy sencillo calcularla.
 Los valores extremos no tienen efectos importantes sobre la mediana,
lo que si ocurre con la media.
 La moda: La moda de un conjunto de valores es aquel valor que
ocurre con mayor frecuencia.
Si todos los valores son diferentes, no hay moda.
Un conjunto de valores puede tener mas de una moda.

20, 21,20,20,34,22,24,27,27 y 27

7, 8, 9, 7, 7, 4, 9, 5, 9, 3, 1, 9, 7 y 8
2,4,5,5,7,8,9,5,8,1,3,0
 Percentil: es un valor tal que por lo menos p por ciento de las observaciones
son menores o iguales que este valor y por lo menos (100 p) por ciento de las
observaciones son mayores o iguales que este valor
CÁLCULO DEL PERCENTIL p
 Ordenar los datos de menor a mayor (colocar los datos en orden ascendente).
 Calcular el índice i

donde p es el percentil deseado y n es el número de observaciones.


 Si i no es un numero entero, debe redondearlo. El primer entero mayor
que i denota la posición del percentil p.
 Si i es un numero entero, el percentil p es el promedio de los valores en
las posiciones i e i + 1.
 Sueldos mensuales iniciales:
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
 calcular el percentil 85 en los sueldos mensuales iniciales
.
 calcular el percentil 50 en los sueldos mensuales iniciales
 Cuartiles: Con frecuencia es conveniente dividir los datos en cuatro
partes; así, cada parte contiene una cuarta parte o 25% de las
observaciones.
A los puntos de división se les conoce como cuartiles y están definidos como
sigue:
Q1 primer cuartil, o percentil 25
Q2 segundo cuartil, o percentil 50
Q3 tercer cuartil, o percentil 75
Medidas de dispersión (variabilidad)
 Información respecto ala cantidad total de variabilidad presente en el
conjunto de datos.
 Si todos los valores son iguales, no hay dispersión
 La magnitud de la dispersión es pequeña cuando los valores, aunque
diferentes, son cercanos entre sí
 RANGO: Este es la diferencia entre el valor mas pequeño y el mas grande en
un conjunto de observaciones

R=XL-Xs R=edad mayor – edad menor = rango de edades

 3925 – 3310= 615.


 La varianza: se basa en la diferencia entre el valor de cada observación (xi) y
la media.
 A la diferencia entre cada valor xi y la media ( cuando se trata de una
muestra, μ cuando se trata de una población) se le llama desviacion respecto
de la media.
 Si se trata de una muestra, una desviación respecto de la media se escribe :

 Si se trata de una población se escribe:


 Varianza poblacional

 Varianza muestral
Promedio
 Desviación estándar: raíz cuadrada positiva de la varianza

 Estudiantes por grupo s=8


 Salario s=165.65
 Hacer los cálculos para edades del grupo y gasto diario en transporte
SESGO
 SE PUEDE CONSIDERAR COMO EL GRADO DE ASIMETRÍA (AS)O FALTA DE SIMETRÍA QUE
PRESENTA UNA DISTRIBUCIÓN DE DATOS AGRUPADOS, ESTA MEDIDA NOS PERMITE
IDENTIFICAR SI LOS DATOS SE DISTRIBUYEN EN FORMA SIMETRICA ALREDEDOR DE UNA
MEDIDA DE TENDENCIA CENTRAL COMO LA MEDIA ARITMÉTICA, MODA O MEDIANA.
 AS: MEDIA – MODA
DESVIACIÓN TÍPICA SIMETRÍA AS=0

ASIMETRIA A LA DERECHA (AS > 0)

ASIMETRÍA A LA IZQUIERDA (AS<0)


 Identificar si los datos se distribuyen de forma uniforme alrededor del punto
central

También podría gustarte