Está en la página 1de 11

DEFINICION

ESTADÍSTICA

Disciplina encargada de:

BIOESTADISTICA 1 - Recolección de datos.


- Organización datos.
- Procesamiento información.
- Interpretar

Para la toma de decisiones.

INTRODUCCION Y
CONCEPTOS GENERALES "Parte de la matemática que estudia las
propiedades variables de las cosas,
generalmente a partir de muestras,
para describir, inferir y predecir acerca
de los sucesos o fenómenos".

¿Cuándo se RECOLECTAN datos ? ¿Cuándo se ORGANIZAN datos ?

Cuando se registran Cuando se ordenan para

características una mejor comprensión y

(medición, observación, facilitar sus análisis.

conteo). (tablas, gráficos y


figuras)

¿ Cuándo se ANALIZAN datos ?


Tabla de Distribución
Edad N° Pacientes

30 - 34 6
Cuando se calculan
35 - 39 12
promedios y medidas de
40 - 44 8
45 - 49 2 variabilidad y
Diagrama Circular

cuando se establecen
relaciones entre ellas
(regresión y correlación).
¿ Cuándo se INTERPRETAN datos ?
TIPOS DE ESTADISTICA

Cuando se le otorga un sentido


práctico a los resultados
obtenidos en el análisis

METODOS DEL CONOCIMIENTO

DEDUCCION

CONCEPTOS BASICOS

INDUCCION

INFERENCIA

DEFINICIONES MARCO MARCO


MUESTRAL POBLACIONAL
Y MUESTRA Y POBLACION
1. MARCO POBLACIONAL: conjunto de individuos o elementos (unidades de análisis o
elementales) que cumplen ciertas propiedades comunes.

2. POBLACION: Es el conjunto total de características de interés del estudio de todos los


individuos del marco poblacional.

3. MARCO MUESTRAL: subconjunto representativo de un marco poblacional.

4. MUESTRA: subconjunto representativo de la población.

5. PARAMETRO: función definida sobre los valores numéricos de una población.

6. ESTADISTICO: función definida sobre los valores numéricos de una muestra.

7. INDIVIDUOS o elementos (unidades elementales): personas u objetos que contienen la


información (carácter) que se desea estudiar. Son las unidades de análisis. EDAD 41 AÑOS

8. CARÁCTER o CARACTERISTICA: propiedades, atributo, rasgos o cualidades de los individuos,


que son materia de interés el estudio.

9. VARIABLE O DATO (modalidad): son los diferentes valores posibles de un carácter o INDIVIDUO o CARÁCTER o DATO O
característica.
ELEMENTO VARIABLE MODALIDAD
10. CLASES: conjunto de variables (intervalos) en el que se verifica que cada modalidad (variable)
pertenece a una y sólo una de las clases.
Población y muestra
y Población (‘population’) es el conjunto de características Población Estadística
sobre las que estamos interesados en obtener conclusiones
(hacer inferencia).
Registro de UNA CARACTERISTICA EN
y Normalmente es demasiado grande para poder abarcarlo. TODOS los elementos del marco
y Puede ser FINITA O INFINITA poblacional.

Tiene tantos datos como elementos el


y Muestra (‘sample’) es un subconjunto de la población al que
tenemos acceso y sobre el que realmente hacemos las marco poblacional.
observaciones (mediciones)
Habrán tantas poblaciones como
y Debería ser “representativo”
características que se deseen registrar en
y Esta formado por miembros “seleccionados” de la
población (individuos, unidades experimentales). un marco poblacional.

Técnicas
MARCO POBLACIONAL Marco Poblacional Marco Muestral
(1200 pacientes de un Hospìtal) de muestreo
1200 pacientes de un hospital 75 pacientes de un hospital

Característica

Edad Peso Enf. Ant. Estado civil


Enfer.
Característica Edad Peso Anteriores Estado Civil

Registro
POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN
de la
Población Población Población carac-
Registro de la terística.
característica ...
P1 P2 P3 P1 P2 P3 Pn
... Pn
(1200 datos) (1200 datos)

Muestra Marco Poblacional Técnicas Marco Muestral


1200 pacientes de un hospital de muestreo 75 pacientes de un hospìtal

y Registro de una característica en todos los


Característica Edad Peso Énf. Ant. Estado civil

elementos del marco muestral.


Edad Peso Enf. Ant. Estado civil MUESTRA MUESTRA MUESTRA MUESTRA

y Tiene tantos datos como elementos el marco m1 m2 m3 mn

75 datos

muestral.
Registro
POBLACIÓN POBLACIÓN POBLACIÓN POBLACIÓN
de la
y Habrán tantas muestras como características carac-
terística.
se deseen registrar en un marco muestral.
P1 P2 P3 ... Pn
Parámetro y Estimador (Estadístico)
Estimador (Estadístico): Valor
representativo de una muestra. Se
Parámetro: Valor representativo de una simboliza por letras latinas.
población. Se simboliza por letras griegas.
Existen tantos estimadores como
Sólo hay un parámetro en cada población. muestras se extraigan de una población.

μ Media poblacional
σ2 Varianza poblacional x Media muestral.
σ Desviación estándar poblacional 2 Varianza muestra.
s
π Proporción poblacional
s Desviación estándar muestral.

p Proporción muestral.

¿Qué son DATOS ?


n1
x1 Son los registros de una característica.

Ejemplo:
n2 x2
POBLACIÓN Características Datos Unidad de medida
n3
x3 Consultas externas 250 día
. . Peso 75 Kg.
. . Estatura 1,80 mts.
nm Profesión Médico ----
xm
PARÁMETRO ESTIMADOR
Si el DATO es útil para tomar decisiones se convierte en
DIFERENTES MUESTRAS OCASIONAN DIFERENTES INFORMACIÓN.
VALORES DEL ESTIMADOR

¿Qué tipos de datos existen?


- VARIABLE: Si el registro de la
característica toma diversos valores
¬ CONSTANTE: Si el registro de la en las unidades elementales.
característica toma un sólo valor en
todas las unidades elementales.
Ejemplo:

• Edad de los pacientes.


Ejemplo: • Profesión de los profesores de la
Universidad Daniel Alcides Carrión
• Sexo de las alumnas de la Escuela de
Enfermeras

• Profesión de los integrantes del Colegio Las constantes no son de mayor interés en
Médico del Perú Estadística. Una misma característica puede
generar constantes ó variables.
Los Datos Variables pueden ser : 2.- Cuantitativos : Registro de una
característica a través de un conteo o una
1.-Cualitativos : Registro de un atributo que no medición. Las operaciones posibles son los
se puede expresar por números sino por promedios y las medidas de dispersión, entre
cualidades o categorías. Provienen de una otras.
observación Las operaciones posibles son: la
Las variables cuantitativas pueden ser:
tasa porcentual y proporciones

Ejemplo: - DISCRETA : Cuando la variable sólo puede


tomar determinados valores dentro de una
Profesión de los participantes a un curso. escala de valores. Proviene de un conteo.
80% son médicos (tasa porcentual).
Ejemplo: Número de emergencias médicas por
8 de cada 10 participantes son médicos (proporción).
día.

Las variables cualitativas pueden ser: - CONTINUA : Cuando la variable puede tomar
cualquier valor, dentro de una escala de
a) Dicotómicas o Binarias (si o no) valores. Provienen de una medición.
b) Ordinales (orden creciente o decreciente) Ejemplo: Tiempo de permanencia de un paciente
c) Nominales (Profesiones, Estado Civil, etc.) en un consultorio externo

RESUMEN DE CLASIFICACIÓN DE VARIABLES ESCALAS DE MEDIDA O MEDICION:

⎧ ⎧ CONTÍNUAS
⎪ ⎪
⎪ NUMÉRICAS ⎨ DEFINICION
⎪ cuantitativas ⎪
⎪ ⎩ DISCRETAS


Una escala es un patrón convencional de medición, y
VARIABLES
⎪ básicamente consiste en un instrumento capaz de
⎪ representar con gran fidelidad verbal, gráfica o
⎧ DICOTOMICAS
⎪ ⎪ simbólicamente el estado de una variable
⎪ CATEGORICAS ⎨ ORDINALES
⎪ cualitativas ⎪
⎩ ⎩ NOMINALES

TIPOS DE ESCALAS DE MEDIDA O MEDICION: Escalas de Medición


a) Escala Nominal o Intensiva: variables cualitativas Escala Nominal:
nominales.
y La escala de medida nominal, consiste en la asignación arbitraria de números o
b) Escala Ordinal: variables cualitativas ordinales. símbolos a cada una de las diferentes categorías en las cuales podemos dividir
el carácter que observamos, sin que puedan establecerse relaciones entre
dichas categorías.
c) Escala de Intervalo: cuantitativo (P. ej. la Tº).
y Por ejemplo,

d) Escala de Proporción o Razón: cuantitativo podemos estar interesados en clasificar los estudiantes de la Universidad San
(Ej. Talla, peso, nivel de glucosa). Carlos de acuerdos a la carrera que cursan.

Clasificar a los equipos de futbol según una característica predefinida.


Escalas de intervalos iguales:
Escala Ordinal:
y Se basa en la afirmación de la existencia de un continuo, seccionable en partes iguales,
y En caso de que puedan detectarse diversos grados de un atributo o en donde cada parte seccionada contiene la misma cantidad de unidades que cualquier
propiedad de un objeto, la medida ordinal es la indicada, puesto que otra sección.
entonces puede recurrirse a la propiedad de "orden" de los números y Es importante destacar que el punto cero en las escalas de intervalos iguales es
asignándolo a los objetos en estudio de modo que, si la cifra asignada al arbitrario, y no refleja en ningún momento ausencia de la magnitud que estamos
objeto A es mayor que la de B, puede inferirse que A posee un mayor midiendo.
grado de atributo que B. y Esta escala, además de poseer las características de la escala ordinal, encontramos que la
asignación de los números a los elemento es tan precisa que podemos determinar la
magnitud de los intervalos (distancia) entre todos los elementos de la escala.
Ejemplo:
Ejemplo:
y Al asignar un número a los pacientes de una consulta médica, según el orden de
llegada, estamos llevando una escala ordinal, es decir que al primeo en llegar le
y El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.
asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada
número representará una categoría en general, con un solo elemento y se puede
establecer relaciones entre ellas, ya que los números asignados guardan la misma
relación que el orden de llegada a la consulta.

Escala de coeficientes o Razones: Ejercicio Aplicativo 1


y El nivel de medida más elevado es el de coeficientes o razones, y se En un programa para la detección de hipertensión en una muestra de 30
diferencia de las escalas de intervalos iguales únicamente por poseer hombres en edades entre 30 y 40 años, la distribución de la presión
diastólica (mínima) en mm Hg fue la siguiente:
un punto cero propio como origen; es decir que el valor cero de esta
escala significa ausencia de la magnitud que estamos midiendo. 70 85 85 75 65 90 110 95 90 70
y Además, siendo que cero ya no es arbitrario, sino un valor absoluto,
60 75 80 120 85 95 90 70 100 65
podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de
la propiedad presente en B. 80 90 95 90 95 110 100 85 80 75

Cual es el Marco Poblacional:


Ejemplo:
Cual es la Población:

y En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no Cual es el Marco Muestral:
tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que Cual es la Muestra:
tienen 3 hijos.
Cual es el Elemento o individuo
Cual es el dato
Que tipo de variable es:
Cual es la Unidad de Media..

En esta situación, identifique:


Ejercicio Aplicativo 2
La característica : Número de procesos deficientes por día.

En un Centro Médico se desea


estimar el número promedio diario de La unidad elemental : Un día (laboral).
procesos que no cumplen las normas
de calidad. Con este fin se elige por El marco poblacional : Número de días (laborales) que
sorteo 10 días laborales del último viene funcionando el Centro Médico.
mes. En uno de los días elegidos se
registraron 32 procesos médicos La población : Registro diario de procesos médicos
deficientes en todo el tiempo que
deficientes. viene funcionando el Centro Médico.

El marco muestral : Diez días laborales (elegidos al azar)


La muestra : Registro diario de procesos
deficientes durante los 10 días
elegidos al azar.

Tipo de dato : Variable cuantitativa discreta


PRESENTACION
Un dato registrado : 32
DE DATOS
La unidad de medida : Procesos

El estimador : Media aritmética muestral ( x)


El parámetro : Media aritmética poblacional (µ)

PARTES DE UNA TABLA


EFECTUADA LA RECOLECCION DE DATOS, ESTOS DEBEN
SEGUIR LOS SIGUIENTES PASOS:
‰ TITULO
‰ TALON
1)DESCRIPCION ‰ CUERPO
2)ANALISIS
3)GENERALIZACION ‰ NOTAS EXPLICATIVAS
PARA LA DESCRIPCION SE UTILIZAN TRES FORMAS DE TITULO
PRESENTACION:
TALON
•TABULAR
•GRAFICA CUERPO
•RESUMEN NUMERICO
NOTAS EXPLICATIVAS

Ejercicio Aplicativo 3
TABLAS ESTADISTICAS
Ordenamos los datos en forma creciente:
60 65 65 70 70 70 75 75 75 80
y Exponen la información recogida en la muestra de manera
inteligente: 80 80 85 85 85 85 90 90 90 90

y Frecuencias absolutas: Contabilizan el número de individuos de 90 95 95 95 95 100 100 110 110 120
cada modalidad.

y Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido


por el total, normalizadas. La amplitud total : A = 120 – 60 = 60

Número de clases: K = √30 = 5.48 Aprox. 6 clases


y Frecuencias acumuladas absolutas y relativas: Acumulan las
frecuencias absolutas y relativas. Son especialmente útiles para
Extensión del intervalo : H = A/ K = 60/6 = 10
calcular cuantiles (como veremos más adelante).
En este caso , entonces, la tabla de frecuencias tendrá aprox. 6 clases de amplitud 10 unidades
en cada clase.
TABLA DE FRECUENCIAS

Variable Frecuencia Frecuencia Frecuencia Frecuencia


normalizada acumulada acumuada norm.
x f fr F Fr
60 - 70 3 0.1 3 0.1 TIPOS DE GRAFICOS
70 - 80 6 0.2 9 0.3

80 - 90 7 0.23 16 0.53 TIPOS DE GRÁFICOS


90 - 100 9 0.3 25 0.83

100 - 110 2 0.07 27 0.90

110 - 120 2 0.07 29 0.97

120 - 130 1 0.03 30 1.00

total 30 1.0

PARTES DE UN GRAFICO Gráficos de barra


CARGO

‰ TITULO Se utilizan para representar variables de OPERARIO GENERAL

‰ ESCALAS tipo cualitativa, por lo general de OPERADOR DE MAQUINA


AUTOMATICA

‰ GRAFICO PROPIAMENTE DICHO nivel nominal. DESPACHADOR DE PRODUCTO


TERMINADO LOCAL

‰ NOTAS EXPLICATIVAS OPERADOR DE DOBLE FILO


OPERARIO GENERAL
OPERADOR DE DOBLE FILO

CARGO Frec

GRAFICO PROPIAMENTE Para graficarla, la variable debe haberse OPERARIO GENERAL 145
DICHO resumido previamente en una tabla de OPERADOR DE MAQUINA
10
AUTOMATICA
frecuencias...
DESPACHADOR DE PRODUCTO
8
TERMINADO LOCAL
OPERADOR DE DOBLE FILO 4
OPERADOR DE MAQUINA ST 12
OPERADOR DE SERVICIOS
1
GENERALES
OPERADOR GRAL. ALMACEN
NOTAS EXPLICATIVAS MATERIA PRIMA Y PRODUCTOS 5
TERMINADOS

Gráficos de barra Diagrama de Pareto


Se trata de una variante del gráfico de barras, en el que la
Elaborado con el Asistente para gráficos de Excel, el gráfico
tabla de frecuencias está ordenada de mayor a menor ...
puede verse como el que se muestra...
203 operarios clasificados en

160
145
203 operarios clasificados en
Este gráfico coloca los
140 160
145
valores con mayor
120 140 frecuencia hacia la
Núm ero de operarios

100 120
izquierda y los de
Nú m e r o d e o p e r ar io s

80 100
menor frecuencia a
60 80
la derecha
40 60

20 10 12
8 5
40
4 1
0
20 12 10
OPERARIO GENERAL OPERADOR DE MAQUINA DESPACHADOR DE OPERADOR DE DOBLE OPERADOR DE MAQUINA OPERADOR DE SERVICIOS OPERADOR GRAL. 8 5
AUTOMATICA PRODUCTO TERMINADO FILO ST GENERALES ALMACEN MATERIA
4 1
LOCAL PRIMA Y PRODUCTOS
0
TERMINADOS
OPERARIO GENERAL OPERADOR DE MAQUINA OPERADOR DE MAQUINA DESPACHADOR DE OPERADOR GRAL. OPERADOR DE DOBLE OPERADOR DE SERVICIOS
Tipo de operario ST AUTOMATICA PRODUCTO TERMINADO ALMACEN MATERIA FILO GENERALES
LOCAL PRIMA Y PRODUCTOS
TERMINADOS

Las barras están separadas entre si, y el ancho de las mismas no Tipo de operario

es representativo
Gráficos circulares Gráficos para variables cualitativas
Al igual que los gráficos de barra, se utilizan para representar variables de
tipo cualitativa, generalmente para representar distribuciones
porcentuales respecto a una clasificación. y Pictogramas

203 operadores según tipo y Fáciles de entender.


1% y Cada modalidad debe ser
2%
3%
proporcional a la
5%
4%
OPERARIO GENERAL frecuencia.
OPERADOR DE MAQUINA ST
6%
OPERADOR DE MAQUINA AUTOMATICA

DESPACHADOR DE PRODUCTO TERMINADO


LOCAL
OPERADOR GRAL. ALMACEN MATERIA
PRIMA Y PRODUCTOS TERMINADOS
OPERADOR DE DOBLE FILO

OPERADOR DE SERVICIOS GENERALES


79%

Excel brinda diferentes opciones respecto a la información


mostrada

Gráficos para variables cuantitativas Histogramas


DISCRETAS
Se utilizan para representar un conjunto de datos cuantitativos
Ejemplo de variable discreta
GRAFICO DE BARRAS GRAFICO INTEGRAL
continuos. En general se requiere previamente el cálculo de
Se lanzan tres monedas al aire en 8 una tabla de frecuencia, y su posterior representación.
ocasiones y se contabiliza el número de
caras, X, obteniéndose los siguientes
resultados: máximo 16,61
mínimo 10,92
rango 5,69
2,1,0,1,3,2,1,2 épsilon 0,0569 % 1
n 203
Resultado Evaluación
k 8,67 Sturges 9
Representar gráficamente el resultado. h 0,64 70
60
Frecuencia Operadores
50
Solución: En primer lugar observamos 10,89
40
11,53 1
que la variable X es cuantitativa 12,17 8
30
20
discreta, presentando las modalidades: 12,81 13
10
13,45 37
0,1,2,3 14,08 53 0
14,72 46 10,89 11,55 12,22 12,88 13,54 14,21 14,87 15,53 16,20
15,36 24
Salarios en miles de Bs.
16,00 17
16,64 4

Polígonos de frecuencia Ojiva


Están vinculados al histograma porque trabajan con la misma También se vincula a los histogramas, ya que usa la información
información. de la tabla de frecuencia (frecuencia acumulativa) para
generar un gráfico muy usado para hacer estimaciones y
Con dos pequeños cambios se
Resultado Evaluación puede convertir un generar respuestas
60
histograma en este
50
polígono.
Ojiva
O p erad o re s

40 Resultado Evaluación
30
1,2
20 1
Operadores

10 0,8

0 No es un gráfico muy difundido a 0,6


0,4
11,21 11,85 12,49 13,13 13,77 14,40 15,04 15,68 16,32 pesar de sus ventajas sobre el 0,2
Salarios en miles de Bs. histograma: 0
11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
Salarios en miles de Bs.

Asimismo permite comparar varios conjunto de datos


Permite comparar varios conjunto de datos
Ojiva Gráficos de caja
Por sus características, este gráfico se construye ubicando las Son gráficos muy simples que ayudan, entre otras cosas, a
frecuencias relativas acumulativas sobre los límites comparar la dispersión de dos o mas grupos de datos.
superiores de cada clase, en lugar de la marca de clase.

Cuartil 1 Cuartil 3
Ojiva máximo
Resultado Evaluación

1,2
1 mínimo
Operadores

0,8
0,6 mediana
0,4
0,2
0
11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64
Salarios en miles de Bs.

• Si la mediana está muy cerca del Q1, se dice que existe un sesgo
positivo.
Distintos diagramas de dispersión
• Si la mediana está muy cerca del Q3, se dice que existe un sesgo
negativo

• Si la mediana está en el centro entre Q1 y Q3, se dice que la


distribución es simetría en el 50% de los datos centrales

Gráficos temporales
Se utilizan para representar series de datos donde el eje
horizontal está representado por el tiempo, es decir la
variable evoluciona en el tiempo.

Energía Consumida Mensual

8.000
7.500
7.000
GWh

6.500
6.000
5.500
5.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
Meses

Estos gráficos son útiles para explorar datos donde no hay


relaciones causales conocidas con otras variables
Ejercicio Aplicativo 5

RESUMEN DE GRAFICAS ESTADISTICAS 1. L a estadística es una ciencia que sólo analiza datos

2. Los datos se organizan para mejorar su comprensión

3. El análisis de datos abarca el cálculo de promedio y


medidas de variabilidad

4. La interpretación de datos consiste en dar un sentido


real a los resultados obtenidos

5. Todo dato constituye información

6. Característica: 70 kgs

7. Una misma carácterística puede generar constantes o


variables, dependiendo del marco muestral de referencia

Ejercicio Aplicativo 5 Ejercicio Aplicativo 5


15.El parámetro representa a una población
8. El color de automóvil de los participantes es una variable
cualitativa, pues hay 13 cuyo automóvil es de color azul, 7 de
color beige y 2 rojos
16.Existen tantos parámetros como muestras se extraigan de
9. La variable cuantitativa proviene de un conteo una población

17.Diferentes muestras, extraidas de una misma población,


10.El tiempo que demora un proceso productivo es una variable ocasionan diferentes valores del estimador
cuantitativa continua
18.Los estimadores se representan por letras griegas
11.Los médicos del IPSS constituyen una población estadística

19.En la estadística descriptiva, el análisis se limita a un


12.Habrán tantas poblaciones como características que se conjunto de datos
deseen registrar en un marco poblacional
20.Las técnicas que permiten estimar un parámetro a partir
13.Cuanto más grande es la muestra, necesariamente será más de datos muestrales se denomina Estadística Inferencial
representativa
14.El muestreo permite disponer de los datos en menor tiempo, 21.El error del muestreo consiste en la equivocación cuando
reduciendo costos. seleccionamos la población.

También podría gustarte