Está en la página 1de 95

Generalidades

Lina María Salazar Torres


Cel: 3127228669
lsalazar42@unilasallista.edu.co
1: Quiz (6 o 7 de febrero)
2: Taller en clase- Tipo de variables y
escalas de medición (27-28 de
Seguimiento 30% febrero)
3: Taller en clase- Probabilidad (20-21
de marzo)
4: Taller de repaso (segundo parcial)
(29-30 de marzo)

Evaluación Parciales 40% (20% c/u)


Primer parcial 13-14 de marzo
Segundo parcial 17-18 de marzo

Final 30% 29-30 de mayo


EVALUACIONES VALOR (%) ESTRATEGIA DE EVALUACIÓN FECHA CONVENIDA

Primer parcial 20 Unidad 1 y Unidad 2 (conceptos basicos de investigacion)

Segundo parcial 20 Unidad 3 (dividida en: 30% taller práctico y 70% respuestas del parcial)

5 Quiz (proceso estadístico)

Seguimiento (mínimo 5% y
máximo 14%, para sumar 9 Taller (Tipo de variables y escalas de medición )
30%)

9 Taller (Probabilidad )

7 Taller de repaso (segundo parcial)

Examen final 30 Preguntas de las unidades (60%) y Analisis practico (40%)


UNIDAD
ESTADÍSTICA DESCRIPTIVA
 Proceso estadístico: elementos y conceptos básicos estadísticos.
 Tipos de variables y escalas de medición.
 Manejo y organización de datos: recolección, tabulación, análisis y
presentación de informes.
 Estadística de variables cuantitativas.
o Medidas de tendencia central: media aritmética, geométrica y
armónica.
o Medidas de dispersión: varianza, desviación estándar,
coeficiente de variación.
 Estadística de variables ordinales.
o Medidas de tendencia central: Mediana.
o Medidas de dispersión: Percentiles.
 Estudio de variables cualitativas.
o Moda.
o Proporciones.
PROCESO ESTADISTICO:
Elementos y conceptos básicos
estadísticos.
Definiciones
Datos son las observaciones recolectadas (como mediciones, géneros, respuestas de
encuestas).

Datos cuantitativos consisten en números que representan conteos o mediciones.


Ejemplo: edad, ingresos, peso, altura, presión, humedad o cantidad de hermanos

Datos cualitativos (o categóricos o de atributo) se dividen en diferentes categorías que se


distinguen por algunas características no numéricas.
Ejemplo: el color, especie, el género, raza o la marca de un producto.
Definiciones
Estadístico es una medición numérica que describe algunas características de
una muestra

Población es el conjunto completo de todos los elementos (puntuaciones,


personas, medidas, etcétera) que se va estudiar. El conjunto es completo
porque incluye a todos los sujetos que se estudiarán.

Parámetro es una medición numérica que describe algunas características de


una población.

Individuos o elementos: personas u objetos que contienen cierta información


que se desea estudiar.
Definiciones
Muestra: Parte de la población. Comprende todos los elementos que se miden.

Censo: Medición de una población. En este caso no habrá ni muestra ni inferencia.

Muestreo: Medición de una muestra.

Hipótesis: Suposición que se establece provisionalmente como base de una investigación


para luego ser confirmada o negada por una prueba científica

Variable: Característica de una población. Puede ser cuantitativa o cualitativa. Puede ser
independiente cuando se trata de una característica que se puede controlar durante el
estudio. También puede ser dependiente cuando se tratade la incógnita que se quiere
conocer.
Definiciones
Inferir: Presumir que las características de los elementos de toda la población tienen los
mismos valores que los elementos medidos en la muestra.

Confiabilidad: Grado de credibilidad que tienen las afirmaciones hechas acercade la


población. Puede entenderse como el complemento del riesgo. Si una afirmación tiene un
90% de confiabilidad, entonces se está corriendo un 10%de riesgo de que sea errada.

Margen de error: Rango de valores que puede tener un valor inferido con una
confiabilidad determinada. Es una especificación que debe cumplirse

Probabilidad: Relación entre la cantidad de casos que cumplen una condición y la cantidad
de casos posibles. Siempre será un valor entre 0 y 1, o sea, entre 0 y 100%.

Prueba estadística: Procedimiento científico que permite comprobar o refutar una


hipótesis.
Definiciones
Fuente de datos EI desempeño de actividades estadísticas obedece a la necesidad de
responder a diversas preguntas.

1. Registros rutinarios. Es difícil imaginar algún tipo de organización que no lleve registros
de la operación diaria de sus actividades.
2. Encuesta. Si los datos necesarios para contestar una pregunta no están disponibles a
partir de los registros almacenados de manera rutinaria, la fuente lógica puede ser una
encuesta.
3. Experimentación. Frecuentemente, los datos necesarios para responder una pregunta
están disponibles solo como resultado de la experimentación.
4. Fuentes externas. Los datos necesarios para responder a una pregunta pueden ya
existir como informes publicados, bancos de datos disponibles 0 en la literatura de
investigación.
Estadistica
El término estadística se deriva de la palabra latina status (que significa “estado”). Los primeros
usos de la estadística implicaron la recopilación de datos y la elaboración de gráficas, para
describir diversos aspectos de un estado o de un país.

Nacimientos y los decesos (1662) Tasas de mortalidad y de enfermedad,


tamaño de poblaciones, ingresos y tasas de
desempleo.

1. Triola MF. Mario F. Triola. 2009. 41 p.


Estadistica
Se ocupa de los métodos y procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa intrínseca de los mismos; as ı́ como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones
y en su caso formular predicciones.
Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando
métodos numéricos y gráficos que resumen y presentan la información contenida en
ellos.

Estadística inferencial: Apoyándose en el calculo de probabilidades y a partir de datos


muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones
sobre un conjunto mayor de datos.
Es󰉃a󰇶󰈎s󰉃󰈏󰇸a
Planea método Obtener datos

Descriptiva Inferencial

resumir o describir
inferencias (o generalizaciones)
características
más allá de los datos conocidos

datos conocidos
La bioestadística puede ser definida como la rama de la estadística
aplicada que corresponde a la aplicación de los métodos estadísticos
en ciencias de la salud y en biología.

• Ayudar a comprender las causas posibles de un enfermedad


• Frecuencia de presentación de una enfermedad.
• Enfermedades en un grupo determinado de personas.
• Efecto y efectividad de fármacos
• Indicador de producción
• Indicadores de reproducción.
Mu󰈩s󰉃󰈹󰇵o
Tiempo Dinero Recursos

Representativa
(población de estudio)

Selección de muestra Selección de variables

validez
Tamaño
Representativa Aleatoria
característica
Fuentes de información

• Observación directa:
– Exploración física
– Exploraciones complementarias
• Entrevistas y cuestionarios
• Registro de datos por el propio
paciente/propietario
• Informador indirecto
• Registros y documentos ya existentes (datos
secundarios):
– Datos individuales
– Datos agregados
Muestreo
Proceso
Obtener datos ¿Cómo? ¿Qué? ¿A quien? ¿Cuándo?
Digitación
Organizar Base de datos (codificación) Datos faltantes
Diccionario de variables
Resumir
Presentar Univariado
Técnica estadística Bivariado
Analizar Multivariado
Interpretar Resultados

Conclusiones Plausibilidad

Decisiones
Tip󰈡󰈻 󰇶󰇵 va󰈸󰈎󰇽󰇻le󰈻
y
es󰇹󰈀󰈘󰇽s 󰇷e 󰈛󰈩d󰈏󰇹ió󰈞.
Variables
Característica de una población, la cual se referencia con símbolos. Puede
ser cuantitativa o cualitativa tomando cualquier valor. Puede ser
independiente cuando se trata de una característica que se puede
controlar durante el estudio. También puede ser dependiente cuando se
tratade la incógnita que se quiere conocer.

V. Cuantitativa V. Cualitativa
Criterios de selección.
Medición del factor o de respuesta.
Variables Confusión –efecto –cadena causa.
Descriptoras de los sujetos estudiados.
Otras variables de interés.
Recoger tantas variables como
sean necesarias y tan pocas como
sea posible.
Tener en cuenta:
• Variaciones biológicas
Claras Operativas Preciso • Errores técnicos
1. Humano
2. Instrumental
• Precisión
• Validez
Variables cualitativas
• Adquieren valores no numéricos
• Son relativas y generales
• Arrojan datos categóricos

Variables politómicas. Son aquellas variables que pueden adquirir tres o más valores.
Existen dos subtipos de variables politómicas

Variables dicotómicas. Son aquellas variables que expresan atributos, que se miden
con la escala nominal y que solo pueden adoptar un valor entre dos opciones. Por
ejemplo: La modalidad de los cursos de idioma, cuyos valores son presencial o virtual.
El nivel de medición nominal se caracteriza por datos que
consisten exclusivamente en nombres, etiquetas o categorías.
Los datos no se pueden acomodar en un esquema de orden
(como del más bajo al más alto).
EJEMPLOS
1. Sí/no/indeciso: Respuestas de sí, no e indeciso en una
encuesta
2. Colores: Los colores de los automóviles conducidos por
estudiantes universitarios (rojo, negro, azul, blanco, magenta,
púrpura, etcétera)
Los datos están en el nivel de medición ordinal cuando
pueden acomodarse en algún orden, aunque no es posible
determinar diferencias entre los valores de los datos o tales
diferencias carecen de significado.
EJEMPLOS
1. Las calificaciones de un curso: Un profesor universitario
asigna calificaciones de A, B, C, D, E o F.
2. Rangos: Con base en varios criterios, una revista ordena
las ciudades de acuerdo con su “habitabilidad”. Dichos
rangos (primero, segundo, tercero, etcétera) determinan
un orden.
Variables cuantitativo
• Adquieren valores numéricos
• Son medibles
• Son contables

Variables discreta. cuando no admiten siempre una modalidad intermedia entre


dos cualesquiera de sus modalidades. Conformado por números enteros.

Variables continua. cuando admiten una modalidad intermedia entre dos


cualesquiera de sus modalidades, Valores en intervalos (toma como valor los
decimales)
El nivel de medición de intervalo se parece al nivel ordinal, pero con la propiedad
adicional de que la diferencia entre dos valores de datos cualesquiera tiene un
significado. Sin embargo, los datos en este nivel no tienen punto de partida cero
natural inherente (donde nada de la cantidad está presente).

EJEMPLOS
1. Temperaturas: Las temperaturas corporales de 98.2°F y 98.6°F son ejemplos de datos a nivel de medición
de intervalo. Dichos valores están ordenados, y podemos determinar su diferencia de 0.4°F.
2. Años: Los años 1000, 2008, 1776 y 1492. (El tiempo no inició en el año 0, por lo que el año 0 es arbitrario y
no constituye un punto de partida cero natural que represente “la ausencia de tiempo”).
El nivel de medición de razón es similar a nivel de
intervalo, pero con la propiedad adicional de que sí
tiene un punto de partida cero natural (donde el cero
indica que nada de la cantidad está presente). Para
valores a este nivel, tanto las diferencias como las
proporciones tienen significado.

1. Pesos: Los pesos (en quilates) de anillos de compromiso de


diamante (el 0 realmente representa la ausencia de peso y 4
quilates es dos veces el peso de 2 quilates).
2. Precios: Los precios de libros de texto universitarios ($0
realmente representa ningún costo y un libro de $90 es tres
veces más caro que un libro de $30).
Naturaleza de la variable Nivel de medición

Dicotómica Nominal
cualitativos
Politómica Ordinal
Escalas de medida Discretas Razón
cuantitativas
Continuas Intervalo
Ejemplos
Variable Naturaleza de la variable Nivel de medición Valores

Edad Cualitativo
Edad Cuantitativo
Peso
Raza
CC
Estado de
conciencia
Litros de leche
Numero de crías
Mastitis
Rabdomiolisis
Escojan una enfermedad y propongan 5 variables donde indicaran :
-Naturaleza de variable
-Nivel de medición
-Valores (si aplican)

6.Displacía de cadera en 3.Rabdomiolisis en equinos 4.Parvovirus en


caninos caninos

2. Mastitis en bovinos 1.Timpanismo en bovinos 9. Calicivirus en felinos

8.Disentería en porcinos 7.Cólico en equinos 5.Enfermedad de Newcastle aves

https://www.3tres3.com/latam/enfermedades/disenteria-porcina_116
Variable Naturaleza de la variable Nivel de medición Valores

Raza de bovinos
Tipo de alimentación
Tipo de pensión equinos
Fase del cáncer
Tipo de producción en bov
Cantidad de alimento día
Nivel de glicemia
Nivel de hematocrito
Tamaño del bazo en cm (eco)
Dependiente (Efecto) Es el fenómeno que resulta, el que debe explicarse.

Relación
Independiente(Causa) Es el motivo, o explicación de ocurrencia de otro fenómeno.
Variable dependientes e independiente

Crecimiento de una planta Cantidad de sol

Suministro de insulina Nivel de glucemia en sangre

Paciente con parvovirus Contacto con secreciones con parvovirus

Consumo de mantequilla de maní Diabetes en gatos

Nota obtenida Horas de estudio


Categorización
Una de las transformaciones más utilizadas es la categorización.
Categoriza las variables

Pasar de Cuantitativa discreta de intervalo a


cualitativa politómica ordinal

Cuantas categorías?
Manejo y organización de
datos:
recolección, tabulación,
análisis y presentación de
informes.
Recolección de datos

Grandes conjuntos de datos

A menudo es útil

Organizarlos y resumirlos

Tabla llamada distribución


de frecuencias
términos estándar
Edades de una Una distribución de frecuencias(o tabla de frecuencias) lista valores de los
datos (ya sea de manera individual o por grupos de intervalos), junto con sus
muestra: frecuencias (o conteos) correspondientes
- 21 a 30 años
- 31 a 40 años
Los límites de clase inferiores son las cifras más pequeñas que pueden
- 41 a 50 años pertenecer a las diferentes clases.
- 51 a 60 años
- 61 a 70 años
- 71 a 80 años Los límites de clase superiores son las cifras más grandes que pueden
pertenecer a las diferentes clases.
términos estándar

Las fronteras de clase son las cifras que se utilizan para separar las clases,
pero sin los espacios creados por los límites de clase.
Edades de una
muestra:
- 21 a 30 años Las marcas de clase son los puntos medios de las clases.
- 31 a 40 años
- 41 a 50 años ( )
Marca de clase =
- 51 a 60 años
- 61 a 70 años
- 71 a 80 años La anchura de clase es la diferencia entre dos límites de clase inferiores
con secutivos o dos fronteras de clase inferiores consecutivas.
TABLAS DE FRECUENCIAS
Una distribución de frecuencias(o tabla de frecuencias) lista
valores delos datos (ya sea de manera individual o por grupos
de intervalos), junto con sus frecuencias (o conteos)
correspondientes.

Relativas Absolutas
Distribución de frecuencias absoluta
Es el número de veces que se repite un resultado en el
conjunto de todos los observados.

Distribución de frecuencias absoluta acumulada


Es la suma de las frecuencias absolutas.
Distribución de frecuencias relativas
Una variante importante de la distribución básica de frecuencias utiliza las
frecuencias relativas, que se obtienen fácilmente dividiendo cada frecuencia
de clase entre el total de frecuencias.

Distribución de frecuencias relativas acumulada


Es la suma de las frecuencias relativas.
Como se organizan los datos
Los datos se suelen guardar en un fichero que contiene filas y columnas.
Este fichero se llama base de datos.

Individuos u observaciones

Variables
PASO 1 PASO 2
PASO 2 PASO 3
PASO 3 PASO 4
PASO 5
PASO 6
PASO 7
TABLAS DE FRECUENCIA
El título debe El cuerpo del cuadro
Constan de: reunir dos consta de un
condiciones conjunto de
• Título, Cuerpo, • Responder a las columnas y filas.
Notas preguntas:
explicativas. ¿qué?, ¿cómo?,
¿dónde?,
¿cuándo?
• Concreto
Al elaborar cuadros
estadísticos, con frecuencia • Disposición incorrecta de los datos.
se cometen errores que • Títulos y encabezados incompletos o inadecuados.
deben evitarse; los • Cuadros que solamente presentan porcentajes.
siguientes son algunos de • Cuadros con mucha información.
los más comunes:

• Título.
• Continuar con las notas explicativas.
• Identificar las unidades de medida que se reportan.
Para leer un cuadro • Observar los resultados correspondientes a las celdas
de totales (columnas y filas).
debemos seguir un
• Comparar los totales con las diferentes celdas que
orden, que puede ser contengan información.
el siguiente: • Relacionar las variables que se estudian.
• Buscar, intencionadamente, irregularidades de los
datos.
• Elaborar una conclusión final del cuadro.
Edades de las actrices
en los rangos:
- 21 a 30 años
- 31 a 40 años
- 41 a 50 años
- 51 a 60 años
- 61 a 70 años
- 71 a 80 años
Edades de los actrices
en los rangos:
- 21 a 30 años
- 31 a 40 años
- 41 a 50 años
- 51 a 60 años
- 61 a 70 años
- 71 a 80 años
GRÁFICOS ESTADÍSTICOS
Los utilizados con mayor
Al igual que en los cuadros, frecuencia son:
en los gráficos también se
consideran:

Diagrama de sectores o gráfico de pastel (Cualitativas)

Título.

Diagrama de barras y columnas (Cualitativas)


Cuerpo del gráfico.

Notas explicativas. Gráfico de cajas y bigotes (Mixta)

Histograma (Cuantitativa)
Grafico de sectores

También conocido como grafica de pastel.


Su uso solo se recomienda para variables
cualitativas nominales de máximo 5 categorías.
Grafico de barras

Esta formada por barras o rectángulos cuya


altura es proporcional al numero de
observaciones en cada categoría.
Los rectángulos están separados entresi
Se utiliza en variables que cumplen un orden.
Grafico: Histograma

Esta formada por barras o rectángulos están juntos y


la altura es proporcional al numero de observaciones
en cada categoría.
Se utiliza en variables continuas.
El histograma contempla todos los
posibles valores dentro de un rango (aunque no
ocurran en la muestra) y los valores próximos se
reúnen en una misma categoría.
Grafico de tallos y hojas

La ventaja es que el rectángulo


está relleno con los propios
valores numéricos, pero se evita
la repetición de los primeros
dígitos de cada cifra. Se puede
elegir su amplitud, aunque
siempre es preferible que las
amplitudes sean de 5 o de 10
unidades.
Grafico: Polígono de frecuencia acumulada

Esta representación considera las


frecuencias acumuladas. Se trata de ir
representando cuántos sujetos en la muestra
presentan, por lo menos, un determinado
valor de la variable.
Variable cuantitativa
Grafico de cajas y bigotes

Es una representación de uso


creciente por sus interesantes
propiedades descriptivas. Se utiliza
para variables cuantitativas.
Consiste en un rectángulo, que es la
caja, y unas prolongaciones
verticales, que son los bigotes.
Los límites de la caja son los
percentiles 25 y 75; La línea que se
encuentra en el centro de la caja es
la mediana (percentil 50).
Variable cualitativa y cuantitativa
Grafico de dispersión

La descripción de la relación entre


dos variables numéricas se hace
mediante un gráfico de dispersión.
Dos variables numéricas.
Características importantes de los datos
1. Centro: Valor promedio o representativo que indica la
localización de la mitad del conjunto de los datos.
2. Variación: Medida de la cantidad en que los valores de los datos
varían entre sí.
3. Distribución: La naturaleza o forma de la distribución de los
datos (como en forma de campana, uniforme o sesgada).
4. Valores extremos: Valores muestrales que están muy alejados
de la vasta mayoría de los demás valores de la muestra.
5. Tiempo: Características cambiantes de los datos a través del
tiempo.
Medidas de tendencia central
Media aritmética Mediana
Moda

La primera y principal El valor central del conjunto ordenado de


medida de tendencia observaciones; es decir, el valor que deja
central es la media La moda tiene poco
la mitad de las observaciones por debajo interés.
aritmética. y la mitad por encima.

Es la suma de todos los El 50% de los individuos estudiados


tienen una valor igual o menor a la Es el valor más
valores (xi) dividida por el frecuente
número de observaciones (n). mediana y el otro 50% un valor igual o
superior.

Se deja influir mucho por los Cuando el número de datos es par, para Puede ocurrir que el
valores extremos hallar la mediana se calcula la media valor más frecuente
entre los dos datos centrales. no sea único.

La mediana es robusta porque no se


deja influir mucho por valores
extremos.
Medidas de tendencia central

Media Mediana Moda


Dato del El que mas
medio se repite

𝑓 −𝑓
𝑀𝑜 = 𝐿 + 𝐴
𝑓 −𝑓 + (𝑓 )
Edad x fi=ni Fi=Ni Xfi
(años)
21-30 4
31-40 10 Me=
41-50 9 Mo=
51-60 3
61-70 1
=
Me=
Mo=
Medidas de dispersión
Rango
Es la diferencia entre el valor
máximo y el valor mínimo
𝑟𝑎𝑛𝑔𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − (𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜)

Se resta el valor mínimo del valor


máximo.

No es tan útil como otras medidas


de variación que incluyen cada
valor.
Rango Medidas de dispersión
intercuartílico
Así como la mediana divide los datos en dos partes iguales

Los cuartiles (Q1, Q2 y Q3) dividen los valores ordenados en cuatro partes iguales.

Q1 = dividen los valores ordenados en cuatro partes iguales.


Q2 = Igual a la mediana; separa el 50% inferior de los valores ordenados del 50% superior.
Q3 = Separa el 75% inferior de los valores ordenados del 25%
superior
Medidas de dispersión
Varianza

Es una descripción general de la cantidad que varían


los valores entre sí. (dispersión)

De un conjunto de valores es una medida de variación


igual al cuadrado de la desviación estándar.

Se dice que la varianza muestral s2 es un estimador sin


sesgo de la varianza poblacional σ2
Medidas de dispersión
Varianza
Medidas de dispersión
Desviación estándar de la
muestra

La medida de variación más importante y útil.

Es la medida de variación de los valores con respecto a la


media

El valor de la desviación estándar s es positivo. (Nunca es


negativa)

Sólo es igual a cero cuando todos los valores de los datos


son el mismo número.

Valores grandes de s implican mayores cantidades de


variación.

puede aumentar de manera drástica con la inclusión de uno o


más valores extremos
Medidas de dispersión

1. Calcule la media
2. Reste la media de cada valor individual para obtener una
lista de desviaciones de la forma
3. Eleve al cuadrado cada una de las diferencias del paso 2
4. Sume todos los cuadrados obtenidos en el paso 3.
5. Divida el total del paso 4 entre el numero de (n-1); el 1
menos que el total de los valores.
6. Calcule la raíz cuadrada del resultado del paso 5.
Medidas de dispersión
Desviación estándar
de la población

La desviación estándar
nos referimos a datos
muestrales

La desviación
estándar σ (sigma
minúscula)
Coeficiente
Medidas de dispersión
de variación

El coeficiente de variación es el cociente entre la desviación típica y el


valor de la media * 100.

El coeficiente de variación representa la desviación estándar medida en


unidades de magnitud relativas a la media. Aunque se exprese como
porcentaje, puede tomar valores por encima del 100% .
Ejercicio

Medidas de dispersión
Desviación estándar
Rango
Rango intercuartílico
Varianza
Coeficiente de variación
HISTOGRAMA
BIVARIADO CUANTITATIVO

También podría gustarte