Está en la página 1de 59

La estadística, es la ciencia que recolecta,

organiza, resume, analiza y toma decisiones ante


situaciones de incertidumbre.

La complejidad de los sistemas biológicos y de salud


asociada a la variabilidad experimental requiere la
aplicación de matemáticas y estadísticas para
entender las diversas problemáticas y situaciones,
con el objeto de analizar datos experimentales de
una manera cuantitativa.
El análisis estadístico tiene dos funciones:

1. Organizar y describir datos experimentales que han sido


recolectados

2. Proporcionar conclusiones inferenciales acerca de una


población, a partir de datos experimentales de la (s) muestra
(s) consideradas.
MÉTODO ESTADÍSTICO: PLANTEAR HIPÓTESIS --->
DISEÑAR EXPERIMENTOS---> RECOGER
DATOS Y ANALIZARLOS--->OBTENER
CONCLUSIONES
"La bioestadística (...) enseña y ayuda a
investigar en todas las áreas de las
ciencias de la vida donde la variable no
es la excepción, sino la regla".
(CARRASCO DE LA PEÑA, 1982)
Población

Es el colectivo que abarca a todos los elementos cuya característica o


características queremos estudiar; dicho de otra manera, es el
conjunto entero al que se desea describir o del que se necesita
establecer conclusiones.

Como ejemplos de poblaciones, podemos citar: todos los estudiantes


de la Universidad Central del Ecuador, o los artículos producidos en
una semana en una determinada fábrica.

Por su tamaño, las poblaciones pueden ser finitas o infinitas.


Muestra

Es un conjunto de elementos seleccionados de una


población de acuerdo a un plan de acción previamente
establecido (muestreo), para obtener conclusiones que
pueden ser extensivas hacia toda la población.

Ejemplos constituyen las muestras que escogen las empresas


encuestadoras en estudios de sondeos de opinión, o la
selección de un grupo de artículos recibidos en una bodega
para estimar las condiciones de todo un embarque.
Censo

Es el estudio de todos y cada uno de los elementos de una


población. Esta condición hace que este tipo de estudios no
sean muy frecuentes, por cuanto la recolección de toda esa
información, sobre todo cuando el tamaño de la población es
muy grande o sus elementos se encuentran muy dispersos, sea
muy costosa.

Ejemplo: último censo de población y vivienda que se realizó en


Ecuador.
Muestreo

Es la técnica que nos permite seleccionar muestras adecuadas


de una población de estudio. El muestreo debe conducir a la
obtención de una muestra representativa de la población de
donde proviene, esta condición establece que cada elemento
de la población tiene la misma probabilidad de ser incluida en la
muestra. El estudio de selección de muestras, en sí constituye
todo un estudio pormenorizado.
Parámetro

Es cualquier medida descriptiva o


representativa de una población.
Generalmente se utilizan las letras griegas como
símbolo.

Ejemplos: media aritmética poblacional (μ)


(mu), desviación estándar poblacional (σ)
(sigma).
Estadístico

Constituyen cualquiera de las medidas


descriptivas de una muestra. Se las simboliza con
letras minúsculas de nuestro alfabeto.

Ejemplos: media aritmética (x), desviación


estándar (s).
Estadística descriptiva

Es la parte de la estadística que permite analizar todo un conjunto


de datos, de los cuales se extraen conclusiones valederas,
únicamente para ese conjunto.

Para realizar este análisis se procede a la recolección y


representación de la información obtenida.

Como ejemplo de estas estadísticas podemos citar a aquellas que


se obtienen generalmente en los deportes, en los rendimientos
académicos de los estudiantes de una determinada materia, en
los negocios al determinar las ventas obtenidas mensualmente en
un determinado año por una empresa en particular.
Estadística inferencial

En esta rama de la estadística, lo que se pretende es


obtener conclusiones generales de una determinada
población, mediante el estudio de una muestra
representativa sacada de ella, dicho de otra manera,
lo que se trata es que, con el valor de los estadísticos
obtenidos, podamos establecer los valores de los
parámetros.
Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden


ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal


Una variable cualitativa nominal presenta modalidades no numéricas que no
admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes
modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasi cuantitativa


Una variable cualitativa ordinal presenta modalidades no numéricas, en las que
existe un orden. Por ejemplo:
 La nota en un examen: suspenso, aprobado, notable, sobresaliente.
 Puesto conseguido en una prueba deportiva: 1º, 2º, 3º,...
 Medallas de una prueba deportiva: oro, plata, bronce.
Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por


tanto se pueden realizar operaciones aritméticas con ella. Podemos
distinguir dos tipos:

- Variable discreta
Una variable discreta es aquella que toma valores aislados, es decir no
admite valores intermedios entre dos valores específicos. Por ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

- Variable continúa
Una variable continua es aquella que puede tomar valores comprendidos
entre dos números. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77,
1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría
dar con tres.
Práctica

1. Proponga dos elementos de estudio que sean de su interés y


anote algunas variables de cada tipo que desearía
conocer.

2. En un estudio estadístico se observó el tiempo que toma en


llegar a su lugar de trabajo desde su lugar de residencia.
Determine cuál es el elemento de observación, cuál es la
variable de estudio y de qué tipo es.
Tipo de variable en SPSS
La propiedad del tipo de variable especifica los tipos de datos de cada variable. Por
defecto se asume que todas las variables nuevas son numéricas.
Los tipos de variable disponibles son los siguientes:

•Numérico. Una variable cuyos valores son números, se muestran en formato numérico
estándar.

Coma. Una variable numérica cuyos valores se muestran con comas que delimitan cada tres
posiciones y con el punto como delimitador decimal.

Punto. Una variable numérica cuyos valores se muestran con puntos que delimitan cada tres
posiciones y con la coma como delimitador decimal. Los valores no pueden contener
puntos a la derecha del indicador decimal.

Notación científica. Una variable numérica cuyos valores se muestran con una E intercalada
y un exponente con signo que representa una potencia de base diez. El Editor de datos
acepta para estas variables valores numéricos con o sin el exponente.
•Fecha. Una variable numérica cuyos valores se muestran en uno de los diferentes formatos
de fecha-calendario u hora-reloj. Es necesario seleccionar un formato de la lista. Para
introducir la fecha se pueden utilizar: barras, guiones, puntos, comas o espacios.

Dólar. Una variable numérica que se muestra con un signo dólar inicial ($), comas que
delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir
valores de datos con o sin el signo dólar inicial.

Moneda personalizada. Una variable numérica cuyos valores se muestran en uno de los
formatos de moneda personalizados que se hayan definido previamente en la pestaña
Moneda del cuadro de diálogo Opciones. Los caracteres definidos en la moneda
personalizada no se pueden emplear en la introducción de datos pero sí se mostrarán en
el Editor de datos.

Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, no se utilizan en los
cálculos. Las mayúsculas y las minúsculas se consideran diferentes. Este tipo también se
conoce como variable alfanumérica.
Escala Nominal.

Su fin es identificar sujetos/objetos dentro de una distribución, por lo


que únicamente podremos establecer las relaciones de
igualdad/desigualdad entre los sujetos/objetos de una distribución.

Un ejemplo es el nombre de las ciudades: solo podemos diferenciarlas


entre sí de acuerdo con esta escala.

El número de los jugadores de fútbol o de baloncesto nos proporciona


la misma información: solo sirve para identificarlos y diferenciarlos del
resto de jugadores, no podemos establecer ningún tipo de orden o de
gradación en función de este número.
Escala Ordinal.

Este tipo de escala está destinada a ordenar a los sujetos/objetos de


una distribución en función de alguna característica.

Cabe señalar que la distancia entre sus unidades no es uniforme. De


esta forma, podemos decir que A está por encima que B, pero no que
sea el doble o que sea la mitad uno que otro.

Un ejemplo es el orden de llegada en una carrera. Además del atributo


de igualdad/desigualdad, en esta escala podemos añadir el
ordenamiento de sus componentes.
Escala de Intervalo.

En esta escala la distancia entre las unidades de medida sí es


uniforme, de forma que podemos decir que D es el doble que A, por
ejemplo. Por ello, permite realizar operaciones matemáticas, como
suma, resta, multiplicación o división. El cero es arbitrario, no indica la
ausencia de atributo. Como ejemplo puede servir la escala de tiempo
que utilizamos: el cero es arbitrario, puesto en el nacimiento de Cristo,
o la escala para medir la temperatura en grados centígrados, en la
que el cero es también relativo
Escala de Razón.

Similar a la de intervalo, con la única diferencia que el


cero en esta escala sí indica la ausencia de atributo,
es cero absoluto. Como ejemplo podemos señalar la
altura en centímetros, o el peso en gramos. En ambos
casos 4 es doble que 2 (2+2=4), o 4 es la mitad que 8,
por ejemplo, debido a que la distancia entre sus
unidades de medida es uniforme
Medidas de tendencia central y posición

Las medidas de tendencia central son


medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores.

Representan un centro en torno al cual se


encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más
utilizadas son: media, mediana y moda.
Promedio o media

La medida de tendencia central más conocida y utilizada es la


media aritmética o promedio aritmético.

Se representa por la letra griega µ cuando se trata del


promedio del universo o población y por Ȳ (léase Y barra)
cuando se trata del promedio de la muestra.

Es importante destacar que µ es una cantidad fija mientras que


el promedio de la muestra es variable puesto que diferentes
muestras extraídas de la misma población tienden a tener
diferentes medias. La media se expresa en la misma unidad que
los datos originales: centímetros, horas, gramos, etc.
Mediana

Otra medida de tendencia central es la mediana. La mediana


es el valor de la variable que ocupa la posición central, cuando
los datos se disponen en orden de magnitud. Es decir, el 50% de
las observaciones tiene valores iguales o inferiores a la mediana
y el otro 50% tiene valores iguales o superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde


al promedio de los dos valores centrales. Por ejemplo, en la
muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Moda

La moda de una distribución se define como el valor


de la variable que más se repite. En un polígono de
frecuencia la moda corresponde al valor de la
variable que está bajo el punto más alto del gráfico.
Una muestra puede tener más de una moda.
Práctica 1
Encontrar la media, mediana y moda de los
siguientes valores: 84; 91; 72; 68; 87; 78; 65; 87; 79.
Las Medidas de Dispersión

Las medidas de dispersión en cambio miden el grado de


dispersión de los valores de la variable.

Dicho en otros términos las medidas de dispersión pretenden


evaluar en qué medida los datos difieren entre sí.

De esta forma, ambos tipos de medidas usadas en conjunto


permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.
Desviación típica.- Medida de dispersión en torno a la
media
Varianza.- Medida de dispersión en torno a la media.
Rango.- Diferencia entre los valores mayor y menor de una
variable numérica.
Mínimo.- Valor más pequeño de una variable numérica
Máximo.- El mayor valor de una variable numérica
E. T. Media.- Medida de cuánto puede variar el valor de la
media de una muestra a otra, extraídas éstas de la misma
distribución.
PRÁCTICA 2
Diagrama de Barras

Es un Diagrama que emplea barras en forma rectangular y que


son proporcionales a las frecuencias que representan; con este
tipo de diagrama se pueden comparar dos o más valores. Se
utiliza para representar los caracteres cualitativos y
cuantitativos discretos. En el eje horizontal, o eje de abcisas (x),
se representan los datos o modalidades; en el eje vertical o de
ordenadas (y), se representan las frecuencias de cada dato o
modalidad
El Diagrama de Sectores también se conoce como
Gráfico de Torta o Gráfico Circular. Representa los
datos en un círculo, de modo que la frecuencia de
cada valor viene dada por un trozo de área del círculo.
Así, el círculo queda dividido en sectores cuya amplitud
es proporcional a las frecuencias de los valores. Con
este tipo de gráfica estadística se puede representar
cualquier variable.
Un histograma es una representación gráfica de una variable en forma de
barras (no separadas entre sí), donde la superficie de cada barra es
proporcional a la frecuencia de los valores representados. En el eje vertical
se representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente señalando las marcas de clase, es decir, la mitad
del intervalo en el que están agrupados los datos.

Se utiliza cuando se estudia una variable continua, como franjas de


edades o altura de la muestra, y, por comodidad, sus valores se agrupan
en clases, es decir, valores continuos. En los casos en los que los datos son
cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de
estudios, es preferible un diagrama de sectores
Calcular la media aritmética, la desviación típica y graficar
Trabajo Práctico 1

Respuestas:
- Medidas de tendencia central: Promedio 8,8 horas, Media: 9horas, Moda: 9horas
- Medidas de dispersión: Desviación estándar: 1,24 horas, Rango: 5 horas
- Grafique
2.1.- Muestreo
2.1.1.- Muestreo probabilístico
2.1.2.- Muestreo no probabilístico
2.2.- Elementos de probabilidad para la inferencia estadística
2.3.- Distribuciones de probabilidad y distribuciones muéstrales
con variables cuantitativas
2.3.1.- Curva normal
2.4.- Prueba de hipótesis
Muestreo (estadística)

En la estadística, se conoce como


muestreo a la técnica para la selección
de una muestra a partir de una población
estadística.
Muestreo Probabilístico

Este método utiliza la teoría estadística para seleccionar al azar


un pequeño grupo de personas (muestra) de una gran población
existente y luego predecir que todas las respuestas juntas
coincidirán con la población en general.
Muestreo Aleatorio Simple

El muestreo aleatorio simple, tal y como su nombre lo indica,


es un método completamente aleatorio que se utiliza para
seleccionar una muestra

Por ejemplo: para tomar una muestra de 10 escuelas, sobre


una población de 200 escuelas que hay en el país, cada
escuela obtiene un número al azar. Entonces, a modo de
sorteo, se seleccionan 10 números que conformarán dicha
muestra
Muestreo estratificado: este es un método en el cual una
población grande se divide en dos grupos más pequeños,
que generalmente no se superponen, sino que
representan a toda la población en conjunto
Muestreo por conglomerados: este es
un método que selecciona de
manera aleatoria a los participantes
cuando están dispersos
geográficamente.
El muestreo no probabilístico es una técnica de
muestreo en la cual el investigador selecciona muestras
basadas en un juicio subjetivo en lugar de hacer la
selección al azar

A continuación los tipos:


El muestreo por conveniencia es una técnica de muestreo no
probabilística donde las muestras de la población se seleccionan solo
porque están convenientemente disponibles para el investigador.

Ejemplo: utilizar a estudiantes voluntarios que sean conocidos del investigador. El


investigador puede enviar la encuesta a los estudiantes y ellos en este caso actuarían
como muestra.
En el muestreo consecutivo el investigador elige una sola
persona o un grupo de muestra, realiza una investigación
durante un periodo de tiempo, analiza los resultados y luego
pasa a otra asignatura o grupo de sujetos si es necesario.

Ejejmplo: Esta técnica de muestreo le da al investigador la


oportunidad de trabajar con muchos temas y afinar su
investigación mediante la recopilación de resultados que tienen
conocimientos vitales
Muestreo por cuota:

El investigador solo necesitará una muestra, no a toda la


población.

Ejemplo:

Para estudiar los objetivos de más de 500 empleados, técnicamente la muestra seleccionada
debe tener un número proporcional de hombres y mujeres. Lo que significa que deben haber 250
hombres y 250 mujeres. Como esto es improbable, los grupos o estratos se seleccionan mediante el
muestreo por cuotas
Elementos de probabilidad para la inferencia estadística

- La población en la cual se pretende estudiar la característica de interés y


el procedimiento científico que se utiliza para muestrear la población.
- La muestra y su análisis descriptivo.
- Las inferencias estadísticas que resulten del análisis descriptivo de la
muestra.
- La probabilidad de que las inferencias realizadas sean correctas.
Distribuciones de probabilidad y distribuciones muéstrales con variables
cuantitativas

Una distribución muestral es una función de probabilidad, ya que asigna a


cada posible valor de un estadístico su probabilidad de aparecer en una
muestra extraída al azar. En realidad, esta definición es estrictamente cierta
solo cuando la variable toma valores discretos; por ejemplo, cuando
procede de un contaje y sus posibles valores son 0, 1, 2, 3, etc. Cuando el
valor del estadístico muestral es una variable continua, la distribución
muestral correspondiente se denomina función de densidad de
probabilidad.
Prueba de hipótesis
Es una regla que especifica si se puede aceptar o rechazar
una afirmación acerca de una población dependiendo de
la evidencia proporcionada por una muestra de datos.

Una prueba de hipótesis examina dos hipótesis opuestas


sobre una población: la hipótesis nula y la hipótesis
alternativa. La hipótesis nula es el enunciado que se probará.
Por lo general, la hipótesis nula es un enunciado de que "no
hay efecto" o "no hay diferencia". La hipótesis alternativa es el
enunciado que se desea poder concluir que es verdadero
de acuerdo con la evidencia proporcionada por los datos de
la muestra.
El coeficiente de correlación de Pearson es una
prueba que mide la relación estadística entre dos
variables continuas. Si la asociación entre los
elementos no es lineal, entonces el coeficiente no se
encuentra representado adecuadamente
Un intervalo de confianza es una técnica de estimación utilizada en
inferencia estadística que permite acotar un par o varios pares de
valores, dentro de los cuales se encontrará la estimación puntual
buscada (con una determinada probabilidad).

En conclusión, el intervalo de confianza no sirve para dar una


estimación puntual del parámetro poblacional, si nos va a servir para
hacernos una idea aproximada de cuál podría ser el verdadero de
este. Nos permite acotar entre dos valores en dónde se encontrará la
media de la población.
Fundamentos de los modelos de regresión

Se utiliza para para estudiar la relación entre


variables, de modo que permita al investigador o
analista de datos, estimar como influyen en el
resultado o valor de un evento, un conjunto de
variables a las que se llama predictoras, o
independientes
El objetivo de un modelo de regresión es tratar de explicar la
relación que existe entre una variable dependiente (variable
respuesta) Y un conjunto de variables independientes
(variables explicativas) X1,..., Xn.

En un modelo de regresión lineal simple tratamos de explicar


la relación que existe entre la variable respuesta Y y una única
variable explicativa X.
La regresión lineal múltiple trata de ajustar
modelos lineales o linealizables entre
una variable dependiente y más de una
variables independientes

También podría gustarte