Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Profesor(a). Participantes:
Katiuska Hernández. Julián Velásquez.
C.I-V- 27.190.164.
Robert Narvaez.
C.I-V- 25.622.942.
Viviana Farías.
C.I-V- 20.375.968.
13-07-21
INTRODUCCION
1 - α α/2 z α/2
Datos discretos: Los datos estadísticos son discretos cuando sus valores son distintos y
separados. Es decir, cuando los datos sólo pueden tomar ciertos valores.
Este tipo de datos no se puede medir, pero se pueden contar. Básicamente representan
información que se puede clasificar.
Mediante este concepto se puede mencionar que las variables tienen una
clasificación:
Categóricas
Numéricas
Las variables categóricas se dividen de la siguiente forma:
Dicotómicas
Nominales
Ordinales
Y las variables numéricas se dividen de la siguiente manera:
Continua
Discreta
Podemos definir como variable cualitativa, toda aquella variable que, como su
propio nombre indica, expresa una cualidad, característica o modalidad. Se conoce
como atributo o categoría a cada modalidad que se presenta, y la medición de la
misma es la clasificación de dichos atributos.
Variables categóricas:
En las ciencias de la salud es bastante frecuente encontrarse con variables
categóricas, como el sexo, la raza, lugar de procedencia, categoría laboral, etc., son
ejemplos de este tipo de variables con las que nos podemos encontrar en nuestro
diario vivir. Estas son variables sobre las que únicamente es posible obtener una
medida de tipo nominal u ordinal (con muy pocos valores) los valores que presentan
corresponden a categorías discretas. Estas categorías no pueden ser ordenadas y
representan grupos diferentes como ya lo mencionamos.
También se toma en cuenta que una variable es medida utilizando una escala de
medición, la elección de las escalas de medición a utilizarse depende del tipo de
variable en estudio y el manejo estadístico al que será sometido la información es
decir existe una correspondencia directa entre tipo de variable y escala de medición. 1
Las variables categóricas pueden clasificarse en:
Variable Nominal
Es aquella variable cualitativa cuya categoría no sigue ningún orden, se agrupa sin
ninguna jerarquía entre sí.
Ejemplos:
Lateralidad (zurdo, diestro)
Estado civil (soltero, casado, divorciado, unión libre)
Grupo sanguíneo (Grupo A-Grupo B- Grupo AB-Grupo 0)
No admiten puntuaciones numéricas ordenandos significativamente sin embargo a
veces en las computadoras se muestran la categoría de estas variables mediante
ciertos códigos computacionales por ejemplo a la variable género se le asigna los
siguientes códigos: hombre-0, mujer-1.
Variable Ordinal
Son aquellas variables categóricas con orden secuencial o progresión natural
esperable o jerarquía.1
Ejemplos:
Medalla deportiva (oro, plata, bronce)
Nivel de clase educativa (último año, primer año, etc.)
Variable Dicotómica
Es aquella variable categórica, la cual puede adoptar solamente dos valores. 1
Ejemplos:
Sexo (masculino, femenino)
Posee obesidad (sí, no)
Variables Numérica
También llamadas variables cuantitativas. Describen una característica en términos
de un valor numérico o cantidad.
Variables Continuas
Son aquellas características que son medidas dentro de un rango continuo infinito
de valores numéricos y se registran con números reales. Pueden presentar cualquier
valor dentro de cierto intervalo.1
Ejemplos:
Estatura (1.76543 m)
Peso (55.6625 kg)
Tamaño de lesión de leishmaniasis (6.0458 mm)
Ingreso familiar ($ 455.651,86)
Dosis efectiva 50 (ED50=12.5 ug/mL)
Variables Discretas
Son también llamadas discontinuas, y están asociadas a conteos o enumeraciones,
razón por la cual, solo permiten ser registradas con números enteros (0,1,2,3, etc.) 1
Ejemplos:
Edad (años cumplidos) (18,25,44)
Número de hijos en una familia (0,1,2,3, etc.)
Número de células en una muestra de sangre (27,70,85)
Número de pétalos en una flor (4,5,6)
Número de familias residentes en una manzana (20,25,45)
Número de insectos atrapados en una red (0,1,2,5,10)
Tipos de Variables
Variable Independiente, Dependiente e Interviniente
Variable Controlada y Aleatoria
Variable Hipotética y Observable
Variables Atributivas y Activas
Variable Estímulo y Respuesta
Variable Cualitativa y Cuantitativa
Variables cualitativas
Son el tipo de variables que como su nombre lo indica expresan distintas
cualidades, características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría, y la medición consiste en una clasificación de dichos
atributos. Las variables cualitativas pueden ser dicotómicas cuando solo pueden
tomar dos valores posibles, como sí y no, hombre y mujer o ser politómicas cuando
pueden adquirir tres o más valores. Dentro de ellas podemos distinguir:
Según la influencia
Según la influencia que le asignemos a unas variables sobre otras, estas podrán
ser:
Variables independientes
Una variable independiente es aquella cuyo valor no depende de otra variable. Es
aquella característica o propiedad que se supone es la causa del fenómeno estudiado.
En investigación experimental se llama así a la variable que el investigador manipula.
La variable independiente es en la que el investigador escoge para establecer
agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un
tipo especial son las variables de control, que modifican al resto de las variables
independientes y que de no tenerse en cuenta adecuadamente pueden alterar los
resultados por medio de un sesgo.
Variables dependientes
Una variable dependiente es aquella cuyos valores dependen de los que tomen
otra variable. La variable dependiente es una función que se suele representar por la
y. La variable dependiente se representa en el eje ordenadas. Son las variables de
respuesta que se observan en el estudio, y que podrían estar influidas por los valores
de las variables independientes. Hayman (1974: 69) la define como propiedad o
característica que se trata de cambiar mediante la manipulación de la variable
independiente. La variable dependiente es el factor que es observado y medido para
determinar el efecto de la variable independiente.
DISTRIBUCIÓN BINOMIAL
La distribución binomial es una distribución de probabilidad discreta que mide el
número de éxitos en una secuencia de n ensayos de BERNOULLI independientes entre
sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Existen muchas
situaciones en las que se presenta una experiencia binomial. Cada uno de los
experimentos es independiente de los restantes (la probabilidad del resultado de un
experimento no depende del resultado del resto). El resultado de cada experimento ha de
admitir sólo dos categorías (a las que se denomina éxito y fracaso). Las probabilidades de
ambas posibilidades han de ser constantes en todos los experimentos (se denotan como
p y q o p y 1-p).• Se designa por X a la variable que mide el número de éxitos que se han
producido en los n experimentos.• Cuando se dan estas circunstancias, se dice que la
variable X sigue una distribución de probabilidad binomial, y se denota B(n,p)
DISTRIBUCION POISSON
Se trata de un modelo discreto, pero en el que el conjunto de valores con
probabilidad no nula no es finito, sino numerable. Esta distribución suele utilizarse para
contajes del tipo número de individuos por unidad de tiempo, de espacio, etc. Propiedades
del modelo de Poisson 1) Esperanza: E(X) = λ.• 2) Varianza: V(X) = λ. En esta distribución
la esperanza y la varianza coinciden.
DISTRIBUCIÓN NORMAL
En estadística y probabilidad se llama distribución normal, distribución de Gauss o
distribución gaussiana, a una de las distribuciones de probabilidad de variable continua
que con más frecuencia aparece aproximada en fenómenos reales. La gráfica de su
función de densidad tiene una forma acampanada y es simétrica respecto de un
determinado parámetro. Esta curva se conoce como campana de Gauss y es el gráfico de
una función gaussiana.
DISTRIBUCIÓN GAMMA
En estadística la distribución gamma es una distribución de probabilidad continua con dos
parámetros k y λ cuya función de densidad para valores x > 0 es Aquí es el número y Γ es la
función gamma. ¡Para valores la aquella es Γ(k) = (k − 1)! (el factorial de k − 1). En este caso - por
ejemplo, para describir un proceso de Poisson - se llaman la distribución distribución Erlang con
un parámetro θ = 1 / λ. El valor esperado y la varianza de una variable aleatoria X de distribución
gamma son E*X+ = k / λ = kθ V*X+ = k / λ2 = kθ2.
Valores: k: 0, 1, 2, ...
Valores: k: 0, 1, 2, ...
La limitación que impone Epidat 4 a los valores que pueden tomar sus parámetros
es que no deben ser mayores que 100 para poder realizar los cálculos.
Parámetros:
p: forma, p > 0
q: forma, q > 0
DISTRIBUCIÓN EXPONENCIAL
Se cumple que variable aleatoria que tome valores positivos y que verifique la
propiedad de “falta de memoria” sigue una distribución exponencial [8].
5. ¿Cómo saber qué tipo de distribución siguen los datos (se ajustan mas)?
Las gráficas de probabilidad son una excelente manera de identificar visualmente la
distribución que siguen los datos. Si los puntos de los datos siguen la línea recta, la
distribución se ajusta.
La heterogeneidad del grupo es fundamental para un buen diseño del muestreo por
conglomerados. Por otra parte, el elemento dentro de cada grupo debe ser tan
heterogéneos como la población objetivo
Pasos para seleccionar el conglomerado:
A. Definir la población objetivo.
7. Cálculo de las medidas de tendencia central y de dispersión para cada uno de los
diferentes tipos de distribución de datos. A. Media, B. Mediana, C. Moda, D. Media
geométrica, E. Media armónica, F. Desviación media, G. Desviación estándar, H.
Varianza.
Las medidas de tendencia central son también frecuentemente usadas para
comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido por
un grupo de vendedores de una zona comparado con el promedio de ventas otro
grupo de vendedores de otra zona, el promedio de reclamos de clientes de una
sucursal, comparado con el promedio de reclamos de otra sucursal.
A. Media
La media es un concepto estadístico básico que representa en un valor las
características que presenta una variable de un conjunto de datos, y sólo
puede usarse con variables cuantitativas. La media puede considerarse un
concepto base para la comprensión de variable aleatoria y sus
distribuciones, ya que la distribución se caracteriza principalmente por las
medidas de tendencia central y de dispersión, siendo frecuentemente la
media uno de los parámetros de las distribuciones. (Estrella 2016). La media
aritmética, o promedio aritmético, es la suma de los valores del grupo de
datos dividida entre la cantidad de valores. Su fórmula se puede describir de
la siguiente manera:
B. Mediana
Es el valor del elemento central del conjunto. Para encontrar la mediana,
primero arreglar los valores del conjunto de acuerdo a su magnitud; es decir,
arreglar los valores del más pequeño al más grande o del más grande al
más pequeño y después localizar el valor central, es decir, el número de
valores sobre la mediana es el mismo que el número de valores debajo de la
mediana. Si el número de valores en un conjunto de datos no agrupados es
par, no hay mediana verdadera.
C. Moda:
También llamada modo o promedio típico de un conjunto de valores; la moda
es el valor el cual ocurre más frecuentemente en el conjunto. Si un valor es
seleccionado al azar del conjunto dado, un valor modal es el valor más
probable a ser seleccionado. Así, la moda es generalmente considerada
como el valor más típico en una serie de datos la cual es llamada, por esa
razón, UNIMODAL.
D. Media geométrica
La media geométrica G, de un conjunto de valores es la raíz n-ésima del
producto de los valores de dicho conjunto: Si hay dos valores, la raíz
cuadrada del producto de estos dos; si son tres, es la raíz cúbica del
producto de los tres valores. La fórmula general es:
E. Media armónica
En otras palabras, la media armónica es una medida estadística recíproca a
la media aritmética, que es la suma de un conjunto de valores entre el
número de observaciones.
La fórmula de la media armónica (H) de un conjunto de números x 1, x2, x3,…,
xn, es la siguiente:
F. Desviación media
La desviación respecto a la media es la diferencia entre cada valor de la
variable estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media.
La desviación media se representa por Explicaciones y ejemplos de
desviación media – 1
G. Desviación estándar
La desviación típica o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de
la variable.
H. Varianza
Encontramos varianza, que es como la mayor parte de los textos científicos
en castellano se refieren a la media aritmética de los cuadrados de las
desviaciones de cada valor respecto de la media aritmética de los datos (por
lo que a veces también se denomina desviación cuadrática media). La
desviación estándar es la raíz cuadrada de la varianza. En algunos textos en
castellano se ve variancia en vez de varianza, pero esta grafía se usa muy
poco, pese a ser la recomendada por la Real Academia.
La varianza es la media aritmética de los cuadrados de las desviaciones
respecto a la media aritmética, es decir, es el promedio de las desviaciones
de la media elevadas al cuadrado.
8. Cálculo de cuartiles, deciles y percentiles para los datos.
A. Cuartiles
Los Cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales (de 25% cada parte). De manera que para resolver
un problema sobre cuartiles solamente tenemos que hallar Q1; Q2 y Q3
Donde:
Qk: Cuartil
Li: Límite inferior del intervalo seleccionado.
k: Debe ser 1; 2 ó 3
n: Número total de datos
f: frecuencia absoluta del intervalo seleccionado.
Fi-1: Frecuencia absoluta Acumulada (pero anterior a la clase cuartil)
a: Amplitud del intervalo (Restar los 2 valores: L sup - L inf)
B. Deciles
Los Deciles son los nueve valores de la variable que dividen a un conjunto de datos
ordenados en 10 partes iguales (de 10% cada parte). De manera que para resolver un
problema sobre deciles solamente tenemos que hallar D1; D2 ; D3 ; D4 ; ... D9
Para hallar los Deciles, se sigue igual procedimiento que los cuartiles.
Para hallar los Deciles (D) para datos agrupados se aplica la siguiente fórmula:
Donde:
Dk: Decil
C. Percentiles
Los Percentiles son los 99 valores de la variable que dividen a un conjunto de datos
ordenados en 100 partes iguales (de 1% cada parte). De manera que para resolver un
problema sobre percentiles solamente tenemos que hallar P1; P2; P3 ; P4; ... ; P99
NOTA: Para hallar los Percentiles se sigue el mismo procedimiento que los Cuartiles.
Para hallar los Percentiles (P) para datos agrupados se aplica la siguiente fórmula:
Donde:
Pk: Percentil
Li: Límite inferior del intervalo seleccionado.
k: Debe ser 1; 2 ; 3 ; 4; 5 ; ... ; 99
n: Número total de datos
f: frecuencia absoluta del intervalo seleccionado.
Fi-1: Frecuencia absoluta Acumulada (pero anterior a la Clase Percentil)
a: Amplitud del intervalo (Restar los 2 valores: L sup - L inf)
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-
statistics/supporting-topics/basics/what-is-a-confidence-level/
https://www.superprof.es/diccionario/matematicas/estadistica/nivel-
confianza.html#:~:text=El%20nivel%20de%20confianza%20es,tomar%20en
%20tanto%20por%20ciento.
https://epamatematicas.blogspot.com/2017/08/cuartiles-deciles-y-percentiles.html
https://sites.google.com/site/estadisticalfrecuencia/e/fgdfgdf