Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guía de Laboratorio No. 1 Probabilidad y Estadistica
Guía de Laboratorio No. 1 Probabilidad y Estadistica
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
COMPETENCIAS GENÉRICAS
Grupal x Individual
Laboratorio n/a
requerido
Introducción
Finalmente, cada estudioso deberá resolver los ejercicios allí planteados y realizar el
cargue de la actividad completando los campos que allí se relacionan.
Bibliografía recomendada
.
Unidad
Eje Temático Referente bibliográfico
Didáctica
Estadística Medidas de Evans, M. (2005). Probabilidad y estadística. Barcelona:
Descriptiva tendencia central Editorial Reverté. (Colección biblioteca UMB)
Aguilar, A., Altamira, J., García, O. (2010). Introducción a la
inferencia estadística. Pearson Educación. (Recuperado
Base de datos ebooks 7/24)
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
Palabras clave
CENTRAL MEASURE TENDENCY
Marco conceptual o referencial
MARCO TEORICO.
DEFINICIONES
TIPO DE VARIABLE
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
Ordinales: Si tienen un orden específico, por ejemplo: estrato, nivel educativo, tipo de dolor,
estado civil.
Nominales: No tiene un orden específico, por ejemplo: Lugar de nacimiento, comida preferida,
deporte preferido.
Variables cuantitativas: Toman valores numéricos ya sean números enteros o decimales, por
ejemplo: edad, estatura, tiempo dedicado a estudias, peso.
Discretas: Toman valores enteros: No de hijos, edad, cantidad discretas. (como son variables
de conteo, toman valores finitos)
Continuas: Toman valores decimales: Tiempo de estudio, estatura, peso. (Como son variables
decimales, toman valores infinitos)
Para el cálculo de medidas de tendencia central utilizaremos las funciones que Excel tiene
previstas para ello. Estas corresponden a:
MEDIDA FÓRMULA
MEDIA =PROMEDIO (datos)
MEDIANA =MEDIANA (datos)
DESVIACIÓN ESTÁNDAR =DESVEST (datos)
VARIANZA =VAR (datos)
RANGO =MAX (datos)-MIN (datos)
Para el caso de la moda, puede ocurrir que los datos sean multimodales o unimodales, para
ambos casos existen funciones que permiten realizar este cálculo.
Las medidas de posición son aquellas que dividen un conjunto de datos en partes porcentualmente
iguales que contienen la misma cantidad de elementos. En el ejemplo anterior, la mediana divide el
conjunto de datos en dos partes porcentualmente iguales (50%) y en cada parte se encuentran 5
individuos. Algunas medidas de posición son los cuartiles, los deciles y los percentiles.
Cuartiles (Q n):
Los cuartiles son tres valores que dividen en cuatro partes porcentualmente iguales a la
distribución (el conjunto de datos).
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
Donde:
Min: Dato mínimo de la distribución.
Q 1: Primer cuartil.
Q 2: Segundo cuartil.
Q3: Tercer cuartil.
Max : Dato máximo de la distribución.
Es importante señalar que el segundo cuartil (Q2) es la mediana.
Cálculo de cuartiles
Para calcular los cuartiles, se debe tener en cuenta:
1. Ordenar los datos de menor a mayor.
(n+1)
2. El primer cuartil (Q 1) es el valor k 1 que corresponde a la posición y el tercer cuartil (
4
3(n+1)
Q3) es el valor k 2 que corresponde a la posición .
4
(n+1) 3(n+1)
Si y no son números enteros, los cuartiles se encuentran por interpolación, usando
4 4
los valores de las posiciones adyacentes.
Para calcular los cuartiles del ejemplo de la frecuencia cardiaca, en primer lugar, se ordenan los
datos de menor a mayor: 67, 69, 70, 75, 78, 82, 83, 88, 89, 97.
A continuación, se calculan las posiciones de Q 1 y Q3.
(n+1) (10+1) 11
Posición de Q 1: = = =2.75
4 4 4
3(n+1) 3 (11) 33
Posición de Q 3: = = =8.25
4 4 4
Como estas posiciones no son enteros, el primer cuartil se toma como el valor 3/4 de la
distancia entre los datos de las posiciones 2 y 3 ordenadas, es decir:
3 3
Q1=69+ ( 70−69 )=69+ (1 ) =69,75
4 4
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
y el tercer cuartil se toma como el valor 1/4 de la distancia entre las posiciones 8 y 9, así:
1 1
Q3=88+ ( 89−88 )=88+ ( 1 )=88,25
4 4
Es fácil notar que entre el primer cuartil (Q 1) y el tercer cuartil (Q 3) se encuentra el 50% de los
datos centrales. Es posible medir este rango usando una medida numérica llamada Rango
intercuartílico (RIQ). El rango intercuartílico es la diferencia entre el tercer cuartil y el primer
cuartil, esto es:
RIC=Q3−Q1
Así, en el ejemplo de las frecuencias cardiacas, se tiene que RIC=Q3−Q1=88,25−69,75=18,5.
El cálculo de los cuartiles se puede emplear para crear un diagrama que nos permita describir de
forma visual el comportamiento del conjunto de datos, esta gráfica recibe el nombre de diagrama
de caja o boxplot.
TABLAS DE FRECUENCIA
Una tabla de frecuencias es un arreglo tabular que describe un conjunto de datos en términos de
distintos tipos de frecuencias: absoluta, relativa y acumulada con el fin de resumir la información.
n=tamaño de la muestra
El valor de k se aproxima al entero más cercano
Rango
3. Amplitud (Ancho del intervalo):
k
La amplitud se aproxima a 1 decimal.
Ejemplo 1:
En un estudio de crecimiento de los varones se obtuvo estas observaciones sobre el perímetro cefálico en
centímetros de la cabeza del niño al nacer:
Construir una tabla de frecuencias para los datos y grafique un histograma para los datos.
Rango 4.4
Amplitud : = =0.73=0.7
k 6
REGRESION LINEAL
Un modelo es una descripción matemática del proceso que se cree que da lugar a las
observaciones en un conjunto de datos. Los modelos en estadística están representados por una
ecuación que describe el supuesto impacto de un conjunto de variables explicativas y la
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
descripción de las distribuciones de probabilidad asociadas a los aspectos del proceso que
suponemos caracterizan una variación aleatoria.
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre
variables, se le llama y a la variable dependiente, y x a la variable predictora o regresora. El
objetivo de la regresión lineal es saber si la variable y se puede escribir en términos de una
variable x, o si la variable x aporta información para poder describir la variable y.
Un diagrama de dispersión ofrece una idea bastante aproximada del tipo de relación que puede
existir entre dos variables y también puede utilizarse para cuantificar el grado de relación que
existe entre ambas, el coeficiente de correlación es esa medida estadística que permite decir si
existe o no relación lineal y que tan fuerte es esa relación. El coeficiente de correlación de Pearson
es una medida lineal entre dos variables cuantitativas, este coeficiente se encuentra entre -1 y 1,
en donde, entre más cerca de -1, la relación es lineal pero inversa; cuando está cerca de 1, la
relación es lineal directa, y finalmente un valor cerca de 0, indica que la relación lineal es nula.
Por ejemplo, en la siguiente situación se toma la estatura (cm) y la talla del calzado de 14
personas en un salón, el investigador quiere saber si hay algún tipo de relación entre estas dos
variables:
Calzado
35 40 35 40 41 37 38 36 41 39 41 37 42 48
Estatura
(cm) 157 168 156 172 172 159 163 160 175 165 170 163 190 190
Parece evidente una relación lineal entre ambas variables, al hallar el coeficiente de correlación de
Pearson se tiene que es igual a 0.91, esto indica que hay una posible relación lineal directa, es
decir, que cuando aumenta la talla del calzado, aumenta la estatura, o si aumenta la estatura,
aumenta la talla del calzado. El coeficiente de correlación solo cuantifica la relación lineal existente
entre las variables, pero el investigador desea una expresión que le permita explicar la estatura
con base en la talla del calzado. El objetivo es encontrar la recta que mejor se ajuste a la nube de
puntos, pues se podrían trazar una infinidad de rectas allí.
Para encontrar la de mejor ajuste usualmente se utiliza el método de mínimos cuadrados, se trata
hallar la recta que minimice las distancia entre los puntos y la misma, y esto se hace a través del
método de mínimos cuadrados, es decir, que la suma de los cuadrados de las distancias verticales
de los puntos a la recta debe ser lo más pequeña posible.
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
Para saber si el modelo se ajusta bien a los datos o si esa es la mejor recta de regresión se calcula
una medida de bondad de ajuste llamada Coeficiente de determinación R2, esta medida toma
valores entre 0 y 1 y representa el grado de ganancia que se puede obtener al predecir una
variable basándose en el conocimiento que se tiene de una u otras variables. Para el caso del
ejemplo que se está manejando se tiene R2 = 0.8374, es decir, que la variable calzado está
explicando a la variable estatura en un 83.74%.
Los modelos de regresión lineal simple funcionan o se pueden realizar bajo algunos supuestos.
Cuando se ajusta una recta de regresión se producen unos errores, estos errores son las
distancias de la recta ajustada a los puntos, así se debe cumplir:
Los errores se deben distribuir normalmente (e ¿¿ ij N (0,1)). ¿
Los errores deben ser no correlacionados.
Homocedasticidad: varianza constante
Presaberes Requeridos.
Identificar las Variables cualitativas y cuantitativas
Conocer las definiciones básicas estadísticas de las Medidas de tendencia Central
Manejo de herramientas ofimáticas- Excel
Actividad de trabajo independiente
No aplica No aplica
No aplica
CONSIDERACIONES ÉTICAS
No aplica
Procedimiento de la práctica
5. Investigue como realizar el cálculo del Índice de Masa Corporal genere una nueva variable
en la base de datos y complete la información de la siguiente tabla.
Realizar una tabla de frecuencias con datos agrupados para la variable “PESO”, grafique
con un histograma.
Realizar una tabla de frecuencias con datos agrupados de la Concentración de glucosa "
Conc. (mg/dL)- glucosa" . Grafique el histograma y concluya respecto a las medidas
calculadas.
Calcular el coeficiente de determinación para la relación entre las variables peso e IMC
Explique la ecuación del modelo para predecir el IMC con la variable peso.
Realice el Diagrama de Dispersión y explique
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS
2. 5.
3. 6.
Resultados obtenidos
Escriba en este espacio los resultados obtenidos y la respuesta a las preguntas formuladas
Conclusiones