Está en la página 1de 15

MACROPROCESO RECURSOS E INFRAESTRUCTURA Y

LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

GUÍA DE LABORATORIO DE PROBABILIDAD Y ESTADÍSTICA


Unidad Temática: Estadística descriptiva
COMPETENCIAS DISCIPLINARES
Guía No.

1 Utiliza herramienta de Excel para hallar medidas de tendencia central, de


posición y de dispersión de un conjunto de datos.
1 1 Construye gráficos y diagramas estadísticos para representar la
Modulo Actividad
Horas de trabajo
información.
2 horas con 6 horas
docente Autónomas

COMPETENCIAS GENÉRICAS

Sintetiza diferentes tipos de datos para la identificación de fenómenos


Tipo de trabajo aleatorios teniendo en cuenta el uso de gráficos y medidas descriptivas en la
solución de problemas de contextos reales.

Grupal x Individual
Laboratorio n/a
requerido
Introducción

 Cada estudioso debe revisar la información cargada en el módulo de su plataforma


Canvas, del material bibliográfico correspondiente.

 Se procede a la orientación directa de la herramienta ofimática, mostrando en cada caso


los códigos y procedimientos requeridos para la generación de resultados de interés según
las temáticas previamente revisada por los estudiosos. Para esta muestra se contará con
una base de datos similar a la considerar para el desarrollo de las actividades de los
estudiosos. Esta actividad tiene un tiempo máximo de una semana.

 Finalmente, cada estudioso deberá resolver los ejercicios allí planteados y realizar el
cargue de la actividad completando los campos que allí se relacionan.

Subtemas: Medidas de tendencia central, de dispersión, tablas de frecuencia

Bibliografía recomendada
.
Unidad
Eje Temático Referente bibliográfico
Didáctica
Estadística Medidas de Evans, M. (2005). Probabilidad y estadística. Barcelona:
Descriptiva tendencia central Editorial Reverté. (Colección biblioteca UMB)
Aguilar, A., Altamira, J., García, O. (2010). Introducción a la
inferencia estadística. Pearson Educación. (Recuperado
Base de datos ebooks 7/24)
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

L., M. (2012). Fundamentos de estadística para las ciencias


de la vida. (4a. ed.) Pearson Educación. (Recuperado Base
Medidas de de datos ebooks 7/24)
dispersión Castillo, I., Guijarro, M. (2006). Estadística descriptiva y
cálculo de probabilidades. Pearson Educación. (Recuperado
Base de datos ebooks 7/24)
Tablas de Triola, M. F. (2004). Estadística. Pearson educación. Base de
frecuencia datos: Pearson. (Recuperado Base de datos ebooks 7/24)

Palabras clave
CENTRAL MEASURE TENDENCY
Marco conceptual o referencial
MARCO TEORICO.

DEFINICIONES

 Población: Lo conforman el conjunto de individuos u objetos con al menos una característica


en común.
 Muestra: Subconjunto de la población que posee las mismas características de la población.
 Variable: Es la característica que se le estudia a la muestra de interés.

TIPO DE VARIABLE
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

Variables cualitativas: Expresan una cualidad, condición o preferencia, generalmente, la


respuesta es no numérica, por ejemplo: estrato, sexo, lugar de nacimiento, nivel educativo.

 Ordinales: Si tienen un orden específico, por ejemplo: estrato, nivel educativo, tipo de dolor,
estado civil.
 Nominales: No tiene un orden específico, por ejemplo: Lugar de nacimiento, comida preferida,
deporte preferido.

Variables cuantitativas: Toman valores numéricos ya sean números enteros o decimales, por
ejemplo: edad, estatura, tiempo dedicado a estudias, peso.

 Discretas: Toman valores enteros: No de hijos, edad, cantidad discretas. (como son variables
de conteo, toman valores finitos)
 Continuas: Toman valores decimales: Tiempo de estudio, estatura, peso. (Como son variables
decimales, toman valores infinitos)

Para el desarrollo de la práctica, descargue la base de datos “BIOQUIMICA BD” y en ella


determine las variables cuantitativas presentes

Para el cálculo de medidas de tendencia central utilizaremos las funciones que Excel tiene
previstas para ello. Estas corresponden a:

MEDIDA FÓRMULA
MEDIA =PROMEDIO (datos)
MEDIANA =MEDIANA (datos)
DESVIACIÓN ESTÁNDAR =DESVEST (datos)
VARIANZA =VAR (datos)
RANGO =MAX (datos)-MIN (datos)

Para el caso de la moda, puede ocurrir que los datos sean multimodales o unimodales, para
ambos casos existen funciones que permiten realizar este cálculo.

Las medidas de posición son aquellas que dividen un conjunto de datos en partes porcentualmente
iguales que contienen la misma cantidad de elementos. En el ejemplo anterior, la mediana divide el
conjunto de datos en dos partes porcentualmente iguales (50%) y en cada parte se encuentran 5
individuos. Algunas medidas de posición son los cuartiles, los deciles y los percentiles.
 Cuartiles (Q n):
Los cuartiles son tres valores que dividen en cuatro partes porcentualmente iguales a la
distribución (el conjunto de datos).
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

Donde:
Min: Dato mínimo de la distribución.
Q 1: Primer cuartil.
Q 2: Segundo cuartil.
Q3: Tercer cuartil.
Max : Dato máximo de la distribución.
Es importante señalar que el segundo cuartil (Q2) es la mediana.
 Cálculo de cuartiles
Para calcular los cuartiles, se debe tener en cuenta:
1. Ordenar los datos de menor a mayor.
(n+1)
2. El primer cuartil (Q 1) es el valor k 1 que corresponde a la posición y el tercer cuartil (
4
3(n+1)
Q3) es el valor k 2 que corresponde a la posición .
4
(n+1) 3(n+1)
Si y no son números enteros, los cuartiles se encuentran por interpolación, usando
4 4
los valores de las posiciones adyacentes.
Para calcular los cuartiles del ejemplo de la frecuencia cardiaca, en primer lugar, se ordenan los
datos de menor a mayor: 67, 69, 70, 75, 78, 82, 83, 88, 89, 97.
A continuación, se calculan las posiciones de Q 1 y Q3.
(n+1) (10+1) 11
Posición de Q 1: = = =2.75
4 4 4
3(n+1) 3 (11) 33
Posición de Q 3: = = =8.25
4 4 4
Como estas posiciones no son enteros, el primer cuartil se toma como el valor 3/4 de la
distancia entre los datos de las posiciones 2 y 3 ordenadas, es decir:
3 3
Q1=69+ ( 70−69 )=69+ (1 ) =69,75
4 4
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

y el tercer cuartil se toma como el valor 1/4 de la distancia entre las posiciones 8 y 9, así:
1 1
Q3=88+ ( 89−88 )=88+ ( 1 )=88,25
4 4

Es fácil notar que entre el primer cuartil (Q 1) y el tercer cuartil (Q 3) se encuentra el 50% de los
datos centrales. Es posible medir este rango usando una medida numérica llamada Rango
intercuartílico (RIQ). El rango intercuartílico es la diferencia entre el tercer cuartil y el primer
cuartil, esto es:
RIC=Q3−Q1
Así, en el ejemplo de las frecuencias cardiacas, se tiene que RIC=Q3−Q1=88,25−69,75=18,5.
El cálculo de los cuartiles se puede emplear para crear un diagrama que nos permita describir de
forma visual el comportamiento del conjunto de datos, esta gráfica recibe el nombre de diagrama
de caja o boxplot.

TABLAS DE FRECUENCIA

Una tabla de frecuencias es un arreglo tabular que describe un conjunto de datos en términos de
distintos tipos de frecuencias: absoluta, relativa y acumulada con el fin de resumir la información.

CÁLCULO DE FRECUENCIAS PARA LA CREACIÓN DE TABLAS ESTADÍSTICAS.

• Frecuencia absoluta ( f i ): Se define como el número de veces que se repite el dato


• Frecuencia relativa ( h i) : Se define como el cociente entre la frecuencia absoluta y el total
de los datos (n representa el tamaño de la muestra)
• Frecuencia absoluta acumulada ( F i ): Se define como la suma sucesiva entre los valores
de f i
• Frecuencia relativa acumulada ( H i ): Se define como la suma sucesiva entre los valores
de hi
• Frecuencia Porcentual ( f % ) : Se define como el producto entre hi y el 100%.

PASOS PARA CREAR LOS INTERVALOS

1. Rango: Dato mayor – Dato menor.

2. Número de intervalos (k ):1+3,322∗log (n) (Método de Sturges)


MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

n=tamaño de la muestra
El valor de k se aproxima al entero más cercano

Rango
3. Amplitud (Ancho del intervalo):
k
La amplitud se aproxima a 1 decimal.

Para construir el primer intervalo se tiene:


¿

Límite Inferior Límite superior

Ejemplo 1:
En un estudio de crecimiento de los varones se obtuvo estas observaciones sobre el perímetro cefálico en
centímetros de la cabeza del niño al nacer:

33,1 34,6 34,2 36,1 35,8 34,8


35,8 34,5 34,2 34,5 34,3 35,2
36,0 36,1 33,9 33,6 35,2 34,6
34,2 33,7 34,9 35,2 34,0 34,1
34,8 37,5 34,0 34,1 34,9 33,7
37,1 34,3 33,9 34,8 35,7 36,0

Construir una tabla de frecuencias para los datos y grafique un histograma para los datos.

PARA CONSTRUIR UNA TABLA DE FRECUENCIA SE SIGUEN LO SIGUIENTES PASOS:

1. Rango: Dato mayor – Dato menor.


Rango: 37.5−33.1=4.4
2. Número de intervalos (k ):1+3,322∗log (n)
n=tamaño de la muestra
n=36
k :1+3,322∗log (n)

k :1+3,322∗log (36 )=6.17 ≈ 6


Rango
3. Amplitud (Ancho del intervalo):
k
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

Rango 4.4
Amplitud : = =0.73=0.7
k 6

CREACIÓN DE LOS INTERVALOS


Para construir el primer intervalo se tiene:
¿

Límite Inferior Límite superior

[ 33.1; 33.1+0.7 )=¿

Perímetro f F fr (frec. Relativa) Fr f%


Cefálico Frec. Frec. Divide frec. Absoluta Relativa Frec.
absoluta acumulada entre el total acumulada porcentual
Relativa*100
¿ 4 4 4 0.11 11
=0.11
36
¿ 11 15 11 0.42 31
=0.31
36
¿ 9 24 9 0.67 25
=0.25
36
¿ 6 30 6 0.84 17
=0.17
36
¿ 4 34 4 0.95 11
=0.11
36
¿ 1 35 1 0.98 3
=0.03
36
[37.3; 38 ] 1 36 1 1 3
=0.03
36
Total 36

REGRESION LINEAL

Un modelo es una descripción matemática del proceso que se cree que da lugar a las
observaciones en un conjunto de datos. Los modelos en estadística están representados por una
ecuación que describe el supuesto impacto de un conjunto de variables explicativas y la
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

descripción de las distribuciones de probabilidad asociadas a los aspectos del proceso que
suponemos caracterizan una variación aleatoria.
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre
variables, se le llama y a la variable dependiente, y x a la variable predictora o regresora. El
objetivo de la regresión lineal es saber si la variable y se puede escribir en términos de una
variable x, o si la variable x aporta información para poder describir la variable y.
Un diagrama de dispersión ofrece una idea bastante aproximada del tipo de relación que puede
existir entre dos variables y también puede utilizarse para cuantificar el grado de relación que
existe entre ambas, el coeficiente de correlación es esa medida estadística que permite decir si
existe o no relación lineal y que tan fuerte es esa relación. El coeficiente de correlación de Pearson
es una medida lineal entre dos variables cuantitativas, este coeficiente se encuentra entre -1 y 1,
en donde, entre más cerca de -1, la relación es lineal pero inversa; cuando está cerca de 1, la
relación es lineal directa, y finalmente un valor cerca de 0, indica que la relación lineal es nula.

Por ejemplo, en la siguiente situación se toma la estatura (cm) y la talla del calzado de 14
personas en un salón, el investigador quiere saber si hay algún tipo de relación entre estas dos
variables:

Calzado

35 40 35 40 41 37 38 36 41 39 41 37 42 48
Estatura
(cm) 157 168 156 172 172 159 163 160 175 165 170 163 190 190

Al hacer un diagrama de dispersión se ve lo siguiente:


MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

Parece evidente una relación lineal entre ambas variables, al hallar el coeficiente de correlación de
Pearson se tiene que es igual a 0.91, esto indica que hay una posible relación lineal directa, es
decir, que cuando aumenta la talla del calzado, aumenta la estatura, o si aumenta la estatura,
aumenta la talla del calzado. El coeficiente de correlación solo cuantifica la relación lineal existente
entre las variables, pero el investigador desea una expresión que le permita explicar la estatura
con base en la talla del calzado. El objetivo es encontrar la recta que mejor se ajuste a la nube de
puntos, pues se podrían trazar una infinidad de rectas allí.

Para encontrar la de mejor ajuste usualmente se utiliza el método de mínimos cuadrados, se trata
hallar la recta que minimice las distancia entre los puntos y la misma, y esto se hace a través del
método de mínimos cuadrados, es decir, que la suma de los cuadrados de las distancias verticales
de los puntos a la recta debe ser lo más pequeña posible.
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

Un modelo de regresión lineal simple es representado por la siguiente expresión:


y ij =β 0 + β 1 x i+ e ij
Donde β 0 es el intercepto de la recta con el eje y , β 1 es la pendiente, x i denota el valor de la
variable predictora o regresora y e ij representa la componente del error. Cuando se hace la
estimación se la recta de regresión se tiene:
^y ij = ^
β0+ ^
β1 xi
El coeficiente β 0 representa el valor que toma la variable y ante la ausencia de la variable x , este
coeficiente no siempre es interpretable, por ejemplo, si la variable x fuera temperatura y la variable
y representara presión, no tendría sentido interpretar el coeficiente β 0, pues nunca hay ausencia
de temperatura. El coeficiente β 1 muestra el cambio de la variable y cuando x cambia una unidad.
Así, en nuestro ejemplo, la recta de regresión que puede modelar los datos es:
y=55.3+ 2.88 x
En este caso, la variable x representa el calzado y la variable y representa la estatura, en términos
de las variables se tendría:
Estatura=55.3+ 2.88∗Calzado
Esta recta de regresión índica que por cada cambio en la talla del calzado la estatura aumenta
2.88 centímetros.
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

Para saber si el modelo se ajusta bien a los datos o si esa es la mejor recta de regresión se calcula
una medida de bondad de ajuste llamada Coeficiente de determinación R2, esta medida toma
valores entre 0 y 1 y representa el grado de ganancia que se puede obtener al predecir una
variable basándose en el conocimiento que se tiene de una u otras variables. Para el caso del
ejemplo que se está manejando se tiene R2 = 0.8374, es decir, que la variable calzado está
explicando a la variable estatura en un 83.74%.
Los modelos de regresión lineal simple funcionan o se pueden realizar bajo algunos supuestos.
Cuando se ajusta una recta de regresión se producen unos errores, estos errores son las
distancias de la recta ajustada a los puntos, así se debe cumplir:
 Los errores se deben distribuir normalmente (e ¿¿ ij N (0,1)). ¿
 Los errores deben ser no correlacionados.
Homocedasticidad: varianza constante
Presaberes Requeridos.
Identificar las Variables cualitativas y cuantitativas
Conocer las definiciones básicas estadísticas de las Medidas de tendencia Central
Manejo de herramientas ofimáticas- Excel
Actividad de trabajo independiente

Desarrollo de la práctica de acuerdo con el procedimiento y su descripción más adelante.


MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

Materiales, equipos e insumos a utilizar

Materiales, equipos e insumos Equipo PC


OFFICE 365 -Microsoft Excel
Materiales del estudiante Calculadora, Apuntes, Grabaciones

Precauciones, nivel de riesgo y recomendaciones a considerar


Muy alto Medio Alto Bajo X
CLASIFICACIÓN DEL RIESGO

FACTORES DE RIESGO COMO MINIMIZAR LOS FACTORES DE RIESGO

 No aplica  No aplica

RECOMENDACIONES, CONSIDERACIONES PARA EL USO DE MATERIAL Y EPP

No aplica

CONSIDERACIONES ÉTICAS

No aplica
Procedimiento de la práctica

1. Descargar la base de datos BIOQUIMICA BD cargada en el módulo 1


2. Realizar una tabla donde aparezcan, el nombre de variable, la descripción de la variable y
sus categorías.
3. Realice un gráfico independiente para cada una de las siguientes variables “GENERO,
ESTADO, ACTIVIDAD DEPORTIVA”, Explique en que proporciones se encuentra la
participación de estas variables.
4. Realizar el análisis de las medidas estadísticas descriptivas correspondientes a 5 variables
cuantitativas en el siguiente esquema.
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

MEDIDAS DE TENDENCIA CENTRAL


 MEDIA
 MODA
 MEDIANA
MEDIDAS DE DISPERSIÓN
 RANGO
 DESVIACIÓN ESTÁNDAR
 VARIANZA
coeficiente de variación

5. Investigue como realizar el cálculo del Índice de Masa Corporal genere una nueva variable
en la base de datos y complete la información de la siguiente tabla.

MEDIDA FEMENINO MASCULINO


Media
Moda
Mediana
Rango
Desviación estándar
Varianza
Coeficiente de Variación

Concluya respecto a los resultados obtenidos

5.Responder las preguntas:

 Determine el porcentaje de personas de Género Femenino que realizan actividad deportiva


2 veces x semana.
 Determine el porcentaje de personas de Género Masculino que tienen sobre peso y
realizan ejercicio 1 vez x semana
 Seleccione la variable cualitativa Estado y muestre gráficamente como es la participación
de cada categoría frente al total de la población, concluya en cada caso.

6. Realizar las siguientes tablas de frecuencia

 Realizar una tabla de frecuencias con datos agrupados para la variable “PESO”, grafique
con un histograma.
 Realizar una tabla de frecuencias con datos agrupados de la Concentración de glucosa "
Conc. (mg/dL)- glucosa" . Grafique el histograma y concluya respecto a las medidas
calculadas.
 Calcular el coeficiente de determinación para la relación entre las variables peso e IMC
 Explique la ecuación del modelo para predecir el IMC con la variable peso.
 Realice el Diagrama de Dispersión y explique
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

INFORME LABORATORIO DE ESTADÍSTICA No 1


Grupo 1. 4. Nota
Integrantes

2. 5.

3. 6.
Resultados obtenidos

Escriba en este espacio los resultados obtenidos y la respuesta a las preguntas formuladas

Análisis e interpretación de resultados


Realice un análisis proponiendo una situación hipotética en el contexto laboral

Conclusiones

Realice Conclusiones respecto a la práctica y como esta enriquece su proceso de


formación.
MACROPROCESO RECURSOS E INFRAESTRUCTURA Y
LABORATORIOS
Nombre del Proceso:
CODIGO: LA-FM-007
GESTIÓN DE LABORATORIOS
Nombre del Documento: VERSION: 6
FORMATO PRACTICAS DE
FECHA: 16/Noviembre/2021
LABORATORIOS

3720 3796 3340 5600 3802

5500 2000 1571 2360 1500

3723 3790 3345 3805 5595

1995 5504 2055 1573 1835

También podría gustarte