Está en la página 1de 51

Modulo:

PRC26 – Simulación
Profesor: Ing. Jose Antonio Lara Ramos M.Sc.
Correo: jalarar@itsa.edu.co

22/06/2021 www.itsa.edu.co 1
Resumen global periodo 1. Etapas de un proyecto de simulación
Formulación del problema
Documentación
Colocación de objetivos y el
plan de proyecto global Diseño de experimentos

Recolección y Producción de corridas de


Conceptualización del modelo simulación y análisis
procesamiento de datos

Si Corridas Si
Construcción del Modelo
adicionales
No Documentación y
No reporte de trabajo
Verificación
Puesta en
marcha
No No del
Validación modelo

22/06/2021 Si www.itsa.edu.co 2
Tomado y editado de: https://repository.uaeh.edu.mx/revistas/index.php/sahagun/article/view/1358/4640
Clase 1, P2
PRC26 – Simulación
Profesor: Jose Antonio Lara Ramos

22/06/2021 www.itsa.edu.co 3
¿De qué depende el tamaño de muestra?
Para calcular el tamaño de muestra se deben considerar las decisiones
estadísticas y no estadísticas que tome el investigador.

• Decisiones estadísticas

El tamaño de muestra dependerá del grado de precisión y confiabilidad


que queremos tener en los resultados. Por esta razón, a mayor grado de
confiabilidad y precisión, mayor será el tamaño de muestra.

22/06/2021 www.itsa.edu.co 4
¿De qué depende el tamaño de muestra?
• Decisiones no estadísticas

En este caso se puede considerar la disponibilidad de los recursos, el


presupuesto o el equipo de personas que hará el trabajo de campo. Si los
recursos son limitados, o el equipo de encuestadores no es óptimo,
probablemente el tamaño de muestra sea menor al deseado. Ten presente
que un encuestador capacitado tiene un costo más elevado que aquel que
no tiene suficiente preparación y experiencia.

22/06/2021 www.itsa.edu.co 5
Factores estadísticos que influyen el cálculo
del tamaño de muestra
Los factores que intervienen al calcular el tamaño de muestra son los
siguientes:

• El error máximo admisible (d)


• Coeficiente de confianza de la estimación (Z)
• Varianza de la población (p.q)

22/06/2021 www.itsa.edu.co 6
El error máximo admisible (d)
Es el que determina la precisión de los resultados. Es la máxima
diferencia que podemos tolerar entre el valor de la variable obtenido en
la muestra y el verdadero valor de ésta en la población.

El error máximo admisible está relacionado inversamente con el tamaño


de la muestra. A mayor error, el tamaño de muestra será más pequeño, y
a menor error el tamaño de muestra será más grande.

22/06/2021 www.itsa.edu.co 7
Paradoja de la línea de costa

Un ejemplo de la paradoja de la línea de costa. Si


la costa de la isla de Gran Bretaña se mide usando
un intervalo de escala de 200 km (izquierda),
entonces la longitud medida de la costa es de
aproximadamente 2.400 kilómetros. Noruega y la paradoja de la línea de costa: Ver Subido por: Un
Mundo Inmenso, 17 jun 2020.

22/06/2021 www.itsa.edu.co 8
Ejemplo
Para una tienda de regalos, la investigación tiene por objetivo conocer el
ticket promedio de compra en la tienda, y considera un error máximo
admisible del 5%.

Solución: Si en el estudio se obtiene que el ticket promedio es de S/.


100 por persona, estaríamos aceptando que realmente el verdadero valor
esté entre 100 ± 5, es decir entre S/. 100 + 5% y S/. 100 – 5%, lo que da
un intervalo de entre S/. 95 y S/. 105.

22/06/2021 www.itsa.edu.co 9
Coeficiente de confianza de la estimación (Z)
Para hacer la afirmación anterior sobre los límites dentro de los cuales
se encuentra el verdadero valor poblacional, debe conocerse la
probabilidad de que estos resultados sean ciertos y esto lo da el
coeficiente o nivel de confianza, el cual es la medida probabilística de
que el intervalo fijado con el error máximo admisible, contenga el
valor poblacional.

A mayor nivel de confianza, más elevado será el tamaño de muestra, y


al contrario, a menor nivel de confianza, el tamaño de muestra también
será menor.
22/06/2021 www.itsa.edu.co 10
confianza de la estimación
+5

-5

22/06/2021 www.itsa.edu.co 11
Ejemplo
En el ejemplo anterior, del ticket promedio de compra de regalos, se
decidió trabajar con un nivel de confianza de 90%, con lo cual
podríamos afirmar con un 90% de certeza que el ticket promedio de
compra está entre S/. 95 y S/. 105.
Solución: Claro está, queda 10% de posibilidades de equivocarnos al
establecer esa conclusión. Si trabajamos con 95% de confianza, nos
quedaría una posibilidad de equivocarnos de 5%.

22/06/2021 www.itsa.edu.co 12
Varianza de la población (p.q)
Recordemos el significado de los símbolos:

p = Es la probabilidad de éxito o proporción esperada. (Las personas


responden Si.)

q = Es la probabilidad de fracaso o proporción de repuestas en la otra


categoría. (Las personas responden No.).

22/06/2021 www.itsa.edu.co 13
Varianza de la población (p.q)
La varianza en los ítems dicotómicos (dos respuestas que se excluyen
mutuamente) es igual a p.q y la varianza mayor (la mayor diversidad de
respuestas) se da cuando p = q = 0.50 (la mitad de las personas responde
sí y la otra mitad responde no).

Como se desconoce la varianza de la población, ponemos la varianza


mayor posible porque a mayor varianza hará falta una muestra mayor.
Es decir, consideramos los valores de p = q = 0.50.

22/06/2021 www.itsa.edu.co 14
Pasos para calcular el tamaño de muestra
Para obtener los datos se debe realizar una encuesta y aplicar un
cuestionario a un determinado número de personas que tengan dichas
características, y para ello es necesario calcular el tamaño de muestra a
considerar en el estudio.

Debemos considerar 3 pasos:

Paso 1. Definir tipo de población y fórmula


Paso 2: Definir los valores de las variables a utilizar
Paso 3: Aplicar la fórmula para calcular el tamaño de muestra
22/06/2021 www.itsa.edu.co 15
Paso 1. Definir tipo de población y fórmula
En primer lugar, dependiendo de la población, si es finita o infinita, se
utilizará la fórmula correspondiente, tal como sigue:
Fórmula para población finita

𝑵 𝒁𝟐 𝒑. 𝒒 En donde:
𝒏= 𝟐 n: Tamaño de muestra que queremos calcular
𝒅 (𝑵 − 𝟏) + 𝒁𝟐 𝒑. 𝒒 N: Tamaño de la población
Z: Coeficiente de confianza para un nivel de confianza
determinado
p: Probabilidad de éxito
q: Probabilidad de fracaso.
d: Error máximo admisible
22/06/2021 www.itsa.edu.co 16
Paso 1. Definir tipo de población y fórmula
La fórmula para calcular el tamaño de muestra cuando el tamaño de la
población se desconoce o es infinita, es la siguiente:
Fórmula para población infinita

𝒁𝟐 𝒑. 𝒒 En donde:
𝒏= n: Tamaño de muestra que queremos calcular
𝒅𝟐 Z: Coeficiente de confianza para un nivel de confianza
determinado
p: Probabilidad de éxito
q: Probabilidad de fracaso.
d: Error máximo admisible
22/06/2021 www.itsa.edu.co 17
Paso 2: Definir los valores de las variables a
utilizar
Para el caso del ejemplo aplicativo, la población es finita, por lo tanto,
utilizaremos la primera fórmula. Las variables cuantificadas son las
siguientes:
• N: Tamaño de la población. 32084 personas.
• Z: Coeficiente de confianza. Z = 1.645 para un nivel de confianza del
90%
• p: Probabilidad de éxito. Consideramos el máximo: 0.50
• q: Probabilidad de fracaso. Será 1.00 – 0.50 = 0.50
• d: Error máximo admisible. Consideramos el 5%

22/06/2021 www.itsa.edu.co 18
Fórmula para población infinita y finita

𝟐
𝒁 𝒑. 𝒒 𝟐 𝑵 𝒁 𝒑. 𝒒
𝒏= 𝒏= 𝟐
𝒅𝟐 𝒅 (𝑵 − 𝟏) + 𝒁𝟐 𝒑. 𝒒
Población infinita Población finita

22/06/2021 www.itsa.edu.co 19
Paso 3: Aplicar la fórmula para calcular el
tamaño de muestra
Aplicamos la fórmula de tamaño de muestra para poblaciones finitas y
obtenemos:

𝟑𝟐𝟎𝟖𝟒 ∙ 𝟏. 𝟔𝟒𝟓𝟐 ∙ 𝟎. 𝟓 ∙ 𝟎. 𝟓
𝒏= 𝟐 𝟐
= 𝟐𝟔𝟖. 𝟑𝟒
𝟎. 𝟎𝟓 ∙ 𝟑𝟑𝟎𝟖𝟒 − 𝟏 + 𝟏. 𝟔𝟒𝟓 ∙ 𝟎. 𝟓 ∙ 𝟎. 𝟓

𝒏 = 269
Como resultado, el cálculo del tamaño de muestra nos da 269 personas;
por lo tanto, que corresponde a la cantidad de encuestas que
realizaremos.

22/06/2021 www.itsa.edu.co 20
n = tamaño de muestra; Z = nivel de confianza (95% o 99%); p = incertidumbre (0.5); q = 1-p ; d
= margen de error (0.04 = ±4); N = individuos de la población
22/06/2021 www.itsa.edu.co 21
EJERCICIO 1
Para estimar la proporción de habitantes de una ciudad que poseen
ordenador personal se toma una muestra de tamaño n. Calcula el valor
mínimo de n para garantizar, con un nivel de confianza del 95%, que el
error de estimación no supera el 2%. (Como se desconoce la proporción, se
hará a partir del caso más desfavorable, que será 0.5).

Solución:

Datos: Un intervalo de confianza de 95%:


1-α = 0.95 => α = 1- 0.95 = 0.05 => zα/2 = z0.025 = Z = 1.96

22/06/2021 www.itsa.edu.co 22
EJERCICIO 1
P(Z ≤ zα/2 ) = [1+(Nc/100)]/2 = [1+(95/100)] = 1.95/2 = 0.975

Por lo tanto al buscar dentro de la tabla de distribución normal 0.975 se obtiene Z =


1.96.
Como se desconoce la proporción, tomaremos p = 0.5 => q = 1-p = 0.5
Error admisible para estimar la proporción, d, viene dado por:

d = Z*(p*q/n)^0.5 < 0.02


𝒁𝟐 𝒑. 𝒒
𝒏=
n = Z2*(p*q)/d2 = (1.96)2*(0.5*0.5)/(0.02)2 = 2401 𝒅𝟐
Población infinita
El tamaño de la muestra debe ser de mas de 2401 habitantes.

22/06/2021 www.itsa.edu.co 23
EJERCICIO 2
El tiempo de conexión a internet de los alumnos de cierta universidad
sigue una distribución normal con desviación típica de 15 minutos.
Para estimar la media del tiempo de conexión, se quiere calcular un
intervalo de confianza que tenga una amplitud menor o igual a 6
minutos, con un nivel de confianza del 95 %. Determina cuál es el
tamaño mínimo de la muestra que es necesario observar.

Solución:

Datos: Un intervalo de confianza de 95%:


1-α = 0.95 => α = 1- 0.95 = 0.05 => zα/2 = z0.025 = Z = 1.96

22/06/2021 www.itsa.edu.co 24
EJERCICIO 2
P(Z ≤ zα/2 ) = [1+(Nc/100)]/2 = [1+(95/100)] = 1.95/2 = 0.975

Por lo tanto al buscar dentro de la table de distribución normal 0.975 se


obtiene, Z = 1.96.
Como la amplitude del intervalo de confianza es:
2*Z*σ/(n^0.5) ≤ 6

d = Z*σ/(n^0.5) ≤ 6/2 =3

d = Z*σ/(n^0.5) = 1.96*15/(n^0.5) ≤ 3

22/06/2021 www.itsa.edu.co 25
EJERCICIO 2
d = Z*σ/(n^0.5) = 1.96*15/(n^0.5) ≤ 3

n = (1.96*15/3)2 = 96.04 ≈ 97

El tamaño mínimo muestral debe ser de 97.

22/06/2021 www.itsa.edu.co 26
EJERCICIO 3
Se va a realizar una encuesta entre el 30% de la población española
mayor de edad. Si se admite un margen de error del 2%, ¿a cuántas
personas habrá que entrevistar con un nivel de confianza del 95 %?
Solución:

Datos: Un intervalo de confianza de 95%:


1-α = 0.95 => α = 1- 0.95 = 0.05 => zα/2 = z0.025 = Z = 1.96

22/06/2021 www.itsa.edu.co 27
EJERCICIO 3
P(Z ≤ zα/2 ) = [1+(Nc/100)]/2 = [1+(95/100)] = 1.95/2 = 0.975

Por lo tanto al buscar dentro de la table de distribución normal 0.975 se


obtiene 1.96.
Como se desconoce la proporción, tomaremos p = 0.3 => q = 1- p = 1 -
0.3 = 0.7
n = Z2*(p.q)/d2 = (1.96)2*(0.3*0.7)/(0.02)2 = 2016.84 ≈ 2017

El tamaño de la muestra debe ser de mas de 2017 habitantes mayores de


edad.
22/06/2021 www.itsa.edu.co 28
Nivel de confianza de:
90%
95%
99%

22/06/2021 www.itsa.edu.co 29
GENERACION DE VARIABLES
ALEATORIAS DISCRETAS (30%)
1. Identifica las variables aleatorias que se van a estudiar
2. Determina la distribución aleatoria óptima para el estudio de los datos
3. Identifica los puntos atípicos de una muestra de datos

22/06/2021 www.itsa.edu.co 30
El árbol de la Estadística Aplicada

¡Eso es! Tres partes fundamentales:


1. Las raíces: los conceptos base
2. El tronco: la metodología y el
software
3. Las ramas: las técnicas de
análisis

https://conceptosclaros.com/como-aprender-estadistica-mito/
22/06/2021 www.itsa.edu.co 31
INTRODUCCIÓN
La estadística actual es el resultado de la unión de dos disciplinas
que evolucionaron de manera independiente hasta confluir en el siglo
XIX: el Cálculo de Probabilidades, que nace en el siglo XVII como
teoría matemática de los juegos de azar, y la Estadística, ciencia del
estado, que estudia la colección y descripción de datos.

www.itsa.edu.co
CONCEPTOS BÁSICOS

Estadística: (Spiegel) estudia


los métodos científicos para
recoger, organizar, resumir y
analizar datos, así como para
sacar conclusiones válidas y
tomar decisiones razonables
basadas en tal análisis.

www.itsa.edu.co
Los
conceptos
Base

https://conceptosclaros.com/como-aprender-estadistica-mito/

www.itsa.edu.co
Las raíces: los conceptos Base
¡Esta parte es fundamental!

1) Con las tablas de datos. Cómo se organizan, qué son las variables y
qué tipos existen.

2) Con la estadística descriptiva: conocer los conceptos


fundamentales de descripción de datos y para qué se utilizan.

3) Con la estadística inferencial: los conceptos más esenciales que nos


servirán para aprender y dominar las técnicas de las ramas del árbol.

22/06/2021 www.itsa.edu.co 35
Imagínate que eres biólogo y quieres comparar especies de flores.
La tabla de datos y
variables: tu materia
Lo primero que vas a hacer es recoger datos de flores que te
prima interese estudiar, ¿verdad?

22/06/2021 https://conceptosclaros.com/como-aprender-estadistica-mito/ www.itsa.edu.co 36


Las raíces: los conceptos Base
Se trata de recoger las dimensiones (ancho y largo) de diferentes flores.
Podemos distinguir dos aspectos en cuánto a la estructura:

Variables = dimensiones de las flores = características = columnas


Observaciones = cada flor que medimos = filas

Nuestra muestra es el número de flores que vamos a medir. Imagínate N


= 150, 150 filas con 5 variables.

22/06/2021 www.itsa.edu.co 37
Las raíces: los conceptos Base
➢ Las dimensiones de las flores (4 variables)
➢ El tipo de especies (1 variable)

Como ves, la tabla de datos es una matriz de números y letras que


engloban las características de lo que estás observando.

Y se organiza en forma de tabla. De matriz.

22/06/2021 www.itsa.edu.co 38
22/06/2021 www.itsa.edu.co 39
https://conceptosclaros.com/como-aprender-estadistica-mito/
Las dos estadísticas: descriptiva e inferencial
Una tabla de datos por sí sola no dice nada. Necesitas herramientas
gráficas y pequeñas características para entenderla.

1. La estadística descriptiva dibuja y se utiliza para entender la


información escondida de tu tabla de datos.

2. En cambio, la estadística inferencial pretende ir un paso más


allá y aportar conclusiones generales a partir de los datos de tu
muestra (de tu tabla de datos).
22/06/2021 www.itsa.edu.co 40
Las dos estadísticas: descriptiva e inferencial
Quédate con una idea:

La descriptiva dibuja y te ayuda


entender tu tabla de datos. La
inferencia te ayuda a responder
preguntas globales (de la
población) a partir de tus datos
(de tu muestra)

22/06/2021 www.itsa.edu.co 41
https://conceptosclaros.com/como-aprender-estadistica-mito/
Estadística descriptiva
Se podemos clasificar los conceptos en función de qué variables describimos o
dibujamos:

Variables cuantitativas:

1. Tabla de frecuencias
2. Valor central (media o mediana)
3. Dispersión (desviación estándar, rango intercuartílico)
4. Medidas de posición (cuartiles, percentiles)
5. Distribución (histograma, boxplot, densidad)
6. Correlación y covarianza
7. Scatterplot y matrixplot
22/06/2021 www.itsa.edu.co 42
Estadística descriptiva
Variables cualitativas

1. Tablas de contingencias
2. Concepto de proporciones
3. Distribución
4. Diagrama de barras y sectores

22/06/2021 www.itsa.edu.co 43
Estadística inferencial
En la estadística inferencial es vital entender:

1. El concepto de muestra y población


2. Qué son las distribuciones de variables
3. Qué es y para qué sirve la distribución de densidad de probabilidad y las
probabilidades
4. El poder de la distribución normal
5. Qué son los intervalos de confianza y su gran poder
6. Tipos importantes de distribuciones de probabilidad
7. El contraste de hipótesis y el p-valor
8. La esencia de los modelos predictivos y sus dos super poderes
22/06/2021 www.itsa.edu.co 44
CONCEPTOS
BÁSICOS

• Variable estadística:
característica o atributo que se
mide en los individuos (seres u
objetos) de una población. Ej,
años de edad, talla, estado civil,
el peso de la ganadería ovina,
diámetro de una pieza, etc. Se
distinguen dos tipos principales
de variables: cuantitativas y
cualitativas.

www.itsa.edu.co
VARIABLE ALEATORIA

Una variable aleatoria (v.a) es una función que asocia un


número real con cada elemento del espacio muestral.

Esta función se llama variable porque puede tomar diferentes


valores, y se llama también aleatoria porque los valores que
toma son al azar, y es medible porque se puede calcular su
probabilidad.

www.itsa.edu.co
VARIABLE ALEATORIA

Los estadísticos utilizan planes de muestreo ya sea para


aceptar o para rechazar lotes de materiales. Suponga que uno
de los planes de muestreo implica el muestreo independiente
de 10 artículos de un lote de 100 de ellos.

Sea X la variable aleatoria definida como el número de


artículos que están defectuosos en la muestra de 10. en este
caso, la variable aleatoria toma los valores 0, 1,…, 9, 10.

www.itsa.edu.co
VARIABLE CUANTITATIVA

Miden alguna cualidad o atributo “cuantificable” de los individuos.


(Valor numérico)

Variables discretas: al ser numerables,


pueden tomar una serie de valores
determinados, pero no los valores
intermedios. Por ejemplo, el número de
cabezas de ganado de una explotación
puede ser 50 ó 51 pero no 50,5.

www.itsa.edu.co
Media, varianza y desviación estándar
Parámetros:
Histograma de la Poblacion
160

140 Media (m)


120

100
Varianza(s2)

Frecuencia
Datos 80

60
Desv. Est. (s)
(Población de Interés) 40

20

0
Etc.
-4 -2 0 2 4
Clases

Inferencias

Muestreo 16
Histograma de la Muestra
Estadísticos:
14

12 Promedio ( X )

Frecuencia
10

Muestras 8 Varianza muestral(S2)


6

4 Desv. Est. muestral(s)


2

0
-4 -2 0 2 4 Etc.
Clases

www.itsa.edu.co
V. A. DISCRETA Y CONTINUA

Se llama variable aleatoria (v.a.) a toda aplicación que asocia a cada


elemento del espacio maestral (S) de un experimento, un número real.

X:S→R

Ejemplo: Se realiza un experimento en un laboratorio cuyo resultado


puede ser positivo o negativo. Construir el espacio muestral y dar una
v.a. asociada al experimento.

S = {Positivo, Negativo} X ( Positivo ) = 1


X es una variable aleatoria X ( Negativo ) = 0
www.itsa.edu.co
V. A. DISCRETA Y CONTINUA

La distribución de probabilidad de una v.a. es una función


que asigna a cada valor posible de dicha v.a. una
probabilidad

Ejemplo. Experimento en un laboratorio


P{X = 1} = P {positivo}

Ejemplo. X : “Bacterias de tipo A en una pipeta”


P {1000 ≤ X ≤ 1500} = P(A) www.itsa.edu.co

También podría gustarte