Clase 1 P2 Modulo PRC26 - Simulación

Modulo:
PRC26 – Simulación
Profesor: Ing. Jose Antonio Lara Ramos M.Sc.
Correo: jalarar@itsa.edu.co
22/06/2021 www.itsa.edu.co 1
Resumen global periodo 1. Etapas de un proyecto de simulación
Formulación del problema
Documentación
Colocación de objetivos y el
plan de proyecto global Diseño de experimentos
Recolección y Producción de corridas de

Conceptualización del modelo simulación y análisis
procesamiento de datos
Si Corridas Si
Construcción del Modelo
adicionales
No Documentación y
No reporte de trabajo
Verificación
Puesta en
marcha
No No del
Validación modelo
22/06/2021 Si www.itsa.edu.co 2
Tomado y editado de: https://repository.uaeh.edu.mx/revistas/index.php/sahagun/article/view/1358/4640
Clase 1, P2
PRC26 – Simulación
Profesor: Jose Antonio Lara Ramos
¿De qué depende el tamaño de muestra?
Para calcular el tamaño de muestra se deben considerar las decisiones
estadísticas y no estadísticas que tome el investigador.
• Decisiones estadísticas
El tamaño de muestra dependerá del grado de precisión y confiabilidad

que queremos tener en los resultados. Por esta razón, a mayor grado de
confiabilidad y precisión, mayor será el tamaño de muestra.
¿De qué depende el tamaño de muestra?
• Decisiones no estadísticas
En este caso se puede considerar la disponibilidad de los recursos, el

presupuesto o el equipo de personas que hará el trabajo de campo. Si los
recursos son limitados, o el equipo de encuestadores no es óptimo,
probablemente el tamaño de muestra sea menor al deseado. Ten presente
que un encuestador capacitado tiene un costo más elevado que aquel que
no tiene suficiente preparación y experiencia.
Factores estadísticos que influyen el cálculo
del tamaño de muestra
Los factores que intervienen al calcular el tamaño de muestra son los
siguientes:
• El error máximo admisible (d)

• Coeficiente de confianza de la estimación (Z)
• Varianza de la población (p.q)
El error máximo admisible (d)
Es el que determina la precisión de los resultados. Es la máxima
diferencia que podemos tolerar entre el valor de la variable obtenido en
la muestra y el verdadero valor de ésta en la población.
El error máximo admisible está relacionado inversamente con el tamaño

de la muestra. A mayor error, el tamaño de muestra será más pequeño, y
a menor error el tamaño de muestra será más grande.
Paradoja de la línea de costa
Un ejemplo de la paradoja de la línea de costa. Si

la costa de la isla de Gran Bretaña se mide usando
un intervalo de escala de 200 km (izquierda),
entonces la longitud medida de la costa es de
aproximadamente 2.400 kilómetros. Noruega y la paradoja de la línea de costa: Ver Subido por: Un
Mundo Inmenso, 17 jun 2020.
Ejemplo
Para una tienda de regalos, la investigación tiene por objetivo conocer el
ticket promedio de compra en la tienda, y considera un error máximo
admisible del 5%.
Solución: Si en el estudio se obtiene que el ticket promedio es de S/.

100 por persona, estaríamos aceptando que realmente el verdadero valor
esté entre 100 ± 5, es decir entre S/. 100 + 5% y S/. 100 – 5%, lo que da
un intervalo de entre S/. 95 y S/. 105.
Coeficiente de confianza de la estimación (Z)
Para hacer la afirmación anterior sobre los límites dentro de los cuales
se encuentra el verdadero valor poblacional, debe conocerse la
probabilidad de que estos resultados sean ciertos y esto lo da el
coeficiente o nivel de confianza, el cual es la medida probabilística de
que el intervalo fijado con el error máximo admisible, contenga el
valor poblacional.
A mayor nivel de confianza, más elevado será el tamaño de muestra, y

al contrario, a menor nivel de confianza, el tamaño de muestra también
será menor.
confianza de la estimación
+5
-5
Ejemplo
En el ejemplo anterior, del ticket promedio de compra de regalos, se
decidió trabajar con un nivel de confianza de 90%, con lo cual
podríamos afirmar con un 90% de certeza que el ticket promedio de
compra está entre S/. 95 y S/. 105.
Solución: Claro está, queda 10% de posibilidades de equivocarnos al
establecer esa conclusión. Si trabajamos con 95% de confianza, nos
quedaría una posibilidad de equivocarnos de 5%.
Varianza de la población (p.q)
Recordemos el significado de los símbolos:
p = Es la probabilidad de éxito o proporción esperada. (Las personas

responden Si.)
q = Es la probabilidad de fracaso o proporción de repuestas en la otra

categoría. (Las personas responden No.).
Varianza de la población (p.q)
La varianza en los ítems dicotómicos (dos respuestas que se excluyen
mutuamente) es igual a p.q y la varianza mayor (la mayor diversidad de
respuestas) se da cuando p = q = 0.50 (la mitad de las personas responde
sí y la otra mitad responde no).
Como se desconoce la varianza de la población, ponemos la varianza

mayor posible porque a mayor varianza hará falta una muestra mayor.
Es decir, consideramos los valores de p = q = 0.50.
Pasos para calcular el tamaño de muestra
Para obtener los datos se debe realizar una encuesta y aplicar un
cuestionario a un determinado número de personas que tengan dichas
características, y para ello es necesario calcular el tamaño de muestra a
considerar en el estudio.
Debemos considerar 3 pasos:
Paso 1. Definir tipo de población y fórmula

Paso 2: Definir los valores de las variables a utilizar
Paso 3: Aplicar la fórmula para calcular el tamaño de muestra
En primer lugar, dependiendo de la población, si es finita o infinita, se
utilizará la fórmula correspondiente, tal como sigue:
Fórmula para población finita
𝑵 𝒁𝟐 𝒑. 𝒒 En donde:
𝒏= 𝟐 n: Tamaño de muestra que queremos calcular
𝒅 (𝑵 − 𝟏) + 𝒁𝟐 𝒑. 𝒒 N: Tamaño de la población
Z: Coeficiente de confianza para un nivel de confianza
determinado
p: Probabilidad de éxito
q: Probabilidad de fracaso.
d: Error máximo admisible
La fórmula para calcular el tamaño de muestra cuando el tamaño de la
población se desconoce o es infinita, es la siguiente:
Fórmula para población infinita
𝒁𝟐 𝒑. 𝒒 En donde:
𝒏= n: Tamaño de muestra que queremos calcular
𝒅𝟐 Z: Coeficiente de confianza para un nivel de confianza
determinado
p: Probabilidad de éxito
q: Probabilidad de fracaso.
d: Error máximo admisible
Paso 2: Definir los valores de las variables a
utilizar
Para el caso del ejemplo aplicativo, la población es finita, por lo tanto,
utilizaremos la primera fórmula. Las variables cuantificadas son las
siguientes:
• N: Tamaño de la población. 32084 personas.
• Z: Coeficiente de confianza. Z = 1.645 para un nivel de confianza del
90%
• p: Probabilidad de éxito. Consideramos el máximo: 0.50
• q: Probabilidad de fracaso. Será 1.00 – 0.50 = 0.50
• d: Error máximo admisible. Consideramos el 5%
Fórmula para población infinita y finita
𝟐
𝒁 𝒑. 𝒒 𝟐 𝑵 𝒁 𝒑. 𝒒
𝒏= 𝒏= 𝟐
𝒅𝟐 𝒅 (𝑵 − 𝟏) + 𝒁𝟐 𝒑. 𝒒
Población infinita Población finita
Paso 3: Aplicar la fórmula para calcular el
tamaño de muestra
Aplicamos la fórmula de tamaño de muestra para poblaciones finitas y
obtenemos:
𝟑𝟐𝟎𝟖𝟒 ∙ 𝟏. 𝟔𝟒𝟓𝟐 ∙ 𝟎. 𝟓 ∙ 𝟎. 𝟓
𝒏= 𝟐 𝟐
= 𝟐𝟔𝟖. 𝟑𝟒
𝟎. 𝟎𝟓 ∙ 𝟑𝟑𝟎𝟖𝟒 − 𝟏 + 𝟏. 𝟔𝟒𝟓 ∙ 𝟎. 𝟓 ∙ 𝟎. 𝟓
𝒏 = 269
Como resultado, el cálculo del tamaño de muestra nos da 269 personas;
por lo tanto, que corresponde a la cantidad de encuestas que
realizaremos.
n = tamaño de muestra; Z = nivel de confianza (95% o 99%); p = incertidumbre (0.5); q = 1-p ; d
= margen de error (0.04 = ±4); N = individuos de la población
EJERCICIO 1
Para estimar la proporción de habitantes de una ciudad que poseen
ordenador personal se toma una muestra de tamaño n. Calcula el valor
mínimo de n para garantizar, con un nivel de confianza del 95%, que el
error de estimación no supera el 2%. (Como se desconoce la proporción, se
hará a partir del caso más desfavorable, que será 0.5).
Solución:
Datos: Un intervalo de confianza de 95%:

1-α = 0.95 => α = 1- 0.95 = 0.05 => zα/2 = z0.025 = Z = 1.96
EJERCICIO 1
P(Z ≤ zα/2 ) = [1+(Nc/100)]/2 = [1+(95/100)] = 1.95/2 = 0.975
Por lo tanto al buscar dentro de la tabla de distribución normal 0.975 se obtiene Z =

1.96.
Como se desconoce la proporción, tomaremos p = 0.5 => q = 1-p = 0.5
Error admisible para estimar la proporción, d, viene dado por:
d = Z*(p*q/n)^0.5 < 0.02

𝒁𝟐 𝒑. 𝒒
𝒏=
n = Z2*(p*q)/d2 = (1.96)2*(0.5*0.5)/(0.02)2 = 2401 𝒅𝟐
Población infinita
El tamaño de la muestra debe ser de mas de 2401 habitantes.
EJERCICIO 2
El tiempo de conexión a internet de los alumnos de cierta universidad
sigue una distribución normal con desviación típica de 15 minutos.
Para estimar la media del tiempo de conexión, se quiere calcular un
intervalo de confianza que tenga una amplitud menor o igual a 6
minutos, con un nivel de confianza del 95 %. Determina cuál es el
tamaño mínimo de la muestra que es necesario observar.
Solución:

1-α = 0.95 => α = 1- 0.95 = 0.05 => zα/2 = z0.025 = Z = 1.96
EJERCICIO 2
P(Z ≤ zα/2 ) = [1+(Nc/100)]/2 = [1+(95/100)] = 1.95/2 = 0.975
Por lo tanto al buscar dentro de la table de distribución normal 0.975 se

obtiene, Z = 1.96.
Como la amplitude del intervalo de confianza es:
2*Z*σ/(n^0.5) ≤ 6
d = Z*σ/(n^0.5) ≤ 6/2 =3
d = Z*σ/(n^0.5) = 1.96*15/(n^0.5) ≤ 3
EJERCICIO 2
d = Z*σ/(n^0.5) = 1.96*15/(n^0.5) ≤ 3
n = (1.96*15/3)2 = 96.04 ≈ 97
El tamaño mínimo muestral debe ser de 97.
EJERCICIO 3
Se va a realizar una encuesta entre el 30% de la población española
mayor de edad. Si se admite un margen de error del 2%, ¿a cuántas
personas habrá que entrevistar con un nivel de confianza del 95 %?
Solución:

1-α = 0.95 => α = 1- 0.95 = 0.05 => zα/2 = z0.025 = Z = 1.96
EJERCICIO 3
P(Z ≤ zα/2 ) = [1+(Nc/100)]/2 = [1+(95/100)] = 1.95/2 = 0.975
Por lo tanto al buscar dentro de la table de distribución normal 0.975 se

obtiene 1.96.
Como se desconoce la proporción, tomaremos p = 0.3 => q = 1- p = 1 -
0.3 = 0.7
n = Z2*(p.q)/d2 = (1.96)2*(0.3*0.7)/(0.02)2 = 2016.84 ≈ 2017
El tamaño de la muestra debe ser de mas de 2017 habitantes mayores de

edad.
Nivel de confianza de:
90%
95%
99%
GENERACION DE VARIABLES
ALEATORIAS DISCRETAS (30%)
1. Identifica las variables aleatorias que se van a estudiar
2. Determina la distribución aleatoria óptima para el estudio de los datos
3. Identifica los puntos atípicos de una muestra de datos
El árbol de la Estadística Aplicada
¡Eso es! Tres partes fundamentales:

1. Las raíces: los conceptos base
2. El tronco: la metodología y el
software
3. Las ramas: las técnicas de
análisis
https://conceptosclaros.com/como-aprender-estadistica-mito/
INTRODUCCIÓN
La estadística actual es el resultado de la unión de dos disciplinas
que evolucionaron de manera independiente hasta confluir en el siglo
XIX: el Cálculo de Probabilidades, que nace en el siglo XVII como
teoría matemática de los juegos de azar, y la Estadística, ciencia del
estado, que estudia la colección y descripción de datos.
www.itsa.edu.co
CONCEPTOS BÁSICOS
Estadística: (Spiegel) estudia

los métodos científicos para
recoger, organizar, resumir y
analizar datos, así como para
sacar conclusiones válidas y
tomar decisiones razonables
basadas en tal análisis.
www.itsa.edu.co
Los
conceptos
Base
www.itsa.edu.co
Las raíces: los conceptos Base
¡Esta parte es fundamental!
1) Con las tablas de datos. Cómo se organizan, qué son las variables y
qué tipos existen.
2) Con la estadística descriptiva: conocer los conceptos

fundamentales de descripción de datos y para qué se utilizan.
3) Con la estadística inferencial: los conceptos más esenciales que nos

servirán para aprender y dominar las técnicas de las ramas del árbol.
Imagínate que eres biólogo y quieres comparar especies de flores.
La tabla de datos y
variables: tu materia
Lo primero que vas a hacer es recoger datos de flores que te
prima interese estudiar, ¿verdad?
22/06/2021 https://conceptosclaros.com/como-aprender-estadistica-mito/ www.itsa.edu.co 36

Se trata de recoger las dimensiones (ancho y largo) de diferentes flores.
Podemos distinguir dos aspectos en cuánto a la estructura:
Variables = dimensiones de las flores = características = columnas

Observaciones = cada flor que medimos = filas
Nuestra muestra es el número de flores que vamos a medir. Imagínate N

= 150, 150 filas con 5 variables.
➢ Las dimensiones de las flores (4 variables)
➢ El tipo de especies (1 variable)
Como ves, la tabla de datos es una matriz de números y letras que

engloban las características de lo que estás observando.
Y se organiza en forma de tabla. De matriz.
Las dos estadísticas: descriptiva e inferencial
Una tabla de datos por sí sola no dice nada. Necesitas herramientas
gráficas y pequeñas características para entenderla.
1. La estadística descriptiva dibuja y se utiliza para entender la

información escondida de tu tabla de datos.
2. En cambio, la estadística inferencial pretende ir un paso más

allá y aportar conclusiones generales a partir de los datos de tu
muestra (de tu tabla de datos).
Las dos estadísticas: descriptiva e inferencial
Quédate con una idea:
La descriptiva dibuja y te ayuda

entender tu tabla de datos. La
inferencia te ayuda a responder
preguntas globales (de la
población) a partir de tus datos
(de tu muestra)
Estadística descriptiva
Se podemos clasificar los conceptos en función de qué variables describimos o
dibujamos:
Variables cuantitativas:
1. Tabla de frecuencias
2. Valor central (media o mediana)
3. Dispersión (desviación estándar, rango intercuartílico)
4. Medidas de posición (cuartiles, percentiles)
5. Distribución (histograma, boxplot, densidad)
6. Correlación y covarianza
7. Scatterplot y matrixplot
Estadística descriptiva
Variables cualitativas
1. Tablas de contingencias
2. Concepto de proporciones
3. Distribución
4. Diagrama de barras y sectores
Estadística inferencial
En la estadística inferencial es vital entender:
1. El concepto de muestra y población

2. Qué son las distribuciones de variables
3. Qué es y para qué sirve la distribución de densidad de probabilidad y las
probabilidades
4. El poder de la distribución normal
5. Qué son los intervalos de confianza y su gran poder
6. Tipos importantes de distribuciones de probabilidad
7. El contraste de hipótesis y el p-valor
8. La esencia de los modelos predictivos y sus dos super poderes
CONCEPTOS
BÁSICOS
• Variable estadística:
característica o atributo que se
mide en los individuos (seres u
objetos) de una población. Ej,
años de edad, talla, estado civil,
el peso de la ganadería ovina,
diámetro de una pieza, etc. Se
distinguen dos tipos principales
de variables: cuantitativas y
cualitativas.
www.itsa.edu.co
VARIABLE ALEATORIA
Una variable aleatoria (v.a) es una función que asocia un

número real con cada elemento del espacio muestral.
Esta función se llama variable porque puede tomar diferentes

valores, y se llama también aleatoria porque los valores que
toma son al azar, y es medible porque se puede calcular su
probabilidad.
www.itsa.edu.co
VARIABLE ALEATORIA
Los estadísticos utilizan planes de muestreo ya sea para

aceptar o para rechazar lotes de materiales. Suponga que uno
de los planes de muestreo implica el muestreo independiente
de 10 artículos de un lote de 100 de ellos.
Sea X la variable aleatoria definida como el número de

artículos que están defectuosos en la muestra de 10. en este
caso, la variable aleatoria toma los valores 0, 1,…, 9, 10.
www.itsa.edu.co
VARIABLE CUANTITATIVA
Miden alguna cualidad o atributo “cuantificable” de los individuos.

(Valor numérico)
Variables discretas: al ser numerables,

pueden tomar una serie de valores
determinados, pero no los valores
intermedios. Por ejemplo, el número de
cabezas de ganado de una explotación
puede ser 50 ó 51 pero no 50,5.
www.itsa.edu.co
Media, varianza y desviación estándar
Parámetros:
Histograma de la Poblacion
160
140 Media (m)

120
100
Varianza(s2)
Frecuencia
Datos 80
60
Desv. Est. (s)
(Población de Interés) 40
20
0
Etc.
-4 -2 0 2 4
Clases
Inferencias
Muestreo 16
Histograma de la Muestra
Estadísticos:
14
12 Promedio ( X )
Frecuencia
10
Muestras 8 Varianza muestral(S2)

6
4 Desv. Est. muestral(s)

2
0
-4 -2 0 2 4 Etc.
Clases
www.itsa.edu.co
V. A. DISCRETA Y CONTINUA
Se llama variable aleatoria (v.a.) a toda aplicación que asocia a cada

elemento del espacio maestral (S) de un experimento, un número real.
X:S→R
Ejemplo: Se realiza un experimento en un laboratorio cuyo resultado

puede ser positivo o negativo. Construir el espacio muestral y dar una
v.a. asociada al experimento.
S = {Positivo, Negativo} X ( Positivo ) = 1

X es una variable aleatoria X ( Negativo ) = 0
www.itsa.edu.co
V. A. DISCRETA Y CONTINUA
La distribución de probabilidad de una v.a. es una función

que asigna a cada valor posible de dicha v.a. una
probabilidad
Ejemplo. Experimento en un laboratorio

P{X = 1} = P {positivo}
Ejemplo. X : “Bacterias de tipo A en una pipeta”

P {1000 ≤ X ≤ 1500} = P(A) www.itsa.edu.co

Clase 1 P2 Modulo PRC26 - Simulación

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 1 P2 Modulo PRC26 - Simulación

Cargado por

Copyright:

Formatos disponibles

Modulo:

Recolección y Producción de corridas de

El tamaño de muestra dependerá del grado de precisión y confiabilidad

En este caso se puede considerar la disponibilidad de los recursos, el

• El error máximo admisible (d)

El error máximo admisible está relacionado inversamente con el tamaño

Un ejemplo de la paradoja de la línea de costa. Si

Solución: Si en el estudio se obtiene que el ticket promedio es de S/.

A mayor nivel de confianza, más elevado será el tamaño de muestra, y

p = Es la probabilidad de éxito o proporción esperada. (Las personas

q = Es la probabilidad de fracaso o proporción de repuestas en la otra

Como se desconoce la varianza de la población, ponemos la varianza

Debemos considerar 3 pasos:

Paso 1. Definir tipo de población y fórmula

Datos: Un intervalo de confianza de 95%:

Por lo tanto al buscar dentro de la tabla de distribución normal 0.975 se obtiene Z =

d = Z*(p*q/n)^0.5 < 0.02

Datos: Un intervalo de confianza de 95%:

Por lo tanto al buscar dentro de la table de distribución normal 0.975 se

El tamaño mínimo muestral debe ser de 97.

Datos: Un intervalo de confianza de 95%:

Por lo tanto al buscar dentro de la table de distribución normal 0.975 se

El tamaño de la muestra debe ser de mas de 2017 habitantes mayores de

¡Eso es! Tres partes fundamentales:

Estadística: (Spiegel) estudia

2) Con la estadística descriptiva: conocer los conceptos

3) Con la estadística inferencial: los conceptos más esenciales que nos

22/06/2021 https://conceptosclaros.com/como-aprender-estadistica-mito/ www.itsa.edu.co 36

Variables = dimensiones de las flores = características = columnas

Nuestra muestra es el número de flores que vamos a medir. Imagínate N

Como ves, la tabla de datos es una matriz de números y letras que

Y se organiza en forma de tabla. De matriz.

1. La estadística descriptiva dibuja y se utiliza para entender la

2. En cambio, la estadística inferencial pretende ir un paso más

La descriptiva dibuja y te ayuda

1. El concepto de muestra y población

Una variable aleatoria (v.a) es una función que asocia un

Esta función se llama variable porque puede tomar diferentes

Los estadísticos utilizan planes de muestreo ya sea para

Sea X la variable aleatoria definida como el número de

Miden alguna cualidad o atributo “cuantificable” de los individuos.

Variables discretas: al ser numerables,

140 Media (m)

Muestras 8 Varianza muestral(S2)

4 Desv. Est. muestral(s)

Se llama variable aleatoria (v.a.) a toda aplicación que asocia a cada

Ejemplo: Se realiza un experimento en un laboratorio cuyo resultado

S = {Positivo, Negativo} X ( Positivo ) = 1

La distribución de probabilidad de una v.a. es una función

Ejemplo. Experimento en un laboratorio

Ejemplo. X : “Bacterias de tipo A en una pipeta”

También podría gustarte

d = Z(pq/n)^0.5 < 0.02