Está en la página 1de 27

Repaso general de estadísticas

Tópicos generales de simulación

Qué vamos a ver?

Proyectos
Simulación discreta
Conceptos generales
• Compendios (surveys): No invasivos.
• Experimentos: Invasivos. Se buscan relaciones de causa y
efecto.
• Estadísticas descriptivas:
• Datos categóricos – por categorías (género, afiliación política, otros).
• Numéricos (peso, color, densidad, otros).
Conceptos generales
• La variable.
• Variable – es una característica que puede ser contada, medida,
categorizada (género, edad, estatura, etc.).
• X = característica.
• x = valor que la característica toma.
Tipos de variables
• Variables discretas y continuas.
• Variables aleatorias discretas: van a depender de si el valor x que toma la
variable es entero o no (0, 1, 2, 3, … , 10).
• Variable aleatoria continua: en este caso, los posibles valores de x
pueden ser descritos solo usando intervalos de números reales (por
ejemplo, 0 a ∞).

https://goo.gl/9NGrMb

http://goo.gl/ipNr8h
Conceptos generales
• La distribución y la variable.
• Distribución – listado de posibles valores de la variable (o intervalos de
valores) y con qué frecuencia (o con qué densidad) se dan. Por
ejemplo:
• Si una variable cuenta el número de éxitos en cierto número de ensayos,
estamos en presencia de una distribución binomial.
• Si ocurren de acuerdo a una curva de campana, distribución normal.
• Si está basada en muestras promedio y el número de datos es limitado, estamos
en presencia de una distribución t.
Conceptos generales
• Distribuciones de
probabilidad más
comunes.

http://goo.gl/VqrbDj
ߪई
Conceptos generales ࣿ

• Error estándar: diferencia entre la población y los resultados de


las muestras Æ Error ≠ Equivocación. (El error usted puede
conocerlo porque lo puede estimar mediante un cálculo. Una
equivocación es algo que usted conoce después de haber incurrido
en ella.)
• Es una medida de la desviación de los datos de la media.
“Cuánto de la variación en y está descrita por la variación en
x”?
• La desviación estándar (ߪ) señala la magnitud de la diversidad en
una población (ࣿ). Por lo tanto:
• El error estándar de la media de la muestra es más grande cuando la
desviación estándar (ߪई ) de la población es más grande.
Conceptos generales
• Etapas de un estudio estadístico:
• Determinar la población a estudiar.
• Recoger los datos.
• Organizar, resumir, analizar. http://goo.gl/bYwo8p

• Extraer conclusiones.
• ¿En qué momento entra la simulación?

Estadísticas Modelo Simulación Resultados


ƒ”ž‡–”‘•
Conceptos generales
•–ƒ†À•–‹…‘•

• La población (population).
• La muestra – subconjunto de la población (sample).
• La aleatoriedad – instrumento para seleccionar una muestra
evitando el sesgo (bias).
• ¿Qué ejemplos de sesgo podría dar?
Conceptos generales
• Estadístico – número que resume los datos recogidos de una
muestra: porcentaje, promedio, percentil, moda, etc.
• Parámetro – número o cifra que corresponde a toda una
población.
• Sesgo (bias) – la Némesis del estadístico. Favoritismo con que
se selecciona una muestra.
La estadística se basa en muestras, no en poblaciones. Los
datos que provienen de una población completa se llaman
“censo.” Si uno, entonces, resume toda la información que
Recuerde provee un censo sobre una variable en un único número, ese
número es un parámetro, no un estadístico. La mayor parte del
tiempo los investigadores intentan establecer el parámetro a
partir del estadístico.
Media y mediana
• La media y la mediana.
• El punto de equilibrio del balancín es afectado por los pesos de las
http://goo.gl/8wgsZT

personas en cada lado, no por el número de personas, de modo que la


media refleja los valores reales de los datos antes que la cantidad de
datos.
• La mediana es el lugar donde se pone el pivote: se tiene un número
igual de personas en cada lado del balancín, con independencia de los
pesos. Con el mismo número de personas en cada lado, el balancín no se
equilibraría en términos de peso (a menos que hubiera gente con el mismo peso a cada
lado). Así, la mediana no se ve afectada por los valores de los datos,
solo por la localización de ellos dentro del conjunto.
Distribución
• Distribución – listado o función que muestra todos los posibles
valores de los datos y la frecuencia con que ellos se dan.
Experimento
• Experimento: estudio que impone un control sobre los sujetos (en
estudio), sobre el entorno, y sobre el registro de las respuestas.
El propósito es encontrar relaciones causa efecto.

http://goo.gl/E1D7jR
Causalidad y correlación
• Causalidad y correlación: la correlación nos dice que hay una
relación entre dos variables. La causalidad nos explica por qué
o cómo.
• Por ejemplo, el número de asesinatos en Nueva York está correlacionado con la venta
de helados, pero estos últimos no son la causa de los primeros ni aquellos de estos.

̱
https://goo.gl/Mg3kDj http://goo.gl/dCjuxk
Causalidad y correlación
• Cuando el coeficiente de correlación es cero, se dice que no hay relación
entre las variables dependiente e independiente.
• Cuando el coeficiente de correlación es menor que േ 0,10, la relación entre
las variables es muy débil.
• Cuando el valor del coeficiente de correlación es cercano a േ 1,00, la
relación entre las variables es muy fuerte.

Relación negativa fuerte No hay relación lineal Relación positiva fuerte

-1 0 +1
Causalidad y correlación
Causalidad y correlación
• Cálculo
o del coeficiente de correlación

X 8 4 5 -1
y -2 0 2 6
Distribuciones y desviaciones
estándar
• La desviación estándar es una medida de cuán dispersas están
las cosas que se comparan.
• “Este huevo es mucho más grande que el promedio”
• La desviación estándar nos dice precisamente qué significa “mucho
más.”
• Distribución de frecuencia.
• Ejemplo: estaturas de niños en el colegio.
Estaturas de menor a mayor (en
pulgadas)
¿Cuál es la relación entre la distribución
de frecuencia y la desviación estándar?
¿Qué significan las diferencias en estatura?
¿Qué significan 15 cm de diferencia en estatura entre los niños?
¿Qué significan 15 cm de diferencia en estatura entre elefantes?
¿Qué tan “grande” es una diferencia?
La respuesta es… depende.
Y depende de la estatura promedio y de la variación entre estaturas.
En definitiva…
• La desviación estándar es una manera de tomar en cuenta, de
una sola vez, tanto el promedio como la variación, de modo que
6 pulgadas (15 cm) pueden ser expresadas de manera que
signifique lo mismo para niños de enseñanza media de una
escuela en relación a los de otra, elefantes en relación a otros
elefantes, y así.
Distribución normal
La distribución normal puede verse como la distribución límite de
una variable aleatoria binomial.
En un experimento binomial, si usamos una probabilidad de éxito
p, podemos analizar qué pasa a medida que el número de
intentos n aumenta.
Para ver qué pasa, podemos construir, por ejemplo, histogramas
para n = 5, 10, 25, y 50…
La curva normal
• La distribución normal:
• Media poblacional: μ
• Desviación estándar: σ
La distribución normal estándar
• La distribución normal estándar (distribución Z).
• Es el estándar por el que todas las distribuciones normales son
medidas.
• Su media es ¿…? y su desviación estándar es ¿…?
• Casi todos sus valores (99,7%) caen entre -3 y +3.
• Un valor z (z value) representa el número de desviaciones estándar a
las que un valor particular dado se encuentra en relación a la media.
La distribución normal estándar
La distribución normal estándar
• Cualquier variable aleatoria puede ser convertida a una
variable aleatoria normal estándar calculando el
correspondiente valor ‫ݖ‬. Este valor se obtiene de la siguiente
fórmula:

‫ ݁ݑ݈ܽݒ‬െ ݉݁ܽ݊ ‫ݔ‬െߤ


‫ݖ‬ൌ ൌ
‫݊݋݅ݐܽ݅ݒ݁݀ ݀ݎܽ݀݊ܽݐݏ‬ ߪ

• En la ecuación, x es el valor de una variable aleatoria normal X


con media ߤ y desviación estándar ߪǤ

También podría gustarte