Está en la página 1de 39

TEMA 1.

INTRODUCCIÓN A
LA ESTADÍSTICA

• MSc. Marcos Fernando Ocaña Sánchez


• Propedéutico de Investigación
• Maestría en Ciencias de la Educación
• ICES
Estadística
• Conjunto de métodos científicos ligados a la
toma, organización, recopilación,
presentación y análisis de datos, tanto para la
deducción de conclusiones como para tomar
decisiones razonables de acuerdo con tales
análisis.
• Es un campo del conocimiento que permite
al investigador/a deducir y evaluar
conclusiones acerca de una población a
partir de información proporcionada por una
muestra

MC. Marcos F Ocaña Sánchez


Estadística
• Específicamente, la estadística trata de
teoremas, herramientas, métodos y
técnicas que se pueden usar en:
a. Recolección, selección y clasificación
de datos.
b. Interpretación y análisis de datos.
c. Deducción y evolución de conclusiones
y de su confiabilidad, basada en datos
muéstrales.
MC. Marcos F Ocaña Sánchez
Estadística

Descriptiva Inferencial

MC. Marcos F Ocaña Sánchez


ESTADÍSTICA
DESCRIPTIVA

• Comprende las técnicas que se emplean


para resumir y describir datos numéricos
• Son sencillas desde el punto de vista
matemático y su análisis se limita a los
datos coleccionados sin inferir en un
grupo mayor
• El estudio de los datos se realiza con
representaciones gráficas, tablas,
medidas de posición y dispersión

MC. Marcos F Ocaña Sánchez


Estadística inferencial
• El problema crucial de la estadística inferencial es
llegar a proposiciones acerca de la población a partir
de la observación efectuada en muestras bajo
condiciones de incertidumbre.
• Esta comprende las técnicas que aplicadas en una
muestra sometida a observación, permiten la toman
de decisiones sobre una población o proceso
estadístico
• En otras palabras, es el proceso de hacer predicciones
acerca de un todo basado en la información de una
muestra
• La inferencia se preocupa de la precisión de los
estadígrafos descriptivos ya que estos se vinculan
inductivamente con el valor poblacional

MC. Marcos F Ocaña Sánchez


Población
• Es el conjunto de todos los elementos que
presentan una característica común
determinada, observable y medible
• Por ejemplo, si el elemento es una persona,
se puede estudiar las características edad,
peso, nacionalidad, sexo, etc
• Los elementos que integran una población
pueden corresponder a personas, objetos o
grupos (por ejemplo, familias, fábricas,
emprersas, etc)
• Las características de la población se
resumen en valores llamados parámetros

MC. Marcos F Ocaña Sánchez


Muestra
• La mayoría de los estudios estadísticos, se
realizan no sobre la población, sino sobre un
subconjunto o una parte de ella, llamado
muestra, partiendo del supuesto de que
este subconjunto presenta el mismo
comportamiento y características que la
población
• En general el tamaño de la muestra es
mucho menor al tamaño de la población
• Los valores o índices que se concluyen de
una muestra se llaman estadígrafos y estos
mediante métodos inferenciales o
probabílisticos, se aproximan a los
parámetros poblacionales

MC. Marcos F Ocaña Sánchez


Variable
• Se llama variable a una
característica que se observa
en una población o muestra, y
a la cual se desea estudiar
• La variable puede tomar
diferentes valores
dependiendo de cada
individuo
• Una variable se puede clasificar
de la siguiente manera

MC. Marcos F Ocaña Sánchez


Variable cualitativa

Una variable cualitativa Ejemplo: El estado civil, con las


nominal presenta modalidades siguientes modalidades: soltero,
no numéricas que no admiten casado, separado,
un criterio de orden. divorciado y viudo.

Ejemplos: La nota en un
Una variable cualitativa
examen: suspenso, aprobado,
ordinal presenta modalidades
notable, sobresaliente. Puesto
no númericas, en las que existe
conseguido en una prueba
un orden.
deportiva: 1º, 2º, 3º, ...

MC. Marcos F Ocaña Sánchez


Variable cuantitativa

Variable discreta: Una variable


discreta es aquella que solo Ejemplo: El número de
puede tomar un número finito de hermanos de 5 amigos: 2, 1, 0, 1,
valores entre dos valores 3.
cualesquiera de una caraterística.

Ejemplos: La altura de los 5


Variable continua: Una variable
amigos: 1.73, 1.82, 1.77, 1.69,
continua es aquella que puede
1.75. En la práctica medimos la
tomar un número infinito de
altura con dos decimales, pero
valores entre dos valores
también se podría dar con tres
cualesquiera de una caraterística.
decimales.

MC. Marcos F Ocaña Sánchez


Variables dependientes e independientes
6
Variable dependiente

4
Serie 1
3
Serie 2

2 Serie 3

0
Categoría 1 Categoría 2 Categoría 3 Categoría 4
Variable independiente
MC. Marcos F Ocaña Sánchez
Frecuencia

• Es la medida del número de veces que se repite un fenómeno por unidad de


tiempo

MC. Marcos F Ocaña Sánchez


Frecuencias Absolutas

• ni: Definida como el número de veces que aparece repetido el valor en cuestión de
la variable estadística en el conjunto de las observaciones realizadas
• Si N es el número de observaciones (o tamaño de la muestra), las frecuencias
absolutas cumplen las propiedades
• La frecuencia absoluta, aunque nos dice el número de veces que se repite un dato,
no nos informa de la importancia de este

MC. Marcos F Ocaña Sánchez


Frecuencias Relativas

• fi: Cociente entre la frecuencia absoluta y el número de observaciones realizadas N. Es decir:

• Esta frecuencia relativa se puede expresar también en tantos por cientos del tamaño de la
muestra, para lo cual basta con multiplicar por 100

• Por ejemplo, si fi = 0.25, esto quiere decir que la variable xi se repite en el 25% de la muestra.

MC. Marcos F Ocaña Sánchez


¿Cómo las calculo?

• ¿De qué ciudad provienen los alumnos de ICES?

𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 =
𝑠𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠

MC. Marcos F Ocaña Sánchez


Ejercicio

MC. Marcos F Ocaña Sánchez


Probabilidad

Probabilidad y estadístia ---> relación directa

Es una herramienta que permite evaluar la confiabilidad de las


conclusiones tomadas acerca de la población cuando se tenga solo
información muestral

MSc. Marcos F. Ocaña Sánchez


Probabilidad

Cuando se lanza al aire una sola moneda, verá cara (H) o cruz (T)

Si lanzas la moneda varias veces al aire, va a generar un número


infinitamente grande de caras o cruces, es decir, toda la población

¿Qué aspecto tiene esta población? Si la moneda es imparcial, entonces


la población debe contener 50% de H y 50% de T

Ahora lance al aire la moneda una vez más. ¿Cuál es la probabilidad de


que resulte una cara? Casi todos dirían que la “probabilidad” es 1/2

MSc. Marcos F. Ocaña Sánchez


Probabilidad

Ahora suponga que no está usted seguro de que la moneda sea imparcial, esto es,
no sabe con certeza si la composición de la población es 50-50 y decide hacer un
experimento sencillo

Lanza al aire la moneda n = 10 veces y observa 10 caras consecutivas

¿Puede concluir que la moneda es imparcial?

Es probable que no, porque si así fuera, observar 10 caras en fila sería muy
improbable; esto es, la “probabilidad” sería muy pequeña. Es más probable
que la moneda esté “cargada”

MSc. Marcos F. Ocaña Sánchez


Condiciones de probabilidad

• Cuando la población es conocida, se usa la


probabilidad para describir la probabilidad de
observar un resultado muestral en particular

• Cuando la población es desconocida y sólo


se dispone de una muestra de esa población,
la probabilidad se usa para hacer enunciados
acerca de la composición de la población, es
decir, hacer inferencias estadísticas

MSc. Marcos F. Ocaña Sánchez


Experimento
• Es el proceso mediante el cual se obtiene una
observación (o medición)

• La observación o medición generada por un


experimento puede o no producir un valor numérico

• Cuando se realiza un experimento, lo que se observa


es un resultado llamado evento simple, con
frecuencia denotado por la mayúscula E con un
subíndice

• Evento simple: resultado que se observa en una sola


repetición del experimento

MSc. Marcos F. Ocaña Sánchez


Experimento: Lanzar un dado

• Experimento: Lance un dado y observe el número que aparece en la cara superior.


Haga una lista de los eventos sencillos del experimento.
• Solución. Cuando el dado se lanza una vez, hay seis posibles resultados. Hay los
eventos sencillos citados a continuación:

• Ahora podemos definir un evento como un conjunto de eventos sencillos, a


menudo denotado por una letra mayúscula.

MSc. Marcos F. Ocaña Sánchez


Experimento del tipo de
sangre
• Experimento: Registre el tipo de sangre de una persona

• Los cuatro posibles resultados mutuamente exclusivos son


estos eventos sencillos:

• E1 = sangre tipo A

• E2 = sangre tipo B

• E3 = sangre tipo AB

• E4 = sangre tipo O

• El espacio muestral es S = {E1, E2, E3, E4}, o S = {A, B, AB, O}.

MSc. Marcos F. Ocaña Sánchez


Cálculo de probabilidad

• La probabilidad de un evento A es una medida de nuestra creencia de que el evento A


ocurrirá
• Una manera práctica de interpretar esta medida es con el concepto de frecuencia relativa
• Si un experimento se realiza n veces, entonces la frecuencia relativa de un suceso particular,
por ejemplo A, es

𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 =
𝑛

• donde la frecuencia es el número de veces que ocurrió el evento A

MSc. Marcos F. Ocaña Sánchez


Cálculo de probabilidad

• Si hacemos que el número n de repeticiones del experimento se haga cada


vez más grande (n → ∞), en última instancia se genera toda la población
• En ésta, la frecuencia relativa del evento A se define como la probabilidad
del evento A; esto es,
𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
𝑃 𝐴 = lim
!→# 𝑛
• Como P(A) se comporta como una frecuencia relativa, P(A) debe ser una
proporción que se encuentre entre 0 y 1; P(A) = 0 si el evento A nunca
ocurre, y P(A) = 1 si el evento A siempre ocurre
• Cuanto más cercano sea P(A) a 1, es más probable que A ocurra

MSc. Marcos F. Ocaña Sánchez


Requisitos para probabilidades de un evento
simple

Cada probabilidad debe estar entre 0 y 1

La suma de las probabilidades de todos los eventos sencillos en S igual a 1

Cuando es posible escribir los eventos sencillos asociados con un experimento y determinar sus
probabilidades respectivas, podemos hallar la probabilidad de un evento A si sumamos las probabilidades
de todos los eventos sencillos contenidos en el evento A

MSc. Marcos F. Ocaña Sánchez


Ejemplo
• Lance al aire dos monedas
imparciales y registre el
resultado
• Encuentre la probabilidad de
observar exactamente una cara
en los dos tiros

MSc. Marcos F. Ocaña Sánchez


Solución
• Para poner en una lista los eventos sencillos en el espacio
muestral, se puede usar un diagrama de árbol

• Las letras H y T significan que se observó una cara o una cruz,


respectivamente, en un tiro en particular

• Para asignar probabilidades a cada uno de los cuatro eventos


sencillos, hay que recordar que las monedas son imparciales

• Por tanto, cualquiera de los cuatro eventos sencillos es tan


probable como cualquier otro

• Como la suma de los cuatro eventos sencillos debe ser 1,


cada uno debe tener una probabilidad P(Ei) = ¼

• Para hallar P(A) = P(observar exactamente una cara), es


necesario hallar todos los eventos sencillos que resulten en el
evento A, es decir E2 y E3:
MSc. Marcos F. Ocaña Sánchez
Ejemplo

• Las proporciones de fenotipos sanguíneos A, B, AB y


O en la población de todos los de raza caucásica en
Estados Unidos se publican como 0.41, 0.10, 0.04 y
0.45, respectivamente

• Si al azar se escoge una persona de este origen étnico


en la población, ¿cuál es la probabilidad de que él o
ella tengan tipo de sangre A o tipo AB?

MSc. Marcos F. Ocaña Sánchez


• Los cuatro eventos sencillos, A, B, AB y O no tienen
probabilidades igualmente posibles

• Sus probabilidades se encuentran usando el


concepto de frecuencia relativa como

P(A) = .41 P(B) = .10 P(AB) = .04

Solución P(O) = .45

•El evento de interés está formado por dos eventos


sencillos, de modo que

P(la persona es tipo A o tipo AB) = P(A) + P(AB) = .41


+ .04 = .45

MSc. Marcos F. Ocaña Sánchez


Ejemplo

• Un plato contiene un dulce amarillo y dos rojos


• Usted cierra los ojos, del plato escoge dos dulces, uno por
uno y anota sus colores
• ¿Cuál es la probabilidad de que ambos dulces sean rojos?

MSc. Marcos F. Ocaña Sánchez


Solución
• Como no se dan probabilidades, se debe hacer una lista de los
eventos sencillos del espacio muestral

• La selección de los dulces en dos etapas sugiere un diagrama de


árbol

• Hay dos dulces rojos en el plato, de modo que se pueden usar las
letras R1, R2 y Y para indicar que se ha seleccionado el primero
rojo, el segundo rojo o el dulce amarillo, respectivamente

• Como usted cerró los ojos cuando escogió los dulces, las seis
opciones deben ser igualmente probables y se les asigna la
probabilidad 1/6

• Si A es el evento de que ambos dulces sean rojos, entonces:

MSc. Marcos F. Ocaña Sánchez


Hipótesis

Nula (H0) Alterna (H1)

No hay diferencias Existe diferencia


entre grupos o significativa entre
𝐻𝑜: 𝜇! = 𝜇"
relación entre grupos o relación
variables entre variables

Unidireccional o
de una cola
𝐻𝑜: 𝜇! ≠ 𝜇"

Bidireccional o de dos colas


𝐻𝑜: 𝜇! < 𝜇"
Ó
𝐻𝑜: 𝜇! > 𝜇"

MC. MARCOS OCAÑA


Hipótesis alternativa (H1)

• Bilateral, bidireccional o de
dos colas: Se formula sin ofrecer
una pista de lo que cree que
ocurre sobre la posición de las
diferencias en la distribución
muestral. Las diferencias se
pueden encontrar en cualquiera
de los dos lados de la
distribución muestral.

MC. MARCOS OCAÑA


Hipótesis alternativa (H1)

• Unilateral, unidireccional o
de una cola: Se formula
ofreciendo una pista de lo que
cree que ocurre sobre la
posición de las diferencias en
la distribución muestral. Las
diferencias se pueden
encontrar en lado de la
distribución muestral.

MC. MARCOS OCAÑA


Error tipo I y tipo II
• Si se rechaza la hipótesis H0 cuando es verdadera se dice que
se comete un error de tipo I.
• Si se acepta la hipótesis H0 cuando es falsa se dice que se
comete un error de tipo II.

MC. MARCOS OCAÑA


Nivel de SIGNIFICANCIA
• La probabilidad de cometer un error de tipo I
• La probabilidad de cometer errores de tipo I, que se simboliza alfa, es la
probabilidad de ocurrencia de los valores del estadístico en la región de
rechazo cuando la Hipótesis Nula es verdadera
• El valor de alfa, también denominado nivel de significación, es definido por el
investigador antes de recoger los datos, y la costumbre es hacer alfa=0.05 o
alfa=0.01
• La probabilidad de cometer errores de tipo II se simboliza beta y depende de
varias circunstancias como la distancia que separa el valor asignado al
parámetro en la Hipótesis Nula de su valor real, el tamaño muestral y el valor
asignado a alfa

MC. MARCOS OCAÑA


APRENDIDO COMO MANTRA

•SI P < 0.05 RECHAZO


H0
•SI P > 0.05 ACEPTO H0
MC. Marcos F. Ocaña Sánchez

También podría gustarte