Está en la página 1de 84

PROBABILIDAD Y ESTADÍSTICA

UNIVERSIDAD TECNOLÓGICA DE PANAMÁ. PRIMER SEMESTRE DE 2023


PROFESORA: NUELY C. DE LA CRUZ LUCK. CORREO: NUELY.DELACRUZ@UTP.AC.PA / WHATSAPP: 6036-4913
MÓDULO 1: CONCEPTOS
FUNDAMENTALES
DE ESTADÍSTICA
OBJETIVOS GENERALES DEL MÓDULO

 Identificar a la Estadística no como una rama de la Matemática sino como un área de


conocimiento que trata del desarrollo de una teoría práctica de la información.

 Motivar a los estudiantes en el estudio de los conceptos y métodos estadísticos.


 Incorporar a la visión de los estudiantes el uso del programa tecnológico Excel
aplicado a la Estadística y Probabilidad.
OBJETIVOS ESPECÍFICOS DEL MÓDULO

 Entender, aprender y utilizar los conceptos y técnicas más importantes de la


Estadística Descriptiva y la Estadística Inferencial.
 Diferenciar entre variables continuas y discretas.
 Distinguir los diferentes niveles de medición de variables.
RECOMENDACIONES

 Se sugiere que el primer paso para desarrollar el Módulo #1 sea leer compresivamente el capítulo #1 del libro
de texto que tiene en la plataforma. La lectura debe ser de manera individual y luego comente los temas leídos
con sus compañeros de equipo.
 Seguido, debe revisar la presentación que se muestra a continuación e ir anotando en su cuaderno o dispositivo
tecnológico las consultas que le surjan y que no puedan ser aclaradas con sus compañeros de equipo.
 Luego, aclare sus dudas con la profesora.
 Resuelva los ejercicios que se encuentran en la Libreta de Trabajo como parte del Módulo 1 durante las clases
asignadas para ello y compare sus respuestas con el libro de texto.
 Asista a clases, participe activamente y valide lo aprendido con otros compañeros tanto de su equipo como de
otros.
 Por último, repase lo aprendido, ya estará más cerca el primer parcial y todo debe estar muy claro.
¡Éxitos!
INTRODUCCIÓN
DEFINICIONES DE ESTADÍSTICA
 El termino Estadística proviene del latín statisticum collegium (“consejo de Estado”) y de
su derivado italiano statista (“hombre de Estado o político”).
 La Estadística es una rama de la Matemática y es la ciencia que se encarga de recolectar
datos de una población o muestra. Los conceptos estadísticos se han trabajado
intuitivamente desde la antigüedad, las primeras culturas recopilaban datos poblacionales
por medio de censos como los realizados en Egipto por Moisés (según consta en la Biblia) y
el empadronamiento que fue efectuado por los romanos en Judea. Para que esta rama de las
Matemáticas tenga lugar y desarrolle sus trabajos deben contar con una serie de
instrumentos que se han convertido en fundamentales.
DEFINICIONES DE ESTADÍSTICA

 La Estadística es la parte del Método Científico que tiene por objeto el hacer
predicciones acerca de una población en base a la información obtenida a través de
una muestra.
ESTADÍSTICA APLICADA

 Se denomina estadística aplicada al área de la Estadística que se ocupa


de inferir resultados sobre una población a partir de una o varias muestras. Es la parte
de la estadística que se aplica en cualquier otra rama externa a ella, como la
comunicación, psicología, medicina, sociología, historia, biología, mercadotecnia,
entre otras.
 La estadística aplicada puede ser dividida en dos ramas: la estadística descriptiva que se refiere a los
métodos de recolección, descripción, visualización y resumen de los datos, que pueden ser presentados
en forma numérica o gráfica y la estadística inferencial que usa la teoría de probabilidades para
generalizar las características de una población a partir de las características de una muestra
representativa. En otras palabras, es la generación de los modelos y predicciones relacionadas a los
fenómenos estudiados, teniendo en cuenta el aspecto aleatorio y la incertidumbre en las observaciones.
 Además de la estadística aplicada, también existe una disciplina denominada estadística matemática,
que abarca las bases teóricas de la materia.
CLASIFICACIÓN DE LA
ESTADÍSTICA
LA ESTADÍSTICA SE CLASIFICA EN:

Estadística
Estadística Inferencial
Descriptiva
ESTADÍSTICA DESCRIPTIVA

 Involucra los procedimientos para identificar una población objeto de estudio,


seleccionar una muestra y agrupar los datos para su posterior análisis e
ilustración en diversos tipos de gráficos.
 En ocasiones un científico sólo desea obtener alguna clase de resumen del
conjunto de datos representados en la muestra.
 La Estadística Descriptiva ofrece un sentido del centro de ubicación de los
datos, de la variabilidad en los datos y de la naturaleza general de la distribución
de observaciones de la muestra. A veces va acompañada por gráficas.
ESTADÍSTICA INFERENCIAL

 La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones


generales para toda la población a partir del estudio de una muestra, y el grado de
fiabilidad o significación de los resultados obtenidos.
LA ESTADÍSTICA INFERENCIAL COMPRENDE:

1. Las tomas de muestras


2. La estimación de parámetros o variables estadísticas
3. El contraste de hipótesis
4. El diseño experimental
PASOS PARA REALIZAR UN PROBLEMA DE INFERENCIA
ESTADÍSTICA

 Planteamiento del problema


 Elaboración de un modelo
 Extracción de la muestra
 Tratamiento de los datos
 Estimación de los parámetros
 Contraste de hipótesis
 Conclusiones
PERO, ¿PARA QUÉ TODO ESTO?
El objetivo del análisis estadístico es identificar tendencias.
Un negocio de venta al por menor, por ejemplo, podría utilizar
el análisis estadístico para encontrar patrones en los datos de los
clientes que se puedan utilizar para crear una experiencia más
positiva y aumentar las ventas.
CONCEPTOS ESTADÍSTICOS
POBLACIÓN

 En Estadística, la población también llamada universo, es el conjunto de elementos de


referencia sobre el que se realizan las observaciones.
MUESTRA

 En Estadística, una muestra es un subconjunto de casos


o individuos de una población estadística.
TIPOS DE POBLACIONES Y MUESTRAS

 Ahora que tenemos claro estos conceptos y cómo debemos conocerlos para los
estudios estadísticos de toda clase, vale la pena profundizar en los tipos.
TIPOS DE POBLACIÓN

 Existen dos tipos de poblaciones, finitas e infinitas. La primera incluye un número


limitado de observaciones, mientras que la población infinita, contempla un gran
conjunto de datos que no pueden alcanzarse por conteo.
EJEMPLOS DE POBLACIONES FINITAS

Número de operaciones Número de piezas


Número de estudiantes
crediticias realizadas defectuosas producidas
matriculados en el
por un banco en una en la línea de
curso
semana producción

Número de unidades de
cierto producto
vendidas en la pasada
semana
EJEMPLOS DE POBLACIONES INFINITAS

Número de unidades Número de personas


que producirá en el que habitarán en el país
futuro una máquina en los próximos 5 años
TIPOS DE MUESTRA O MUESTREO

Muestra no Muestra
probabilística probabilística
MUESTRA / MUESTREO NO PROBABILÍSTICO
 Suele ser mucho más sencilla y económica de obtener. Comprende un agrupamiento de
procedimientos como muestras a juicio, muestras de cuotas y el denominado trozo de pastel.
 La desventaja del modelo no probabilístico es que no hay una forma probabilística de estimar qué
tan representativas son esas muestras de la población.
 Para la muestra a juicio, el entrevistador selecciona a cualquier sujeto que desee, mientras que en las
muestras de cuota la selección está restringida por varias cuotas preestablecidas en relación con
sexo, edad, raza, y otras características que tratan de simular cualidades conocidas de la población.
 En cualquier caso, el entrevistador evitará elegir vecindarios pobres, áreas inaccesibles o zonas de
depresión para trabajar. Con esto, los resultados tienen un prejuicio o sesgo automático porque se
omitirán grupos enteros en el proceso de selección. 
 El trozo de pastel se compone de un proceso de autoselección por mera conveniencia.
EJEMPLOS DE MUESTRA NO PROBABILÍSTICA

Personas Los
que miembros de
responden a una clase en
un anuncio particular

Personas
que visitan
Personas en
una
un teatro
exhibición
particular
en un centro
comercial
MUESTRA / MUESTREO PROBABILÍSTICO

 Una muestra probabilística es aquella en la cual los sujetos de la muestra se


seleccionan con base en probabilidades conocidas.
TIPOS DE MUESTREO PROBABILÍSTICO

Aleatorio
Sistemático Estratificado
Simple

Conglomerados
MUESTREO PROBABILÍSTICO – ALEATORIO SIMPLE

 Muestreo aleatorio simple: muestra seleccionada de manera que cada elemento o individuo de la población tenga
las mismas posibilidades de que se le incluya.
 Ejemplo: suponga que una población consta de 845 empleados de Nitra Industries. Se va a elegir una muestra de
52 empleados de dicha población. Una forma de asegurarse de que todos los empleados de la población tienen las
mismas posibilidades de que se les elija consiste en escribir primero el nombre de cada empleado en un papel y
depositarlos todos en una caja. Después de mezclarlos , se efectúa la primera selección tomando un papel de la
caja sin mirarlo. Se repite este proceso hasta terminar de elegir la muestra de 52 empleados. Un método más
conveniente de seleccionar una muestra aleatoria consiste en utilizar un número de identificación por cada
empleado y una tabla de números aleatorios como la del apéndice B.6. Como su nombre lo indica, estos números
se generaron mediante un proceso aleatorio (en este caso, con una computadora).
PARÁMETRO ESTADÍSTICO

 En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse
del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente
mediante una fórmula aritmética obtenida a partir de datos de la población.
ESPACIO MUESTRAL

 Conjunto de resultados elementales posibles asociado al experimento.


EJEMPLOS DE REPRESENTACIÓN
DE ESPACIO MUESTRAL
Los ejemplos que se presentarán a continuación, serán tratados con temas
relacionados con los juegos de azar. El objetivo, es el de facilitar la
comprensión del concepto y las ideas del tema tratado.

Para el desarrollo de los mismos, se utilizarán las primeras herramientas que


nos ayudarán a determinar la composición del espacio muestral en una forma
efectiva y organizada.
Ejemplo #1

Se lanzan dos monedas simultáneamente, ¿cuál es el espacio


muestral de este experimento?

Solución

El experimento consta de un ensayo formado por dos monedas, las


cuales pueden dar como resultado dos casos posibles cada una.

Para obtener el espacio muestral, podemos utilizar como


herramienta un eje de coordenadas. En el mismo, se tendrá como
instrumento a las dos monedas y como variables, las dos lecturas,
cara o sello, en cada una de ellas.
ESQUEMA GRÁFICO PARA MOSTRAR EL ESPACIO MUESTRAL

Yi

(C,S) (S,S)
S
MONEDA #2

(C,C) (S,C)
C

C S
Xi
MONEDA #1
En este caso, se cumple con el concepto de equiprobabilidad, es decir, los
eventos tienen la misma probabilidad de ocurrir.

Ejemplo #2

Se lanzan dos dados simultáneamente, ¿cuál es el espacio muestral de este


experimento?

Solución

El experimento consta de un ensayo formado por dos dados, los cuales


pueden dar como resultado seis casos posibles cada uno.

Como se trata de dos dados, podemos utilizar como herramienta el eje de


coordenadas para definir el espacio muestral. El instrumento consiste en
los dos dados y las variables se identifican como la lectura de los seis
números en cada uno de ellos.
ESQUEMA GRÁFICO PARA MOSTRAR
EL ESPACIO MUESTRAL

Yi
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
6
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
5
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
4
DADO #2

(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)


3
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
2
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
1

1 2 3 4 5 6
Xi
DADO #1
El espacio muestral estará formado por 36 casos posibles.

Ejemplo #3

Se lanzan tres monedas simultáneamente, ¿cuál es el espacio muestral de


este experimento?

Solución

El experimento consta de un ensayo en el cual se lanzan tres monedas, las


cuales pueden dar como resultado dos casos posibles cada una.
Recurrimos al diagrama de árbol para describir el espacio
muestral, según la secuencia lógica de los acontecimientos.

Este diagrama es de tipo secuencial, el cual parte de un origen y


describe simétricamente por etapas los resultados posibles.

Se derivan como instrumentos las tres monedas y como


variables las lecturas, cara o sello, que se identifiquen en cada
una de ellas.
MONEDA

#1 #2 #3 RESULTADOS
POSIBLES

C
CCC
C S
CCS
C
C S CSC
S
CSS
C
SCC
S C S
SCS
C
S SSC
S
SSS
MEDIDAS ESTADÍSTICAS
MEDIDAS DE POSICIÓN

 En un conjunto de datos las medidas de posición están diseñadas para brindar al


analista alguna medida cuantitativa de dónde está el centro de los datos en una
muestra. También se les llama Medidas de Tendencia Central. En otras palabras,
se trata de valores de la variable estadística que se caracterizan por la posición
que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:
media, moda y mediana.
MEDIA

 La media es simplemente un promedio numérico.


MODA

 La moda es el dato más repetido, el valor de la variable con mayor frecuencia. Su


cálculo es extremadamente sencillo, pues sólo necesita de un recuento.
MEDIANA

 El propósito de la mediana de la muestra es reflejar la tendencia central de la muestra,


de manera que no esté influida por los valores extremos.
FÓRMULAS (MEDIA Y MEDIANA) Y EJEMPLO
CÁLCULO DE MODA

Así, si disponemos de las ventas por semana del número de


tanques de gas de 25 libras en una tienda durante las últimas 10
semanas de la forma siguiente:

5 2 4 6 4 3 4 4 2 3

La moda será de 4 tanques o unidades, por ser el valor que más


se repite en la distribución.
TIPOS DE VARIABLES
VARIABLES ESTADÍSTICAS
Definición de variable: Una variable estadística es una característica que
puede fluctuar y cuya variación es susceptible a adoptar diferentes valores,
los cuales pueden medirse u observarse. Las variables adquieren valor
cuando se relacionan con otras variables. A partir de este concepto se puede
mencionar que una variable es la que permite relacionarla con algún
problema o fenómeno, el cual vamos a investigar y buscar posible
soluciones.

Se clasifican Cuantitativa
Cualitativas
en: s
VARIABLE ALEATORIA

 Una variable aleatoria o variable estocástica es una función que asigna un valor,


usualmente numérico, al resultado de un experimento aleatorio. Los valores posibles
de una variable aleatoria pueden representar los posibles resultados de un
experimento aún no realizado, o los posibles valores de una cantidad cuyo valor
actualmente existente es incierto. En términos formales una variable aleatoria es una
función definida sobre un espacio de probabilidad. Una variable aleatoria puede
concebirse como un valor numérico que está afectado por el azar.
EJEMPLO

 Supongamos que se lanzan dos monedas al aire. El espacio muestral, esto es, como ya
se definió, el conjunto de resultados elementales posibles asociado al experimento,
quedaría de la siguiente manera:

Donde (c representa "sale cara" y x, "sale cruz"). Podemos asignar entonces a cada
suceso elemental del experimento el número de caras obtenidas.
TIPOS DE VARIABLES ALEATORIAS

 Variable aleatoria discreta


 Variable aleatoria continua
VARIABLE ALEATORIA DISCRETA

 Toma valores finitos y/o fijos. Una característica X es de tipo discreto cuando puede
tomar una serie de valores claramente separados x1… xk.
VARIABLE ALEATORIA CONTINUA

 Una variable aleatoria es continua si su recorrido es un conjunto no numerable.


Intuitivamente esto significa que el conjunto de posibles valores de la variable abarca
todo un intervalo de números reales.
EJEMPLO

 La variable que asigna la estatura a una persona extraída de una determinada


población, es una variable continua ya que, teóricamente, todo valor entre, pongamos
por caso, 0 y 2,50 m, es posible.
VARIABLES CUALITATIVAS

 Son aquellas que se evalúan a través de atributos y se dividen en Nominales y


Jerarquizadas. Cabe indicar, que este tipo de variable, al no relacionarse de manera
natural como variable numérica, debe convertirse a valores numéricos antes de que se
trabaje con ellas.
VARIABLES NOMINALES

 Estas se identifican en categorías o cualidades bien definidas, procediéndose a contar


el número de observaciones que quedan en cada una de ellas. Por lo general, este tipo
de variables forman parte de cuestionarios en donde el interesado selecciona uno de
los atributos que despliega como respuesta. Cabe indicar, que las respuestas se
disponen en categorías mutuamente excluyentes y colectivamente exhaustivas.
EJEMPLOS DE VARIABLES NOMINALES
VARIABLES JERARQUIZADAS

 Son aquellas que se derivan de situaciones relativas para denotar un orden en la


respuesta.
EJEMPLOS DE VARIABLES JERARQUIZADAS
RESUMIENDO LOS TIPOS DE VARIABLES:
RESUMIENDO LAS POBLACIONES Y TIPOS DE VARIABLES

TIPOS DE VARIABLES O DATOS


POBLACIÓN
CONTINUOS DISCRETOS NOMINALES JERARQUIZADOS

Número Año
ESTUDIANTES Peso en libras de Género académico
estudiantes
PRODUCCIÓN Porcentaje Número Tamaño
DE de de Sabor de la
GASEOSAS azúcar rupturas botella

PRODUCTORES Demanda Número Tipo Tamaño


de de de de la
AGROPECUARIOS crédito productores productor finca
NIVELES DE MEDICIÓN DE LAS
VARIABLES
NIVELES DE MEDICIÓN DE LAS VARIABLES

 Los datos se clasifican por niveles de medición. El nivel de medición de los datos rige los cálculos que
se llevan a cabo con el fin de resumir y presentar los datos. También determina las pruebas estadísticas
que se deben realizar.
 Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La medición más baja, o
más primaria, corresponde al nivel nominal. La más alta, o el nivel que proporciona la mayor
información relacionada con la observación, es la medición de razón.
DATOS DE NIVEL NOMINAL

 En el caso del nivel nominal de medición, las observaciones acerca de una variable cualitativa sólo se
clasifican y cuentan. No existe una forma particular para ordenar las etiquetas. No existe un orden
natural.
 El género representa otro ejemplo del nivel nominal de medición.
DATOS DE NIVEL ORDINAL

 Una calificación es más alta o mejor, que la siguiente: superior es mejor que bueno, bueno es mejor
que promedio, etc. Sin embargo, no es posible distinguir la magnitud de las diferencias entre los
grupos. ¿La diferencia entre superior y bueno es la misma que entre malo e inferior?
 No es posible afirmarlo. Si sustituye 5 por superior y 4 por bueno, concluirá que la calificación
superior es mejor que la calificación bueno, pero si añade una calificación de superior y una de bueno
no espere que el resultado tenga significado. Además, no debe concluir que la calificación de bueno
(calificación de 4) sea necesariamente dos veces más alta que malo (calificación de 2). Sólo tendrá
claro que la calificación bueno es mejor que la calificación malo; no en qué grado es mejor
calificación.
RESUMIENDO:

 Las propiedades del nivel ordinal de los datos son las siguientes:
1. Las clasificaciones de los datos se encuentran representadas por conjuntos de etiquetas o nombres
(alto, medio, bajo), las cuales tienen valores relativos.
2. En consecuencia, los valores relativos de los datos se pueden clasificar u ordenar.
DATOS DE NIVEL DE INTERVALO

 El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las características del
nivel ordinal, pero, además, la diferencia entre valores constituye una magnitud constante. Un ejemplo
de nivel de intervalo de medición es la temperatura. Suponga que las temperaturas altas durante tres
días consecutivos de invierno en Boston son de 28, 31 y 20 grados Fahrenheit. Estas temperaturas se
clasifican fácilmente, aunque, además, es posible determinar la diferencia entre ellas, gracias a que un
grado Fahrenheit representa una unidad de medición constante.
EJEMPLO

 Otro ejemplo de escala de intervalo de


medición consiste en las tallas de ropa
para dama. Enseguida se muestran datos
referentes a diversas medidas de una
prenda de una mujer caucásica típica.
EXPLICACIÓN DEL EJEMPLO ANTERIOR

 ¿Por qué razón la talla es una medición de intervalo? Observe que conforme la talla cambia 2 unidades
(de la talla 10 a la 12, o de la talla 24 a la 26), cada medida aumenta 2 pulgadas. En otras palabras, los
intervalos son los mismos.
RESUMIENDO:

 Las propiedades de los datos de nivel de intervalo son las siguientes:


1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea de la característica en
cuestión.
2. Diferencias iguales en la característica representan diferencias iguales en las mediciones.
DATOS DE NIVEL DE RAZÓN

 Todos los datos cuantitativos son registrados en el nivel de razón de la medición. El nivel de razón es
el más alto. Posee todas las características del nivel de intervalo, aunque, además, el punto 0 tiene
sentido y la razón entre dos números es significativa. Ejemplos de la escala de razón de medición
incluyen salarios, unidades de producción, peso, cambios en los precios de las acciones, la distancia
entre sucursales y la altura. El dinero ilustra bien el caso. Si tiene cero dólares, entonces no tiene
dinero. El peso constituye otro ejemplo.
EJEMPLO

Observe que Lahey, padre, gana el doble de lo que


gana su hijo. En la familia de Rho, el hijo percibe el
doble de ingresos que su padre.
RESUMIENDO:

Las propiedades de los datos de nivel de razón son las siguientes:


1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los números asignados a las
clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos números es significativa.
GRÁFICA RESUMEN DE LOS PRINCIPALES NIVELES DE
MEDICIÓN
OTRAS MEDIDAS DE TENDENCIA
CENTRAL
MEDIA PONDERADA

 La media ponderada es una medida de tendencia central, que es apropiada cuando en un conjunto de datos cada
uno de ellos tiene una importancia relativa (o peso) respecto de los demás datos. Se obtiene multiplicando cada
uno de los datos por su ponderación (peso) para luego sumarlos, obteniendo así una suma ponderada; después se
divide esta entre la suma de los pesos, dando como resultado la media ponderada.
REALICE EL SIGUIENTE EJEMPLO

 Se puede usar una media ponderada para calcular la nota final de parciales de esta asignatura, en donde se asigna
distinta importancia (peso) a los distintos exámenes que se realicen. Por ejemplo, los dos primeros exámenes
tienen un peso o valor de 30% y 20% respectivamente, y el último del 50%; las calificaciones respectivas son de
81, 75 y 95, entonces la nota final de parciales corresponde a la siguiente media ponderada:
 81 x 0.30 = 24.3
 75 x 0.20 = 15.0
 95 x 0.50 = 47.5
86.8
RANGO MEDIO

 El medio rango o rango medio de un conjunto de valores numéricos X = {x1…, xn} es la media del menor y
mayor valor, o la mitad del camino entre el dato de menos valor y el dato de mayor valor. En consecuencia el
medio rango es:
EJEMPLO
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de
mayor valor Max= 8. El medio rango resolviéndolo mediante la
correspondiente fórmula sería:
REPRESENTACIÓN DEL MEDIO RANGO

También podría gustarte