Está en la página 1de 44

ESTADISTICA

APLICADA
UNIDAD DE APRENDIZAJE N° 1
ESTADÍSTICA DESCRIPTIVA
ASPECTOS GENERALES
La palabra Estadística procede del vocablo
“Estado”, toda vez que correspondía a los
gobiernos de los Estados establecer registros
de diferentes datos.

Aporte de la
estadística a la
vida diaria

Herramienta de trabajo Solución de problemas Investigación teórica


(Comportamiento de datos) (Procesos investigativos) (Predecir el
comportamiento)
CONCEPTO DE ESTADÍSTICA

Es la ciencia que se encarga de la recolección,


ordenamiento, representación, análisis e
interpretación de datos generados en una
investigación sobre hechos, individuos o
grupos de los mismos, para deducir de ello
conclusiones precisas o estimaciones futuras.
Es una de las mejores herramientas para
brindar soporte al análisis de datos y al
proceso de toma de decisiones.
POBLACIÓN

Población finita: Población cuyo número


de elementos es numerable. Ejm. la
población de un municipio

Es el colectivo que Población infinita: Población cuyo


abarca a todos los número de elementos no se puede
elementos cuya
característica o
determinar por ser excesivamente
características grande. Ejm. la cantidad de estrellas en el
queremos. universo.
El universo al que
se desea describir
estudiar.
MUESTRA Y MUESTREO

MUESTRA: Es un conjunto de elementos seleccionados de


una población de acuerdo a un plan de acción previamente
establecido (muestreo), para obtener conclusiones que
pueden ser extensivas hacia toda la población

MUESTREO: Es la técnica que nos permite seleccionar


muestras adecuadas de una población de estudio.
Cada elemento de la población tiene la misma probabilidad
de ser incluida en la muestra
MUESTREO

Componentes del
Clases de muestras
muestreo

Marco de la muestra: Registro de los ítems Muestreo probabilístico o al azar: Los


de la población de la que se extrae la elementos de la muestra se escogen por
muestra. métodos estadísticos basados en la teoría
de la probabilidad. Con reposición o
Unidad de la muestra: Es el elemento al reemplazo y Sin reposición o reemplazo
que habrá que dirigirse para obtener los
datos de interés.

Muestreo no probabilístico: Es una técnica


en la cual el investigador selecciona
muestras basadas en un juicio subjetivo. Es
más útil para estudios exploratorios como la
encuesta piloto
CENSO

Es el estudio de todos y cada uno de los


elementos de una población.
Este tipo de estudios no es muy
frecuentes, por cuanto la recolección es
muy costosa.
PARÁMETRO

Es cualquier medida descriptiva o


representativa de una población.

Generalmente se utilizan las letras griegas


como símbolo. Ejm. media aritmética
poblacional (μ) (mu), desviación estándar
poblacional (σ) (sigma).
ESTADÍSTICO

Constituyen cualquiera de las medidas


descriptivas de una muestra.

Se las simboliza con letras minúsculas de


nuestro alfabeto. Ejemplos: media aritmética
(x), desviación estándar (s).
DIVISIONES DE LA ESTADÍSTICA

Estadística Estadística
descriptiva inferencial Pretende obtener
Describe los datos de un conclusiones generales de
fenómeno ya ocurrido y una población, mediante
cuyo comportamiento el estudio de una muestra
conocemos representativa sacada de
ella.

Ejm. deportes, Con el valor de los


rendimientos estadísticos obtenidos, se
académicos, negocios al establecen los valores de
determinar las ventas los parámetros. Ejm
obtenidas. fármacos. Muestreo

Población Muestra

Inferencia Cálculos
Estadística Estadísticos
EL MÉTODO ESTADÍSTICO
El método por el cual se procesan los
datos abarca las siguientes etapas:

Recolección de
datos

Medición de datos y Agrupamiento de


análisis (parámetros de datos y gráficos (Tablas
posición y dispersión) o gráficos)
EL MÉTODO ESTADÍSTICO
El método por el cual se procesan los
datos abarca las siguientes etapas:

Recolección de
En estadística inferencial, a datos
partir del estudio de la
muestra se pretende inferir
aspectos relevantes de toda
la población.

Medición de datos y Agrupamiento de


análisis (parámetros de datos y gráficos (Tablas
posición y dispersión) o gráficos)
VARIABLES DE DATOS

Variable es todo aquello La información que se Están determinadas con


pasible de tomar valores obtiene de un estudio el interés que se tenga
diferentes de unidad en estadístico, proviene de sobre los elementos de
unidad. variables observación
EJERCICIO DE APLICACIÓN

Ejercicio de aplicación:
En un estudio estadístico se observó el tiempo que toma
en llegar a su lugar de trabajo desde su lugar de
residencia. Determine cuál es el elemento de
observación, cuál es la variable de estudio y de qué tipo
es.
ESCALAS DE MEDICIÓN

Son un instrumento de medida, de acuerdo al cual


se asignan valores a los datos estadísticos. Es
posible distinguir cuatro niveles o escalas de
medición:
- Nominal
- Ordinal
- Por intervalos o proporciones
- Por razón
ESCALAS DE MEDICIÓN
Nominal
• Es el nivel más bajo de medición y consiste en nombrar con lenguaje común los objetos con el único
fin de clasificarlos.
• Los datos no poseen ningún orden y generan categorías mutuamente excluyentes y exhaustivas.
Ordinal
• Podemos establecer un orden entre las distintas categorías
• Es una escala que está por encima de la nominal y se utiliza para clasificar u ordenar un conjunto de
datos.
• También generan categorías mutuamente excluyentes (niveles salariales, clase alta, clase media y
clase baja.).
Por intervalos
• Es una escala que se utiliza para etiquetar variables que tienen un orden natural y una diferencia cuantificable entre
valores, pero sin valor de «cero verdadero», es decir es un cero arbitrario que no implica ausencia de valor (Ejm.
temperatura).
• En esta escala, una diferencia entre dos números consecutivos, representa la misma diferencia en la magnitud de la
variable.
Por razón
• Posee todas las propiedades de las escalas anteriores —igualdad-desigualdad (escala nominal), orden
(escala ordinal) y distancia (escala por intervalo)—, tiene la ventaja de tener un cero absoluto que
indica carencia absoluta del atributo medido.
• Esta es la escala más habitual para medir propiedades físicas, como el peso, la altura, el volumen.
SISTEMATIZACIÓN DE DATOS

Serie simple: Presenta los valores recolectados de


forma que figuran todos y cada uno de ellos (no
agrupados).

Distribución de frecuencias: Es una tabla estadística


donde se presentan los datos resumidos, de tal
manera que se puede en una visión panorámica
establecer un criterio sobre su comportamiento.

Intervalos de clase: Se usan para estudiar un hecho


en el que la amplitud de la población o muestra es
grande, por lo que es necesario definir los intervalos
de clase, que son subconjuntos del conjunto de
valores que puede tomar la variable
DISTRIBUCIÓN DE FRECUENCIAS

El cuadro de frecuencias tiene


como finalidad presentar de
manera ordenada los valores Los datos se clasifican y ordenan de
que toman las diferentes acuerdo con ciertas características
características. cualitativas o cuantitativas,
indicándose el número de veces que
se repite el valor de la variable o
atributo (frecuencia de ocurrencia).
DISTRIBUCIÓN DE FRECUENCIAS

Estudio realizado con una variable


cualitativa (tipo de automotor)

TIPO DE VEHÍCULOS QUE CIRCULARON AL FRENTE DEL


COLEGIO MILITAR

TIPO N° DE AUTOMOTORES • Datos son de carácter nominal


Automóvil 25
Bus 12 • Las distribuciones de frecuencia
están conformadas por
Camioneta 10 categorías mutuamente
Camión 5 excluyentes y exhaustivas
Furgoneta 8
TOTAL 60
DISTRIBUCIÓN DE FRECUENCIAS

Ejercicio de aplicación:
Representar un cuadro de percepción del servicio de
alimentación de las instalaciones del Colegio Militar.

SERVICIO N° DE DD. Y CC. CC.


Excelente
Muy bueno
Bueno
Regular
Malo
TOTAL
DISTRIBUCIÓN DE FRECUENCIAS PARA
VARIABLES CONTINUAS

Para este tipo de variables es necesario entrar en un proceso de


categorización mediante intervalos, que agrupan a un conjunto de valores
que están incluidos en cada uno de ellos.

Número de categorías que va a


Se calcula la amplitud (i) de
Rango de valores tener la distribución
cada intervalo de clase:
RANGO = MÁXIMO - MÍNIMO Nº DE CATEGORÍAS = 1 +
i =RANGO/(N° CATEGORÍAS)
3.3*LOG(n)

Se completa la categorización
con la determinación de las Se establecen los límites de
frecuencias de clase de cada cada categoría: Se determina el
categoría: límite inferior de la primera
categoría, a este valor se suma
 Frecuencias = Elementos la amplitud del intervalo.
observados
EJERCICIO DE APLICACIÓN

Ejercicio de aplicación:
Realizar la categorización del siguiente conjunto de datos
obtenidos en la determinación del tiempo (minutos) que un
cliente se mantuvo en la fila antes de ser atendido en una
sucursal bancaria de la zona Sur.

12 14 9 10 8 26 27 14 13 14
3 5 10 8 7 7 6 13 12 21
25 27 22 7 12 12 13 19 18 17
28 30 25 21 15 15 16 21 20 14
14 16 11 18 21 8 9 10 9 9
7 9 4 32 20 4 5 8 7 18
6 8 12 11 16 31 24 26 25 26
4 6 18 12 14 22 23 31 30 12
EJERCICIO DE APLICACIÓN

• NÚMERO DE ELEMENTOS n=80


• MÁXIMO 32
• MÍNIMO 3
1. Rango = 32 – 3=29
2. Número de categorías=1+3,3*log(80)=7,28 (se pueden escoger
entre siete u ocho categorías)
3. Amplitud del intervalo= RANGO/N° de categorías = 29/7 = Límites
de las categorías Ancho del
Límite inferior Límite siguiente
intervalo
4. Límites de las categorías 2 4 6
6 4 10
10 4 14
14 4 18
18 4 22
22 4 26
26 4 30
30 4 34
EJERCICIO DE APLICACIÓN

Límite Límite Límite Límite


Intervalo Intervalo
inferior superior inferior superior
2 <6 [2,6] 2 6 [2,6]
6 <10 [6,10] >6 10 [6,10]
10 <14 [10,14] >10 14 [10,14]
14 <18 [14,18] >14 18 [14,18]
18 <22 [18,22] >18 22 [18,22]
22 <26 [22,26] >22 26 [22,26]
26 <30 [26,30] >26 30 [26,30]
30 34 [30,34] >30 34 [30,34]
EJERCICIO DE APLICACIÓN

5. Determinación de frecuencias de clase (f). Se debe realizar el conteo respectivo.

Límite Límite Frecuencia


Intervalo
inferior superior Absoluta
2 6 [2,6] 9
>6 10 [6,10] 18
>10 14 [10,14] 18
>14 18 [14,18] 10
>18 22 [18,22] 9
>22 26 [22,26] 8
>26 30 [26,30] 5
>30 34 [30,34] 3
Total 80
EJERCICIO DE APLICACIÓN- OTRAS
FRECUENCIAS

Frecuencia Frecuencias
Frecuencia
porcentual acumuladas
relativa (fr)
(f%) “menor que”
Se comienza con la
primera categoría y se
Indica la observa cuántos
distribución elementos son
porcentual menores que el límite
superior de esta
Resulta de categoría
multiplicar la
frecuencia relativa
Se contabiliza la cantidad de
Resulta de dividir la por 100% elementos que son menores
frecuencia absoluta que el segundo límite
superior y así
de cada intervalo sucesivamente, hasta llegar
por el total de casos a la última categoría cuya
(n) frecuencia acumulada será
igual a (n)
EJERCICIO DE APLICACIÓN- OTRAS
FRECUENCIAS

Frecuencias
Frecuencias
Acumuladas
acumuladas “mayor Marcas de Clase
porcentuales menor y
que”
mayor (fa%<) (fa%>)

Se comienza con el La frecuencia Se obtienen al sumar


acumulada que se los límites de cada
total de la frecuencia
presente en forma categoría y dividirlos
acumulada
entre dos
relativa o
porcentual, tiene
que dividirse por el
Se contabiliza la total de elementos
cantidad de del estudio y en el
elementos que son caso porcentual, 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟+𝑙í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
mayores o iguales al multiplicarse 𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒=
límite inferior de también por 100. 2
cada categoría
EJERCICIO DE APLICACIÓN-
DISTRIBUCIÓN DE FRECUENCIAS

Frecuencia Frecuencia
Frecuen Frecuencia Frecuencia
Frecuencia Frecuencia Acumulada Acumulada
Marca cia Acumulada Acumulad
Límites Absoluta Porcentual porcentual porcentual
de Clase Relativa menor que a mayor
(f) (f%) menor que mayor que
(fr) (fa<) que (fa>)
(fa%<) (fa%>)

2 6 4 9 0,1125 11,25 9 80 11,3 100,0


6 10 8 18 0,225 22,5 27 71 33,8 88,8
10 14 12 18 0,225 22,5 45 53 56,3 66,3
14 18 16 10 0,125 12,5 55 35 68,8 43,8
18 22 20 9 0,1125 11,25 64 25 80,0 31,3
22 26 24 8 0,1 10 72 16 90,0 20,0
26 30 28 5 0,0625 6,25 77 8 96,3 10,0
30 34 32 3 0,0375 3,75 80 3 100,0 3,8
Total 80 1 100
EJERCICIO DE APLICACIÓN

Ejercicio de aplicación:
Las calificaciones de 50 alumnos en Matemáticas han sido las
siguientes:

5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4,
8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.

Construir la tabla ampliada de distribución de frecuencias y


dibuja el diagrama de barras.
DATOS ESTADÍSTICOS

REPRESENTACIONES GRÁFICO SISTEMA DE EJES


DE DATOS • Es una representación de CARTESIANOS
ESTADÍSTICOS datos ilustrada, • Los gráficos usan como
construida sostén un sistema de ejes
• los gráficos muestran en principalmente mediante
forma extensiva y con la cartesianos X e Y, donde
la asignación de valores a se presentan dos
necesaria profundidad las un conjunto de líneas
características del variables asociadas. En el
horizontales y verticales eje «Y», se colocan las
fenómeno en estudio. llamadas «ejes». frecuencias. El eje «X»
representa la variable de
análisis.
PRINCIPALES GRÁFICOS ESTADÍSTICOS

GRÁFICO CARACTERÍSTICA
Diagramas de barras o
Son utilizados para variables cualitativas
columnas
y cuantitativas.
Diagrama de sectores
Son más utilizados cuando los datos son
Diagramas lineales
discretos
El diagrama de dispersión es usado para
analizar la relación de dos variables
Diagramas de dispersión (correlación, regresión), sobre todo para
estudiar el comportamiento de variables
en el tiempo.
Histogramas
Se usan para representar a datos
Polígonos de frecuencia
categorizados mediante intervalos
Ojivas
DIAGRAMA DE BARRAS O COLUMNAS

Si es el eje vertical en el que se marcan las frecuencias el diagrama será de


columnas, por el contrario, si es en el eje horizontal donde se representan la
frecuencia, el diagrama será de barras.

PAÍS DE N° DE
Ejemplo PROCEDENCIA PERSONAS
Se ha realizado un estudio Perú 10
de la procedencia de los Argentina 6
turistas que visitan la Brasil 9
Reserva de Apolobamba, Chile 5
con una muestra de 70 Estados Unidos 8
personas, obteniéndose la Alemania 12
siguiente distribución: Francia 8
Reino Unido 7
España 4
Australia 1
Total 70
DIAGRAMA DE BARRAS O COLUMNAS

ESTUDIO SOBRE PAIS DE PROCEDENCIA DE TURISTAS

Diagrama de
barras
ESTUDIO SOBRE PAIS DE PROCEDENCIA DE TURISTAS

Diagrama de
columnas
DIAGRAMA DE SECTORES
Es un gráfico que se presenta como un círculo en el cual constan divisiones o
sectores que representan a las diferentes categorías que tiene la distribución.

Ejemplo
Se ha realizado un estudio
sobre la precepción de
servicios de atención al
cliente, con una muestra de 80
personas, obteniéndose la
siguiente distribución:

TIPO DE
N° PERSONAS
SERVICIO
Excelente 10
Muy bueno 15
Bueno 20
Regular 18
Malo 17
TOTAL 80
DIAGRAMA LINEALES
Es utilizado en la representación de una variable en el tiempo, estableciéndose siempre que la
variable tiempo estará ubicada en el eje horizontal y la otra variable en el eje vertical.

El análisis de estos datos permitirá el cálculo de alguna función matemática que mejor
represente el comportamiento de los datos, de tal manera de poder realizar pronósticos a un
futuro inmediato.

Ejemplo
Una empresa exportadora de flores ha determinado durante 12 años, el valor anual de
sus exportaciones, expresado en millones de dólares, los datos se muestran en la
siguiente tabla:

EXPORTACIÓN DE FLORES
(En Millones de Bs)

AÑO 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
VALOR 0,85 1,02 1,15 1,08 1,16 1,2 1,35 1,28 1,16 1,38 1,45 1,55
DIAGRAMA LINEALES
DIAGRAMA DE DISPERSIÓN
Nos permite visualizar la relación entre dos variables de estudio, una con carácter de
independiente y la otra dependiente de la primera. La variable independiente se
ubicará en el eje horizontal y la dependiente en el eje vertical.

PRECIO DE VENTA DE AUTOS USADOS


PRECIO DE
ANTIGÜEDAD
VENTA
9 7,8
7 8,1
11 4,8
10 5,9
8 8
7 9,5
8 7,9
11 5,2
10 6,3
2 4,2
5 10,5
6 9,2
HISTOGRAMA
• Está formado por un conjunto de rectángulos, cada uno de ellos levantado en cada
intervalo, de manera que la base será igual a la amplitud del intervalo y la altura estará
dada por la frecuencia absoluta o relativa.
• Se utiliza para la representación de la variable continua.
Ejemplo
Se realizó un estudio sobre
una muestra de 100 familias
de cuatro integrantes, para
determinar cuál es el gasto
semanal en alimentación,
obteniéndose la siguiente
distribución:
GASTO EN $US. N° DE
FAMILIAS
0-50 10
50-100 26
100-150 24
150-200 17
200-250 13
250-300 8
300-350 2
TOTAL 100
POLÍGONO DE FRECUENCIAS
Sobre la base del histograma, primero, se establecen los puntos medios en la parte
superior de cada rectángulo (marca de clase) y, luego, se unen dichos puntos mediante
una línea.

Vamos a trazar el
polígono de frecuencias
del estudio realizado
sobre los gastos
semanales familiares en
alimentación, en la
muestra de 100 familias
compuestas por cuatro
integrantes.
OJIVAS O POLÍGONO DE FRECUENCIAS ACUMULADA

Constituye un gráfico de tipo lineal que forma una línea poligonal abierta. Está
representado por los segmentos rectos que se unen secuencialmente en los puntos que se
generan al relacionar los límites inferior o superior de cada categoría con las respectivas
frecuencias acumuladas “menor que” o “mayor que”.

A la distribución de Frecuencia Frecuencia


frecuencias anterior, Acumulada Acumulada
Marca de Frecuencia
se adicionarán dos Límites porcentual porcentual
Clase Absoluta (f) menor que mayor que
columnas, una para la
(fa%<) (fa%>)
frecuencia acumulada
0 50 25 10 10 100
absoluta “menor que”
y otra para la 50 100 75 26 36 90
frecuencia acumulada 100 150 125 24 60 64
porcentual “mayor 150 200 175 17 77 40
que”, con estos datos 200 250 225 13 90 23
adicionales se 250 300 275 8 98 10
trazarán las ojivas 300 350 325 2 100 2
respectivas. Total 100
OJIVAS O POLÍGONO DE FRECUENCIAS ACUMULADA

GASTOS SEMANALES EN ALIMENTACIÓN


OJIVA PORCENTUAL “MAYOR QUE”
OJIVAS O POLÍGONO DE FRECUENCIAS ACUMULADA

GASTOS SEMANALES EN ALIMENTACIÓN


OJIVA PORCENTUAL “MENOR QUE”
LEYES DE PROBABILIDADES
REGLAS DE LA ADICIÓN

GRACIAS POR SU ATENCIÓN…

También podría gustarte