Está en la página 1de 53

Probabilidad y estadística

Probabilidad y estadística

 Probabilidad
Busca datos numéricos más o menos objetivos para evaluar las probabilidades de
un evento futuro, es decir, su grado de certidumbre o verosimilitud.
La probabilidad solo va a estudiar los eventos no determinísticos, aquellos que
pueden suceder o no (un evento determinístico es aquel que sucede por las leyes
físicas, por ejemplo, si se arroja una piedra, la misma va caer siempre).

 Estadística
Utiliza esos datos proporcionando métodos y técnicas útiles para la toma de
decisiones.
Relación entre Probabilidad y estadística

La estadística utiliza datos pasados, la probabilidad busca datos futuros.


Se utiliza la estadística para calcular la probabilidad y se utiliza la probabilidad para que
con esos datos calcular estadística.
Dato
 Es un valor que nos brinda cierta información.
Dato estadístico
 Es cuando esa información nos sirve para un análisis estadístico.
Método estadístico
Es un conjunto de pasos a seguir para resolver un problema
1) Formulación del problema
2) Diseño del experimento o investigación
3) Recolección de datos
4) Procesamiento y análisis de datos
5) Generalización o inferencia final
Población y muestra

 Población
“Es un conjunto de todos los elementos que estamos estudiando, acerca de los
cuales queremos sacar conclusiones”. Levin & Rubin (1996).

 Muestra
“Es parte de una población a estudiar que sirve para representarla”. Murria R.
Spiegel (1991).
Para que sea muestra tiene que ser representativa de la población.
Razones para el muestreo
 Costo (siempre trabajar con muestra es más económico que trabajar con la
población).
 Tiempo
 Pruebas destructivas (Por ejemplo, estudiar la resistencia de un clavo, si utilizo la
población se va a obtener la información, pero al haber utilizado todos los clavos,
no sería útil dicha información, ya que se habría arruinado todos los clavos).
Razones para trabajar con la población

 Exactitud de los resultados

 Contar (censo)

 Sensibilidad de los resultados


Tipos de soporte
Son la forma en que se van a mostrar los datos
 Enunciados

 Tabas

 Gráficos
Distribuciones categóricas

Una distribución de frecuencias categóricas muestra el número o la proporción


de observaciones que corresponden a cada una de las clases cualitativas,
mutuamente excluyentes. (significa que si un dato pertenece a una clase no
puede pertenecer a otra clase.
DATO
Dato
 Es un valor que nos brinda cierta información.
Dato estadístico
 Es cuando esa información nos sirve para un análisis estadístico.
Variable estadística
Se entiende como variable estadística a aquellas características o cualidades
que poseen los individuos que componen una muestra. Es un símbolo que
identifica un elemento dentro de un grupo, este puede variar, es inconstante,
inestable y mudable.
En la estadística, el uso de variables simplifica de cierta forma la recolección e
interpretación de datos obtenidos. Ya que le permiten al analista agrupar la
población de acuerdo a rasgos comunes y presentar mediante gráficos y tablas
de frecuencia la información relevante. 
Las variables como elemento esencial para el estudio de la muestra de una
población, se pueden clasificar en:
Variables Cualitativas
Son aquellas características o cualidades en las cuales no existe una escala de
medición, es decir, que no se puede cuantificar con números. Estas se dividen en:
 
Variables Nominales: son aquellas variables que no siguen un orden o no
obedecen una ordenación.
Variables Ordinales: son aquellas variables las cuáles se organizan siguiendo un
orden o jerarquía.
Variable Cuantitativa

Son aquellas variables que pueden ser expresadas por medio de números. Con este tipo
de variable se puede llevar a cabo ciertas operaciones aritméticas. Entre las cuales se
encuentran:

Variable Discreta: es aquella variable compuesta por valor valores aislados o enteros.
Esta no presente valores intermedios

Variable Continua: es aquella variable compuesta por valores intermedios o fracciones


de ellos.
Tipos de datos según su representación
Datos simples

Datos repetidos

Datos agrupados
Datos simples
 Son los datos que están representados individualmente

16 10 12 15 16 18 10 15 12 15

 
Datos repetidos
 
 Son los datos representados en una tabla según la cantidad de veces que se repite cada
uno.
  Datos simples
16 10 12 15 16 18 10 15 12 15

Datos repetidos
Xi (dato) fi (frecuencia, cuantas
veces se repite cada dato)
10 2
12 2
15 3
16 2
18 1
Datos agrupados
 
 Son los datos presentados en una tabla, según a la clase o intervalo al que pertenecen.
Existe una gran cantidad de datos, pero no se repiten entre sí.
 
Por ejemplo, tenemos los siguientes datos:
16,1 10,4 12,5 15,3 16 18,5 10,5 15,2 12,1 15,6

Cuando los límites reales coinciden con los nominales


 
Clase fi
10 a 13 4
13 a 16 4
16 a 19 2
Marca de clase
 
𝐿𝑠 + 𝐿𝑖
𝑥𝑖=
2
Clase fi xi
10 a 13 4 (10+13)/2=
11,5
13 a 16 4 (13+16)/2=
14,5
16 a 19 2 (16+19)/2=
17,5
Cuando los límites reales no coinciden con los nominales
 

𝐿í 𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 supe 𝑟𝑖𝑜𝑟 =( 𝐿í 𝑚𝑖𝑡𝑒𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑓𝑖+1+𝑙 í 𝑚𝑖𝑡𝑒 𝑛𝑜𝑚𝑖𝑛𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑓𝑖 ) /2

Clase fi Lrs Lri


10,1 a 13 4 *10,05 (13,1+13)/2=
13,05
13,1 a 16 4 (13,1+13)/2= (16,1+16)/2=
13,05 16,05
16,1 a 19 3 16,1+16)/2= *19,05
16,05
 LRI= LRSi -c = 13,5 – 3 = 10,5
 LRS= LRIi + c = 16,05+3= 19,05

El ancho de clase o de intervalo, se calcula como la diferencia entre el


límite superior y el inferior
Distribuciones de frecuencias

 Cuando trabajamos con datos repetidos o agrupados


 
Frecuencia Absoluta simple

Xi (dato) fi (frecuencia absoluta simple, cuantas


veces se repite cada dato)
10 2
12 2
15 3
16 2
18 1
n 10
Frecuencia Absoluta Acumulada

Xi (dato) fi (frecuencia absoluta Fi (Frecuencia


simple, cuantas veces se Absoluta Acumulada)
repite cada dato)

10 2 2
12 2 2+2= 4
15 3 2+2+3=7
16 2 2+2+3+2=9
18 1 2+2+3+2+1=10
n 10  
La frecuencia absoluta acumulada del primer intervalo es igual a la frecuencia
absoluta simple del primer intervalo.

La frecuencia absoluta acumulada del último intervalo es igual a “n”


Frecuencia relativa simple
Es la participación que tiene ese dato en el total

Xi (dato) fi (Frecuencia Fi (Frecuencia fr(Frecuencia


absoluta simple, absoluta relativa
cuantas veces se acumulada) simple)
repite cada dato) proporción

10 2 2 2/10=0,2
12 2 4 2/10=0,2
15 3 7 3/10=0,3
16 2 9 2/10=0,2
18 1 10 1/10=0,1
n 10   1
El total de la frecuencia relativa simple siempre es igual a uno.
 
Frecuencia relativa acumulada
Xi fi (Frecuencia absoluta Fi (Frecuencia fr(Frecuencia Fr(Frecuencia relativa
(dato) simple, cuantas veces absoluta relativa acumulada)
se repite cada dato) acumulada) simple) proporción
proporción
10 2 2 0,2 0,2
12 2 4 0,2 0,2+0,2=0,4
15 3 7 0,3 0,2+0,2+0,3=0,7
16 2 9 0,2 0,2+0,2+0,3+0,2=0,9
18 1 10 0,1 0,2+0,2+0,3+0,2+0,1=1
n 10   1  

La frecuencia relativa acumulada del primer intervalo es igual a la frecuencia relativa


simple del primer intervalo.
La frecuencia relativa acumulada del último intervalo es igual a uno.
Frecuencia relativa porcentual
 

X fi (Frecuencia absoluta Fi (Frecuencia fr(Frecuencia fr(Frecuencia f%


i simple, cuantas veces absoluta relativa relativa (Frecuencia
se repite cada dato) acumulada) simple) acumulada) relativa
proporción proporción porcentual)

1 2 2 0,2 0,2 0,2*100=20


0
1 2 4 0,2 0,4 0,2*100=20
2
1 3 7 0,3 0,7 0,3*100=30
5
1 2 9 0,2 0,9 0,2*100=20
6
1 1 10 0,1 1 0,1*100=10
8
n 10   1   100
El total de la frecuencia relativa porcentual es igual a 100.
 
Frecuencia relativa acumulada porcentual
 
Xi fi Fi fr Fr f% F%
   

10 2 2 0,2 0,2 20 20
12 2 4 0,2 0,4 20 40
15 3 7 0,3 0,7 30 70
16 2 9 0,2 0,9 20 90
18 1 10 0,1 1 10 100
n 10   1   100  

La frecuencia relativa acumulada porcentual del primer intervalo es igual a la frecuencia relativa porcentual
del primer intervalo.
La frecuencia relativa acumulada porcentual del último intervalo es igual cien.
Tablas y Gráficos
Tablas y gráficos
 
Tipos de soporte
Son la forma en que se van a mostrar los datos
 Enunciados
 Tabas
 Gráficos
Tablas estadísticas
 
 Esta forma de representación consiste en ordenar los datos numéricos en filas y
columnas, con las especificaciones acerca de su naturaleza.
Cinco elementos de apoyo son necesarios para la descripción de los datos mostrados en
una tabla: 

1) El título de la tabla debe hacer una descripción clara y precisa de los datos.


Debe responder las tres preguntas "qué", "dónde" y "cuándo". Hay que ser
breve y conciso, y evitar el uso de verbos.
Buen ejemplo
“Edad de jubilación estimada por ocupaciones en Argentina, 2012."

Este texto da toda la información necesaria para


comprender y utilizar los datos correctamente.

2) Los encabezados de las columnas, expuestos en la parte superior de la tabla,


deben indicar qué datos hay presentes en cada columna de la tabla y proporcionar
los metadatos necesarios (por ejemplo, unidad de medida, período de tiempo o área
geográfica). 
3) Los encabezados de las filas, en la primera columna de la tabla, deben identificar
los datos presentes en cada fila de la tabla

4) Las notas a pie, en la parte inferior de la tabla, pueden proporcionar


cualquier información adicional necesaria para comprender y utilizar
correctamente los datos (definiciones, por ejemplo). 

5) La línea que contiene la fuente, en la parte inferior de la tabla, debe


indicar la fuente de los datos, es decir, la organización que elaboró los
datos y el método de recogida de datos (por ejemplo, censo de población o
encuesta de población activa). 

La siguiente figura indica cómo estos componentes de una tabla deberían


ser mostrados.
Los valores de los datos deben estar expuestos de tal manera que la
información clave sea fácil de extraer.
A los usuarios les será más sencillo seguir las columnas hacia abajo o a través de
las filas, en función del mensaje. Considerar esto a la hora de decidir si presentar
la tabla con una orientación vertical u horizontal.
Se pueden utilizar unas líneas o un sombreado suave para animar a los usuarios a
leer en horizontal o en vertical. El espaciamiento y el sombreado pueden cambiar
la forma en que se lee una tabla.

Las columnas deben estar uniformemente espaciadas y no demasiado


separadas. Las tablas deben ser sólo tan amplias como lo requiera el contenido de
los datos.
 
Tablas estadísticas fáciles de entender

 Evitar texto innecesario.


 Presentar los datos por orden cronológico en el caso de series temporales o usando una
clasificación estándar. Para series temporales más largas, puede ser más apropiado utilizar el
orden cronológico inverso (es decir, comenzando con el período más reciente y yendo hacia
atrás), en algunos casos, como el desempleo mensual. 
 Usar mínimamente las posiciones decimales. 
 Utilizar separadores de miles. El uso de un espacio en lugar de un símbolo puede evitar el
problema de tener que traducir entre lenguas. 
 Alinear los números hacia la coma decimal (o a la derecha en la ausencia de cifras decimales)
hace claramente apreciable su valor relativo. No centres los números en una columna, a
menos que todos ellos tengan la misma extensión. 
Cuando se hace una serie de tablas para una publicación o sitio web, se debe utilizar el mismo
diseño en todas las tablas. Considerar cuánta información se necesita proporcionarse en los
títulos de las tablas (qué es obvio y qué no lo es) y ser coherente en el uso de abreviaturas.
Gráficos
 
 Histograma de frecuencia
Un histograma es una representación gráfica de una variable en forma de barras,
teniendo en cuenta que la superficie de cada barra es proporcional a la frecuencia
de los valores representados. Un histograma nos permite ver cómo se distribuyen
los valores de la variable en estudio.

Usamos los histogramas cuando analizamos variables continuas, o cuando


trabajamos con variables discretas que toman un gran número de valores y son
agrupadas en intervalos. Cuando tenemos variables cualitativas, se emplean
los diagramas de barras.
 
¿Cómo construir un histograma?
Partimos de una tabla de frecuencias con datos agrupados, y seguimos los siguientes
pasos: En el eje horizontal (X), colocamos los límites de clase. Opcionalmente, puedes
colocar las marcas de clase.
En el eje vertical (Y), colocamos las frecuencias. Se suele tomar la frecuencia absoluta,
pero también se puede trabajar con la frecuencia relativa o con la frecuencia porcentual.
Dibujamos las barras de cada clase, teniendo en cuenta que la altura de cada barra es igual
a la frecuencia.
 Polígono de frecuencias
 
  Es un gráfico que se obtiene a partir de un histograma, uniendo los puntos medios
de los techos, o bases superiores, de los rectángulos. Se acostumbra a prolongar el
polígono hasta puntos de frecuencia cero.
 
 Un polígono de frecuencia permite ver con gran claridad las variaciones de la
frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o
más distribuciones, ya que, así como es difícil representar dos o más histogramas en
un mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de
frecuencias.
 
 La suma de las áreas de los rectángulos de un histograma de amplitud constante, es
igual al área limitada por el polígono de frecuencias y el eje X.
 
 Diagrama de Pareto
 
El diagrama de Pareto es una gráfica que organiza valores, los cuales están separados
por barras y organizados de mayor a menor, de izquierda a derecha respectivamente.
Esta gráfica permite asignar un orden de prioridades para la toma de decisiones de una
organización y determinar cuáles son los problemas más graves que se deben resolver
primero.

Su finalidad, es hacer visibles los problemas reales que están afectando el alcanzar
los objetivos de la empresa y reducir las pérdidas que esta posee.
Además, permite evaluar previamente, cuáles son las necesidades del público objetivo
y cómo satisfacerlas con nuestro producto o servicio, logando también, el objetivo de la
mercadotecnia.
¿Cómo surgió el diagrama de Pareto?

Fue enunciado por primera vez por el ingeniero, sociólogo, economista y filósofo
italiano Vilfredo Pareto (1848-1923).

Mediante su estudio sobre la división de la riqueza en Italia en aquella época, llegó a


la conclusión de que el 80% de la riqueza estaba en manos del 20% de la población y
el otro 20% de riqueza estaba en el 80% restante.
Al determinar esto, lo publicó por primera vez en 1896 en su «Cours d’économie
politique».
¿Cómo funciona el principio de Pareto?

Representa la regla 80/20, es decir, que, en la mayoría de las situaciones, el 80% de


las consecuencias son debido al 20% de las acciones o el 80% de los defectos de
un producto se debe al 20% de las causas.

En otras palabras, podemos decir que, aunque muchos factores contribuyan a una


causa, son pocos los responsables de dicho resultado.

A pesar de que la relación no siempre es exacta, normalmente sí se cumple el


principio de Pareto y es la base de este diagrama.
¿Cuáles son los elementos del diagrama de Pareto?

El diagrama de Pareto está conformado por una estructura dividida en tres partes:
El eje «Y» izquierdo es la frecuencia de la ocurrencia del problema.

El eje «Y» de la parte derecha es el porcentaje acumulado del número total de


ocurrencias.

La parte inferior del eje «X» muestra los problemas, quejas, defectos o desperdicios
que se presentaron.
Para concluir
Recuerda que el diagrama de Pareto te permite asignar un orden de prioridades,
direccionando tus esfuerzos y tiempo al 20% de las causas que logran solucionar el 80%
de los problemas de la empresa.
Construir el diagrama de Pareto

Luego, con los datos de la tabla anterior, se delinea el diagrama, sus ejes de
ordenadas, se insertan los datos (en orden descendientes) y se agregan las barras.
Con los datos del porcentaje acumulado, se coloca un punto céntrico en cada barra y
luego se unen con una línea.

Para ir finalizando, se analiza el gráfico.

Para concluir este diagrama, se agregan datos como la fecha, título, qué se estudió,
medidas correctivas a aplicar.
Gráfico de ojiva
Se utiliza para representar la frecuencia acumulada. Similar al polígono de
frecuencia, se forma uniendo los puntos más altos de cada columna, pero de
un histograma que represente las frecuencias acumuladas
Círculo radiado
 Los gráficos circulares o de sectores muestran porcentajes y proporciones. ...
La unión de todos los sectores forman un círculo completo.
 

También podría gustarte