Está en la página 1de 53

Cra. Paola F.

Doffo
Probabilidad y estadística

Probabilidad
• Busca datos numéricos más o menos objetivos para evaluar las probabilidades
de un evento futuro, es decir, su grado de certidumbre o verosimilitud.
• La probabilidad solo va a estudiar los eventos no determinísticos, aquellos que
pueden suceder o no (un evento determinístico es aquel que sucede por las
leyes físicas, por ejemplo, si se arroja una piedra, la misma va caer siempre).

Estadística
• Utiliza esos datos proporcionando métodos y técnicas útiles para la toma de
decisiones.

Cra. Paola F. Doffo


Relación entre Probabilidad y estadística

• La estadística utiliza datos pasados, la


probabilidad busca datos futuros.
• Se utiliza la estadística para calcular la
probabilidad y se utiliza la probabilidad
para que con esos datos calcular
estadística.

Cra. Paola F. Doffo


• Dato
• Es un valor que nos brinda
cierta información.
• Dato estadístico
• Es cuando esa información
nos sirve para un análisis
estadístico.

Cra. Paola F. Doffo


Método estadístico

• Es un conjunto de pasos a
seguir para resolver un problema
• Formulación del problema
• Diseño del experimento o
investigación
• Recolección de datos
• Procesamiento y análisis de
datos
• Generalización o inferencia
final

Cra. Paola F. Doffo


Población y muestra

• Población
• “Es un conjunto de todos los
elementos que estamos estudiando,
acerca de los cuales queremos sacar
conclusiones”. Levin & Rubin (1996).

• Muestra
• “Es parte de una población a estudiar
que sirve para representarla”. Murria
R. Spiegel (1991).
• Para que sea muestra tiene que ser
representativa de la población.

Cra. Paola F. Doffo


Cra. Paola F. Doffo
Razones para el muestreo

Costo (siempre trabajar con muestra es más económico que trabajar con la
población).

Tiempo

Pruebas destructivas (Por ejemplo, estudiar la resistencia de un clavo, si utilizo


la población se va a obtener la información, pero al haber utilizado todos los
clavos, no sería útil dicha información, ya que se habría arruinado todos los
clavos).

Cra. Paola F. Doffo


Razones para
trabajar con la
población • Exactitud de los resultados

• Contar (censo)

• Sensibilidad de los resultados

Cra. Paola F. Doffo


• Son la forma en que se van a mostrar los
Tipos de datos
soporte • Enunciados

• Tabas

• Gráficos

Cra. Paola F. Doffo


Distribuciones categóricas

• Una distribución de frecuencias categóricas


muestra el número o la proporción de
observaciones que corresponden a cada una de
las clases cualitativas, mutuamente excluyentes.
(significa que si un dato pertenece a una clase
no puede pertenecer a otra clase.

Cra. Paola F. Doffo


Dato
•Es un valor que nos brinda
cierta información.
DATO Dato estadístico
•Es cuando esa información
nos sirve para un análisis
estadístico.
Cra. Paola F. Doffo
Variable estadística

• Se entiende como variable estadística a aquellas características o


cualidades que poseen los individuos que componen una muestra. Es un
símbolo que identifica un elemento dentro de un grupo, este puede variar,
es inconstante, inestable y mudable.
• En la estadística, el uso de variables simplifica de cierta forma la
recolección e interpretación de datos obtenidos. Ya que le permiten al
analista agrupar la población de acuerdo a rasgos comunes y presentar
mediante gráficos y tablas de frecuencia la información relevante.
• Las variables como elemento esencial para el estudio de la muestra de una
población, se pueden clasificar en:

Cra. Paola F. Doffo


Son aquellas características o cualidades en
las cuales no existe una escala de medición, es
Variables decir, que no se puede cuantificar con
números. Estas se dividen en:
Cualitativas • Variables Nominales: son aquellas variables

que no siguen un orden o no obedecen una


ordenación.
• Variables Ordinales: son aquellas variables
las cuáles se organizan siguiendo un orden
o jerarquía.

Cra. Paola F. Doffo


• Son aquellas variables que pueden ser expresadas
Variable por medio de números. Con este tipo de variable se
puede llevar a cabo ciertas operaciones aritméticas.
Cuantitativa Entre las cuales se encuentran:

• Variable Discreta: es aquella variable compuesta por


valor valores aislados o enteros. Esta no presente
valores intermedios

• Variable Continua: es aquella variable compuesta


por valores intermedios o fracciones de ellos.

Cra. Paola F. Doffo


Cra. Paola F. Doffo
Tipos de datos según su
representación

DATOS SIMPLES DATOS REPETIDOS DATOS AGRUPADOS

Cra. Paola F. Doffo


Datos simples
• Son los datos que están representados individualmente

𝑛 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎


𝑁 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

Cra. Paola F. Doffo


Son los datos representados en una tabla según la cantidad de
Datos repetidos veces que se repite cada uno.

Cra. Paola F. Doffo


Datos agrupados
• Son los datos presentados en una tabla, según
a la clase o intervalo al que pertenecen. Existe
una gran cantidad de datos, pero no se repiten
entre sí.

• Por ejemplo, tenemos los siguientes datos:

Cra. Paola F. Doffo


Marca de clase

Clase fi xi
10 a 4 (10+13)/2=
𝐿𝑠 + 𝐿𝑖 13 11,5
𝑥𝑖 =
2 13 a 4 (13+16)/2=
16 14,5
16 a 2 (16+19)/2=
19 17,5

Cra. Paola F. Doffo


Cuando los límites reales no coinciden con los
nominales
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑓𝑖 + 𝑙í𝑚𝑖𝑡𝑒 𝑛𝑜𝑚𝑖𝑛𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑓𝑖 − 1
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 =
2
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑓𝑖 + 1 + 𝑙í𝑚𝑖𝑡𝑒 𝑛𝑜𝑚𝑖𝑛𝑎𝑙 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑓𝑖
𝐿í𝑚𝑖𝑡𝑒 𝑟𝑒𝑎𝑙 supe𝑟𝑖𝑜𝑟 =
2

Clase fi Lrs Lri


10,1 a 4 *10,05 (13,1+13)/2=
13 13,05
13,1 a 4 (13,1+13)/2= (16,1+16)/2=
16 13,05 16,05
16,1 a 3 16,1+16)/2= *19,05
19 16,05

Cra. Paola F. Doffo


• LRI= LRSi -c = 13,5 – 3 = 10,5
• LRS= LRIi + c = 16,05+3= 19,05

El ancho de clase o de intervalo, se calcula como la diferencia


entre el límite superior y el inferior
𝑐 = 𝑙𝑟𝑠 − 𝑙𝑟𝑖

Cra. Paola F. Doffo


Distribuciones de Xi (dato) fi (frecuencia absoluta
frecuencias simple, cuantas veces se
repite cada dato)
10 2
Cuando trabajamos con 12 2
datos repetidos o 15 3
agrupados
16 2
Frecuencia Absoluta 18 1
simple
n 10

Cra. Paola F. Doffo


Frecuencia Absoluta Acumulada
• 𝑛 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑓𝑖
• 𝑁 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 = 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑓𝑖

Xi (dato) fi (frecuencia absoluta Fi (Frecuencia


simple, cuantas veces Absoluta Acumulada)
se repite cada dato)

10 2 2
12 2 2+2= 4
15 3 2+2+3=7
16 2 2+2+3+2=9
18 1 2+2+3+2+1=10
n 10
Cra. Paola F. Doffo
• La frecuencia absoluta acumulada del
primer intervalo es igual a la frecuencia
absoluta simple del primer intervalo.
• La frecuencia absoluta acumulada del
último intervalo es igual a “n”

Cra. Paola F. Doffo


Es la participación que tiene ese dato en el total
Frecuencia relativa simple 𝑓𝑟 =
𝑓𝑖
𝑛

X I (DATO) F I (FRECUENCI A ABSOLUTA FI (FRECUENCIA F R (FRECUENCIA


SIMPLE, CUANTAS VECES ABSOLUTA RELATI VA
SE REPITE CADA DATO) ACUMULADA) SIMPLE)
PROPORCI ÓN

10 2 2 2/10=0,2

12 2 4 2/10=0,2

15 3 7 3/10=0,3

16 2 9 2/10=0,2

18 1 10 1/10=0,1

n 10 1

Cra. Paola F. Doffo


El total de la frecuencia
Frecuencia relativa
relativa simple siempre es
acumulada
igual a uno.

Cra. Paola F. Doffo


Xi fi (Frecuencia Fi (Frecuencia fr(Frecuencia Fr(Frecuencia relativa
(dato) absoluta simple, absoluta relativa simple) acumulada)
cuantas veces se acumulada) proporción proporción
repite cada dato)
10 2 2 0,2 0,2
12 2 4 0,2 0,2+0,2=0,4
15 3 7 0,3 0,2+0,2+0,3=0,7
16 2 9 0,2 0,2+0,2+0,3+0,2=0,9
18 1 10 0,1 0,2+0,2+0,3+0,2+0,1=1
n 10 1

• La frecuencia relativa acumulada del primer intervalo es igual a la frecuencia relativa


simple del primer intervalo.
• La frecuencia relativa acumulada del último intervalo es igual a uno.
Cra. Paola F. Doffo
Xi fi (Frecuencia Fi fr(Frecuencia fr(Frecuencia f%
absoluta simple, (Frecuencia relativa relativa (Frecuencia
cuantas veces se absoluta simple) acumulada) relativa
repite cada dato) acumulada) proporción proporción porcentual)
10 2 2 0,2 0,2 0,2*100=20
12 2 4 0,2 0,4 0,2*100=20
15 3 7 0,3 0,7 0,3*100=30
16 2 9 0,2 0,9 0,2*100=20
18 1 10 0,1 1 0,1*100=10
n 10 1 100

Frecuencia relativa porcentual

f% = fri ∗ 100

Cra. Paola F. Doffo


El total de la frecuencia relativa
porcentual es igual a 100.

Frecuencia relativa acumulada porcentual

f% = Fri ∗ 100

Cra. Paola F. Doffo


Xi fi Fi fr Fr f% F%

10 2 2 0,2 0,2 20 20
12 2 4 0,2 0,4 20 40
15 3 7 0,3 0,7 30 70
16 2 9 0,2 0,9 20 90
18 1 10 0,1 1 10 100
n 10 1 100

• La frecuencia relativa acumulada porcentual del


primer intervalo es igual a la frecuencia relativa
porcentual del primer intervalo.
• La frecuencia relativa acumulada porcentual del
último intervalo es igual cien.

Cra. Paola F. Doffo


Cra. Paola F. Doffo
Tablas y gráficos

Son la forma en que se van a mostrar los datos


• Enunciados
Tipos de soporte
• Tabas
• Gráficos

Cra. Paola F. Doffo


Tablas
estadísticas
• Esta forma de
representación consiste
en ordenar los datos
numéricos en filas y
columnas, con las
especificaciones acerca de
su naturaleza.

Cra. Paola F. Doffo


Cinco elementos de apoyo son necesarios para la descripción de los datos mostrados en
una tabla:

El título de la tabla debe hacer una descripción clara y precisa de los datos. Debe responder las tres
preguntas "qué", "dónde" y "cuándo". Hay que ser breve y conciso, y evitar el uso de verbos.

Buen ejemplo: “Edad de jubilación estimada por ocupaciones en Argentina, 2012.“ Este texto da toda la
información necesaria para comprender y utilizar los datos correctamente

.
Los encabezados de las columnas, expuestos en la parte superior de la tabla, deben indicar qué datos hay
presentes en cada columna de la tabla y proporcionar los metadatos necesarios (por ejemplo, unidad de
medida, período de tiempo o área geográfica).

Cra. Paola F. Doffo


3) Los encabezados de las filas, en la primera columna de la tabla, deben identificar los datos
presentes en cada fila de la tabla

4) Las notas a pie, en la parte inferior de la tabla, pueden proporcionar cualquier información
adicional necesaria para comprender y utilizar correctamente los datos (definiciones, por
ejemplo).

5) La línea que contiene la fuente, en la parte inferior de la tabla, debe indicar la fuente de los
datos, es decir, la organización que elaboró los datos y el método de recogida de datos (por
ejemplo, censo de población o encuesta de población activa).

La siguiente figura indica cómo estos componentes de una tabla deberían


ser mostrados.
Cra. Paola F. Doffo
Cra. Paola F. Doffo
Los valores de los datos deben estar expuestos de tal
manera que la información clave sea fácil de extraer.
A los usuarios les será más sencillo seguir las columnas hacia
abajo o a través de las filas, en función del mensaje.
Considerar esto a la hora de decidir si presentar la tabla con
una orientación vertical u horizontal.
Se pueden utilizar unas líneas o un sombreado suave para
animar a los usuarios a leer en horizontal o en vertical. El
espaciamiento y el sombreado pueden cambiar la forma en
que se lee una tabla.

Las columnas deben estar uniformemente espaciadas y no


demasiado separadas. Las tablas deben ser sólo tan amplias
como lo requiera el contenido de los datos.

Cra. Paola F. Doffo


• Evitar texto innecesario.
• Presentar los datos por orden cronológico en el caso de
series temporales o usando una clasificación estándar. Para
series temporales más largas, puede ser más apropiado
utilizar el orden cronológico inverso (es decir, comenzando
con el período más reciente y yendo hacia atrás), en algunos
casos, como el desempleo mensual.

Tablas estadís •


Usar mínimamente las posiciones decimales.
Utilizar separadores de miles. El uso de un espacio en lugar
ticas fáciles de un símbolo puede evitar el problema de tener que
traducir entre lenguas.

de entender • Alinear los números hacia la coma decimal (o a la derecha en


la ausencia de cifras decimales) hace claramente apreciable
su valor relativo. No centres los números en una columna, a
menos que todos ellos tengan la misma extensión.
• Cuando se hace una serie de tablas para una publicación o sitio
web, se debe utilizar el mismo diseño en todas las tablas.
Considerar cuánta información se necesita proporcionarse en los
títulos de las tablas (qué es obvio y qué no lo es) y ser coherente
en el uso de abreviaturas.

Cra. Paola F. Doffo


Gráficos Histograma de frecuencia
• Un histograma es una representación gráfica de una
variable en forma de barras, teniendo en cuenta que la
superficie de cada barra es proporcional a la frecuencia
de los valores representados. Un histograma nos permite
ver cómo se distribuyen los valores de la variable en
estudio.

• Usamos los histogramas cuando analizamos variables


continuas, o cuando trabajamos con variables discretas
que toman un gran número de valores y son agrupadas
en intervalos. Cuando tenemos variables cualitativas, se
emplean los diagramas de barras.

Cra. Paola F. Doffo


¿Cómo construir un histograma?
Partimos de una tabla de frecuencias con datos
agrupados, y seguimos los siguientes pasos: En el eje
horizontal (X), colocamos los límites de clase.
Opcionalmente, puedes colocar las marcas de clase.
En el eje vertical (Y), colocamos las frecuencias. Se suele
tomar la frecuencia absoluta, pero también se puede
trabajar con la frecuencia relativa o con la frecuencia
porcentual.
Dibujamos las barras de cada clase, teniendo en cuenta
que la altura de cada barra es igual a la frecuencia.

Cra. Paola F. Doffo


• Es un gráfico que se obtiene a partir de un histograma, uniendo los
puntos medios de los techos, o bases superiores, de los rectángulos.
Se acostumbra a prolongar el polígono hasta puntos de frecuencia
Polígono cero.

Un polígono de frecuencia permite ver con gran claridad las


de

variaciones de la frecuencia de una clase a otra. Son muy útiles
cuando se pretende comparar dos o más distribuciones, ya que, así
frecuencias como es difícil representar dos o más histogramas en un mismo
gráfico, resulta muy sencillo hacerlo con dos o más polígonos de
frecuencias.

• La suma de las áreas de los rectángulos de un histograma de


amplitud constante, es igual al área limitada por el polígono de
frecuencias y el eje X.

Cra. Paola F. Doffo


Cra. Paola F. Doffo
Diagrama de Pareto

El diagrama de Pareto es una gráfica que organiza valores, los cuales están separados por barras y
organizados de mayor a menor, de izquierda a derecha respectivamente.
Esta gráfica permite asignar un orden de prioridades para la toma de decisiones de una
organización y determinar cuáles son los problemas más graves que se deben resolver primero.

Su finalidad, es hacer visibles los problemas reales que están afectando el alcanzar los objetivos
de la empresa y reducir las pérdidas que esta posee.
Además, permite evaluar previamente, cuáles son las necesidades del público objetivo y cómo
satisfacerlas con nuestro producto o servicio, logando también, el objetivo de la mercadotecnia.

Cra. Paola F. Doffo


• ¿Cómo surgió el diagrama de Pareto?

• Fue enunciado por primera vez por el ingeniero, sociólogo, economista y filósofo
italiano Vilfredo Pareto (1848-1923).

• Mediante su estudio sobre la división de la riqueza en Italia en aquella época,


llegó a la conclusión de que el 80% de la riqueza estaba en manos del 20% de la
población y el otro 20% de riqueza estaba en el 80% restante.
• Al determinar esto, lo publicó por primera vez en 1896 en su «Cours d’économie
politique».

Cra. Paola F. Doffo


¿Cómo funciona el principio de Pareto?

Representa la regla 80/20, es decir, que, en la mayoría


de las situaciones, el 80% de las consecuencias son
debido al 20% de las acciones o el 80% de los defectos
de un producto se debe al 20% de las causas.

En otras palabras, podemos decir que, aunque muchos


factores contribuyan a una causa, son pocos los
responsables de dicho resultado.

A pesar de que la relación no siempre es exacta,


normalmente sí se cumple el principio de Pareto y es la
base de este diagrama.

Cra. Paola F. Doffo


¿Cuáles son los elementos
del diagrama de Pareto?

• El diagrama de Pareto está conformado por una estructura dividida en tres partes:
• El eje «Y» izquierdo es la frecuencia de la ocurrencia del problema.

• El eje «Y» de la parte derecha es el porcentaje acumulado del número total de


ocurrencias.

• La parte inferior del eje «X» muestra los problemas, quejas, defectos o desperdicios que
se presentaron.

Cra. Paola F. Doffo


• Para concluir
• Recuerda que el diagrama de
Pareto te permite asignar un
orden de prioridades,
direccionando tus esfuerzos y
tiempo al 20% de las causas que
logran solucionar el 80% de los
problemas de la empresa.

Cra. Paola F. Doffo


Construir el diagrama de • Luego, con los datos de la tabla anterior, se
delinea el diagrama, sus ejes de ordenadas, se
Pareto insertan los datos (en orden descendientes) y se
agregan las barras.
• Con los datos del porcentaje acumulado, se
coloca un punto céntrico en cada barra y luego se
unen con una línea.

• Para ir finalizando, se analiza el gráfico.

• Para concluir este diagrama, se agregan datos


como la fecha, título, qué se estudió, medidas
correctivas a aplicar.

Cra. Paola F. Doffo


Cra. Paola F. Doffo
Gráfico de ojiva
• Se utiliza para representar la
frecuencia acumulada.
Similar al polígono de
frecuencia, se forma uniendo
los puntos más altos de cada
columna, pero de un
histograma que represente
las frecuencias acumuladas

Cra. Paola F. Doffo


Círculo radiado
• Los gráficos circulares o de
sectores muestran porcentajes y
proporciones. ... La unión de
todos los sectores forman
un círculo completo.

Cra. Paola F. Doffo

También podría gustarte