Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Datos: son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e
interpretación. A todos los datos reunidos para un determinado estudio se les llama conjunto de datos
para el estudio. (un dato es un valor numérico o cualidad de una variable).
Elementos/ Unidad elemental: son las entidades de las que se obtienen los datos o los elementos en
estudio. Ejemplo: población, muestra.
Variable: es una característica de los elementos de interés. Por ejemplo: persona, animales, plantas,
etc.
El elemento es el conjunto general (población o muestra), dentro de este van a estar las variables
(características del elemento), y estas variables se van a convertir en datos cuando le asignamos
valores, atributos o cualidades.
Escala de medición: determinará la cantidad de información que contiene cada dato, donde a su vez
indica la manera más apropiada para resumirlos y analizarlos estadísticamente.
Estas escalas sirven para determinar la cantidad de información contenida en datos cualitativos,
entendiendo por estos a todos aquellos datos que contienen atributos, etiquetas, nombres, cualidades,
etc.:
Escala nominal: se la utiliza cuando a la variable en estudio se le puede asignar como dato un
nombre, número u orden.
Escala ordinal: se utiliza si los datos de la escala nominal muestran una mayor cantidad de
propiedades, y el orden o clasificación es significado. Ejemplo: Por ejemplo, una empresa
automovilística envía a sus clientes cuestionarios para obtener información sobre su servicio
de reparación. Cada cliente evalúa el servicio de reparación como excelente, bueno o malo.
Como los datos obtenidos son las etiquetas excelente, bueno o malo, tienen las propiedades
de los datos nominales, pero además pueden ser ordenados o jerarquizados en relación con la
calidad del servicio. Un dato excelente indica el mejor servicio, seguido por bueno y, por
último, malo. Por lo que la escala de medición es ordinal.
Variable: cuestionario que la empresa envía a sus clientes.
Datos: excelente, bueno, malo.
Estas escalas sirven para determinar la cantidad de información contenida en datos cuantitativos,
entiendo a estos como todos aquellos que son identificados con números:
Escala de intervalos: se da cuando los datos de una variable tienen las mismas propiedades
que los datos de una escala ordinal y el intervalo entre los valores se expresan en unidades
fijas. Ejemplo: las calificaciones obtenidas por tres alumnos en la prueba de matemáticas con
620, 550 y 470, pueden ser ordenadas en orden de mejor a peor. Además, las diferencias entre
las calificaciones tienen significado. Por ejemplo, el estudiante 1 obtuvo 620-550= 70 puntos
más que el estudiante 2 mientras que el estudiante 2 obtuvo 550-470 = 80 puntos más que el
estudiante tres.
Escala de razón: en esta escala los datos tienen las mismas propiedades que los datos de
intervalos y la razón de los dos valores es significativa, se la puede utilizar para medir
distancias, tiempos, alturas, peso, etc. Ejemplo: considere el costo de un automóvil. El valor
1
cero para el costo indica que el automóvil no cuesta, que es gratis. Además, si se compara el
costo de un automóvil de $30 000, con el costo de otro automóvil, $15 000, la propiedad de
razón muestra que $30 000/$15 000 = 2: el primer automóvil cuesta el doble del costo del
segundo.
Fuente de datos
Fuentes existentes: donde los datos ya existen y lo que se hace es buscarlos en las bases de
datos de la empresa, registraciones internas y/o contables (sueldos, edades, etc.).
Estudios estadísticos: en este caso los datos para llevar a cabo un proyecto por ejemplo no se
encuentran disponibles en fuentes existentes, por lo que es necesario obtenerlos a través de
diferentes estudios estadísticos experimentales y observacionales. Ejemplos: encuestas,
estadísticas.
Errores de adquisición de los datos: ejemplo: un entrevistador puede cometer un error de
escritura, como una transposición al escribir la edad de una persona y en lugar de 24 años
escribir 42 años, o en una entrevista, el entrevistado puede malinterpretar una pregunta y dar
una respuesta incorrecta.
ESTADISTICA DESCRIPTIVA
Dicha estadística recolecta y resume diferentes tipos de datos de forma tal que, cuando los mismos
sean presentados puedan ser comprendidos fácilmente por el lector. Son ejemplos de esta estadística
la información que se encuentra en diarios, revistas, informes de empresas, etc. Se basa en la teoría de
las probabilidades.
Los elementos que forman parte de la estadística descriptiva son:
Población: es el elemento bajo estudio más grande y los paramentos utilizados son:
o Promedio.
o Desvió estándar.
Muestra: subconjunto de la población que debe ser representativa de la misma (para que
sea representativa tienen que estar si o si en la misma proporción todas las variables/
datos que se encuentran en la población). Y el parámetro utilizado es:
o Promedio estadístico.
ESTADÍSTICA INFERENCIAL:
La inferencia estadística consiste en tomar datos de una muestra y con ellos realizar
estimaciones e hipótesis sobre las características de la población
Población: totalidad de familias de clase de media de Reconquista.
Muestra: 10 familias de clase media de Reconquista.
Al no tener fuentes de datos existentes, utilizaremos estudios estadísticos para obtener datos
de nuestra muestra y así realizar hipótesis respecto de la población en general. (estamos trabajando
con inferencia estadística).
2
UNIDAD 2
Datos/variables cualitativas: Son todos aquellos datos que contienen atributos, etiquetas,
nombres, cualidades, etc.
Interpretación reglón 2: “de las 40 familias hay 9 de ellas que tienen 1 hijo”. “el 22.5% de las
40 familias tienen 1 hijo”
o Gráficos de barra: se utilizan para representar los datos cualitativos que figuran en la
distribución de frecuencias absoluta, relativa y porcentual.
Simples.
Compuestos: comparar cosas diferentes. Ejemplo: rendimientos de hombres y
mujeres en distintos trabajos.
Bidireccionales: comparar cosas opuestas.
o Grafica circular o de pastel: para elaborarla primero se traza un circulo que representa
todos los datos, luego con las frecuencias relativas se subdivide el circulo en partes, que
estas representan las frecuencias relativas de cada clase.
3
Discretos: se da cuando la variable toma como valores números enteros, y estos surgen de
un proceso de conteo. Por ejemplo: número de hijos que tiene una familia, número de
unidades producidas, etc.
Continuos: la variable puede tomar como valores números enteros como decimales, y el
mismo surge de un proceso de medición. Por ejemplo: sueldos, peso de una persona, etc.
Distribución de frecuencia: para poder realizarla con datos cuantitativos se deben seguir tres
pasos:
1. Determinar el número de clases que no se superponen: las clases son los números de
intervalos que se van a utilizar para agrupar los datos.
2. Definir el ancho de cada clase: el número y el ancho de las clases no son decisiones
independientes, sino que se determinan en base a distintos procedimientos. en este
caso para definir el ancho de la clase, vamos a utilizar la siguiente formula:
Ancho de clase aproximado = (valor de datos mayor – valor de datos menos) / número de
clases
3. Determinar los límites de clases: se los debe fijar para definir en qué intervalo se van a
incluir cada dato. El límite de clase inferior identifica el menor valor asignado a la
clase, mientras que el límite de clase superior identifica el mayor valor asignado a la
clase.
EJEMPLO:
AUDITORÍA ANUAL
(DÍAS DE DURACIÓN)
12 14 19 18
15 15 18 17
20 27 22 23
22 21 33 28
14 18 16 13
Total 20
En esta distribución de frecuencia se observa lo siguiente:
1. Las duraciones de las auditorías que se presentan con más frecuencia son de la clase 15-
19 días. Ocho de las 20 auditorías caen en esta clase.
2. Sólo una auditoría requirió 30 o más días.
Discretas:
Frecuencia absoluta (fi): grafico de bastones
Frecuencia acumulada (Fi): grafico escalonado
Continuas:
Frecuencia absoluta (fi): histograma
Polígono de frecuencia
Frecuencia acumulada (Fi): ojiva
Histograma: La figura es un histograma de las duraciones de las auditorías. La clase con mayor
frecuencia se indica mediante el rectángulo que se encuentra sobre la clase 15–19 días. La altura
del rectángulo muestra que la frecuencia de esta clase es 8
Ojiva
5
Análisis exploratorio de datos
Las técnicas del análisis exploratorio de datos consisten en una aritmética sencilla y
gráficas fáciles de dibujar útiles para resumir datos.
Es una de las formas que se tiene para realizar el análisis exploratorio de datos, y sirve
para mostrar simultáneamente la clasificación y la forma de un conjunto de datos. Este grafico se
puede utilizar independientemente si la variable es continua o discreta. LOS DATOS TIENEN QUE
ESTAR ORDENADOS DE MENOR A MAYOR.
Para realizarlo primero se coloca los dígitos principales de cada dato, a la izquierda de una
línea vertical. Y en el caso de que se tenga un numero de tres cifras, las dos primeras van a la
izquierda y la última a la derecha. El tallo es lo que se coloca a la izquierda y puede estar formado
por varios números del mismo dato, y la hoja es lo que va a la derecha y solamente puede
formarse por una cifra de cada dato.
Las ventajas de utilizar este grafico
Es más fácil elaborarlo a mano que un histograma.
Dentro de un intervalo proporciona más información que un histograma, ya que el tallo y
hoja muestran datos actuales.
Permite reconstruir aproximadamente el lote de datos original (a través de la unidad de
hoja).
Permite que participen todos los datos.
Permite visualizar el comportamiento de datos.
6
Resumen de Cinco Números: En este caso se usan los siguientes valores para resumir a la
totalidad de datos:
1) Valor menor.
2) Primer Cuartil.
3) Mediana.
4) Tercer Cuartil.
5) Valor Mayor.
Para realizar el resumen de 5 números se recomienda colocar a todos los datos en orden
ascendente, es decir, de menor a mayor, para así detectar el fácilmente el menor y mayor valor y
luego los cuartiles y mediana.
Características:
Diagrama de Caja (Box-Plot): éste también es un resumen gráfico de datos que se basa en un
resumen de 5 números. Para éste se necesitan los mismos datos que para el resumen de 5
números y además el Rango Intercuartílico. PERMITE IDENTIFICAR OBSERVACIONES ATÍPICAS.
1) Se realiza una caja (rectángulo), en donde sus extremos están ubicados en el cuartil 1 y en
el cuartil 3. Contiene el 50% de datos.
2) Se traza una línea vertical dentro de la caja que representa a la Mediana.
7
3) Con el Rango intercuartilico se localizan los límites, el límite inferior es 1.5 por debajo del
cuartil 1 y 1.5 por encima del cuartil 3.
4) Se señala con un asterisco la ubicación de observaciones atípicas.
Tabulaciones cruzadas:
Covarianza:
Es un resumen de los datos de 2 variables, se elaboran con dos variables cualitativas,
cuantitativas o una combinación de ambas. Ejemplo: si el restaurante 5 de la primera tabla tiene
muy buena calidad y su precio es $33, a este restaurante le corresponde el renglón 2 y la columna
3 de la tabla cruzada.
Forma de cálculo:
Si trabajamos con una muestra:
Ejemplo:
Diagrama de dispersión:
Es una representación gráfica de la relación entre dos variables cuantitativas.
Línea de tendencia:
Es una línea que da una aproximación de la relación.
Ejemplo de ambas:
8
Muestra el diagrama de dispersión y la línea de tendencia para los datos de la tabla
anterior. Para la semana uno hay 2 comerciales que generan 50 ventas, y ese punto (2;50) se traza
en el diagrama que sigue, lo mismo con los demás datos. También muestra una relación positiva
entre el número de comerciales y las ventas, ya que a mayor publicidad hay mayores ventas, pero
esto no es perfecto.
Unidad 3
Medidas de localización, posición o tendencia central
Con estas medidas se busca calcular y obtener un valor de la variable “x” que, en lo posible
este en el centro de distribución.
Media aritmética o promedio:
La media nos brinda una medida de ubicación central de los datos y es la medida de
ubicación más importante para una variable. Si los datos son datos de una muestra, la media se
denota ; si los datos son datos de una población, la media se denota con la letra griega μ.
La media es el valor de la variable que resulta de sumar todos los valores que toma la
variable dividido el número total de datos. ESTA NO SE GRAFICA.
Ejemplo.
Datos: 46; 54; 42; 46; 32
n= 5 datos
Mediana:
La mediana es el valor que se encuentra en el medio de los datos, cuando estos están
acomodados de menor a mayor.
Para un número impar de datos, la mediana es el valor del medio. Ejemplo:
Datos: 4; 5; 7; 8; 10
9
n= 5
mediana= 7
Para un numero par de datos, no se tiene un valor central, por ende, se debe calcular la
posición de la mediana, y luego buscar la misma en el dato a dato.
Posición de la mediana= (n+1) /2
Moda:
Es el valor que más frecuentemente se presenta (es el valor de la variable que
corresponde a la mayor frecuencia). SE GRAFICA EN GRAFICO DE BASTONES Y SE ENCUENTRA EN
EL BASTON MAS ALTO.
Muchas veces puede pasar que no haya moda y esto se debe a que no hay frecuencia, es
decir que no hay una repetición del valor que toma la variable. También hay situaciones en que la
mayor frecuencia ocurre en dos o más valores diferentes, en este caso se tendrán datos bimodales
o multimodales.
Percentiles:
El percentil p es un valor tal que por lo menos p por ciento de las observaciones son
menores o iguales que este valor y por lo menos (100 - p) por ciento de las observaciones son
mayores o iguales que este valor.
Calculo para obtener percentiles y cuartiles:
Ejemplo:
Determine el percentil 85 en los sueldos mensuales iniciales.
Paso 1: Ordenar los datos de menor a mayor
3310; 3355; 3450; 3480; 3480; 3490; 3520; 3540; 3550; 3650; 3730; 3925
Paso 2:
Cuartiles:
Los datos se dividen en 4 partes, conteniendo cada una de ellas el 25% de las observaciones.
Los puntos de división son definidos como:
Q1: primer cuartil o percentil 25
10
Q2: segundo cuartil o percentil 50 (mediana)
Q3: tercer cuartil o percentil 75
Ejemplo:
Datos: 3310; 3355; 3450; 3480; 3480; 3490; 3520; 3540; 3550; 3650; 3730; 3925
Posición Q1: (25/100) x 12 = 3
Rango Intercuatílico: Es la diferencia entre el tercer cuartil “Q3” y el primer cuartil “Q1”
Varianza: Es la diferencia el valor que toma cada variable (Xi) y la media/promedio elevada
al cuadrado. A diferencia mencionada al inicio se la conoce con el nombre de desviación respecto
de la media/promedio. Dentro de esta tenemos a:
Para ilustrar dicho calculo colocamos a continuación una imagen que contiene un ejemplo:
11
Los
valores asociados con la varianza muestral pueden causar confución ya que, la desviación respecto
de la media está elevada al cuadrado, provocando que la comprención e interpretación intuitiva
de los valores finales de la varianza se dificulte.
Desviación Estandar: Se la define como la raíz cuadrada de la VARIANZA. Con esta medida
los resultados finales se encuntran expresados en las mismas unidades que los valores
originales (datos iniciales), ya que como la varianza eleba todo al cuadrado al colocar la raíz se
elimina el cuadrado permitiendo ver valores reales. Es más facil de interpretar que la varianza.
Coeficiente de Variación: Permite ver que tan grande es la desviación estándar respecto
de la media/promedio.
12
Formas de Distribución
Con la figura que se coloca a continuación se puede ver diferentes histogramas
sesgados y simétricos:
Para datos sesgados a la izquierda el error (sesgo) es NEGATIVO y la media es MENOR que
la mediana, para aquellos que están sesgados a la derecha el error es POSITIVO y la media es
MAYOR que la mediana, si los datos son simétricos el sesgo es CERO y la media y la mediana son
IGUALES.
13
Teorema de Chebyshev
Dicho teorema permite hacer afirmaciones sobre la proporción de los valores de datos
que deben estar dentro de un número específico de desviaciones estándar de la media. Para éste
se requiere que el valor Z sea mayor que 1, pero no necesariamente que sea un número entero. Se
aplica a cualquier conjunto de datos sin importar la forma de distribución de los mismos.
Regla Empírica
Aproximadamente 68% de los valores de datos estará dentro de UNA desviación estándar
de la media
Aproximadamente 95% de los valores de datos estará dentro de DOS las desviaciones
estnadar de la media.
Casi todos los valores de datos deben estar dentro de TRES desviaciones estandar de la
media.
Por ejemplo: Los envases de dtergente liquido se llenan automáticamente en una línea de
producción. Los pesos de llenado suelen tener una distribución en forma de campana. El peso
medio de llenado es de 16 onzas y la desviación estandar es de 0.25 onzas, entonces utilizamos la
regla empírica para formaular las siguientes concluciones:
Aproximadamente el 68% de los envases llenos pesará entre 15.75 onzas (16 – 0.25 onzas)
y 16.25 (16 + 0.25 onzas)
Aproximadamente el 95 % de los envases llenos pesará entre 15.50 onzas (16 – 0.25 –
0.25) y 16.50 onzas (16 + 0.25 + 0.25)
Casi todos los envases llenos persarán entre 15.25 onzas (16 – 0.25 – 0.25 – 0.25) y 16.75
onzas (16 + 0.25 + 0.25 + 0.25)
1) Un valor de datos que se registró incorrectamente, y en este caso el error debe corregirse
antes de realizar un analisis posterior.
2) Una observación que se introdujo de forma incorrecta en el conjunto de datos y al
detecarla se la debe eliminar.
3) Un valor de datos inusual que se registró correctamente y pertenece al conjunto de datos
que por ende al detecarlo se lo debe conservar.
14
Los valores Z (valores estandarizados) se utilizan para detectar dichas observaciones atípicas y
se recomienda tomar como valor atípico cualquier valor de datos que tenga un valor Z menor a 3 o
mayor que 3.
RESUMEN:
En dicho capítulo se introdujeron varios estadísticos descriptivos que se utilizan para resumir
la posición, la variabilidad y la forma de distribución de una conjunto de datos. En etse caso nos
centramos en variables cuyos datos son númericos y si dichos valores se obtienen de una muestra
se los conoce con el nombre de estadísticos muestrales y si se los obtiene de una población se los
llama parámetros poblacionales. A continuación se verán las simbologias de cada
estadístico/parametro:
15
UNIDAD 4
INTRODUCCIÓN A LA PROBABILIDAD
La probabilidad nos muestra la posibilidad de que un echo/evento ocurra, expresado en
medidas númericas. Los valores de la misma siempre se asignan en una escala de 0 a 1, por ende
una probabilidad ercana a 0 indica que es poco probable de que el evento en cuestión ocurra y
una probabilidad cercana a 1 muestra que el evento tiene una gran posibilidad de ocurrir.
Ejemplo:
Al definir todos los posibles resultados del experimento obtenemos lo que se denomina ESPACIO
MUESTRAL o EVENTO
16
las monedas tenemos 2 resultados posibles y a la lanzar la segunda moneda tenemos 2
resultados más.
Datos:
N = 5 partes
N = 2 partes
Entonces:
Para el experimento que consiste en tomar solo 2 partes de las 5 partes que se tienen en total
existen 10 resultados posibles.
Permite que se calcule el numero de resultados experimentales cuando se seleccionan “n” objetos
de un conjunto de “N” objetos totales y el orden de selección es importante:
17
Ejemplo: Tomamos el mismo ejemplo que en la regla de combinación:
N = 5 partes
N = 2 partes
Asignación de porbabilidades
Dicho método es apropiado utilizarlo cuando todos los resultados del experimento sin
igualmente probables, es decir que todos tienen la misma probabilidad de ocurrencia.
Podemos tomar como ejemplo el experimento que consiste en arrojar una moneda, en donde
los resultados del experimento son igualmente probables ya que hay un 50% de probabilidad de
que salca cara y otro 50% de probabilidad de que salga cruz.
Forma de cálculo:
Es apropiado cuando los datos están disponibles para estimar la proporción del tiempo en que
ocurrirá el resultado si el experimento se repite un gran número de veces.
18
Utilizando el método bajo estudio tendremos:
P(0) = 2/20 = 0.10 Existe una probabilidad del 10% de que ningun paciente tenga que
esperar solo 2 días para realizarse el estudio
P(3) = 4/20 = 0.20 Existe una probabilidad del 20% de que 3 pacientes deban esperar 4
dias para realizarse el estudio.
3) Método Subjetivo:
Es apropiado de utilizar cuando no se puede asumir de forma realista que los resultados del
experimento son igualmente probables y a su vez se dispone de pocos datos relevantes. Dicho
método utiliza la experiencia o intuición de las personas para asignar probabilidades por lo que se
dice que es un método personal y requiere de un cuidado especial para asegurar que los dos
requisitos básicos se cumplan.
Complemento de un Evento:
Dado un determinado evento “A”, el complemento del evento “A” se define como:
El evento que consta de todos los puntos de la muestra que NO están incluidos dentro de “A” y se
denota como “AC”.
P(A) + P(Ac) = 1
Entonces de esa formula básica podemos obtener:
La probabilidad de A, conociendo la probabilidad de la ocurrencia de su complemento:
P(A) = 1 - (PAc).
Diagrama de Venn: “Consiste en una representación gráfica del Espacio Muestral y de las
operaciones que involucran a eventos”.
19
Dicha representación se realiza mediante un rectángulo que representa a el especio muestral
en general y mediante círculos dentro del espacio muestral se represnetan a los eventos:
Evento A
Complemento de A
Ley de la Adición:
Esta ley es util cuando interesa conocer la probabilidad de que POR LO MENOS ocurra uno de
los dos eventos bajo analisis.
Si tenemos a los eventos “A” y “B” con esta ley nos interesa conocer la probabilidad de que
ocurra el evento “A” O el evento “B” O ambos eventos. (se la utiliza para calcula la probabilidad de
la unión de 2 eventos).
Entonces ahora con este concepto definido podemos concluir en que la formula para el
cálculo de la ley de adición para eventos compatibles es la siguiente:
20
Ley de la multiplicación: Se la utiliza para calcular la probabilidad de la intersección de dos
eventos, y también es necesaria para calcular la ley de la adición. En este apartado es
necesario que retomemos la siguiente definición:
Entonces ahora con este concepto definido podemos concluir en que la formula para el
cálculo de la ley de multiplicación para eventos compatibles es la siguiente:
21
Ley de adición para eventos mutuamente excluyentes:
Supongamos que se tiene un evento “A” con probabilidad P(A). Si ademas tenemos
información respecto de la existencia de otro evento “B” que YA OCURRIÓ podriamos obtener una
nueva probabilidad del evento A a la que se denomina PROBABILIDAD CONDICIONAL y se denota
como P(A/B) “probabilidad de A sabiendo que B ya ocurrio”.
Forma de cálculo:
Los valores de los bordes de la tabla que colocaremos a continuación nos muestran las
probabilidades de cada caso en particular:
22
Dichas probabilidades se las conoce con el nombre de PROBABILIDADES MARGINALES.
Entonces la probabilidad de que este policía sea ascendido sabiendo que es hombre es del
30%.
Teorema de Bayes
El proceso comienza con las estimaciones de probabilidad previa o inicial para eventos
específicos de interés. Luego, de fuentes como una muestra, se obtienen informes especiales o
pruebas de productos que brindan información adicional sobre los eventos que permiten
actualizar los valores iniciales obteniendo lo que se conoce con el nombre de probabilidades
posteriores. El teorema de Bayes proporciona un medio para efectuar estos cálculos.
El teorema es válido siempre y cuando los eventos bajo análisis sean mutuamente
excluyentes y su unión es el espacio muestral total (los eventos son colectivamente exhaustivos).
Forma de cálculo:
23
Pasos para poder llevar a cabo el teorema de bayes:
1) Preparar 3 columnas:
Columna 1: Mencionar a los eventos mutuamente excluyentes.
Columna 2: Calcular las probabilidades previas de cada uno de esos eventos mutuamente
excluyente. P (A i).
Columna 3: Calcular las probabilidades condicionales de los eventos.
2) Elaborar una cuarta (4) columna, en la cual se debe calcular las probabilidades conjuntas a
través de la ley de multiplicación. Estas probabilidades se calculan multiplicando los
valores de la columna 2 y la columna 3.
3) Sumar la totalidad de probabilidades conjuntas de la columna 4 para así obtener la
probabilidad de la NUEVA INFORMACIÓN P(B).
4) En la quinta (5) columna se calculan las probabilidades posteriores utilizando la relación
básica de probabilidad condicional. P (A i / B).
24
UNIDAD 5 Y 6
25
Variables Aleatorias
“Una Variable Aleatoria es una descripción numérica de los resultados de un
experimento”. Y por ende pueden asumir como dato valores numéricos.
Al igual que vimos en las primeras unidades las variables pueden ser Discretas o
Continúas dependiendo de los valores que asumen.
1) Discretas: Pueden asumir únicamente valores enteros, es decir: 0, 1, 2, …..
Ejemplo:
26
Durante los últimos 300 días de operación mostraron que durante 54 días no se
vendió ningún automóvil, en 117 días se vendió 1 automóvil, en 72 días se vendieron 2
automóviles, en 42 días se vendieron 3, en 12 días se vendieron 4 y en 3 días se vendieron
5 automóviles.
Variable Aleatoria (x) = Número de automóviles vendidos en 1 día.
Sabemos la cantidad de autos que se venden por día por ende podemos calcular las
probabilidades de cada uno de los valores que puede asumir la variable:
f (0) = 54/300 = 0.18
f (1) = 117/300 = 0.39
f (2) = 72/300 = 0.24 La suma de todas las probabilidas
debe ser igual a 1
f (3) = 42/300 = 0.14
f (4) = 12/300 = 0.04
f (5) = 3/300 = 0.01
27
Valor Esperado y Varianza
Valor Esperado:
“El valor esperado o media, de una variable aleatoria es su medida de posición central”.
Dicho valor no necesariamente debe ser un valor que la variable deba asumir. Sino que es
el promedio ponderado de todos los valores que asume la variable aleatoria.
Forma de cálculo:
Ejemplo:
Varianza:
Se la utiliza para resumir la variabilidad en los valores de una variable aleatoria.
Una parte fundamental de la varianza es la desviación, que mide a que distancia está el
valor esperado de un valor particular de la variable aleatoria.
Forma de cálculo:
Ejemplo:
28
o Desviación estándar: Raíz cuadrada positiva de la varianza.
Distribución de Bermoulli
29
Función de probabilidad Binomial
30
2) La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la
ocurrencia o no ocurrencia del otro intervalo.
Al trabajar con este tipo de distribución es importante saber que tanto el VALOR
ESPERADO como la VARIANZA son iguales.
31
Distribución de probabilidad Hipergeométrica
La distribución de probabilidad hipergeométrica mantiene una relación estrecha con la
distribución de probabilidad binomial, pero difiere de esta última en dos puntos
esenciales:
1) Sus ensayos no son independientes.
2) Su probabilidad de éxito varía de un ensayo a otro.
La función de probabilidad se utiliza para hipergeométrica se utiliza para calcular la
probabilidad de que:
32
Solución:
UNIDAD 7
Distribuciones de probabilidad continuas
Una de las principales diferencias entre las variables aleatorias discretas y continuas
radica en la manera de calcular las probabilidades.
33
Distribución de probabilidad Uniforme
Ejemplo:
Variable aleatoria x = tiempo de vuelo de un avión que viaja de Chicago a Nueva York.
Dicho tiempo puede ser cualquier valor que se encuentre dentro del intervalo de
120 minutos hasta 140 minutos. Además, se cuenta con datos reales sobre los vuelos que
permiten concluir que:
La probabilidad de que el tiempo de vuelo este dentro de un intervalo de 1
minutos es IGUAL a la probabilidad de que se encuentre dentro de cualquier otro intervalo
de 1 minuto, siempre y cuando esos minutos se encuentren dentro del intervalo general
de 120;140 minutos.
Para el siguiente planteo tenemos la siguiente función de densidad:
34
Altura 1/20
Entonces = 10 * 1/20 = 0.50
Curva Normal:
35
o La curva norma tiene dos parámetros, la media y la desviación estándar, que
determinan la ubicación y la forma de distribución normal.
o El punto más alto de la curva representa a la media y coincide con la mediana y la
moda de la distribución.
o La media de este tipo de distribución puede ser negativa, positiva o incluso valer
cero.
o La distribución normal es simétrica, ya que la forma de la curva a la izquierda de la
media es exactamente igual a la forma de la curva a la derecha de la media y por
ende tampoco está sesgada.
o La desviación estándar determina que tan plana y ancha es la curva normal. Los
valores altos dan lugar a una curva más ancha y plana.
o La probabilidad también está representada por el área debajo de la gráfica (de la
curva normal) y el área total bajo la curva de una distribución normal es 1.
36
La razón por la que es tan importante estudiar la distribución normal
estándar radica en
que, para calcular
las
37