Está en la página 1de 92

TEORÍA DE DECISIONES

PPT 1

Profesor: Eduardo Barrera Robles


932456897

1
Descripción de la asignatura:

Al terminar el curso el alumno deberá ser capaz de analizar, evaluar y seleccionar entre varias
alternativas de gestión aquella que le permita optimizar el uso de los recursos.

Requisitos de entrada:

Fundamentos de Estadística.
Realizar operatoria asociada a matemáticas de ingeniería.

Objetivos específicos:

1.- Conocer y comprender la utilidad teórica y práctica de los métodos cuantitativos en el amplio
campo de la toma de decisiones.
2.- Analizar, evaluar las técnicas y metodología de la toma de decisiones, en la perspectiva de la
formulación y diseño de los modelos adecuados a problemáticas administrativas y económicas
factibles de ser tratadas cuantitativamente.
3.- Evaluar la aplicabilidad de diferentes algoritmos que permiten la solución de dichos modelos e
implementarlos acertadamente.
2
Plan de evaluaciones
Tipo de Evaluación Ponderación
EVP1 25% de NP
EVP2 35% de NP
EVP3 40% de NP
Guías de apoyo 10% en cada EVP
Nota de presntación a examen (NP) (0,25xEVP1)+(0,35xEVP2)+(0,4xEVPG)
Examen (EX) 30% de NF
Nota Final (NF) (0,7x NP)+(0,3xEX)

3
Agenda
• La toma de decisiones
• Definición
• Las etapas
• Los tipos
• Repaso de materias anteriores:
• Algoritmos
• Análisis de datos
• Tipos de variables
• Procesamientos de datos
• Estadística
• Regresión lineal
• Teoría de errores
• Inecuaciones

4
TOMA DE DECISIONES ¿Qué entiende por toma de decisiones?

La toma de decisiones se define como un proceso cognitivo de la elección RACIONAL entre


alternativas para conseguir la consecución de un objetivo o meta.

“Enamorarse puede ser un proceso afectivo, pero casarse es una decisión racional”

“La ausencia de lo racional en las decisiones puede llevarnos a perder la vida”

Es común que los ingenieros conciban la toma de decisiones como su actividad primordial, ya que
permanentemente deben determinar qué hacer, quién lo hará, cuándo y dónde lo hará y a veces
incluso cómo lo hará.

También se puede definir el término decidir como identificar y resolver los problemas que se le
presenta a toda organización. Por tanto, el desencadenante del proceso de toma de decisiones es la
existencia de un problema y nos preguntamos cuándo existe un problema. Luego, existirá un problema
cuando hay diferencia entre la situación real y la situación deseada.

5
ETAPAS EN LA TOMA DE DECISIONES

6
TIPOS DE DECISIONES

7
Secuenciales o Encadenadas

Es frecuente que nos encontremos en la empresa algunos procesos en los que el decisor debe adoptar una
secuencia de decisiones ya que una decisión en el momento actual puede condicionar y exigir otras
decisiones en momentos del tiempo posteriores. En estos casos para ayudarnos a la toma de decisiones se
utiliza una técnica denominada árbol de decisión.

8
La teoría de decisiones proporciona una manera útil de clasificar modelos para la toma de decisiones,
esta se clasifica en tres categorías

Una decisión bajo certidumbre es aquella en la que


quienes toman la decisión saben con certeza la
consecuencia de cada una de las alternativas que
implica la selección de la decisión.

Las decisiones bajo riesgo ofrecen más de una


opción y para la cual suponemos que quien toma la
decisión puede llegar a una estimación de
probabilidades de la ocurrencia de cada las
opciones.

La toma de decisiones bajo incertidumbre implica


que no se conoce las probabilidades de que
prevalezca una u otra de las opciones para elegir.

9
TEORÍA DE LA DECISIÓN

La Teoría de decisiones nace con fines Económico – Militar pero luego se abre a diversos campos como el
tecnológico, político, social, forestal, minero, agrícola, personal, etc.

Nuevas ideas han crecido por el estímulo de tales problemas y han originado extensos tratados de teoría
de juegos, programación matemática, teoría de colas, teoría de la información, control estadístico, etc.,
construyendo disciplinas aplicadas que llevan los nombres de Investigación Operativa, Ciencia de la
dirección y control, Análisis de sistemas, Cibernética, inteligencia de negocios, etc.

Todas ellas giran alrededor del problema típico de la decisión: Analizar científicamente varios cursos
de acción posibles para determinar el óptimo.

De modo genérico se puede decir que el método fundamental de enfrentarse a estos problemas es formar
modelos matemáticos (algoritmos) apropiados.

Un modelo es una imagen simplificada de la situación real, en que las relaciones empíricas se traducen
en relaciones matemáticas o lógicas entre los entes que se introducen en el modelo.

10
REPASO
PREVIO

11
¿que entiende por algoritmo?
Se puede entender un algoritmo como una secuencia de pasos finitos bien definidos que resuelven un
problema. Por ejemplo, la ejecución de tareas cotidianas tan simples como cepillarse los dientes,
lavarse las manos o seguir el manual de instrucciones de armado de un mueble, se pueden ver como
un algoritmo.

En resumen, un algoritmo debe ser suficiente para resolver el problema y ante varios algoritmos que
resuelvan el mismo problema, siempre será preferible el que tenga un camino más corto.
12
Diagrama de flujo del proceso
Sociedad Americana de Ingenieros Mecánicos –ASME

13
American National Standard Institute (ANSI)

14
International Organization
Instituto Alemán de Normalización (Deutches Institut fur
for Standarization (ISO)
Normung – DIN)

15
Usando diagramas de flujo, confeccionar un algoritmo para la resolución de la ecuación de 2do grado.

16
¿Qué es el análisis de datos?
El análisis de datos es el proceso de exploración, transformación y examinación de datos para
identificar tendencias y patrones que revelen insights (descubrimiento no obvio) importantes y
aumenten la eficiencia para respaldar la toma de decisiones. Una estrategia moderna de análisis de
datos les permite a los sistemas y a las organizaciones trabajar a partir de análisis automatizados en
tiempo real, lo que garantiza resultados inmediatos y de gran impacto.

Tipos de análisis de datos


• Análisis descriptivo: responde la pregunta “¿Qué
sucedió?” (¿Cuáles fueron nuestras ventas de la semana
pasada?)
• Análisis de diagnóstico: responde la pregunta “¿Por qué
esta sucediendo esto?” (¿Por qué aumentaron nuestras
ventas con respecto a la semana anterior?)
• Analítica predictiva: responde la pregunta “¿Qué
sucederá?” (¿Cómo creemos que serán nuestras ventas
en esas mismas tiendas durante la temporada
navideña?)
• Análisis prescriptivo: responde la pregunta “¿Qué debo
hacer?” (Según nuestras predicciones, recomendamos
enviar más cantidad de un producto determinado a fin
de evitar que se agote).
17
Los tipos de análisis de datos
1. Cualitativos
Expresan en muchas ocasiones opiniones, por lo tanto no son numéricos. Puedes obtenerlos a través
de encuestas de satisfacción, focus groups o entrevistas con usuarios, consumidores o clientes que
comparten impresiones sobre un producto, servicio o necesidades.

2. Cuantitativos
Son los que se expresan con números y se basan en información medible y comprobable.

Según su función se pueden clasificar en los siguientes grupos:


A. Descriptivos
Explican, por el ejemplo, el desempeño de las ventas de una organización o las ganancias obtenidas
durante un periodo específico. Ayudan a responder lo que sucede dentro de un área, al finalizar un
esfuerzo de marketing o en la empresa en general.

B. De diagnóstico
Son los que permiten comprender por qué sucede lo que acabas de concluir con un análisis
descriptivo. Es más complejo de llevarse a cabo; de ahí la importancia de contar con herramientas
que te ayuden a procesar tus datos y hacer evidente dónde debes hacer ajustes para alcanzar tus
objetivos la próxima vez. 18
C. Predictivos
Gracias a un modelo predictivo de análisis de datos es posible hacer proyecciones para el futuro de la
empresa: cuánto sería necesario invertir para alcanzar la competencia, cuánto espera vender en los
siguientes meses, cómo podría comportarse el mercado. Todo gracias al análisis e interpretación de
datos históricos confiables. Es el que permite adelantarse a escenarios (favorables y no) y tomar medidas
de prevención si es necesario. Lo que nos lleva al siguiente tipo de análisis de datos.

D. Prescriptivos
Cuando se llevan a cabo los tres anteriores, entonces es posible crear una estrategia para tomar
decisiones futuras, que debe tener en cuenta lo que ha sucedido, por qué ha sucedido, qué puede pasar
y cuáles acciones deben tomarse en consecuencia. De esa forma, se crean modelos que utilizan mejor los
recursos e integran los datos en información valiosa.

19
E. Data driven (IMPULSADOR DE DATOS)
Finalmente, la clasificación data driven está basada en la forma en que la era digital obtiene una
cantidad abrumadora de datos. Es difícil seguirles el paso sin un software que los recolecte,
clasifique y presente para que las personas expertas en análisis haga las interpretaciones
oportunas. Aquí nos referimos a tres principales:

• Business intelligence: que es básicamente lo que hace una empresa con los datos que recibe
para mejorar su gestión y el impacto de su negocio.
• Big data: que se centra en todos los datos que se obtienen acerca del mercado, la competencia
y los clientes de una empresa en gran escala para predecir tendencias.
• Small data: la contraparte del anterior, que tiene en cuenta las segmentaciones especializadas y
se centra en cantidades más pequeñas, precisas y ordenadas de un negocio.

20
¿Cómo hacer el análisis de datos en tu organización? 6 pasos
1. Define la razón de tu análisis.
2. Establece lo que medirás y cómo lo harás.
3. Obtén los datos.
4. Clasifica los datos.
5. Analiza los datos.
6. Haz una interpretación de los datos
Herramientas de análisis de datos destacadas
1. Software para crear dashboards de KPI de HubSpot
2. Software de marketing analítico de HubSpot
3. Power BI
4. Google Analytics
5. Grow
6. Minitab
7. Tableau
8. Sisense
9. Qlik
10.Alteryx
11.Pepermint 21
Variable:
Se llama variable a una característica que se observa en una población o muestra, y a la cual se
desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo.
Una variable se puede clasificar de la siguiente manera.

a) Variable cuantitativa: es aquella que toma valores


numéricos.
• Continua: son valores reales. Pueden tomar cualquier
valor dentro de un intervalo. Ej. Peso, estatura, sueldos.
• Discreta: toma valores enteros. Ej. N° de hijos de una
familia, n° de alumnos de un curso.
b) Variable cualitativa: es aquella que describe cualidades. No
son numéricas.
• Nominal: son cualidades sin orden. Ej. Estado civil,
preferencia por una marca, sexo, lugar de residencia.
• Ordinal: son cualidades que representan un orden y
jerarquía. Ej. Nivel educacional, días de la semana,
calidad de la atención, nivel socioeconómico.

22
Tipos de variables

Variables Reflejan
Respuesta con significado cualidades/atributos:
numérico color, género, estado,
país, etc.

Resultado de la Cuantitativas Cualitativas


medición:
temperatura,
presión, peso,
impuestos, etc.
De naturaleza no
Continuas Discretas numérica (Nominal y
ordinal)

Resultado del conteo,


puede asumir cualquier
Toman cualquier valor Adoptan ciertos valor en un rango en
dentro de un intervalo valores con vacíos específico: número de
específico existentes autos, número de
estudiantes, número de
hijos, etc.
23
Medidas de estadística descriptiva

Tendencia Dispersión Forma Posición


Central

Media o Rango Asimetría Cuartiles


Mediana Moda
Esperanza

Simple Varianza Curtosis Deciles

Desviación
Ponderada Percentiles
Estándar

Coeficiente
Quintiles
de variación
24
PROCESAMIENTO DE DATOS

¿Qué diferencias hay entre universo población y muestra?


Población se refiere al universo, conjunto o totalidad de elementos sobre los que se investiga o hacen
estudios. Muestra es una parte o subconjunto de elementos que se seleccionan previamente de una
población para realizar un estudio.
Estadígrafos de tendencia central: Los estadígrafos de posición o de tendencia central son valores que
se ubican al centro de un conjunto de datos ordenados según su magnitud.
Estadígrafos de variabilidad o dispersión
La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor
central, generalmente la media aritmética.

Estadígrafos de forma
Su utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de
generar el gráfico.
Estadígrafos de Posición
Son medidas de localización, su función es informar del valor de la variable que ocupará la posición (en
tanto por cien) que nos interese respecto de todo el conjunto de variables.
25
Media aritmética
La media aritmética se calcula sumando los datos y dividiendo el resultado entre el número de datos, si x1,
x2 … xN son los datos, siendo N el número total de datos. Entonces la fórmula de la media aritmética es:

Media ponderada
En ocasiones, algunos de los datos son más importantes o tienen más peso que los demás, por lo que
cuando se calcula la media de los datos, se quiere que estos influyan más en el resultado, a cada dato Xi
le asigna un peso Pi y la media ponderada es:

Ej. Un inversionista tiene 1.200 acciones A cuyo valor promedio es $34 y 800 acciones B cuyo valor
promedio es $45. El valor promedio de las 2.000 acciones es:

26
Mediana: Es otra medida de posición o tendencia central. Se define como aquel valor de la variable que
supera la mitad de las observaciones y a su vez es superado por la otra mitad de ellas. Por esta razón, se la
considera como el valor central, ya que se divide a los datos en 2 grupos (las observaciones deben estar
ordenadas de mayor a menor).

*Par: n/2 y n/2+1 Impar: (n+1)/2

Moda: Es un estadígrafo que puede definirse como el valor mas frecuente o el valor de la variable que
presenta la mayor frecuencia absoluta.

27
Rango: es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una
población o muestra estadística.

Varianza: Es una medida de dispersión que Tomamos como ejemplo los siguientes datos de una
representa la variabilidad de una serie de datos población:
respecto a su media. Es la media aritmética de
los cuadrados de las desviaciones estándar. Se
denota por S2. No tiene una interpretación
directa al estar al cuadrado. A mayor dispersión
mayor valor de la varianza, a menor dispersión
menor valor de la varianza.

Parámetro

Estadística

28
Desviación estándar: Se designa por la letra S y se define como la raíz de la varianza. La desviación
estándar es mas usada que la varianza. Una de sus utilidades es medir la concentración de los
datos respecto a la media aritmética.

Coeficiente de variación: Se designa por la letra CV, el Coeficiente de Variación es una medida de
dispersión que permite el análisis de las desviaciones de los datos con respecto a la media y al mismo
tiempo las dispersiones que tienen los datos dispersos entre sí. Es de forma porcentual.

29
Coeficiente de asimetría: Mide el grado de asimetría de la distribución con respecto a la media. Un
valor positivo de este indicador significa que la distribución se encuentra sesgada hacia la izquierda
(orientación positiva). Un resultado negativo significa que la distribución se sesga a la derecha.

Curtosis: Determina el grado de concentración que presentan los valores en la región central de la
distribución. Cuanto mayor sea la curtosis, mayor la concentración de datos cerca de la media de la
distribución coexistiendo al mismo tiempo con una relativamente elevada frecuencia de datos muy
alejados de la misma
Para la distribución Normal

30
Los Estadígrafos de Posición tienen la propiedad de dividir la serie estadística en grupos de números iguales
de términos.

• Separan la muestra en grupos de 1%


Percentiles • Son 99

• Separan la muestra en grupos de 10%


Deciles • Son 9

• Separan la muestra en grupos de 20%


Quintiles • Son 4

• Separan la muestra en grupos de 25%


Cuartiles • Son 3

En cualquiera de los cuatro casos, la medida de posición seleccionada toma el valor de uno de los términos
o del punto medio entre dos términos.
Para el cálculo de estas tres medidas de posición es necesario arreglar los términos en forma creciente o
decreciente.
31
Tablas de frecuencia

Una tabla de frecuencias muestra de forma ordenada un conjunto de datos estadísticos y a cada uno
de ellos le asigna una frecuencia que, en pocas palabras, son las veces que se repite un número o
dato. Puedes usar las tablas de frecuencias para ordenar variables cuantitativas o cualitativas.
Tipos de frecuencias

Frecuencias absolutas: son el número de veces que se repite un número en un conjunto de datos.

Frecuencias absolutas acumuladas: es la suma de las frecuencias absolutas.

Frecuencia relativa: corresponde a las veces que se repite un número en un conjunto de datos
respecto al total, pero se expresa en porcentajes (%).

Frecuencia relativa acumulada: es la suma de las frecuencias relativas.

32
Paso 1: Paso 2:

Reúne los datos. Crea una nueva tabla. En la primera columna, ubica las
notas de 1 a 10, de menor a mayor. En la segunda
columna, escribe la cantidad de veces que se repite cada
nota y llama a estos datos frecuencia absoluta

33
Paso 3:

Hasta aquí tienes una tabla de frecuencias


sencilla, pero también puedes agregarle una
columna más para calcular la frecuencia
absoluta acumulada. Sus valores se obtienen
sumando los datos en diagonal.

Por ejemplo: el primer número siempre va a ser


igual al primer dato de la frecuencia absoluta, en
este caso es cero. Luego, para obtener el
segundo dato, necesitas sumar el cero con el dos,
que es el segundo número de la frecuencia
absoluta y justamente, el que está ubicado de
forma diagonal. Entonces: 0 + 2 = 2.

34
Paso 4:
¡Continuemos con la tabla de frecuencias del salón de clases! Añade una cuarta columna con el
nombre frecuencia relativa. Toma cada dato de la frecuencia absoluta y divídelo en 20, que es la
cantidad de datos totales que tienes. Así:

0 ÷ 20 = 0 2 ÷ 20 = 0,1 1 ÷ 20 = 0,05

35
Paso 5:
Para la frecuencia relativa acumulada debes sumar los datos en diagonal, como lo hicimos para la
frecuencia absoluta acumulada.

Entonces, el primer número siempre va a ser igual al primer dato de la frecuencia relativa, en este caso
es cero. Luego, para obtener el segundo dato, necesitas sumar el cero con el 0,1, que es el segundo
número de la frecuencia relativa y justamente, el que está ubicado de forma diagonal. Así:

0 + 0,1 = 0,1 0,1 + 0,05 = 0,15 0,15 + 0,1 = 0,25

36
Diferencias entre datos agrupados y datos no agrupados
La diferencia entre datos agrupados y datos no agrupados no reside ni en la forma de obtenerlos ni en el
tipo de datos que son. La diferencia se encuentra en el tratamiento que se le ha dado a los datos una
vez que han sido recogidos.

Simplificando, los datos no agrupados son aquellos que tras ser recopilados no se ha hecho nada con
ellos, también se incluyen en este grupo los que han sido ordenados. Sin embargo, los datos agrupados
han sido clasificados generalmente por frecuencia.

Para que quede más claro, imaginemos que queremos saber a qué hora se despierta un bebé a lo largo
de una semana. Para ello, anotaremos la hora a la que se despierta cada uno de los días. Los datos tal y
como se obtienen son datos no agrupados:

37
Sin embargo, los datos agrupados se presentarían por el número de veces que se ha despertado el
bebé por cada una de las horas. La siguiente tabla lo muestra:

38
SUGERENCIAS PARA CONSTRUIR TABLAS DE FRECUENCIAS E HISTOGRAMAS

- El número de clases (intervalos) debe ser entre 5 y 20, dependiendo del rango y del número
total de datos.
- Todos los datos deben estar incluidos en alguna clase.
- Es conveniente que el ancho de clase sea igual para todas las clases, aunque en algunos casos
pueden elegirse anchos diferentes en cada clase, dependiendo de la distribución de los datos.
Sea M=numero de clases; C=ancho de clase; R=Rango
opción 1) Si se elige un número M de clases, entonces C=ancho de clase se determina: C=R/M
opción 2) Si se elige el ancho de clase C, entonces M=número de clases se determina: M=R/C
Redondeando hacia arriba en cada caso.
- El ancho de clase en definitiva es la diferencia entre la frontera superior y la frontera inferior
de la clase.
- Los límites aparentes tienen los mismos dígitos significativos que los datos (decimales).
- En los límites aparentes, el límite superior de una clase y el límite inferior de la siguiente clase
deben tener un dígito significativo de diferencia.
- Para el caso de datos continuos se requiere obtener la marca de clase, que es el punto medio
del intervalo de la clase, se denota por su valor es obtenido al promediar los extremos del
intervalo.
39
ALGUNAS PROPUESTAS COMUNES PARA DETERMINAR EL NÚMERO DE CLASES

Regla de Sturges:
𝑁𝑁𝑁 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 = 1 + 3.322 ∗ 𝐿𝐿𝐿𝐿𝐿𝐿(𝑛𝑛)
Donde n=número de datos

Regla de Scott:
3.5 𝑆𝑆 1
−3
𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 = 3 → 3.5 𝑆𝑆 𝑛𝑛
𝑛𝑛
Donde S= Desviación Estándar y n=número de datos

Excel por tabla dinámica:

A criterio del diseñador

40
Ejemplos con Excel

Variables cualitativas

Variables cuantitativas
Datos no agrupados
Datos agrupados

41
Activación de Conocimientos previos
Constituyen una rama de las Mide la mayor o
matemáticas que se ocupa de menor posibilidad de
medir o determinar que se dé un
cuantitativamente la posibilidad determinado
de que un suceso o experimento resultado (suceso o
produzca un determinado evento) al realizar un
resultado. experimento
aleatorio.

¿Qué es la Probabilidad?
La probabilidad de un Toma valores
suceso indica el grado entre 0 y 1 (o
de confianza que expresados en
La probabilidad 0 indica que tanto por ciento,
podemos tener en que el resultado no ocurrirá
%)
ese suceso ocurra. nunca.
La probabilidad 1 que el
resultado ocurrirá siempre.

42
Los experimentos (o fenómenos) aleatorios son aquellos en los que no se puede predecir el
resultado. Ejemplo: lanzar un dado.

Si se puede predecir el resultado, es un experimento determinista. Ejemplo: Extraer una bola de


una urna que sólo contiene bolas rojas es un experimento determinista ya que podemos predecir
que la bola extraída será roja.

Espacio Muestral (denotado E, Ω o U): Es el conjunto de los resultados posibles de un experimento


aleatorio.

Lanzamiento de un dado Lanzamiento de una moneda


E={1, 2, 3, 4, 5, 6} E={cara, sello}
E ={n° par , n° impar}
43
Probabilidad Simple o Clásica ( Regla de Laplace)
Esta definición clásica de probabilidad fue una de las primeras que se dieron (1900) y se atribuye a Laplace;
también se conoce con el nombre de probabilidad a priori pues, para calcularla, es necesario conocer, antes de
realizar el experimento aleatorio, el espacio muestral y el número de resultados o sucesos elementales que
entran a formar parte del suceso. En este caso todos los posibles resultados del experimento aleatorio poseen
igual probabilidad, es decir, son equiprobables.

Evento o suceso (A): es el resultado particular de un experimento aleatorio. Es


una parte o subconjunto de este.

Ejemplos
a) ¿Cuál es la probabilidad de obtener cara al lanzar una moneda? E={cara, sello} A= Obtener cara.
𝑷𝑷 ( 𝑨𝑨) = ½= 𝟎𝟎, 𝟓𝟓 →50%
b) ¿Cuál es la probabilidad de obtener el número 6 al lanzar un dado? E={1, 2, 3, 4, 5, 6} B = Obtener el número 6.
𝑷𝑷 (𝑩𝑩) = 1/6= 𝟎𝟎, 𝟏𝟏𝟔𝟔𝟔𝟔. . → 𝟏𝟏𝟔𝟔, 𝟕𝟕%

c) En bolsa hay 10 bolitas, 2 blancas, 3 rojas y 5 azules. ¿Cuál es la probabilidad de que al sacar una bola
blanca ? E={rojas, blancas, azules} C = Obtener bola blanca.
𝑷𝑷 (𝑪𝑪) = 2/10=0, 𝟐𝟐 → 𝟐𝟐𝟎𝟎% 44
Regla de la suma o adición de probabilidades

La regla de adición o regla de la suma, establece que si tenemos un evento A y un


evento B, la probabilidad de que ocurra el evento A o el evento B se calcula de la
siguiente manera:
P(A⋃B) = P(A) + P(B) − P(A⋂B)
Donde:

P(A) : probabilidad de que ocurra el evento A.


P(B) : probabilidad de que ocurra el evento B.
P(A⋃B) : probabilidad de que ocurra el evento A o el evento B.
P(A⋂B) : probabilidad de que ocurra el evento A y el evento B a la vez.

P(A o B) = P(A⋃B) unión.

P(A y B) = P(A⋂B) intersección.

45
¿Y si los eventos son mutuamente excluyentes?

Dos eventos A y B son mutuamente excluyentes si no pueden ocurrir al mismo


tiempo, es decir, si no tienen elementos comunes. Por ejemplo, sacar una carta al
azar de una bajara, y obtener un 5 y un 7, son eventos mutuamente excluyentes,
ya que no hay ninguna carta que tenga un 5 y un 7 al mismo tiempo. Entonces
P(A⋂B) = 0 , por lo tanto, partiendo de la misma fórmula, obtendríamos la
siguiente expresión:

P(A⋃B) = P(A) + P(B) − P(A⋂B)

P(A⋃B) = P(A) + P(B) − 0

P(A⋃B) = P(A) +P(B)

Caso contrario:
P(A o B)= P(A⋃B) = P(A) + P(B) − P(A y B) si A y B son no excluyentes.

46
Ejemplo 1:
La probabilidad de que un día cualquiera, Carlos almuerce pollo frito es de 0,4.
La probabilidad de que almuerce hamburguesa es de 0,3; mientras que la
probabilidad de que almuerce pollo frito y hamburguesa el mismo día es de
0,1. Calcula la probabilidad de que un día cualquiera, Carlos almuerce pollo
frito o hamburguesa.
Definimos nuestras probabilidades:

Probabilidad de que Carlos almuerce pollo frito: P(A) = 0,4.


Probabilidad de que Carlos almuerce hamburguesa: P(B) = 0,3.
Probabilidad de que Carlos almuerce pollo frito y hamburguesa el mismo día:
P(A⋂B) = 0,1.
Probabilidad de que Carlos almuerce pollo frito o hamburguesa:
P(A⋃B) = ?
P(A⋃B) = P(A) + P(B) − P(A⋂B)

P(A⋃B) = 0,4 + 0,3 − 0,1

P(A⋃B) = 0,6
47
Ejemplo 2:
Considere el lanzamiento de una dado normal, ¿Cuál es la probabilidad
de obtener un 2 o 4?

Ejemplo 3:
Considerando una polla en el barrio para el próximo domingo de 100
números. ¿Cuál es la probabilidad que número asociado al premio mayor
del sorteo, sea un número mayor a 79 o número par?

Ejemplo 4:
Las bolas de 1 a 5 son bolas blancas y las numeradas de 6 hasta 10 son de
color rojo. Se selecciona de la bolsa un bola aleatoriamente ¿cuál es la
probabilidad que sea de color blanca o impar?

48
Regla del producto o multiplicación de probabilidades

La regla de la multiplicación establece que la probabilidad de


ocurrencia de dos o más eventos estadísticamente independientes es
igual al producto de sus probabilidades individuales

P (A y B) = P (A ∩ B) = P (A) ·P (B)

si A y B son independientes. Decimos que dos sucesos A y B son


independientes entre sí, cuando la ocurrencia de uno de ellos no
modifica la probabilidad del otro.

P (A y B) = P (A B) = P (A) ·P (B|A)

si A y B son dependientes. Decimos que dos sucesos A y B son dependientes


entre sí, cuando la ocurrencia de uno de ellos modifica la probabilidad del
otro. Donde P (B|A) es la probabilidad de B habiendo ocurrido A.

49
Ejemplo 1:
¿Cuál es la probabilidad que al lanzar una moneda tres veces, esta caiga las
tres veces cara?
En este ejercicio son sucesos independientes por lo que se ocupara la fórmula de
probabilidades independientes
P (a y b y c)= P(a ᴖ b ᴖ c) = P(a) * P(b) * P(c)
a, b y c es la probabilidad de salir cara
P(a ᴖ b ᴖ c) = 1/2 * 1/2 * 1/2
P(a ᴖ b ᴖ c) = 1/8
P(a ᴖ b ᴖ c) = 0.125 * 100%
P(a ᴖ b ᴖ c) = 12.5%
Ejemplo 2:
Una caja contiene 2 canicas azules y 3 rojas. Si se extraen dos canicas al azar sin
reposición, ¿cuál es la probabilidad de que las dos sean azules?
Dado que las canicas serán extraídas de la misma caja, y que las canicas que se extraigan,
no serán devueltas a la caja (no hay reposición), entonces, se trata de eventos
dependientes.

Evento A: obtener una canica azul en la primera extracción.


Evento B: obtener una canica azul en la segunda extracción.
Por la regla de la multiplicación, sabemos que: 50
Probabilidades con Diagrama de árbol

¿Cómo calcular probabilidades en el


diagrama del árbol?

51
Ejemplo:
En la sala de clases hay 12 estudiantes que tienen celular y 5 estudiantes que no poseen celular. Al elegir
tres personas al azar:¿Cuál es la probabilidad de que los tres tengan celular? y ¿Cuál es la probabilidad de
que dos de ellos tengan celular?

52
• ¿Cuál es la probabilidad de que los tres tengan celular?

53
• ¿Cuál es la probabilidad de que dos de ellos tengan celular?

54
DISTRIBUCIONES DE PROBABILIDADES
Hay muchos sucesos que están modelizados a través de distribuciones de probabilidad. A continuación
vamos a detallar las más conocidas.
Distribuciones discretas Distribuciones continuas
1. Distribución uniforme discreta (n,k) 1. Distribución uniforme o rectangular (a,b)
2. Distribución binomial (n,p) 2. Distribución normal (, S)
3. Distribución hipergeométrica (N,R,n) 3. Distribución lognormal (, S)
4. Distribución geométrica (p) 4. Distribución logística (a, b)
5. Distribución binomial negativa (r,p) 5. Distribución beta (p,q)
6. Distribución Pascal (r,p) 6. Distribución gamma (a,p)
7. Distribución Poisson (λ) 7. Distribución exponencial (λ)
8. Distribución ji-cuadrado (n)
9. Distribución t de Student (n)
10. Distribución F de Snedecor (n,m)
11. Distribución Cauchy (, ѳ)
12. Distribución Weibull (a, b)
13. Distribución Laplace (a, b)
14. Distribución Pareto (α, x0)
15. Distribución triangular (a, c, b)
55
Ejemplos de distribuciones de probabilidad

Ten en cuenta que las explicaciones y ejemplos que vas a ver a continuación requieren saber un
poquito de Matemáticas. Además no están contados en profundidad, puesto que eso requeriría
conocimientos avanzados de varios conceptos y técnicas de cálculo. Estos ejemplos se ofrecen
como algo meramente ilustrativo de cómo se hace a veces para calcular probabilidades de diversos
sucesos.

Para empezar vamos a explicar dos conceptos matemáticos: el factorial de un número y número
combinatorio.

El factorial de un número natural n se denota por n! y se define como sigue:


n! = n * (n-1) * ... * 2 * 1
Por ejemplo: 8! = 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1 = 40.320
n
Se denomina número combinatorio n sobre k, y se denota por   a la expresión
k 

 n  = n!
 k  k!*(n − k)!
56
Ejemplos de distribuciones de probabilidad

En los números combinatorios, n y k deben ser números naturales, y además k debe ser siempre
menor o igual que n.

Los números combinatorios sirven para calcular de cuántas formas podemos hacer una selección
de k objetos a elegir de entre n elementos.

Por ejemplo, un juego tipo Loto que consiste en escoger 6 números de entre 49 y apostar porque
nuestros seis números van a ser los extraídos. Si hacemos una apuesta simple, la probabilidad que
tenemos de ganar el primer premio es de una frente a todas las maneras que haya de seleccionar
6 números de entre 49, sin que haya números repetidos y sin que nos importe el orden en el que se
extraen. La respuesta a esto nos la da el número combinatorio

En resumen, la probabilidad de ganar el primer premio de este juego haciendo una única apuesta
es de una entre casi catorce millones.

57
1- La distribución Uniforme Discreta:

Es una función de probabilidad para variables discretas. Un suceso aleatorio se dice que
sigue una distribución uniforme discreta si tiene un número finito de resultados y los
resultados son equiprobables; en este caso, la probabilidad de cualquiera de los
resultados individuales es:
1
Nº de resultados

La distribución uniforme discreta utiliza la regla de Laplace.

58
Ejemplo de distribución uniforme discreta: saliendo del metro

Hemos quedado con un amigo en una zona de la ciudad que no conocemos, sólo sabemos la
parada de metro. Cuando llegamos el metro tiene cuatro salidas y no sabemos por cuál hay que
salir. Sólo hay una salida que nos lleva a nuestro amigo, ¿cuál es la probabilidad de que
escojamos la salida buena?

Hay cuatro opciones para escoger (4 resultados posibles), y como no tenemos ninguna información
adicional sobre la salida correcta, asignamos a todas la misma probabilidad de ser la correcta
(sucesos equiprobables).
Hay una salida buena (1 resultado favorable).

Entonces la probabilidad de escoger la salida buena es 1/4 = 0,25 = 25%

59
2- La distribución Binomial

Es otra función de probabilidad para variables discretas. Cuando un suceso aleatorio cumple las
siguientes condiciones :

• Sólo tiene dos resultados, que llamaremos E (de éxito) y F (de fracaso)
• La probabilidad de que el resultado del suceso sea E es p y la de F es q, y además se cumple que
p+q=1, o lo que es lo mismo, 1-p = q.

si el suceso se repite n veces y queremos estudiar el número de veces que se obtiene como
resultado E, la probabilidad de que, repitiendo el experimento n veces aparezca r veces E, será:

Se dice que este tipo de sucesos sigue una distribución binomial.

=n*p y S=√(𝑛𝑛 ∗ 𝑝𝑝 ∗ 𝑞𝑞)

60
Ejemplo de distribución binomial: la sobre venta de pasajes en los aviones

Una compañía aérea tiene un avión de 100 plazas. Como casi siempre hay pasajeros que
fallan, la compañía decide vender más billetes que plazas hay en el avión. Se sabe que un
viajero tiene un 90% de probabilidades de acudir al aeropuerto y coger el vuelo. Un día la
compañía vende 110 billetes, ¿cuál es la probabilidad de que ese día se presenten 105
pasajeros y por lo tanto exista sobre venta?
P(r=105)=
En este caso:
E = el viajero se presenta en el aeropuerto, con probabilidad p = 0,9
F= el viajero no se presenta en el aeropuerto, con probabilidad q=1-p= 1– 0,9 = 0,1
n = 110 pasajeros que han comprado el billete
r = 105 número de éxitos (viajeros que se presentan para coger el vuelo)

110  105 110−105


P(se presentan 105 pasajeros) =  105  * 0,9 * 0,1 ≈ 0,019 =1,9%
 

61
Se lanza una moneda, sus dos posibles resultados son cara o sello. Si el evento a medir es el que al
lanzarla salga cara, su resultado es éxito (si sale cara) o fracaso (si sale sello).
Cuando este proceso se repite n veces y se cuenta la cantidad de veces que resultó el éxito en las
n repeticiones, estamos frente a una distribución binomial.

La solución óptima (obtenida


por POM QM)

Ej. : Si se lanza una moneda 10 de veces. ¿Cuál es


la probabilidad que salga cara 6 veces?
P(r=6)=

62
b) Salgan al menos cuatro caras

P(r >=4)= (0,2051+0,2461+0,2051+0,1172+0,0439+0,0098+0,001)=0,8282

P(r >=4)= 1- P(r< 4)= 1- (P(r= 0)+ P(r= 1) + P(r =2) +P(r=3)) =1-(0,001+0,0098+0,0439+ 0,1172)=0,8282
c) Salgan entre cuatro y seis caras

P(4<=r<=6)= P(r=4)+ P(r=5) + P(r =6)= 0,2051+0,2461+0,2051=0,6565

d) Salgan menos de 4 caras

P(r <4)= P(r= 0)+ P(r= 1) + P(r =2) +P(r=3) =0,001+0,0098+0,0439+ 0,1172=0,1719

63
1.- Cada muestra de aire tiene 10% de posibilidades de contener una molécula rara particular. Suponga que las
muestras son independientes con respecto a la presencia de la molécula rara. Encuentre la probabilidad de que
en las siguientes 18 muestras, exactamente 2 contengan la molécula rara.
Sea r=número de muestras de aire que contiene la molécula rara en la siguientes 18 muestras analizadas. Entonces r
es una variable aleatoria binomial con p=0,2 y n=18. Por lo tanto,

2.- El jefe de recursos humanos de una empresa realiza un test de diez ítems a los aspirantes a un puesto, teniendo
en cada ítems cuatro posibles respuestas, de las que sólo una es correcta. Suponiendo que los aspirantes teniendo
la misma probabilidad de responder. Se pide hallar las probabilidades para el aspirante:

a) Conteste todos los ítems mal


b) Conteste al menos cuatro ítems bien
c) Conteste entre cuatro y seis ítems bien
d) Conteste todos los ítems bien
e) Conteste menos de tres ítems bien

64
3- La distribución de Poisson

Es otra función de probabilidad para variables discretas. La distribución de Poisson es un modelo


de probabilidad que se utiliza para medir la probabilidad de ocurrencia de un fenómeno aleatorio
en un intervalo de tiempo o en una región. Por ejemplo, las llamadas de teléfono a una central en
una hora, el número de accidentes de tráfico por semana, el número de piezas defectuosas, el
número de personas que llegan a una tienda de autoservicio en un tiempo determinado, el número
de solicitudes de seguro procesados por una compañía en un período especifico, número de
usuarios que se conectan a internet durante un día, etc.

A diferencia de la distribución binomial, esta variable toma valores discretos infinitos.


El parámetro λ es el nº promedio de ocurrencia del evento por unidad de tiempo o por intervalo de
referencia.
λ=  =S2

La distribución de Poisson de parámetro λ establece que la probabilidad de que ocurran x


fenómenos en un intervalo (temporal o espacial) dado es:

65
Ejemplo de distribución de Poisson: ¿cuántos goles se meterán en el partido?

Sabemos que el número de goles que se meten en un partido de fútbol sigue una distribución de
parámetro λ=2 (dato ficticio). ¿Cuál es la probabilidad de que el próximo partido, entre un equipo y
otro se marquen en total 8 goles?
x=8
λ=2 28 e −2
P(x=8)= ≈ 0,00086 = 0,086%
8!
b) Se marquen al menos cuatro goles

P(X >=4)= P(X=4)+ P(X=5) + P(X=6)+P(X=7)+ P(X=8) + P(X=9)+P(X=10)+P(X=11) = 0,14288

c) Se marquen entre cuatro y seis goles

P(4<=X<=6)= P(X=4)+ P(X=5) + P(X=6)= 0,09022+0,03609+0,01203=0,13834

La solución óptima (obtenida


por POM QM)
66
d) Se marquen menos de 2 goles

P(X <2)= P(X= 0)+ P(X= 1)=0,13534+0,27067=0,40601

Suponga que el nº de llamadas que llegan a una central telefónica es de 0,5 por minuto en
promedio. Encuentre la probabilidad que en 1 minuto no lleguen llamadas.
x=0
λ=0,5

b) Lleguen al menos cuatro llamadas

c) Lleguen entre dos y cinco llamadas

d) Lleguen menos de dos llamadas

La solución óptima (obtenida


por POM QM)
67
1. Supongamos que el número de imperfecciones en un alambre delgado de cobre sigue una distribución Poisson
con una media de 2.3 imperfecciones por milímetro.
(a) Determine la probabilidad de 2 imperfecciones en un milímetro de alambre.
(b) Determine la probabilidad de 10 imperfecciones en 5 milímetros de alambre.

2. La contaminación constituye un problema en la fabricación de discos de almacenamiento óptico. El número de


partículas de contaminación que ocurre en un disco óptico tiene una distribución de Poisson y el número promedio
de partículas por centímetro cuadrado de superficie del disco es 0.1. El área de un disco bajo estudio es 100
centímetros cuadrados.
(a) Encuentre la probabilidad de que ocurran 12 partículas en el área del disco bajo estudio.
(b) La probabilidad de que ocurran cero partículas en el área del disco bajo estudio.

3. El número de pinchazos en los neumáticos de cierto vehículo industrial tiene una distribución de Poisson con
media 0.3 por cada 50000 kilómetros .Si el vehículo recorre 100000 km, se pide:
a) probabilidad de que no tenga pinchazos
b) Probabilidad de que tenga menos de tres pinchazos

68
4- La distribución Exponencial

La distribución exponencial es una distribución continua que se utiliza para modelar tiempos de
espera para la ocurrencia de un cierto evento. Suele referirse a la cantidad de tiempo que
transcurre hasta que se produce algún evento específico. Por ejemplo, la cantidad de tiempo (que
comienza ahora) hasta que se produzca un terremoto tiene una distribución exponencial.

El parámetro de decaimiento λ es el nº promedio de ocurrencia del evento por unidad de tiempo o


por intervalo de referencia.

La esperanza (Media) de una variable exponencial es =1/λ y S= 

Se dice que un suceso aleatorio sigue una distribución exponencial de parámetro λ si el fenómeno
sólo toma resultados positivos y además la probabilidad de que el fenómeno:

tenga un resultado de valor menor o igual que x es:

69
tenga un resultado de valor mayor o igual que x es:

tenga un resultado de valor mayor X1 y menor que X2 es:

P(X1 < x < X2) = P(x > X1) – P(x < X2)

70
Ejemplo 1: El tiempo de revisión del motor de un avión sigue una distribución exponencial con media 22
minutos. Encontrar la probabilidad de que el tiempo de revisión sea menor a 10 minutos.

La solución óptima (obtenida


por POM QM)

Ejemplo 2: En promedio, una determinada pieza de computadora dura diez años. El tiempo que dura la parte de la
computadora se distribuye exponencialmente. ¿Cuál es la probabilidad de que una pieza de computadora dure más de
7 años? Y ¿Cuál es la probabilidad de que una pieza de computadora dure entre nueve y 11 años?

La solución óptima (obtenida


por POM QM)

71
1.- El tiempo de vida de una lámpara especial sigue una distribución exponencial con media 100 hrs. ¿Cuál es
la probabilidad de que una lámpara dure por lo menos 30 horas?

2.- Sabemos que la duración de una bombilla es un fenómeno aleatorio que sigue una distribución exponencial de
parámetro λ = 0,001. ¿Cuál es la probabilidad de que la bombilla se funda antes de llevar 2000 horas encendida?

3.- Supongamos que la duración de una llamada telefónica, en minutos, es una variable aleatoria exponencial con
parámetro de decaimiento 1/12 . El decaimiento p[parámetro] es otra forma de ver 1/λ. Si otra persona llega a un
teléfono público justo antes que usted, calcule la probabilidad de que tenga que esperar más de cinco minutos.
Supongamos que X = la duración de una llamada telefónica en minutos.

72
5- La distribución Normal
La mas utilizada de las distribuciones, esta distribución con un gráfico como campana se centra en el valor
promedio, denominado  y su dispersión respecto a él, se denomina S, llamada desviación estándar.
La función normal describe de forma aproximada muchos fenómenos que suceden en la naturaleza tales
como la estatura de las personas, el coeficiente intelectual en los niños, etc. Muchas mediciones que se
hacen en forma natural tienden a tener distribuciones de frecuencia relativa que se asemejan mucho a la
curva normal, probablemente porque la naturaleza tiende a promediar los efectos de las distribuciones
variables que intervienen en una respuesta determinada.

73
1. Los pesos de 2 000 soldados presentan una distribución normal de media 65 kg y desviación típica 8 kg.
Calcula la probabilidad de que un soldado elegido al azar pese:
a) Más de 61 kg.
b) Entre 63 y 69 kg.
c) Menos de 70 kg.
d) Más de 75 kg

2. Considere una población de recién nacidos, en los cuales interesa estudiar la variable talla.
Se puede suponer que la talla de los recién nacidos es una distribución normal con esperanza 50 cm y desviación
estándar 2 cm.
(a) ¿Cual es la probabilidad de que un niño mida menos de 45 cm al nacer?
(b) ¿Cual es la probabilidad de que un niño al nacer mida a lo menos 52 cm?
(c) ¿Que porcentaje de recién nacidos que mide entre 48 y 52 cm ?
(d) Si nacen 200 niños en un mes, ¿cuantos de ellos medirán entre 48 y 52 cm?

3. Los salarios mensuales de los recién graduados que acceden a su primer empleo se distribuyen según una
ley normal de media $1.300.000 líquidos y desviación típica $300.000. Calcular el porcentaje de graduados que
cobran:
a) Menos de $600.000 al mes b) Entre $1.000.000 y $1.500.000 al mes c) Más de $2.200.000 al mes

74
Dato curioso: los sucesos aleatorios en el mundo real

Los ejemplos del lanzamiento de la moneda y el dado son los ejemplos típicos de sucesos aleatorios, pero
no parecen muy naturales. ¿Qué otras cosas aleatorias hay en el mundo? Vamos a ver algunos ejemplos.

1- La altura de una persona, o en general el tamaño de cualquier ser vivo. La estatura que alcanzamos
viene determinada genéticamente pero sólo en parte. La otra parte son los factores ambientales, que se
pueden controlar más o menos, pero nunca completamente: alimentación durante el periodo de
crecimiento, padecimiento de ciertas enfermedades, exposición a factores que alteren el crecimiento
(consumo de sustancias nocivas etc). Todo esto hace que no se puede predecir la estatura que alcanzará
una persona con exactitud.

75
Regresión lineal: Método causal en el que una variable (conocida como variable dependiente), esta
relacionada con una o mas variables independientes por medio de una ecuación lineal.

Variable dependiente: Variable que se desea pronosticar su comportamiento (su comportamiento


depende de las variables independientes)

Variable independiente (explicativa): Variables que se supone influyen en la variable dependiente, y por
ende, son la “causa” de los resultados obtenidos en el pasado.

Regresión lineal simple: Una sola variable dependiente explica el comportamiento de la variable
independiente.

Regresión lineal múltiple: Dos o mas variables dependientes explican el comportamiento de la variable
independiente.

76
Coeficiente de correlación R: Es una medida que indica el nivel de asociación entre las variables
dependiente e independientes en un modelo de regresión lineal.

Coeficiente de determinación R2: Es una medida que indica porcentualmente el cambio de la variable
dependiente respecto de la independiente.

Interpretación del coeficiente de determinación


Supongamos que queremos explicar la cantidad de goles
que anota Cristiano Ronaldo según la cantidad de
partidos que juega. Suponemos que, a mayor cantidad
de partidos jugados, más goles meterá. Los datos
pertenecen a las últimas 8 temporadas. De tal manera,
tras extraer los datos, el modelo arroja la siguiente
estimación:

Cómo podemos ver en el gráfico, la relación es positiva. A más partidos jugados, como es lógico, más
goles anota en la temporada. El ajuste, según el cálculo del R cuadrado, es de 0,835. Esto quiere decir
que es un modelo cuyas estimaciones se ajustan bastante bien a la variable real. Aunque técnicamente
no sería correcto, podríamos decir algo así como que el modelo explica en un 83,5% a la variable real.
77
El problema del coeficiente de determinación
El problema del coeficiente de determinación, y razón por el cual surge el coeficiente de determinación
ajustado, radica en que no penaliza la inclusión de variables explicativas (independientes) no significativas.
Es decir, si al modelo se añaden cinco variables explicativas que guardan poca relación con los goles que
anota Cristiano Ronaldo en una temporada, el R cuadrado aumentará. Es por ello que muchos expertos
económetras, estadísticos y matemáticos se oponen al uso del R cuadrado como medida representativa de
la bondad del ajuste real.
El coeficiente de determinación ajustado

El coeficiente de determinación ajustado (R cuadrado ajustado) es la medida que define el porcentaje


explicado por la varianza de la regresión en relación con la varianza de la variable explicada. Es decir,
lo mismo que el R cuadrado, pero con una diferencia: El coeficiente de determinación ajustado penaliza
la inclusión de variables.

Como hemos dicho anteriormente, el coeficiente de determinación de un modelo aumenta aunque las
variables que incluyamos no sean relevantes. Ya que esto supone un problema, para intentar
solventarlo, el R cuadrado ajustado queda tal que:

78
En la fórmula, N es el tamaño de la muestra y k el número de variables explicativas. Por deducción
matemática, a valores más altos de k, más alejado estará el R cuadrado ajustado del R cuadrado
normal. Al revés, a valores más bajos de k, más cerca estará de 1 la fracción central y, por tanto, más
parecidos serán el R cuadrado ajustado y el R cuadrado normal.

Recordando que k es el número de variables explicativas, deducimos que este no puede ser cero. Si
fuese cero, no existiría modelo. Como mínimo tendremos que explicar una variable en función de
otra variable. Dado que k debe ser como mínimo 1, el R cuadrado ajustado y el R cuadrado normal no
pueden tener el mismo valor. Es más, el R cuadrado ajustado será siempre inferior al R cuadrado
normal.
Dado un conjunto de pares ordenados (xi; yi) se pretende obtener la expresión analítica de una función
polinómica que produzca, en algún sentido, el mejor ajuste posible sobre ese conjunto de datos. Si
asumimos que los datos tienen una tendencia lineal entonces es posible representarlos a través de la
forma de la ecuación de la recta.

79
Ejemplo 1: La empresa X del rubro de venta de celulares
presenta una tabla con los datos de inversión en publicidad
y ventas obtenidas al final de cada periodo, le indican a
usted que requieren saber si existe una relación confiable
entre la inversión en publicidad y las ventas que se obtienen
a fin de poder estimar las ventas que recibirán si hacen una
inversión en publicidad de $8.000.000 para el periodo 11.
Inversion en
Periodo publicidad Ventas
1 $5.000.000 $160.000.000
2 $5.570.000 $189.380.000
3 $4.350.000 $139.200.000
4 $7.900.000 $260.700.000
5 $6.800.000 $217.000.000
6 $5.400.000 $183.600.000
7 $6.900.000 $234.600.000
8 $3.900.000 $136.500.000
9 $4.200.000 $138.600.000
10 $5.780.000 $202.300.000

80
Publicidad v/s Ventas y = 32,77138x + 3.323.716,88792

$300.000.000
R² = 0,97861 Var.Indepen Var. Dependiente
Inversion en
$250.000.000
Periodo publicidad Ventas
$200.000.000
1 $5.000.000 $160.000.000
2 $5.570.000 $189.380.000
ventas

$150.000.000
3 $4.350.000 $139.200.000
$100.000.000
4 $7.900.000 $260.700.000
5 $6.800.000 $217.000.000
$50.000.000
6 $5.400.000 $183.600.000
$0
7 $6.900.000 $234.600.000
$0 $2.000.000 $4.000.000 $6.000.000 $8.000.000 $10.000.000
8 $3.900.000 $136.500.000
Publicidad
9 $4.200.000 $138.600.000
10 $5.780.000 $202.300.000
11 $8.000.000 $265.494.757

81
Ejemplo 2: R&C es una empresa
fabricante de muebles, ha observado que Impuestos
Mes UF ($) Ventas K$
sus ventas no son lo esperado al pasar los ($K/und)
ene-21 $ 33 $ 2.214 $ 550.000
meses. Hay directivos que opinan que se feb-21 $ 30 $ 2.208 $ 590.000
debe al aumento de impuestos que mar-21 $ 33 $ 2.396 $ 510.000
abr-21 $ 27 $ 2.110 $ 605.000
impuso el gobierno para la importación may-21 $ 31 $ 2.232 $ 557.000
de materias primas, lo cual encarece el jun-21 $ 35 $ 2.215 $ 570.000
precio final de sus productos y por tanto jul-21 $ 30 $ 1.915 $ 590.000
ago-21 $ 30 $ 2.104 $ 600.100
el mercado compra menos. sept-21 $ 28 $ 1.971 $ 621.500
Otros indican que se debe al aumento en oct-21 $ 33 $ 2.112 $ 603.500
nov-21 $ 31 $ 2.169 $ 510.000
el valor de la UF que genera tanto sobre dic-21 $ 33 $ 2.187 $ 578.160
costos en la compra de materias primas y ene-22 $ 28 $ 2.013 $ 610.000
desestimula las exportaciones, haciendo feb-22 $ 25 $ 1.955 $ 654.501
mar-22 $ 18 $ 1.839 $ 710.000
que sus productos sean mas costosos y abr-22 $ 17 $ 1.859 $ 686.111
con menos oportunidades de venderse. may-22 $ 29 $ 2.037 $ 627.349
jun-22 $ 25 $ 1.966 $ 650.695
La dirección requiere saber cual factor es jul-22 $ 12 $ 1.534 $ 748.000
mas importante para priorizar medidas. ago-22 $ 28 $ 2.049 $ 623.521
sept-22 $ 15 $ 1.665 $ 749.728
Además de pronosticar el valor de ventas oct-22 $ 21 $ 2.061 $ 619.522
para el próximo trimestre si los impuestos nov-22 $ 25 $ 1.987 $ 643.860
y la UF se pronostican como se muestran: dic-22 $ 17 $ 1.667 $ 730.750

82
independiente independiente dependiente
Impuestos vs Ventas y = -9283,8x + 867717
Mes
Impuestos
UF ($) Ventas K$
R² = 0,8251 ($K/und)
$800.000
ene-21 $ 33 $ 2.214 $ 550.000
$700.000
feb-21 $ 30 $ 2.208 $ 590.000
$600.000
mar-21 $ 33 $ 2.396 $ 510.000
Ventas (K$)

$500.000 abr-21 $ 27 $ 2.110 $ 605.000


$400.000 may-21 $ 31 $ 2.232 $ 557.000
$300.000 jun-21 $ 35 $ 2.215 $ 570.000
$200.000 jul-21 $ 30 $ 1.915 $ 590.000
$100.000 ago-21 $ 30 $ 2.104 $ 600.100
$-
sept-21 $ 28 $ 1.971 $ 621.500
$10 $15 $20 $25 $30 $35 $40 oct-21 $ 33 $ 2.112 $ 603.500
Impuestos (K$/Und) nov-21 $ 31 $ 2.169 $ 510.000
dic-21 $ 33 $ 2.187 $ 578.160
ene-22 $ 28 $ 2.013 $ 610.000
y = -305,09x + 1.238.604,45
feb-22 $ 25 $ 1.955 $ 654.501
UF vs Ventas R² = 0,87 mar-22 $ 18 $ 1.839 $ 710.000
$900.000 abr-22 $ 17 $ 1.859 $ 686.111
$800.000 may-22 $ 29 $ 2.037 $ 627.349
jun-22 $ 25 $ 1.966 $ 650.695
$700.000
jul-22 $ 12 $ 1.534 $ 748.000
$600.000
ago-22 $ 28 $ 2.049 $ 623.521
$500.000 sept-22 $ 15 $ 1.665 $ 749.728
$400.000 oct-22 $ 21 $ 2.061 $ 619.522
$300.000 nov-22 $ 25 $ 1.987 $ 643.860
$200.000 dic-22 $ 17 $ 1.667 $ 730.750
$100.000
ene-23 $ 19 $ 2.214 $ 612.534
feb-23 $ 24 $ 2.208 $ 594.719
$-
$1.450 $1.550 $1.650 $1.750 $1.850 $1.950 $2.050 $2.150 $2.250 $2.350 $2.450
mar-23 $ 22 $ 2.219 $ 600.121

Y=1119722,31027252-3,81052483662795X1-196,38123599079X2

83
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,948122021
Coeficiente de determinación R^2 0,898935366 Impuestos UF
R^2 ajustado 0,889310163 0,817098322 0,864571597
Error típico 22012,8165
Observaciones 24

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 90510670355 45255335178 93,3939103 3,5342E-11
Residuos 21 10175845899 484564090,4
Total 23 1,00687E+11

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0%Superior 95,0%
Intercepción (b) 1119722,31 67138,83554 16,67771419 1,3696E-13 980099,4584 1259345,16 980099,458 1259345,16
Variable X 1 (m1) -3,810524837 1,566529147 -2,432463413 0,02402522 -7,06830054 -0,55274913 -7,06830054 -0,55274913
Variable X 2 (m2) -196,381236 50,12015453 -3,918208909 0,00078985 -300,6118033 -92,1506687 -300,611803 -92,1506687

Y=b+m1X1+m2X2
Y=1119722,31027252-3,81052483662795X1-196,38123599079X2

84
Ejemplo 3: Una inmobiliaria especializada en alquilar departamentos a estudiantes universitarios,
ha observado con preocupación que al pasar de los semestres han alquilado menos unidades
habitacionales. El gerente de la inmobiliaria afirma que se debe al aumento de la inseguridad del
sector, pero también piensa que se puede deber al aumento de costos en las matriculas que pagan
los estudiantes, generando que busquen alternativas de viviendas mas económicas.
El gerente a suministrado la siguiente información a un ingeniero de UAC al que contrato para
explicar el fenómeno y genere un pronostico para el próximo año.

85
Teoría de errores
Error: Desviación del valor verdadero
Error Grosero: Medición que se aleja mucho del conjunto de mediciones.
Error Tolerable: Mediciones cercanas entre si de todas las obtenidas.
Valor medio: Valor mas cercano a la cantidad verdadera.

Error Aparente: Diferencia entre cada medida y el valor medio.

Error Absoluto:

Error porcentual: (Error absoluto /Valor medio)x 100

86
Ejemplo 1: Usted es contratado en una empresa dedicada a
la certificación de instrumentos de medición de distintos
tipos, le toca hacer el análisis para medidores de velocidad
usados en túneles de viento de aeronáutica y le piden
indicar la velocidad real del instrumento.
Para el análisis se adjunta la siguiente tabla de datos
levantada en terreno.

Muestra N° Velocidad (m/s)


1 99,39
2 98,35
3 99,47
4 100,02
5 120,35
6 99,72
7 98,88

87
Muestra N° Velocidad (m/s) Promedio Error aparente (Error aparente)2 Error absoluto Error porcentual
Errores
tolerables 1 99,39 0,085 0,007
2 98,35 -0,955 0,912
3 99,47 0,165 0,027
4 100,02 99,305 0,715 0,511 0,246 0,25%
Errores
Groseros 5 120,35
6 99,72 0,415 0,172
7 98,88 -0,425 0,181

1,811
� 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 2

Velocidad real = 99,305± 0,246 [m/s]

88
INECUACIONES
DE PRIMER GRADO CON UNA INCÓGNITA
Forma general:
• ax+b>0
• a x +b + ≥
• a x +b + <
• ax+b≤0
Para resolverlas se siguen los mismos pasos que en las ecuaciones de primer grado con una incógnita:
1. Quitar paréntesis.
2. Quitar denominadores.
3. Agrupar términos semejantes a ambos lados de la desigualdad.
4. Despejar la incógnita.
En este último paso hay que tener en cuenta una propiedad de las desigualdades: “Si se multiplican los
dos miembros de una desigualdad por un número negativo cambia el sentido de la misma”.
La solución de una inecuación de este tipo puede ser:
1. Un conjunto de números reales que se suele expresar en forma de intervalo.
2. Cualquier número real.
3. Ningún número real. Entonces se dice que no tiene solución.
89
90
1.- En una fiesta, Olga, Begoña y Salvador hablan de la edad que tienen. Sabemos que la suma de las
edades de los tres es inferior a 85 años, que Begoña tiene el doble de años que Olga y que Salvador tiene
15 años más que Begoña. ¿Podrías decir si la persona más joven es ya mayor de edad?

2.- La familia Sánchez quiere ir de viaje. Por eso se han puesto en contacto con dos agencias de viaje. La
agencia Salimos cobra 75 euros más 0,50 euros por kilómetro y la agencia Marchamos cobra 95 euros más
0,40 euros por kilómetro.
a) ¿A partir de cuántos kilómetros resulta más barata la agencia Salimos?
b) Para hacer un viaje de 350 km, ¿qué agencia es la más rentable? ¿Y para hacer un viaje de 480 km?

3.- El lado desigual de un triángulo isósceles tiene 8 cm. Determina la medida de uno de los otros dos
lados si el perímetro tiene que ser mayor de 20 cm.

4.- Si al triple de un número le restamos diez unidades, resulta mayor que si al doble de este número le
sumamos cuatro. ¿Qué números verifican este enunciado?

5.- La suma de la mitad y la cuarta parte de un número es más pequeña o igual que el triple de
este número menos seis unidades. Encuentra la solución de esta inecuación.

91
92

También podría gustarte