Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA DESCRIPTIVA
Por:
LILIANA MARÍA LÓPEZ VASQUEZ
Centro de Ciencia Básicas
INTRODUCCIÓN
1. CONCEPTOS BÁSICOS
La palabra estadística deriva del latín medieval Status, donde tiene el sentido de
estado político. Los comienzos de la estadística pueden ser hallados en el antiguo
Egipto, cuyos faraones lograron recopilar hacia el año 3050 antes de Cristo, datos
relativos a la población y la riqueza del país.
El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de
Israel con la finalidad de conocer el número de la población.
De igual forma durante los siglos XV, XVI, y XVII, hombres como Leonardo de
Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y
René Descartes, recolectaron datos con fines científicos, que ayudaron a mejorar
el método científico.
Ciencias Básicas
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística
de los recursos nacionales, comprensiva de datos sobre organización política,
instrucciones sociales, comercio y poderío militar.
Uno de los más grandes avances en estadística, se dio en el siglo XVII, cuando
los bancos y las compañías de seguros empezaron a utilizar los datos
estadísticos, además a tratar matemáticamente la demografía, la economía y
muchos aspectos de las ciencias sociales. Fue en Alemania donde comenzó a
tomar más fuerza esta disciplina orientada a la descripción de los bienes del
Estado, gozando de una sistematización y respondiendo a principios doctrinales.
¿Qué es Estadística?
Consumo: 10 Watts.
Luminosidad: 50 Watts.
Alta Calidad.
Embalaje: Caja.
Cantidad: 100 Unidades.
Empaque: Caja por Unidad
Otro elemento importante para la Estadística son las VARIABLES. Las variables
son un conjunto de características de interés en una investigación científica, las
cuales toman valores diferentes en cada estudio, como por ejemplo la estatura, la
vida de las llantas de un automóvil, el color de la piel, la raza, entre otros.
Dependiendo de la naturaleza de los datos y el tipo de variable se decide que
herramientas estadísticas se van a utilizar. Las variables pueden clasificarse en
Cuantitativas y Cualitativas.
Una Variable es Cuantitativa siempre que los valores que puede asumir sean los
resultados de medidas numéricas. Ejemplo: la estatura, la edad, el peso, etc. A su
vez estas variables pueden ser continuas o discretas. Continuas cuando
teóricamente pueden tomar un número incontable de valores dentro de un intervalo,
como es el caso de la estatura. Discretas cuando los valores que pueden tomar
Ciencias Básicas
están separados entre sí por una determinada cantidad, una característica de esta
variable son los vacíos o interrupciones entre los valores que puede tomar. Ejemplo,
el número de hijos.
2. DISTRIBUCIONES DE FRECUENCIAS
𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑛 = 𝑁
∑ 𝑓𝑖 = 𝑁
𝑖=1
𝐹1 = 𝑓1
𝐹2 = 𝑓1 + 𝑓2
𝐹3 = 𝑓1 + 𝑓2 + 𝑓3
𝐹4 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4
𝐹𝑛 = 𝑓1 + 𝑓2 + 𝑓3 + 𝑓4 + ⋯ + 𝑓𝑛 = 𝑁
Ciencias Básicas
𝒇𝒊
Decimal 𝒉𝒊 = ó
𝒏
𝒇𝒊
En forma porcentual 𝒉𝒊 = ∗ 𝟏𝟎𝟎
𝒏
𝐻1 = ℎ1
𝐻2 = ℎ1 + ℎ2
𝐻3 = ℎ1 + ℎ2 + ℎ3
𝐻4 = ℎ1 + ℎ2 + ℎ3 + ℎ4
𝐻𝑛 = ℎ1 + ℎ2 + ℎ3 + ℎ4 + ⋯ + ℎ𝑛 = 1
Ciencias Básicas
Ejemplo 1). Supongamos que se tiene una población constituida por 2 000 cajas
y deseamos examinarlas con el fin de determinar el número de piezas o elementos
defectuosos que contiene cada caja. Por diferentes razones se desea que la
investigación no sea exhaustiva, es decir, no examinar la totalidad de las 2 000
cajas o universo, sino por el contrario, seleccionar una muestra de tamaño 30,
correspondiente a una investigación parcial. (Ciro, 2013)
𝑥1 = 3, 𝑥2 = 2, 𝑥3 = 0, 𝑥4 = 2, 𝑥5 = 3, 𝑥6 = 1, 𝑥7 = 1, 𝑥8 = 0, 𝑥9 = 1,
𝑥10 = 3, 𝑥11 = 3, 𝑥12 = 4, 𝑥13 = 4, 𝑥14 = 3, 𝑥15 = 2, 𝑥16 = 4, 𝑥17 = 2,
𝑥18 = 4, 𝑥19 = 4 𝑥20 = 2, 𝑥21 = 4, 𝑥22 = 0, 𝑥23 = 0, 𝑥24 = 1, 𝑥25 = 3, 𝑥26 = 2
𝑥27 = 3, 𝑥28 = 1, 𝑥29 = 2, 𝑥30 = 2
12, 12, 13, 11, 12, 14 13, 13, 14, 12, 12, 13, 12, 15, 13, 13, 12, 12, 14, 14, 12, 13,
14, 12, 12
Xi fi F hi (Frecuencia H (Frecuencia
(Frecuencia (Frecuencia Relativa) Acumulada Relativa)
Absoluta) Acumulada Fracción Decimal % Fracción Decimal %
Absoluta)
11 1 1 1/25 0.04 4 1/25 0.04 4
12 11 12 11/25 0.44 44 12/25 0.48 48
13 7 19 7/25 0.28 28 19/25 0.76 76
14 5 24 5/25 0.2 20 24/25 0.96 96
15 1 25 1/25 0.04 4 25/25 1 100
Total 25 1.00 100
Causas fi hi
(variables cualitativa) (Frecuencia (Frecuencia
Absoluta) Relativa)
%
Enfermedades
499 30.8
respiratorias
las enfermedades del
292 18
sistema osteomuscular
los traumatismos 142 8.8
las enfermedades del
140 8.6
sistema nervioso
los trastornos mentales 105 6.5
las enfermedades
102 6.3
infecciosas
Otras causas 340 21
Total 1620 100
478 458 683 780 736 448 591 555 420 422 282 425 367 419 444
339 694 478 498 310 537 592 549 391 569 460 359 251 655 161
666 239 398 720 648 533 586 321 487 610 470 436 527 487
313 644 495 122 521 368 531 472 540 504 542 634 337 282
415 291 621 253 763 746 323 575 439 449 321 450 135 578
210 480 223 433 444 437 360 559 308 477 463 223 370 369
425 459 418 351 361 183 383 259 469 392 517 479 345 452
(Salazar, 2002)
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
𝑎
Al valor 𝑋𝑚𝑖𝑛 se le resta aproximadamente y la parte restante se le suma
2
658
3. 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 (𝐼) > = 82,25 𝑙𝑢𝑒𝑔𝑜 𝐼 = 83
8
𝒂
6. Se distribuye el valor de 𝒂 entre los intervalos; a 𝑋𝑚𝑖𝑛 = 122 y se le resta 𝟐
𝑎
y a 𝑋𝑚𝑎𝑥 = 780, se le suma 2 .
Luego el primer intervalo, tiene como límite inferior 119, que es el resultado de
restarle 3 a 122 y tiene como límite superior 202; porque a 119, se le suma la
amplitud que es 83. Quedando así: (119 − 202]; el segundo intervalo tiene como
límite inferior el límite superior del intervalo anterior (202): (202 − 285] y como
límite superior la suma de 202 y 83 y así sucesivamente.
𝐿𝑖𝑚𝑖𝑡𝑒𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝐿𝑖𝑚𝑖𝑡𝑒𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
𝑥𝑖 =
2
Ciencias Básicas
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
__________________________________________________________________
Ciencias Básicas
3. METODOS GRÁFICOS
“Un gráfico puede valer más que mil palabras, pero puede tomar muchas palabras
para hacerlo”
John Tukey
Los gráficos estadísticos nos permiten usar nuestra habilidad para visualmente
procesar información de un gráfico. Esto nos permite hacer juicios respecto a la
variabilidad, escala, patrones y tendencias de los datos.
Elementos de un gráfico:
Título Principal
Título Secundario o Subtitulo
Descripción del Grafico
Región de Datos y Símbolos
Eje Horizontal y Escala
Eje Vertical y Escala
Apuntadores
Descriptores de Señales y marcas
Ciencias Básicas
Algunos gráficos:
3.1. HISTOGRAMAS
Para uno construir un histograma se debe dividir la recta real en intervalos o clases
(algunos recomiendan que sean de igual longitud) y luego contar cuántas
observaciones caen en cada intervalo.
Desventajas:
Histograma en R:
> datos1<-scan()
1: 4.7 4.7 4 4.7 3 4.1 3.8 4.4 5 3.3 3.8 6.4 6 4.9 3.3 3.6 4.7 4.4 5.4 5.8 3.3 3.0
26:
Ciencias Básicas
3.3. OJIVA
Ojiva
30
Frecuencia Acumulada
25
20
15
10
5
0
2,6 3,2 3,8 4,4 5 5,6 6,2 6,8
Marca de clase
Los gráficos de barras constituyen una herramienta muy adecuada para comparar
los tamaños relativos de cantidades que se distribuyen en el espacio, en el tiempo.
Estos diagramas se usan con frecuencia en los informes económicos, como por
ejemplo, en las memorias de las empresas y en la prensa financiera. Esta técnica
gráfica puede usarse también para ilustrar el movimiento de una magnitud a lo largo
del tiempo.
Ciencias Básicas
Una forma alternativa de ilustrar la evolución de una cantidad a lo largo del tiempo,
consiste en dibujar un gráfico con los diferentes valores a lo largo del tiempo.
Situando el tiempo a lo largo del eje horizontal, y la cantidad numérica de interés en
el eje vertical, se obtiene para cada observación un punto en el gráfico. Uniendo
los puntos consecutivos mediante líneas, se obtiene un gráfico temporal, que
proporciona una idea visual de la evolución fácil y rápida de la variable.
Ciencias Básicas
Los gráficos de tortas son otro ejemplo de la utilidad de los métodos gráficos de
presentación de datos que se basan en la comparación de áreas para hacerse una
idea de las magnitudes relativas de los números.
A menudo nos interesa relación entre dos números, en caso de que esta exista. Un
diagrama de dispersión proporciona una visión gráfica de la relación entre dos
variables. Este gráfico se utiliza para analizar el modelo de regresión lineal.
Como herramienta visual se puede utilizar para ilustrar los datos, para estudiar
simetría, para estudiar las colas, y supuestos sobre la distribución, también se
puede usar para comparar diferentes poblaciones.
Ciencias Básicas
Una medida de tendencia central es un único número que indica el centro de una
serie de números a partir de los cuales se calcula. Las medidas de tendencia central
también se llaman de localización.
En este curso estudiaremos como medidas de tendencia central sólo tres la media
aritmética, la mediana y la moda.
x1 x x 3 .... x n
Fórmula de la media:
n
𝑥̅ = media
n= número de elementos
x= valores o datos
Ciencias Básicas
Ejemplo 1). Calcule la media de los siguientes números: 10, 11, 12, 12, 13
Por lo tanto, la media de los 5 números es 11.6. Note que la media resulta un
número que está entre el rango de elementos; en este caso, 11.6 está entre 10, 11,
12 y 13.
∑ni=1 xi ∗ % x1 %1 + x2 %2 + x3 %3 … + xn %n
x̅m = =
∑ni=1 % %1 + %2 + %3 + ⋯ %n
Ejemplo 2). Once alumnos de primer año de un colegio obtuvieron los siguientes
puntajes en una prueba de destreza manual:
70, 83, 74, 75, 81, 75, 92, 75, 90, 94, 75.
La moda para estos datos es 75 puesto que este puntaje aparece con más
frecuencia que los demás.
Un grupo de datos puede no tener ninguna moda o tener más de una. Esto no
ocurre con la media y la mediana, medidas que, para un conjunto de datos, siempre
existen y son únicas. La moda no es una medida muy utilizada.
De acuerdo a los datos (13, 13, 14, 13, 14, 11, 12, 13, 14, 12, 15) calcular la mediana
de la edad de 11 estudiantes del grado séptimo de una institución educativa.
Ciencias Básicas
11, 12, 12, 13, 13, 13, 13, 14, 14, 14, 15
- Calculo de la Mediana: 𝑀𝑒 = 13
11, 12, 12, 13, 13, 13, 13, 14, 14, 14, 15 La mediana divide la población en
dos partes iguales
De acuerde a los siguientes datos (24, 25, 22, 20, 12, 25, 17, 16, 15 y 17). Calcular
la mediana del número de horas gastadas en mirar televisión por los 10 estudiantes.
12, 15, 16, 17, 17, 20, 22, 24, 25, 25.
- Se busca el lugar que ocupa la mediana: n=10, n es par, el lugar que ocupa
𝑛 10 𝑛+2 10+2
es = =5 𝑦 = = 6, Al lugar 5 corresponde el dato 17 y al lugar 6
2 2 2 2
12, 15, 16, 17, 17, 20, 22, 24, 25, 25.
Ciencias Básicas
17 + 20
𝑀𝑒 = = 18,5
2
La mediana no se ve afectada por los valores extremos tanto como la media. Para
aclarar este punto consideremos los puntajes de una prueba. Si las observaciones
se ordenan en forma ascendente, tenemos:
xi fi hi Fi Hi fi*xi
3 5 20,8 5 21 15
4 7 29,2 12 50 28
5 8 33,3 20 83 40
6 4 16,7 24 100 24
total 24 107
∑n
i=1 xi ∙fi 107
Luego la media es x̅ = = = 4,46
n 24
4.2.2. La Moda
xi fi hi Fi Hi
La moda es 5 porque es
3 5 20,8 5 21
el que tiene mayor
frecuencia.
4 7 29,2 12 50
𝑀𝑑 = 5
5 8 33,3 20 83
6 4 16,7 24 100
total 24
Ciencias Básicas
4.2.3. La Mediana
xi fi hi Fi Hi
El lugar de la
3 5 20,8 5 21𝑛
mediana es 2 =
4 7 29,2 1224 50
2
= 12
5 8 33,3 20 83
6 4 16,7 24𝑀𝑒 =100
4
total 24
𝑛 𝑛
- es número decimal, por ejemplo = 12,5, luego la mediana es la media
2 2
del dato que corresponde al lugar 12 y el dato que corresponde al lugar 13.
xi fi hi Fi Hi
3 5 0,20 5 0,20
4 7 0,28 12 0,48
5 8 0,32 20 0,80
Contiene el dato que
6 5 0,20 25 1,00 ocupa el lugar 13 que es
total 25 5
4+5
Luego la mediana es 𝑀𝑒 = = 4.5
2
∑𝑘
𝑖=1 𝑥𝑖 𝑓𝑖
𝑥̅ = k es el número de intervalos de clase, n es la sumatoria de las
𝑛
frecuencias .
4.3.2. Mediana:
𝑗
𝑀𝑒 = 𝐿 + 𝑓 ∙ 𝐼; Dónde:
(22 – 27] 3 32
6
Luego la mediana es: 𝑀𝑒 = 12 + 13 . 5 = 14,31
4.3.3. La Moda:
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑑 = 𝐿 + ×𝐼
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
Donde:
𝐼: Amplitud
(22 – 27] 3 32
5. MEDIDAS DE POSICIÓN
Los percentiles representan los valores de la variable que están por debajo de un
porcentaje, el cual puede ser una valor de 1% a 100% (en otras palabras, el total
de los datos es divido en 100 partes iguales).
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Para los deciles, tomaremos el total de los datos divididos en 10 partes iguales,
por tanto, existirán 10 deciles.
Ciencias Básicas
Para los cuartiles, tomaremos el total de los datos divididos en 4 partes iguales.
Ejemplo 1). Medidas de posición para datos sin agrupar - variable discreta
Lo primero que se hace con la información anterior es ordenar los datos de menor
a mayor
4 8 10 12 12 16 16 16 18 18 20 22 24 28 30
𝑘(𝑛+1) 1(15+1) 16
Para lo cual se usa la fórmula = = = 4, esto quiere decir que el
𝑄 4 4
4 8 10 12 12 16 16 16 18 18 20 22 24 28 30
Luego Q1 = 12
Para el 𝑸𝟑
𝑘(𝑛+1) 3(15+1) 48
= = = 12 ; La posición que ocupa Q3 está entre el dato 12 y 13
𝑄 4 4
4 8 10 12 12 16 16 16 18 18 20 22 24 28 30
Séptimo decil
7(𝑛+1) 7(15+1) 48
D7= = = = 11,2
10 10 4
4 8 10 12 12 16 16 16 18 18 20 22 24 28 30
32∗(15+1)
100
= 5,12;
Ciencias Básicas
Variable discreta: Calcula los cuartiles, deciles y percentiles Q1, Q2, D4, P42, en la
siguiente tabla:
xi fi Fi
0 3 3
1 7 10
2 15 25
3 10 35
4 8 43
5 5 48
6 2 50
Para Q1 la posición será n/4 =50/4 =12,5, en este caso sería el dato 12 y el
dato 13; que está en el tercer renglón, observando la frecuencia acumulada;
luego Q1=2
Para Q3, la posición será 3n/4 =150/4 =37,5; siendo los datos 37 y 38; los
cuales se encuentran ubicados en la fila 5; luego el Q3=4
Para D4, la posición será 4n/10 = 200/10=20; siendo el dato 20, el cual se
encuentra ubicado en la tercera fila, luego D4=2
Ciencias Básicas
INTERVALO fi Fi
33,1 37,4 3 3
Q1
37,4 41,6 5 8
41,6 45,8 7 15
45,8 50 10 25
Q3
50 54,2 15 40
54,2 58,4 9 49
58,4 62,6 1 50
4,5
𝑄1 = 41,6 + × 4,2 = 44,3
7
2,5
𝑄3 = 50 + × 4,2 = 50,7
15
5
𝐷4 = 45,8 + × 4,2 = 47,9
10
Para calcular el P83: tendrá como posición 83(n/100)=41,5; que está en el sexto
intervalo; luego:
1,5
𝑃83 = 54,2 + ∗ 4,2 = 50,7
9
Ciencias Básicas
ACTIVIDAD
INTERVALO fi Fi
2,1 5,5 3 3
5,5 8,9 16 19
8,9 12,3 4 23
12,3 15,7 12 35
15,7 19,1 5 40
3. Completa la tabla y calcular el Q1, Q3, D1, D7, D5, P40, P75, del conjunto de
datos organizados en una distribución de frecuencia simple.
xi fi Fi
0 2
1 3
2 5
3 6
4 2
total 18
Ciencias Básicas
Ciencias Básicas
Una medida de centralización, casi nunca es suficiente por sí sola, para resumir
adecuadamente las características de un conjunto de datos. Por lo general,
necesitaremos, además, una medida de la dispersión de los datos.
Rango, Varianza, Desviación típica, Media de las deviaciones absolutas,
Coeficiente de variación, cuartiles, percentiles, deciles
6.2. Varianza:
∑N 2
i=1(xi −μ) ×fi ∑n ̅ )2 ×fi
i=1(xi −x
σ2 = s2 =
N n−1
Ciencias Básicas
∑N 2
i=1(xi −μ) ×fi ∑n ̅ )2 ×fi
i=1(xi −x
σ=√ s=√
N n−1
Cuando se tienen dos o más varianzas, que están dadas en unidades con
medidas diferentes, estas pueden compararse entre sí, empleando el coeficiente
de variación que se define como el cociente de dividir la desviación típica por su
respectiva media aritmética, el cual se considera una desviación relativa. Si el
resultado obtenido se multiplica por 100, la variación comparativa entre dos o más
variables, dadas en unidades de medida diferentes, se expresarán en términos
porcentuales. Esta medida de dispersión se simboliza mediante CV
𝑠
𝐶𝑉 = × 100%
𝑥̅
del total de las observaciones y sí, por el contrario, el coeficiente de variación (CV)
se hace mayor al 33%, indicará que cada vez su valor es mayor será más
heterogénea. Por tanto la media irá perdiendo su representatividad, de ahí que en
muestreo se proceda, en estos casos, a dividir la población en grupos más
homogéneos, denominados estratos, permitiendo la aplicación del método de
muestreo aleatorio estratificado.
𝑄 = 𝑄3 − 𝑄1
Al igual que con la mediana no está afectada por valores extremos, se recomienda
cuando la medida de centralización es la mediana.
∑6𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛−1
(5 − 17)2 + (12 − 17)2 + (10 − 17)2 + (30 − 17)2 + (20 − 17)2 + (25 − 17)2
=
6−1
La varianza 𝑠 2 = 92
∑6𝑖=1(𝑥𝑖 −𝑥̅ )2
Desviación típica es 𝑠 = √ = √92 = 9.59 minutos
𝑛−1
Los datos tienen una desviación típica de 9,59 minutos por usuario.
Coeficiente de variación
9.59
𝐶𝑉 = × 100 = 56.4
17
Ciencias Básicas
0 3 0 -2 4 12
1 10 10 -1 1 10
2 25 50 0 0 0
3 8 24 1 1 8
4 4 16 2 4 16
50 100 46
100
𝑥̅ = =2
50
Varianza:
∑ni=1(xi − x̅)2 × fi 46
s2 = = = 0.94
n−1 49
Desviación típica:
∑n ̅ )2 ×fi
i=1(xi −x
s=√ = √0.94 = 0.97; Luego la desviación típica del conjunto de datos
n−1
es 0,97
Coeficiente de variación:
Ciencias Básicas
0.97
𝐶𝑉 = × 100 = 48,5%
2
𝑄1 = 1 𝑄3 = 2,
𝑁
1
𝑀. 𝐷. = ∑|𝑥𝑖 − 𝑥̅ |
𝑁
𝑖=1
𝑥𝑖 𝑓𝑖 𝑥𝑖 ∙ 𝑓𝑖 𝑥𝑖 − 𝑥̅ |𝑥𝑖 − 𝑥̅ | |𝑥𝑖 − 𝑥̅ | ∙ 𝑓𝑖
0 3 0 -2 2 6
1 10 10 -1 1 10
2 25 50 0 0 0
3 8 24 1 1 8
4 4 16 2 2 8
50 100 32
Ciencias Básicas
1 32
𝑀. 𝐷. = 𝑁 ∑𝑁
𝑖=1|𝑥𝑖 − 𝑥̅ | ∙ 𝑓𝑖 = 50 = 0.64,
Es una medida menos utilizada pero también indica la dispersión de los datos.
0.5(𝑄3 −𝑄1 )
𝐾= 𝑃90 −𝑃10
𝐾 = 0,263 Normal
Número de Númeo de
hijos 𝑥𝑖 mujeres 𝑓𝑖
0 26
1 40
2 50
3 40
4 22
5 14
6 8
Ciencias Básicas
Solución:
Donde:
𝑀𝑑 = 2
𝑀𝑒 = 2
504.2
𝑠2 = = 2,53 luego la desviación típica es 𝑠 = √2,53 = 1,59
199
2,33 − 2
𝐴𝑠 = = 0.207
1,59
𝑄1 = 1 𝑄2 = 3 𝑃10 = 0 𝑃90 = 5
0,5 × (3 − 1) 1
𝐾= = = 0,20
(5 − 0) 5
𝑘 = 0,20 < 0,263. Por tanto la distribución es achatada, y se tendrá por tanto que
hay más distribución respecto al promedio.
Ciencias Básicas
𝑦 = 𝛽0 + 𝛽1 𝑥+∈
β0 y β1, se conoce como parámetros del modelo y ∈ (letra griega épsilon) es una
variable aleatoria que se conoce como términos del error. Tel término del error da
cuenta de la variabilidad y que no puede ser explicada por relación lineal entre x y
y
(1 𝑛 ∑ 𝑥𝑖 𝑦𝑖 −∑ 𝑥𝑖 ∑ 𝑦𝑖
= 𝛽, se conoce como la pendiente
𝑛 ∑ 𝑥𝑖 2 −(∑ 𝑥𝑖 )2
Interpretación
COEFICIENTE DE CORRELACIÓN
∑ 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅ 𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑟𝑥𝑦 = =
𝑛𝑠𝑥 𝑠𝑦 √𝑛 ∑ 𝑥𝑖 2 − (∑ 𝑥𝑖 )2 √𝑛 ∑ 𝑦𝑖 2 − (∑ 𝑦𝑖 )2
x peso 29 35 28 44 25 34 30 33 28 24
y 31 27 29 25 31 29 28 28 28 33
combustible
Número de
trabajadores (x) 5 15 20 25 30 30 40 50 60 70
Producción (y) 4 10 15 20 24 25 33 38 40 44
8. PROBABILIDAD
1
Astrágalos: Por su constitución y forma de seis caras, en la antigüedad se utilizaba para la aleatoriedad de
probabilidades por los ciudadanos. Se podría decir que el hueso de Astrágalo es el precursor del dado de seis caras que
conocemos en la actualidad
Ciencias Básicas
Experimentos aleatorios son los que pueden dar lugar a varios resultados, sin
que pueda ser previsible enunciar con certeza cuál de éstos va a ser observado en
la realización del experimento.
Al lanzartresmonedas, elespaciomuestral es
Ciencias Básicas
a uno de estos dos sucesos. Por tanto, la unión A B tiene lugar si y sólo si A y /o
B ocurren
Un ejemplo, supóngase que se lanza una moneda. La frase “la probabilidad de que
salga cara es ½” puede ser interpretada con la ayuda de dos conceptos: frecuencia
relativa y probabilidad subjetiva.
Probabilidad subjetiva
Donde la notación indica que el sumatorio corresponde a todos los resultados básicos
pertenecientes a A
P( A B) P(O
A B
I )
Donde la sumatoria se extiende a todos los resultados básicos en AUB, pero dado
que A y B son mutuamente excluyentes, un resultado no puede pertenecer a
ambos sucesos, pero por lo que el lado derecho de la ecuación puede ser dividido
en dos partes:
P(O
A B
I ) P(O I ) P(O I )
A B
Considere un experimento que se puede llevar a cabo una y otra vez de una
manera idénticae independiente, y sea A un evento que consiste en un conjunto
fijo de resultados del experimento.
Ejemplo:
Ciencias Básicas
De entre los 1.000 billetes, 10 ganarán primeros premios, 100 ganarán premios de
consolación y 890 no ganarán premio alguno. Nuestro único billete puede ser
considerado como uno elegido entre loa 1.000, sea A el suceso “el billete elegido
gana un primer premio”. Dado que son 1.000 resultados igualmente probables, 10
de los cuales corresponde al suceso A, tenemos que:
10
P( A) 0.01
1.000
100
P( A) 0.10
1.000
Ahora bien, el suceso “el billete gana algún premio” es sencillamente la unión de
los sucesos A y B, además, dado que sólo se permite un premio por billete, estos
sucesos son mutuamente excluyentes. Por tanto, la probabilidad requerida es:
Bibliografía