Está en la página 1de 19

APUNTES DE PROBABILIDAD Y ESTADISTICA

Ing. Guillermo Casar Marcos

CAPITULO I

ANALISIS ESTADISTICO DE DATOS MUESTRALES

DEFINICIÓN DE PROBABILIDAD

Es el cociente entre la frecuencia observada del suceso y el total de


observaciones cuando el experimento se realiza un número grande de veces.
Dadas un conjunto de condiciones, un experimento, no siempre podemos
predecir exactamente lo que va a ocurrir. La probabilidad es la disciplina
matemática que estudia estos experimentos.

DEFINICIÓN DE ESTADÍSTICA

El término estadística tiene su raíz en la palabra estado. Surge cuando se


hace necesario para sus intereses cuantificar conceptos. En la mayoría de los
casos esta cuantificación se hará en función de unos fines económicos o
militares. El estado quiere conocer censo de personas, de infraestructura, de
recursos en general, para poder obtener conclusiones de esta información.
Actualmente la estadística es una ciencia. No es ya una cuestión reservada al
estado. Podríamos decir que se encuentra en la totalidad del resto de ciencias.
La razón es clara: por una parte la estadística proporciona técnicas precisas
para obtener información, (recogida y descripción de datos) y por otra parte
proporciona métodos para el análisis de esta información.

De ahí el nombre de estadística descriptiva, ya que el objetivo será, a partir de


una muestra de datos (recogida según una técnica concreta), la descripción de
las características más importantes, entendiendo como características, aquellas
cantidades que nos proporcionen información sobre el tema de interés del cual
hacemos el estudio.

RELACIÓN ENTRE PROBABILIDAD Y ESTADÍSTICA

La probabilidad y la estadística se relacionan en una forma muy curiosa. En


esencia, la probabilidad es el vehículo que le permite al estadístico usar la
información contenida en una muestra para hacer inferencias o para describir
la población de la cual se ha obtenido la muestra.

1
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Los métodos estadístico matemáticos emergieron desde la teoría de


probabilidad, la cual data desde la correspondencia entre Pierre de Fermat y
Blaise Pascal (1654). Christian Huygens (1657) da el primer tratamiento
científico que se conoce a la materia. El Ars Conjectandi (póstumo, 1713) de
Jakob Bernoulli y la doctrina de posibilidades (1718) de Abraham de Moivre
estudiaron la materia como una rama de las matemáticas. 1 en la era moderna,
el trabajo de Kolmogorov ha sido un pilar en la formulación del modelo
fundamental de la teoría de probabilidades, el cual es usado a través de la
estadística.

Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para
la combinación de observaciones desde los principios de la teoría de
probabilidades. Laplace representó la ley de probabilidades de errores
mediante una curva y dedujo una fórmula para la media de tres observaciones.
También, en 1871, obtiene la fórmula para la ley de facilidad del error
(término introducido por Lagrange, 1744) pero con ecuaciones inmanejables.
Daniel Bernoulli (1778) introduce el principio del máximo producto de las
probabilidades de un sistema de errores concurrentes.

El método de mínimos cuadrados, el cual fue usado para minimizar los errores
en mediciones, fue publicado independientemente por Adrien-Marie Legendre
(1805), Robert Adrain (1808), y Carl Friedrich gauss (1809). Gauss había
usado el método en su famosa predicción de la localización del planeta enano
Ceres en 1801.

CLASIFICACIÓN DE LA ESTADÍSTICA

La estadística se divide en dos ramas:

 La estadística descriptiva, que se dedica a los métodos de recolección,


descripción, visualización y resumen de datos originados a partir de los
fenómenos en estudio. Los datos pueden ser resumidos numérica o
gráficamente. Ejemplos básicos de descriptores numéricos son la media
y la desviación estándar. Resúmenes gráficos incluyen varios tipos de
figuras y gráficos.

2
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

 La inferencia estadística, que se dedica a la generación de los modelos,


inferencias y predicciones asociadas a los fenómenos en cuestión
teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se
usa para modelar patrones en los datos y extraer inferencias acerca de la
población de estudio. Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hipótesis), estimaciones de
características numéricas (estimación), pronósticos de futuras
observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables (análisis de regresión).
Otras técnicas de modelamiento incluyen anova, series de tiempo y
minería de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.


Hay también una disciplina llamada estadística matemática, la cual se refiere a
las bases teóricas de la materia. La palabra estadísticas también se refiere al
resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en
estadísticas económicas, estadísticas criminales, etc.

ESTADISTICA DESCRPTIVA

CONCEPTOS BASICOS

1.- UNIVERSO

El universo es un conjunto de elementos involucrados en un


experimento aleatorio.

2.- POBLACION

Es un conjunto total de valores posibles con una característica particular


correspondiente a un universo.

3
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

3.- TAMAÑO DE LA POBLACION

El número de valores que contiene la población.

Ejemplo:

En un país se van a considerar los habitantes que ganan entre 100 mil y
200 mil pesos mensuales.

El universo son los habitantes de ese país.

La población los habitantes que ganan entre 100 mil y 200 mil pesos.

El tamaño de la población, es la cantidad de gente que gana entre 100 y


200 mil pesos.

4.- MUESTRA

Es un subconjunto de la población obtenida de acuerdo a una regla


determinada.

Ejemplo:

Los individuos que ganan entre 100 y 200 mil y además viven en la
ciudad m, del país en cuestión.

5.- TAMAÑO DE LA MUESTRA

Número de elementos de la muestra.

FRECUENCIA

En una muestra hay n elementos. sean x1, x2,….., xk k valores


numéricos asociados a determinados resultados del experimento. Si hay:

4
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

f1 resultados iguales a x1
f2 resultados iguales a x2
“ “ “ “ “
“ “ “ “ “
fk resultados iguales a xk

A f1, f2, …..fk se le llama frecuencia de ocurrencia de x1, x2,….,xk


respectivamente.

Ejemplo:

Se realiza un examen

NA, S, B, MB

f1 15 ---- NA ---- x1
f2 10 ---- S ---- x2
f3 12 ---- B ---- x3
f4 3 ---- MB ---- x4

FRECUENCIA RELATIVA

fi
fi* = ; i = 1, 2, 3, ……, k
n

donde fi es la frecuencia de ocurrencia del resultado xi y n es el tamaño dela muestra.

Para el ejemplo anterior:

15 12
f1* = f3 * =
40 40

10 3
* *
f2 = f4 =
40 40

5
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

FRECUENCIA RELATIVA ACUMULADA

A un valor x1 es la suma de las frecuencias relativas de todos los valores


menores o iguales a xi

i
Fi = 
i 1
fj* ; i = 1, 2, ……, k

3
F3 = 
i 1
fj * = f 1 * + f 2 * + f 3 *

15 10 12
= + +
40 40 40

37
F3 =
40

F4 = 1

DISTRIBUCION EMPIRICA

Es el conjunto de parejas ( xi, fi* ) para toda i

Para el ejemplo

( NA, 15/40 ) ; ( S, 10/40 ) : ( B, 12/40 ) ; ( MB, 3/40 )

o en forma tabular:

xi fi*
NA 15 / 40
S 10 / 40
B 12 / 40
MB 3 / 40

6
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Se tiene una muestra de tamaño grande específicamente cuando el


número de resultados es considerable, es más conveniente trabajar con
intervalos de clase. La amplitud de todos estos intervalos se llama rango y el
punto medio de cada intervalo de clase se llama marca de clase.

El arreglo en una tabla de los intervalos de una clase, frecuencia,


frecuencias relativas y frecuencias relativas acumuladas de llama tabla de
frecuencias.

Ejemplo:

En una muestra de 25 varillas se obtuvieron las siguientes medidas:


13.02, 12.94, 12.99, 13.07, 12.91, 12.93, 13.06, 13.04, 13.05, 12.93, 12.97,
12.98, 13.10, 13.06, 12.97, 12.99, 12.90, 13.05, 12.98, 13.00, 12.96, 13.01,
12.98, 12.96, 13.03.

INTERVALO DE MARCA DE fi fi* Fi


CLASE CLASE (x᷉ )
12.895 – 12.937 12.916 4 4 / 25 4 / 25 = 16%
12.937 – 12.979 12.958 5 5 / 25 9 / 25 = 36%
12.979 – 13.021 13 8 8 / 25 17 / 25 = 68%
13.021 – 13.063 13.042 6 6 / 25 23 / 25 = 92%
13.063 – 13.105 13.084 2 2 / 25 25 / 25 = 100%

Valor máximo = 13.10

Valor mínimo = 12.90

 fi = 25

Como la muestra son con dos cifras decimales, la fracción que se suma y resta,
se considera tres decimales con un múltiplo del tamaño de la muestra que es
25, por lo tanto para este ejemplo es 0.005

Valor máximo + 0.005 = 13.10 + 0.005 = 13.105

7
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Valor mínimo – 0.005 = 12.90 – 0.005 = 12.895

Rango = 13.105 – 12.895 = 0.21

Amplitud del Intervalo = 0.21 / 5 = 0.042

13.02 12.94 12.99 13.07 12.91


12.93 13.06 13.04 13.05 12.93
12.97 12.98 13.10 13.06 12.97
12.99 12.90 13.05 12.98 13.00
12.96 13.01 12.98 12.96 13.03

HISTOGRAMA
Cuando se trabaja con una tabla de frecuencias al conjunto de parejas ( x i , fi* ),
donde xi es una marca de clase para el i-ésimo intervalo, constituye la distribución
empírica. Esta distribución se puede representar mediante el histograma y mediante el
polígono de frecuencias.

8
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS

fractil en %

fractil en 100% = 13.105

fractil en 0% = 12.895

fractil en ( 17 / 25 ) x 100% = 13.021


68

percentil ( 1ro , 2do , …. , 100mo )


fractiles decil (1ro, 2do, ….. , 10mo )
cuartil ( 1ro 25% , 2do 50% , 3ro 75% , 4to 100% )

PARAMETROS DE LAS DISTRIBUCIONES EMPIRICAS


1. MEDIA

Es el promedio aritmético de todos los datos de la muestra:


1
n
x = 
i 1
xi

9
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Con una tabla de frecuencias

m m

 i 1
x᷉i fi i 1
x᷉i fi

x = =
m

 i 1
fi n

En el ejemplo:

(12.916) (4) + (12.958) (5) + (13) (8) + (13.042) (6) + (13.084) (2)
x = = 12.9949
25

x = 12.9949

1
25
x = i 1
Xi = 12.9964 Exacto

25

2. MEDIANA

Es un valor tal que la mitad de las observaciones son menores que ese valor y la otra
mitad mayores que el mismo. Para determinar la mediana conviene ordenar los valores
observados del menor al mayor.

Ejemplos:

a) 1, 7, 8, 10, 12, 15, 17, 23, 24


Mediana = 12

b) 1, 7, 8, 10, 12, 15, 17, 23, 24, 29

12 + 15
= 13.5 Mediana
2

c) 4, 5, 5, 6, 7, 7, 7, 8, 9, 9
Mediana = 7

10
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Si se trabaja con intervalos de clase:

n/2 – (  f)a
Mediana = a + Δx [ ]
fm

donde en la tabla de frecuencias se trabaja en el intervalo en donde la frecuencia f i rebasa


el 50%, por primera vez, entonces:

Δx = Es el tamaño del intervalo.


a = Al extremo izquierdo del intervalo.
n = Al número de valores observados en el experimento.
fm = A la frecuencia correspondiente al intervalo en cuestión.
(  f)a = A la suma de las frecuencias correspondientes a los intervalos anteriores.

En el ejemplo: se trabaja en el 3e intervalo

12.5 – (4 + 5)
Mediana = 12.979 + 0.042 [ ] = 12.997375
8

Mediana = 12.9974

3. MODA (O MODO)

Es el número que aparece más frecuentemente.

En el ejemplo:

Moda = 12.98 es unimodal

si se repiten igual número de veces dos o más números se saca el promedio.

Ejemplos: con dos modas (bimodal)


con tres modas (trimodal)




con varias modas (multimodal)

11
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Si se trabaja con una tabla.- la moda se encuentra en el intervalo que tiene mayor
frecuencia.

HISTOGRAMA.

d1
Moda = a + Δx [ ]
d2 + d1

En el ejemplo: d1 = 3 ; d2 = 2

3
Moda = 12.979 + 0.042 [ ]
3+2

Moda = 13.0042

4. FRACTILES.

Establecen la localización de diversos valores que dividen a la muestra en grupos de


acuerdo a las frecuencias o a las observaciones.

En una tabla:
n x Fracción - ( Σ f )a
Fractil = a + Δx [ ]
(f) Fractil
12
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

POLIGONO DE FRECUENCIA RELATIVA ACUMULADA:

Cuartiles: C1, C2, C3, C4

C1 = Fractil al 25%

En el ejemplo:

25 (0.25) – 4
C1= 12.937 + (0.042) [ ] = 12.9559
5

25 (0.50) - 9
C2= 12.979 + (0.042) [ ] = 12.997375
8

25 (0.75) -17
C3= 13.021 + (0.042) [ ] = 13.03325
6

25 (1) - 23
C4= 13.063 + (0.042) [ ] = 13.105
2

25 (0.01) – 0
d1= 12.895 + (0.042) [ ] = 12.92125
4

13
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

5. VARIANCIA:

Es el promedio aritmético de los cuadrados de las desviaciones de las observaciones


con respecto a su valor medio.
n

i 1
(xi - x )2

S2X =
n

Si se trabaja con una tabla:

i 1
( x᷉ i – x )2 fi
2
S x=
n

donde:

x᷉ = marca de clase
k = número de intervalo
x i = media
fi= la frecuencia
n = número de observaciones

Para el ejemplo:

(12.916 – 12.9952)2 (4) + (12.958 – x )2 (5) +…… + (13.084 – x )2 (2)


Sx2=
25

S2x= 0.0024

2
Sx= Desviación estándar = S x

Sx = 0.0024 = 0.048989794856

6. COEFICIENTE DE VARIACION.

Sx
C. V.=
x

14
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

En el ejemplo:

0.0024
C. V.= = 0.0037
12.9952

7. COEFICIENTE DE ASIMETRIA:

Media – Moda 12.9952 – 13.042


C. A.= = = - 0.9554
Sx 0.04898

Distribución simétrica positiva:

15
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Distribución simétrica negativa:

8. COEFICIENTE DE APLANAMIENTO.

El grado de aplanamiento de una distribución empírica se llama curtosis y se mide


por el siguiente coeficiente.
m4
Coeficiente momento de curtosis =
m22

donde:

mr .- es el momento de orden r con respecto a la media.

i 1
( xi – x )r

mr =
n

En una tabla de frecuencias


i 1
(xi – x )r fi

mr =
n
Observar que: m2 = SX2
16
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

SEAN LOS HISTOGRAMAS:

En A:
5 (4) + 7 (10) + 9 (5)
x= = 7.105
19
En B:
5 (6) + 7 (7) + 9 (6)
x = = 7
19
17
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

En A:
(5 – 7.105)2 (4) + (7 – 7.105)2 (10) + (9 – 7.105)2 (5)
m2= = 1.8836566
19

(5 – 7.105)4 (4) + (7 – 7.105)4 (10) + (9 – 7.105)4 (5)


m4= = 7.527
19

m4 7.527
Coeficiente de curtis = = = 2.122
m22 (1.8836) 2

En B:
(5 – 7)2 (6) + (7 – 7)2 (7) + (9 – 7)2 (6)
m2 = = 2.526
19

(5 – 7)4 (6) + (7 – 7)4 (7) + (9 – 7)4 (6)


m4 = = 10.105
19

m4 10.105
Coeficiente de curtis = = = 1.58
2 2
m2 (2.526)

TAREA:

Datos: 0, 45, 65, 80, 85, 80, 20, 45, 17, 73, 35, 62, 57, 45, 10, 67, 65, 42, 10, 40, 65, 48, 15,
65, 52, 75, 35, 100, 57, 65, 45, 57, 42, 48, 70, 35, 35, 42, 25, 38, 25, 80, 85, 100, 28, 25, 65,
85, 25, 35.

Son 50 calificaciones, de los alumnos del grupo 26 de probabilidad y estadística.

INTERVALOS MARCAS fi fi * Fi
DE CLASE DE CLASE
-0.1 - 19.94
19.94 – 39.98
39.98 – 60.02
60.02 – 80.06
80.06 – 100.1

18
APUNTES DE PROBABILIDAD Y ESTADISTICA
Ing. Guillermo Casar Marcos

Valor máximo = 100

Valor mínimo = 0

 fi = 50

Se suma y resta: 0.1

Valor máximo + 0.1 = 100 + 0.1 = 100.1

Valor mínimo – 0.1 = 0 – 0.1 = - 0.1

Rango = 100.1 – (- 0.1) = 100.2

Amplitud del intervalo = 100.2 / 5 = 20.04

100.1 + 0.1
Δx = = 20.04
5
Calcular:

a) media
b) mediana
c) moda
d) fractiles C1, C2, C3, C4
e) variancia y desviación estándar
f) coeficiente de asimetría
g) coeficiente de aplanamiento
h) histograma con polígono de frecuencias
i) polígono de frecuencias relativas acumuladas
j) coeficiente de variación

19

También podría gustarte