Está en la página 1de 43

INTRODUCCION:

ESTADISTICA DESCRIPTIVA E INFERENCIAL

UNALM - 2020
¿QUÉ ES LA ESTADÍSTICA?
Estadística es la disciplina que esta relacionada con el estudio de la
variabilidad, de la incertidumbre, del estudio de la toma de decisiones dentro de
la fase de incertidumbre.
Es de mucha utilidad para evaluar y cuantificar la incertidumbre.
La estadítica juega un rol muy importante en el estudio de las ciencias
atmosféricas ya que permite hacer comparaciones y predecir resultados.
Conceptos de estadística
Población: Es el conjunto de todos los elementos a los que se somete
a un estudio estadístico.
Individuo: O Unidad Estadística es cada uno de los elementos que
componen la población.
Muestra: Es un conjunto representativo de la población en referencia,
el número de individuos de una muestra que el de la población.
Muestreo: es la reunión de datos que se desea estudiar, obtenidos de
una proporción reducida y representativa de la población.
Valor: Es cada uno de los distintos resultados que se pueden obtener
en un estudio estadístico. Si lanzamos una moneda al aire 5 veces
obtenemos dos valores: cara y sello
Dato: Es cada uno de los valores que se han obtenido al realizar un
estudio estadístico. Si lanzamos una moneda al aire 5 veces: cara, cara,
sello, sello, sello.
Estadística Descriptiva
Cuando se tiene un conjunto de
datos desorganizados sirve de
muy poco esa información. Por
eso a las técnicas empleadas
para organizar y presentar los
datos se le conoce como
estadística descriptiva.
Estadística descriptiva es un
conjunto de métodos para
organizar y presentar los datos
de manera significativa.
Estadística Inferencial
Es un conjunto de métodos y técnicas para determinar una
característica del total de una población. La estadística
inferencial permite hacer deducciones o conclusiones sobre
el objeto de estudio.
Estadística Inferencial
Queremos saber como es el comportamiento de temperatura durante el
mes de junio en la ciudad de Talara, no necesitamos ver todos los datos,
tomamos una muestra de un periodo de tiempo (todos los junio de 1970
– 1980).
A la selección de una parte de los datos (población) para su estudio se
le conoce como muestreo, y con las técnicas adecuadas de muestreo se
pueden hacer inferencias muy precisas del total.
Tipo de variables estadísticas
Variables Cualitativas: Se refieren a características o cualidades
que no pueden ser medidas con números.
Podemos distinguir dos tipos:

Variable Cualitativa Nominal: presenta modalidades no numérica que


no admiten un criterio de orden: Condiciones de la bóveda celeste:
nublado, cubierto, despejado, muy nublado, muy cubierto, etc.
Variable Cualitativa Ordinal: Presenta modalidades no numérica que
las que existe un orden.
Por ejemplo:
Orden de años mas cálidos: !982, 1975, 2001, 2016.
Valores temperaturas mas bajas en Chapualca: -21.7°C, -22.8°C, 23.7°C,
24.6°C.
conseguido en una prueba deportiva: 1°. 2°, 3°…
Medallas de una prueba deportiva: oro, plata, bronce.
Variables Cuantitativas: Es la que expresa mediante un número, por
tanto se pueden realizar operaciones aritméticas con ellas.
Podemos distinguir dos tipos:

Variable C. Discreta: es aquella que toma valores aislados, es decir no


admite valores intermedios entre dos valores específicos:
Número de eventos de friajes en selva los últimos 5 años: 5, 7, 4, 9,
8 eventos

Variable C. Continua: Es aquella que puede tomar valores


comprendidos entre dos números:
Los valores mas bajos de temperatura mínimas en Chuapalca
(Tacna) en los 5 últimos años: -23.5°C, -22.7°C, -24.8°C, -23.9°C y
-25.4°C.
Distribución de frecuencias
Es una ordenación en forma de tabla de los datos estadísticos,
asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un
determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total
de datos, que se representa por N.
Para indicar resumidamente estas sumas se
utiliza la letra griega Σ (sigma mayúscula) que
se lee suma o sumatoria.
Frecuencia relativa
Es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se
representa por ni.

La suma de las frecuencias relativas es igual a 1.


Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias
absolutas de todos los valores inferiores o
iguales al valor considerado.
Se representa por Fi.

Frecuencia relativa acumulada


La frecuencia relativa acumulada es el cociente entre
la frecuencia acumulada de un determinado valor y
el número total de datos. Se puede expresar en tantos por
ciento.
Por ejemplo:
Durante el mes de julio, en una ciudad se han
registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29,
30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31,
34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada
de menor a mayor, en la segunda hacemos el recuento y en la
tercera anotamos la frecuencia absoluta:

Este tipo de tablas de frecuencias se utiliza con variables discretas.


Construcción de una tabla de datos agrupados

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44,
31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32,
13.

 1º Se localizan los valores menor y mayor de la distribución. En este


caso son 3 y 48.
 2º Se restan y se busca un número entero un poco mayor que la
diferencia y que sea divisible por el número de intervalos queramos
establecer.
 Es conveniente que el número de intervalos oscile entre 6 y 15.
 En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10
intervalos.
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma
amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente.

Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a
todo el intervalo para el cálculo de algunos parámetros.
Se forman los intervalos teniendo presente que el límite inferior
de una clase pertenece al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente intervalo.
PROBABILIDAD
La probabilidad de un suceso es un número, comprendido entre 0 y 1,
que indica las posibilidades que tiene de verificarse cuando se realiza
un experimento aleatorio.
Experimentos deterministas
Son los experimentos de los que podemos predecir el resultado
antes de que se realicen.
Si dejamos caer una piedra desde una altura determinada
sabemos, sin lugar a dudas, que la piedra bajará.
Experimentos Aleatorios
Son aquellos que no podemos predecir el resultado ya que
aquellos dependen del azar.
Por Ejemplo:
Si lanzamos una moneda no sabemos si caerá cara o sello.
Si lanzamos un dado tampoco sabremos que resultados nos
dará.
Teoría de probabilidades
La teoría de probabilidades se ocupa de asignar un cierto número a
cada posible resultado que pueda ocurrir en un experimento aleatorio,
con el fin de cuantificar dichos resultados y saber si un suceso es más
probable que otro. Con este fin, introduciremos algunas definiciones:

Suceso
Es cada uno de los resultados posibles de una experiencia
aleatoria.
Al lanzar una moneda salga cara.
Al lanzar un dado se obtenga cuatro.
Espacio muestral
Es el conjunto de todos los posibles resultados de una experiencia
aleatoria, lo representaremos por E (o bien por la letra griega Ω).
Ejemplos: 
Espacio muestral de una moneda: E = { C, X }
Espacio muestral de un dado: E = {1, 2, 3, 4, 5, 6}

Suceso aleatorio
Suceso aleatorio es cualquier subconjunto del espacio muestral.

Tirar un dado un suceso sería que saliera par, otro, obtener


múltiplo de 3, y otro, sacar 5.
Un Ejemplo completo:

Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente


tres bolas. Calcular:

1. El espacio muestral.


E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n,
n,n)}

2. El suceso A = {extraer tres bolas del mismo color}.


A = {(b,b,b); (n, n,n)}

3. El suceso B = {extraer al menos una bola blanca}.


B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}

4. El suceso C = {extraer una sola bola negra}.


C = {(b,b,n); (b,n,b); (n,b,b)}
Axiomas de la probabilidad

1.La probabilidad es positiva y menor o igual que 1.


0 ≤ p(A) ≤ 1

2. La probabilidad del suceso seguro es 1.


p(E) = 1

3.Si A y B son incompatibles, es decir A ∩ B = φ entonces:


p(A  U B) = p(A) + p(B)
Propiedades de la Probabilidad
1.  La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la
probabilidad del suceso contrario es:

2.  Probabilidad del suceso imposible es cero.

3.  La probabilidad de la unión de dos sucesos es la suma de sus probabilidades


restándole la probabilidad de su intersección.
Propiedades de la Probabilidad
4.  Si un suceso está incluido en otro, su probabilidad es menor o igual a la de
éste.

5.  Si A1, A2, ..., Ak son incompatibles dos a dos entonces:

6  Si el espacio muestral E es finito y un suceso es S = {x1, x2, ..., xn}


entonces:
Regla de Laplace

Si realizamos un experimento aleatorio en el que hay n sucesos


elementales, todos igualmente probables - equiprobables, entonces
si A es un suceso, la probabilidad de que ocurra el suceso A es:
Ejemplos
Determinar si los siguientes experimentos son aleatorios o
deterministicos:

Extraer una carta de una baraja


Lanzar una moneda al aire
Arrojar una piedra a un pozo
Medir las hojas de un árbol
Medir la altura del Everest
Medir la temperatura a la que congela el agua destilada
Medir la temperatura de un enfermo
Calcular el volumen de un cubo
Calcular la masa de un litro de agua de mar
Ejemplos
Determinar si los siguientes experimentos son aleatorios o
deterministicos:

Extraer una carta de una baraja (Aleatorio)


Lanzar una moneda al aire (Aleatorio)
Arrojar una piedra a un pozo (Deterministas)
Medir las hojas de un árbol (Aleatorio)
Medir la altura del Everest (Deterministas)
Medir la temperatura a la que congela el agua destilada (Det)
Medir la temperatura de un enfermo (Aleatorio)
Calcular el volumen de un cubo (Deterministas)
Calcular la masa de un litro de agua de mar (Deterministas)
Media Aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el
resultado entre el número total de datos.
X es el símbolo de la media aritmética.

La Humedad Relativa en la ciudad de Lambayeque de 6 días consecutivos son: 84,


91, 72, 68, 87 y 78 %. Hallar la humedad relativa medio.

80 %
 
Media Aritmética de Datos Agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de
la media es:
Ejemplo de Media Aritmética con Datos Agrupados

Se tienen los porcentajes de humedad relativa en la ciudad de Arequipa en 42 días


diferentes, se han obtenido los rangos que muestra la tabla. Calcula la humedad
relativa media.
Propiedades de la Media Aritmética
1. La suma de las desviaciones de todas las puntuaciones de una distribución
respecto a la media de la misma igual a cero.

La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética


7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 = 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

2. La suma de los cuadrados de las desviaciones de los valores de la variable con


respecto a un número cualquiera se hace mínima cuando dicho número coincide
con la media aritmética.
Propiedades de la Media Aritmética
3. Si a todos los valores de la variable se les suma un mismo número,
la media aritmética queda aumentada en dicho número.

4. Si todos los valores de la variable se multiplican por un


mismo número la media aritmética queda multiplicada por
dicho número.
Observaciones Sobre la Media Aritmética
1. La media se puede hallar sólo para variables cuantitativas.
2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas. Si tenemos una distribución con los
siguientes velocidades del viento:
5 m/s, 7 m/s , 4 m/s, 7 m/s, 6 m/s, 7 m/s, 9 m/s, 19 m/s.
La media es igual a 8 m/s, que es una medida de centralización poco representativa de la
distribución.
4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada.

En este caso no es posible hallar la media porque no podemos calcular la marca de clase de


último intervalo.
La Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de
menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables cuantitativas.

¿Como calculamos la Mediana?

1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un número impar de medidas la mediana es la puntuación central de la


misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me = 5

3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las


dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me = 9.5
Cálculo de la Mediana con Datos Agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre 

Li es el límite inferior de la clase donde se encuentra la mediana.


N/2 es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos
Calcular la mediana de una distribución estadística que viene dada por la siguiente
tabla:

100/2 = 50

Clase de la mediana: [66, 69)


La Moda Estadítica
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.


Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5  Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia


es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.


2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de


las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálculo de la Moda para Datos Agrupados
1º Todos los intervalos tienen la misma amplitud.

Li es el límite inferior de la clase modal.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.

También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:


Calcular la moda de una distribución estadística que viene dada por la
siguiente tabla:
Cálculo de la Moda para Datos Agrupados

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas:

La clase modal es la que tiene mayor altura.

La fórmula de la moda aproximada cuando existen distintas amplitudes es:


En la siguiente tabla se muestran los intervalos de intensidad del viento en Km/h
(débil, moderado, fuerte, muy fuerte) registrados durante los últimos 50 días en la
ciudad de Pisco. Calcular la moda.

También podría gustarte