Está en la página 1de 29

ESTADISTICA

Muestra
Es el conjunto de observaciones (datos) que se obtienen de
alguna fuente de observación (población).  
Estadísticas de la muestra
Son magnitudes que se calculan para caracterizar a un
conjunto de observaciones o datos llamada muestra aleatoria
extraída de una población. Usualmente a la estadística de la
muestra se denomina como estadístico o estadística. A los
estadísticos se acostumbra representar mediante el alfabeto
Latino como por ejemplo el promedio se representa por:
ESTADISTICA
Población
Es la fuente de observación o de los datos.
Parámetros de una población
Son magnitudes que caracterizan a la población y cuyo valor no
se puede calcular con exactitud, sólo se pueden estimar a través
de los estadísticos. Los parámetros dependen básicamente del
tipo de distribución de la variable aleatoria que representa a la
población, por ejemplo la población de las precipitaciones medias
anuales puede ser explicada mediante la distribución normal,
cuyos parámetros son la media y la varianza. A los parámetros se
acostumbra representar mediante el alfabeto Griego como por
ejemplo la media poblacional se representa por .
Métodos estadísticos
Son los métodos que permiten obtener conclusiones acerca
de la población a partir de la muestra, o por medio de
muestras; la palabra estadística se usa comúnmente en vez
de usar métodos estadísticos.
Los métodos estadísticos o la estadística está basado en
principios matemáticos que describen el comportamiento
de un conjunto de observaciones (muestra) donde se centra
la atención en los datos mismos sin considerar las causas
que influyeron en el suceso, es decir la estadística es una
ciencia de descripción de los resultados y no de causalidad.
Métodos estadísticos

Por las consideraciones indicadas a la estadística se


define como una técnica que proporciona un conjunto
de métodos que permiten recopilar, clasificar y
presentar los datos en forma adecuada, a esta parte de
la estadística se le denomina como la estadística
descriptiva. La otra parte de la estadística que permite
tomar decisiones relacionadas a la población a partir
de la muestra es la estadística inferencial (estimación
de parámetros y prueba de hipótesis).
RECOPILACION
La recopilación de la información en la
hidrología se realiza tomando muestras (datos),
dado que no es posible recopilar todos los datos
de la población referente a una variable
hidrometeorológica. Como se trata de una
muestra y se considera que la recopilación de los
datos se efectúa al azar, se dice que el muestreo
es aleatorio y por consiguiente a la muestra se
denomina muestra aleatoria.
REGISTROS DE DESCARGAS DEL RIO QUEROCOCHA –ESTACION
QUEROCOCHA
DESCARGAS MÁXIMAS INSTANTÁNEAS
ANUALES DEL RIO QUEROCOHA
AÑO Q AÑO Q AÑO Q
1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80  
CLASIFICACION

Para facilitar la interpretación y la evaluación


correspondiente, estos datos deben ser
clasificados o categorizados o distribuidos en
clases, es decir los datos deben ser organizados
en clases o grupos. La clasificación se logra
ordenando los datos según su magnitud en
forma ascendente o descendente y luego se
agrupan en clases. Al clasificar los datos, se
determina el número de datos en cada clase,
dado que cada una de estas clases tienen sus
límites (valores) superior e inferior definidos.
Procedimiento para obtener las distribuciones de frecuencias

1. Ordenar los datos en forma descendente


2. Calcular el rango o la amplitud de la muestra
3. Calcular el número de intervalos de clase
4. Calcular la amplitud de cada intervalo de clase
5. Calcular los límites de clase de cada intervalo de
clase.
6. Calcular las marcas de clase
7. Calcular la frecuencia absoluta
8. Calcular la frecuencia relativa de cada intervalo de
clase
9. Calcular la función densidad empírica
Presentación de datos

Después de la clasificación de datos, es necesario


presentar los resultados en forma de tablas y en forma
de gráficos, con la finalidad de facilitar su interpretación
y su posterior análisis.
1. Presentación tabular o distribuciones de frecuencia
La presentación tabular o las distribuciones de
frecuencia o tabla de distribuciones de frecuencia es
una tabla que divide los datos de la muestra en cierto
número de clases, donde se muestra el número de
datos en cada clase, a este número de datos en cada
clase se le conoce con el nombre de frecuencia de clase
o simplemente frecuencia
FORMATO DE LA TABLA DE FRECUENCIAS

NUMERO DE INTERVALO MARCA DE FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA FUNCION


INTERVALO DE CLASE CLASE ABSOLUTA RELATIVA ABSOLUTA RELATIVA DENSIDAD
DE CLASE K (2) (3) (4) (5) ACUMULAD ACUMULAD EMPÍRICA
(1) A A (8)
(6) (7)
1

TOTAL  
Presentación en forma gráfica
Una distribución de frecuencia como lo indicado
en el cuadro N°1.3.3, es más fácil de interpretar
en presentaciones gráficas. Las presentaciones
gráficas son: histograma, polígono de
frecuencias, distribución de frecuencias
acumulada, distribuciones de frecuencias
relativas acumuladas y función densidad
empírica.
Ejemplo
– Para los datos del cuadro N°1.1.1 hallar la tabla de
distribuciones de frecuencia, histogramas,
polígonos de frecuencias, las funciones de
distribución acumulada y la función densidad
empírica.
– Hallar la frecuencia relativa de cada dato, la
probabilidad que el evento sea mayor o igual a un
valor determinado y la probabilidad de que el
evento sea menor a un valor dado.
Descripción de datos

La razón fundamental de clasificar los datos en una tabla


y graficar las frecuencias es para describir la naturaleza
de la distribución de frecuencias, La descripción se
realiza mediante los estadísticos o los estadígrafos
1.Estadísticas de posición
2.Medidas muestrales de dispersión
3.Momentos muestrales, medidas de asimetría y
curtosis
1 Estadísticas de posición

Son números que indican la localización del valor


medio o valor central de la distribución de
frecuencias, estos estadísticos son denominados
como medidas de localización o medidas de
tendencia central; por tanto las medidas de
posición determinan la ubicación del valor central
de los datos de una distribución de frecuencias.
Los estadísticos de posición comúnmente usados
son: media, mediana y moda.
2 Medidas muestrales de dispersión

Estos estadísticos (números) indican el grado de dispersión o


desfases en los datos de la muestra, poca dispersión indica
una uniformidad en los valores de la muestra, mientras que
alta dispersión indica poca uniformidad en los valores de la
muestra. Cuando los valores son muy cercanos al promedio
existe uniformidad y cuando los valores de la muestra son
muy alejados al promedio se dice que no hay uniformidad,
es decir los valores de la muestra son diferentes o dispersos.
Los estadísticos de dispersión son: rango, varianza,
desviación estándar y coeficiente de variación.
Momentos muestrales, medidas de asimetría y
curtosis

Para evaluar el tipo de una curva de una distribución de frecuencias y


para comparar las distribuciones es necesario calcular cuatro valores a
partir de la muestra:
Promedio que mide la localización del valor central de la distribución de
frecuencias.
Desviación estándar que mide el grado de dispersión de las frecuencias
con respecto al del valor central.
Coeficiente de asimetría que mide el grado asimetría o la falta de
equilibrio de la distribución de frecuencias entre las dos regiones en que
queda dividida la curva de la distribución por la ordenada trazada sobre el
valor más alto de la distribución de frecuencias (moda).
Coeficiente de curtosis que mide el grado de concentración en los valores
centrales de la curva.
Momentos muestrales, medidas de asimetría y
curtosis
Existen varias clases de descriptores aritméticos,
siendo los momentos el método adecuado para
calcular los estadígrafos, es decir con el cálculo de
momentos se determina los estadígrafos o
estadísticos Como en los cursos de estática,
resistencia de materiales, física, matemáticas, etc. se
calculan los momentos de órdenes primero, segundo,
etc. generalizando se tiene: momento con respecto al
origen de coordenadas y momentos con respecto a la
media.
Medida de asimetría

La asimetría de una muestra se mide mediante


el coeficiente de asimetría, para el cálculo del
coeficiente de asimetría se emplea el tercer
momento con respecto a la media y para que
este coeficiente no tenga dimensiones el tercer
momento se divide entre la desviación estándar
elevado a la potencia 3. El coeficiente de
asimetría o sesgo de una muestra se calcula
mediante las siguientes ecuaciones:
Medida de apuntamiento
El grado apuntamiento del polígono de frecuencias
(forma puntiaguda del polígono de frecuencias) se
mide mediante el coeficiente de curtosis. Para el
cálculo del coeficiente de curtosis se emplea el cuarto
momento con respecto a la media y para que este
coeficiente no tenga dimensiones el cuarto momento
se divide entre la desviación estándar elevado a la
potencia 4. El coeficiente de curtosis de una muestra
se calcula mediante las siguientes ecuaciones:
2
n m3 1 n
g  Cs  m3  ∑  xi - x 
3

 n  1 n  2 S 3 n i 1

3
n M4
CK  n

 x  x

 n 1 n  2 n  3 S
4
i
4 M4  i 1

n
– Sí g=0 es una distribución simétrica
– Sí g>0 es una distribución sesgada a la derecha
(polígono de frecuencias con cola más larga a la derecha)
– Sí g<0 es una distribución sesgada a la izquierda
(polígono de frecuencias con cola más larga hacia la
izquierda).
• El sesgo del polígono de frecuencias se aprecia
trazando una vertical por la moda donde se
diferencia la cola del polígono de frecuencias.
• Es importante indicar que los tres números son
suficientes para tener una idea de la forma del
histograma.
el valor del coeficiente de curtosis es costumbre
comparar con Ck=3 que es coeficiente de
apuntatamiento de una curva continua de forma
de una campana (curva normal).
– Sí Ck>3 es una distribución leptocúrtica, picuda o
puntiaguda.
– Sí Ck=3 es una distribución mesocúrtica o
moderada (curva normal)
– Sí Ck<3 es una distribución platicúrtica, achatada o
plana.

También podría gustarte