Está en la página 1de 18

PROCESAMIENTO

DE INFORMACIÓN
ESTADÍSTICA
Docente: Dr. Antonio Jiménez Gutierrez
Alumna: Esther Anahí Flores Cruz

01
Unidad de Aprendizaje 1
 SECUENCIA DE CONTENIDOS
1.1 Importancia del estudio de la estadística.
1.2 Tablas de distribución de frecuencias y
representaciones gráficas.
1.3 Medidas de tendencia central
1.4 Medidas de posición
1.5 Medidas de dispersión.
1.6 Estudio de poblaciones con datos bivariados.

2
1.1 Importancia del estudio de la estadística.

• La Estadística es una rama de las matemáticas que se encarga de estudiar los


métodos científicos necesarios para recoger, organizar y analizar datos. Esta
ciencia interpreta datos numéricos para obtener conclusiones que se basan en
probabilidades.

La estadística nos:
 Permite una descripción más exacta.
 Nos obliga a ser claros y exactos en nuestros procedimientos y
en nuestro pensar.
 Permite resumir los resultados de manera significativa y
cómoda
 Nos permite deducir conclusiones generales

3
 la finalidad de este contenido es conocer los principales conceptos y elementos de
la estadística descriptiva e inferencial y cuál ha sido su uso en las ciencias sociales
y principalmente en el ámbito educativo.

Por un lado:
La estadística descriptiva se refiere al conjunto de métodos estadísticos que
describen y/o caracterizan un grupo de datos.

Y la estadística inferencial busca deducir y sacar conclusiones acerca de


situaciones generales mas allá del conjunto de datos obtenidos.

4
1.2 Tablas de distribución de frecuencias y representaciones
gráficas.

La distribución de frecuencias o tabla de frecuencia es una ordenación en


forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.

 Ejemplo: Tabla de frecuencia

5
Una representación gráfica es un tipo de representación de datos
generalmente cuantitativos, mediante recursos (líneas, vectores, superficies o
símbolos), para que se manifieste visualmente la relación estadística que
guardan entre sí

 Ejemplo: Representaciones gráficas

6
Las tablas de frecuencia y graficas son las que organizan los datos para mostrar
que tan seguido ocurre algo (frecuencia), permite organizar la información
numérica.
 Tanto en las tablas como en los gráficos el número de veces que se repite un
dato se denomina frecuencia de ese dato.

7
1.3 Medidas de tendencia central.

La medidas de centralización nos indican en torno a qué valor (centro) se distribuyen


los datos. Sirve como un método para comparar los resultados medios obtenidos por
dos o más grupos.
Las medidas de tendencia central más comunes son:

•Media aritmética
•Mediana
•Moda

8
Media aritmética
La media aritmética, también conocida como promedio, es el valor que se obtiene
al sumar todos los datos y dividirlos por la cantidad total de datos.

4,6,8,10,16,18

Mediana
La mediana es el valor que ocupa el lugar central de
todos los datos cuando éstos están ordenados de
menor a mayor.

 se representa por Me
 se puede hallar solo para variables cuantitativas
9
Moda
La moda estadística de un conjunto de datos, se define como el número que
está representado más veces dentro de esos datos, es decir, aquel número
que presenta una mayor frecuencia absoluta dentro de la muestra.

 En un grupo puede haber dos modas y se conoce como bimodal, y más de


dos modas o multimodal cuando se repiten más de dos valores; se llama
amodal cuando en un conglomerado no se repiten los valores.
 Por último, se conoce como moda adyacente cuando dos valores continuos
tienen la misma cantidad de repeticiones. En este caso se saca el promedio
de ambos.

10
1.4 Medidas de posición.
Las medidas de posición son indicadores estadísticos que permiten resumir los
datos en uno solo, o dividir su distribución en intervalos del mismo tamaño.
Las medidas de posición, por tanto, sirven para medir y para dividir.
Las medidas de posición más comunes utilizadas
en estadística, son:

1. Cuartiles: Hay 3 cuartiles que dividen a una


distribución en 4 partes iguales: primero,
segundo y tecer cuartil.

2. Deciles: Hay 9 deciles que la dividen en 10


partes iguales: (primero al noveno decil).

3. Percentiles: Hay 99 percentiles que dividen a


una serie en 100 partes iguales: (primero al
noventa y nueve percentil).
11
1.5 Medidas de dispersión.
Las Medidas de dispersión son parámetros estadísticos que indican como se
alejan los datos respecto de la media aritmética. Sirven como indicador de la
variabilidad de los datos.

 Las medidas de dispersión más utilizadas son el rango, la desviación


estándar y la varianza.

 Rango
Indica la dispersión entre los valores
extremos de una variable. se calcula como
la diferencia entre el mayor y el menor valor
de la variable. Se denota como R.

12
 Desviación media

Es la media aritmética de los valores


absolutos de las diferencias de cada dato
respecto a la media.

 Desviación estándar

La desviación estándar mide el grado


de disersión de los datos con
respecto a la media, se denota
como s para una muestra o
como σ para la población. Se define
como la raiz cuadrada de la varianza
según la expresión:
13
 Varianza

La varianza es una medida de dispersión que


representa la variabilidad de una serie de datos
respecto a su media. Formalmente se calcula como
la suma de los residuos al cuadrado divididos entre
el total de observaciones.

 Coeficiente de Variación

El coeficiente de variación se utiliza para comparar conjuntos de datos pertenecientes a


poblaciones distintas. Es una medida estadística que nos informa acerca de la dispersión
relativa de un conjunto de datos.

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del
conjunto y por lo general se expresa en porcentaje para su mejor comprensión.
X: variable sobre la que se pretenden calcular la
varianza
Sx: Desviación típica de la variable X.
| x̄ |: Es la media de la variable X en valor absoluto con 14
x̄ ≠ 0
1.6 Estudio de poblaciones con datos bivariados.
Se llaman datos bivariados a aquellos que provienen de dos variables
medidas al mismo tiempo sobre cada individuo.

 Diagrama de dispersión.
Es una gráfica donde aparecen los valores muestrales considerados como parejas
ordenadas (x1, y1), (x2, y2), …, (xn, yn). Si los valores muestrales dan una
configuración de puntos como el del diagrama de dispersión, el modelo se llama de
regresión lineal simple.

15
DISTRIBUCIÓN BIDIMENSIONAL
• Las distribuciones bidimensionales son aquellas en las que se estudian al mismo
tiempo dos variables de cada elemento de la población

TABLAS DE DATOS
• Los pares de valores se pueden contemplar en tablas de datos, estas tablas de
datos permiten condensar la información que se necesita para un análisis que de
origen a la relación entre ambos elementos, sean X y Y con una variable única o
sean X y Y variables con un mismo individuo

16
 Análisis de Correlación Lineal
El objetivo es ver si existe o no una relación de carácter lineal entre las
dos variables, y si existe, entonces medir el grado de intensidad de la
linealidad.

 Análisis de Regresión Lineal


Si se cumplen ciertas suposiciones, la ordenada b de la muestra y la pendiente m
de la muestra se pueden usar como estimaciones de los parámetros respectivos
de la población m* y b*.
Así, la ecuación de regresión muestral que representa el modelo de regresión en
línea recta es:
Y*i = mXi + b

Donde
Y* = valor pronosticado de Y para cada observación
Xi = valor de X para cada observación
17
 CORRELACIÓN Y COVARIANZA

• Existe una relación entre la correlación y la covarianza, puesto que la covarianza busca
el establecimiento de una relación lineal entre las variables X y Y
• la correlación es aquello que indicará la fuerza y la dirección lineal que se establece
entre dos variables aleatorias.
• La covarianza de una variable bidimensional, es la media aritmética de los productos
de las desviaciones de cada una de las variables respecto a sus medias respectivas.

 RELACIÓN LINEAL
• Una vez que se define el valor de covarianza se definen los siguientes elementos:
1. Cuando la covarianza es mayor que cero, hay una relación directa positiva es decir
una relación lineal con una pendiente mayor que cero
2. Cuando la covarianza es negativa hay una correlación lineal inversa con una
pendiente menor que cero.
3. Y cuando la covarianza en igual que cero no existe una relación lineal entre X y Y.

18

También podría gustarte