Documentos de Académico
Documentos de Profesional
Documentos de Cultura
IXTEPEC, OAXACA
CLAVE: 20DNL0002Q
PROCESAMIENTO DE INFORMACIÓN
ESTADÍSTICA
ACTIVIDAD
El término estadística proviene del latín statisticum collegium que significa “consejo de
Estado” y de su derivado italiano statista entendido como “hombre de Estado”. Por lo tanto,
con precisión las diversas características de ese conjunto. Así, que la estadística descriptiva
estadística descriptiva no hace inferencia sobre los datos; su propósito es obtener una visión
Estadística descriptiva
presentación.
Por lo visto anteriormente nos damos cuenta que la estadística descriptiva se limita en sí
misma a los datos recolectados y no realiza generalización acerca de donde provienen esos
datos estadísticos.
Toda técnica, arte o disciplina científica maneja una serie de términos o conceptos
significativa entre sí. Los mismos pueden ser comparados, analizados e interpretados en
población dada, ya sea una nación, una comunidad o una determinada organización.
estadísticos se emplea la letra griega ∑ llamada sigma. Esta notación indica: suma total.
es:
notación indica el primer elemento a sumarse. La (n) indica el término final de la suma.
La importancia de la estadística
por lo que ha adquirido un papel clave en la investigación. Se usa como un valioso auxiliar
y en los diferentes campos del conocimiento y en las variadas ciencias. Es un lenguaje que
Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida se toman con base en la
aplicación de la Estadística.
La estadística es de gran importancia en la investigación científica debido a que:
estadística dentro de las ciencias permitió el estudio de los fenómenos, que, a pesar de tener
que la estadística describe estos fenómenos. En la mayoría de los casos, observando una
mínima parte del conjunto de los datos analizados, es decir, a través de una muestra.
herramientas que posibilitan manejar datos. De estos datos se extraen conclusiones que
permiten tomar decisiones.
educativo, a un centro docente, una comunidad, una sociedad, entre otras, por tal motivo es
LA ESTADÍSTICA EN LA ESCUELA
La principal razón del estudio de la estadística es que los fenómenos aleatorios tienen
mayor relación con la recolección de datos empíricos, una mayor búsqueda de evidencias
REPRESENTACIONES O GRAFICAS.
La distribución de frecuencias
Definición: una distribución de frecuencia viene a ser una serie de datos elaborados en
las frecuencias le llamaremos total de observaciones que representaremos por (n). Así:
Tenemos que saber que las distribuciones de frecuencias se pueden arreglar de dos
formas diferentes, esto es, para datos agrupados y para datos no agrupados.
Ahora bien, antes de pasar a trabajar con las distribuciones de frecuencias es necesarios
que conozcamos algunos términos fundamentales que nos ayudaran a entender mejor las
distribuciones de frecuencias, tanto para datos no agrupados, así como para datos
agrupados.
Frecuencia simple (fi): es el número de veces que aparece el mismo dato estadístico en
un conjunto de observaciones. Aquí (f) se lee como frecuencia, mientras que (i) define el
Frecuencia relativa porcentual (fr%): resultan de multiplicar cada frecuencia relativa por
absolutas.
Frecuencia Acumulada Relativa (Fr): esta resulta de dividir cada una de las frecuencias
Frecuencias acumuladas relativas porcentuales (Fr %): resultan de multiplicar cada una
Punto medio o maca de clases (Xi): estas se obtienen al dividir el límite inferior y el
modo más expresivo que la tablas, basta una simple observación para apreciar sus
características más relevantes. Así mismo, permiten sacar cualquier conclusión sobre los
datos observados.
gráficos. Sin embargo, lo importante es elegir el más adecuado para los tipos de variables
Histogramas
Polígono de frecuencias
Ojivas
Gráfica circular
Gráficas de barras
Gráfica lineal
fuentes, de forma clara, precisa y ordenada. Casi todos tipos de información puede
Según las características y la cantidad de datos, conviene utilizar uno u otro gráfico.
1.1- Gráficos
Los gráficos permiten visualizar la información contenida en las tablas de manera rápida
y sencilla, demostrando con mayor claridad la relación que estos datos tienen entre sí.
A- Gráficos de barras
Son aquellos que emplean rectángulos (barras) que se colocan paralelamente. La altura
indica la frecuencia de ese dato. Los gráficos de barras, permiten representar información
numérica en forma clara y ordenada, para comunicarla a otras personas. Con la información
espacio libre se ubican la barra. Los datos numéricos van en el eje vertical (determinando la
D- Pictogramas.
Son los más llamativos, ya que se representan por medio de dibujos, se reemplaza las
barras por dibujos. Se usan para lograr el interés masivo del público.
E- Histograma
Es un gráfico formado por barras contiguas, donde cada una representa un intervalo de
valores, sirve para expresar información sobre datos que están agrupados.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un
ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son:
media, mediana y moda. Las medidas de dispersión en cambio miden el grado de dispersión
de los valores de la variable. Dicho en otros términos las medidas de dispersión pretenden
evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas
de su posición y su dispersión.
Promedio o media
promedio aritmético. Se representa por la letra griega µ cuando se trata del promedio del
universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es
importante destacar que µ es una cantidad fija mientras que el promedio de la muestra es
variable puesto que diferentes muestras extraídas de la misma población tienden a tener
diferentes medias. La media se expresa en la misma unidad que los datos originales:
dato y la media:
Ejemplo de desviaciones:
cero.
Mediana
que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir,
el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50%
Moda
La moda de una distribución se define como el valor de la variable que más se repite. En
punto más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
Rango de variación
variable.
son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores
que cambian de muestra en muestra dentro de una misma población. La varianza se expresa
variable.
Fórmulas
dispersión:
de la varianza indica que los datos están alejados del promedio. Es difícil hacer una
comparan las varianzas de dos muestras, por ejemplo, varianza de la muestra igual 18 y
varianza de la muestra b igual 25. En este caso diremos que los datos de la muestra b tienen
mayor dispersión que los datos de la muestra a. esto significa que en la muestra a los datos
están más cerca del promedio y en cambio en la muestra b los datos están más alejados del
promedio.
Si bien la mediana divide el conjunto de datos en dos partes iguales, existen otros
CUARTILES
Dividen a la población de datos en cuatro partes iguales, correspondiendo cada uno de
ellos al 25% de los datos. Tenemos por tanto tres cuartiles que denotamos como Q1, Q2,
DECILES
de los datos. Tendríamos, por tanto, nueve deciles que denotamos por D1, D2, D3, ..., D9
PERCENTILES
del conjunto de datos en los que estamos interesados. Ya hemos resumido nuestros datos en
"Supongamos que dos alumnos han realizado cinco exámenes cada uno. Para evaluarlos
ALUMNO 1: 4, 5, 5, 5, 6. Media = 5
ALUMNO 2: 1, 2, 5, 8, 9. Media = 5
Si vemos los dos tendrían la misma nota, lo que nos haría pensar que los dos alumnos
son similares, pero si observamos sus notas hay una gran diferencia entre ambos. El alumno
1 tiene unas notas muy homogéneas, muy próximas a la media mientras que el segundo
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la
homogénea y por tanto nos dan una medida sobre la representatividad de los parámetros de
RANGO O RECORRIDO
La principal ventaja del rango es su fácil cálculo, aunque su valor es poco significativo,
ya.
RI = Q3 - Q1
En ocasiones también se suele usar como valor la mitad del rango intercuartílico,
Las siguientes medidas que vamos a analizar se basan en medir la diferencia de los datos
con la media. Que sólo tiene en cuenta los dos valores extremos.
DESVIACIÓN MEDIA
La desviación media es la media de la distancia de los valores de los datos (en valor
absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con distancias
positivas, lo que daría como resultado que la desviación media sea cero para cualquier
distribución de datos.
VARIANZA
Como hemos referido antes para evitar que se anulen diferencias positivas y negativas,
en a la desviación media se toma valor absoluto. Dado que la función valor absoluto no
tiene unas buenas propiedades matemáticas (por ejemplo, no es derivable) otra manera de
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores de los
datos a la media.
DESVIACIÓN TÍPICA
Dado que la desviación típica es una medida que está expresada en las mismas unidades
expresa tanto de forma decimal como en tanto por ciento, y nos expresaría la desviación
DATOS BIVARIADOS
lo general, nos interesa establecer la relación entre las dos variables. • Al igual que los
datos univariados, se utilizan las diferentes herramientas gráficas, dependiendo del tipo de
• Cuando trabajamos una variable sobre dos individuos simultáneamente o dos variables
sobre un mismo individuo estamos hablando de los datos bivariados. • Los datos bivariados
se expresan a través de pares de valores, es decir pares ordenados tipo (a,b), cuando se
en las que se estudian al mismo tiempo dos variables de cada elemento de la población.
estas tablas de datos permiten condensar la información que se necesita para un análisis que
de origen a la relación entre ambos elementos, sean X y Y con una variable única o sean X
los pares ordenados de ambas variables o de ambos individuos se conoce con el nombre de
diagrama de dispersión, porque allí están dispersos los datos de ambas variables, este tipo
de diagrama es muy común en el análisis de diferentes datos con respecto al tiempo para
estudios científicos, estudios demográficos, entre otros estudios especializados. En donde
se pretende establecer la relación que puede haber entre una variable y otra, para facilitar un
estudio determinado. • Los datos que corresponden a dos tipos de individuos o a dos
covarianza, puesto que la covarianza busca el establecimiento de una relación lineal entre
del producto entre la desviación de cada Xi con respecto a su media y la desviación de cada
este producto utiliza la misma cantidad de datos por que se supone que para cada X hay una
Y, si no, no existiría dicho par ordenado. • Una vez que se define el valor de covarianza se
definen los siguientes elementos que ocurren. • Cuando la covarianza es mayor que cero,
hay una relación directa positiva es decir una relación lineal con una pendiente mayor que
cero • Cuando la covarianza es negativa hay una correlación lineal inversa con una
pendiente menor que cero. • Y cuando la covarianza en igual que cero no existe una