Investigacion UNIDAD 1

Instituto Estatal de Educación
Pública de Oaxaca
Subdirección General de
Servicios Educativos
Unidad de Educación Normal y
Formación Docente
Escuela Normal Urbana Federal del
Istmo.
ASIGNATURA: PROCESAMIENTO DE INFORMACION ESTADISTICA
ENCARGADO DEL CURSO: DR. ANTONIO JIMENEZ GUTIERREZ
TAREA: PLANEACION POR UNIDAD DIDÁCTICA. (
TAREA: INVESTIGACION DE LA PRIMERA UNIDAD
ALUMNO: ARLETH LOPEZ ANTONIO
SEMESTRE: CUARTO
GRUPO: “A”
LUGAR Y FECHA: CD. IXTEPEC. A 17 DE MAYO DEL 2022

¿Qué es estadística?
La estadística se considera un método utilizado para recoger, organizar, concentrar,
reducir, presentar, analizar, generalizar y contrastar los resultados numéricos
(datos) de observaciones directas o indirectas de fenómenos reales, así como de la
información obtenida a partir de la experimentación, para estar en condiciones de
llevar a cabo tanto evaluaciones como conclusiones adecuadas, y tomar decisiones
acertadas y confiables.
Definición: la estadística es la ciencia que estudia las técnicas y procedimientos
para la recolección, organización, presentación y análisis de datos a fin de obtener
conclusiones acerca de los mismos.
Podemos considerar la estadística dividida en dos partes o áreas fundamentales,
según enfoquemos el estudio de la investigación sobre todo el conjunto de la
población o sobre una parte de ella. Esto es, estadística descriptiva y estadística
inferencial.
Cuando hablamos de estadística descriptiva nos referimos a la parte de la
estadística que de forma minuciosa describe, resume y ofrece los métodos para
hacer posible la recolección, organización y presentación de los datos.
Esta perspectiva de la estadística está limitada a sí misma, simplemente a los datos
recolectados, aquí la estadística no realiza ningún tipo de generalización de los
datos obtenidos.
La importancia de la estadística
La estadística resulta fundamental para conocer el comportamiento de ciertos
eventos, por lo que ha adquirido un papel clave en la investigación. Se usa como un
valioso auxiliar y en los diferentes campos del conocimiento y en las variadas
ciencias. Es un lenguaje que permite comunicar información basada en datos
cuantitativos.
Es tan importante que casi no existe actividad humana en que no esté involucrada
la Estadística. Las decisiones más importantes de nuestra vida se toman con base
en la aplicación de la Estadística.
La estadística es de gran importancia en la investigación científica debido a que:
 Permite una descripción más exacta.
 Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro
pensar.
 Permite resumir los resultados de manera significativa y cómoda.
 Nos permite deducir conclusiones generales.
La distribución de frecuencias
Definición: una distribución de frecuencia viene a ser una serie de datos
elaborados en categorías, con el número de observaciones que contiene cada
categoría.
La frecuencia se refiere a la cantidad de cada categoría. En tanto, que a la sumatoria
de las frecuencias le llamaremos total de observaciones que representaremos por
(n). Así:
Tenemos que saber que las distribuciones de frecuencias se pueden arreglar de
dos forma diferentes, esto es, para datos agrupados y para datos no agrupados.
Ahora bien, antes de pasar a trabajar con las distribuciones de frecuencias es
necesarios que conozcamos algunos términos fundamentales que nos ayudaran a
entender mejor las distribuciones de frecuencias, tanto para datos no agrupados,
así como para datos agrupados.
 Frecuencia simple (fi): es el número de veces que aparece el mismo dato
estadístico en un conjunto de observaciones. Aquí (f) se lee como frecuencia,
mientras que (i) define el orden de las clases.
 Frecuencia relativa (fr): esta resulta de dividir cada frecuencia simple entre el
total de observaciones. La sumatoria de las frecuencias relativas es igual a
1.
 Frecuencia relativa porcentual (fr%): resultan de multiplicar cada frecuencia
relativa por 100 La sumatoria de las frecuencias relativas es igual a 100%.
 Frecuencias Acumuladas (Fi): se obtienen de las sumas sucesivas de las
frecuencias absolutas.
 Frecuencia Acumulada Relativa (Fr): esta resulta de dividir cada una de las
frecuencias acumulada entre el total de observaciones, así:
 Frecuencias acumuladas relativas porcentuales (Fr %): resultan de
multiplicar cada una de las frecuencias acumuladas relativas por 100.
 Punto medio o maca de clases (Xi): estas se obtienen al dividir el límite
inferior y el límite superior de cada clase entre dos.
Presentación gráfica de los datos estadísticos
Los gráficos estadísticos tiene la ventaja que permiten transmitir información de un
modo más expresivo que la tablas, basta una simple observación para apreciar sus
características más relevantes. Así mismo, permiten sacar cualquier conclusión
sobre los datos observados.
En la actualidad, parece infinita la posibilidad de diseño de los diferentes tipos de
gráficos. Sin embargo, lo importante es elegir el más adecuado para los tipos de
variables que vamos a presentar. Los gráficos siguientes son los principales:
Los gráficos permiten visualizar la información contenida en las tablas de manera
rápida y sencilla, demostrando con mayor claridad la relación que estos datos
tienen entre sí.
 Histogramas
 Polígono de frecuencias
 Ojivas
 Gráfica circular
 Gráficas de barras
 Gráfica lineal
LAS MEDIDAS DE TENDENCIA

Las medidas de tendencia central son parámetros estadísticos que informan sobre
el centro de la distribución de la muestra o población estadística.
Estas medidas son la media, la moda y la mediana.
Media
La media es el valor promedio de un conjunto de datos numéricos, calculada como
la suma del conjunto de valores dividida entre el número total de valores. A
continuación se muestra la fórmula de la media aritmética:
Mediana
La mediana es un estadístico de posición central que parte la distribución en dos,
es decir, deja la misma cantidad de valores a un lado que a otro. Las fórmulas
propuestas no nos darán el valor de la mediana, lo que nos darán será la posición
en la que está dentro del conjunto de datos. Las fórmulas que indica la posición de
la mediana en la serie son las siguientes:
Cuando el número de observaciones es par:
Mediana = (n+1) / 2 → Media de las posiciones observaciones
Cuando el número de observaciones es impar:

Mediana = (n+1) / 2 → Valor de la observación
Moda
La moda es el valor que más se repite en una muestra estadística o población. No
tiene fórmula en sí mismo. Lo que habría que realizar es la suma de las repeticiones
de cada valor.
LAS MEDIDAS DE POSICIÓN
Las medidas de posición son indicadores estadísticos que permiten resumir los
datos en uno solo, o dividir su distribución en intervalos del mismo tamaño. Por
tanto, no es más que una técnica estadística para separar los datos de una
distribución. Eso sí, debe cumplirse que los grupos sean iguales. Por eso, existen
diversos tipos de cuantil.
Forma de cálculo del cuantil
Los cuantiles pueden calcularse desde un punto de vista paramétrico y no
paramétrico. Veamos ambos con mayor detalle y también la llamada «función
cuantil».
Paramétricos: Se utilizan en distribuciones cuya forma conocemos. Es decir, la

distribución será normal, uniforme, exponencial, etcétera. De esta forma, se asume
que es conocida y sus principales parámetros (media aritmética y varianza) también.
No paramétricos: Es adecuado con muestras pequeñas en las que es difícil saber
su forma exacta y, por tanto, no conocemos su función de distribución. Este método
aporta valores similares al anterior cuando la muestra aumenta y, por tanto, es
indiferente el uso de ambos.
Función cuantil: Estamos ante una forma de cálculo de tipo probabilístico. El objetivo
es calcular un valor que tenga una probabilidad determinada en una función de
distribución. No entraremos en cuestiones matemáticas que complican el concepto.
Cuantiles más frecuentes
Cuartil: Separa los valores en cuatro grupos iguales y existen tres cuartiles. Es el
más frecuente. El cuartil uno (Q1) son los datos menores y el tres (Q3) los mayores.
Por otro lado, el cuartil dos (Q2) se corresponde con la mediana (Me) que es un
estadístico de posición que divide la distribución de los datos a la mitad. Los valores
del cuantil serían 0.25 (Q1), 0.5 (Q2) y 0.75 (Q3).
Quintil: Similar al anterior, es menos frecuente y divide los datos en cinco partes
iguales. Por tanto, hay cuatro quintiles. Los valores del cuantil en este caso serían
0.20, 0.40, 0.60, 0.80.
Decil: En este caso se dividen en diez partes y, por tanto, hay nueve deciles. Una
vez más, este tampoco es demasiado frecuente. Sus valores serían de 0.1 a 0.9.
Percentiles: Estamos ante una variante en que la distribución se divide en cien
partes iguales. Puede ser de interés para muestras muy numerosas. Sus valores
van de 0.01 a 0.99.
LAS MEDIDAS DE DISPERSIÓN
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de
arrojar un valor numérico que ofrezca información sobre el grado de variabilidad de
una variable.
Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación
típica y el coeficiente de variación (no confundir con coeficiente de determinación).
Rango
El rango es un valor numérico que indica la diferencia entre el valor máximo y el
mínimo de una población o muestra estadística. Su fórmula es:
R = Máxx – Mínx
Donde:
 X → Variable sobre la que se pretenden calcular la varianza

 xi → Observación número i de la variable X. i puede tomará valores entre
1 y n.
 N → Número de observaciones.
 x̄ → Es la media de la variable X.
Varianza
La varianza es una medida de dispersión que representa la variabilidad de una serie

de datos respecto a su media. Formalmente se calcula como la suma de los residuos
al cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:

 xi → Observación número i de la variable X. i puede tomará valores entre 1
y n.
Desviación típica
La desviación típica es otra medida que ofrece información de la dispersión respecto

a la media. Su cálculo es exactamente el mismo que la varianza, pero realizando la
raíz cuadrada de su resultado. Es decir, la desviación típica es la raíz cuadrada de
la varianza.

 xi → Observación número i de la variable X. i puede tomará valores entre 1
y n.
Coeficiente de variación
Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la

media del conjunto y por lo general se expresa en porcentaje para su mejor
comprensión.

 σx → Desviación típica de la variable X.
 | x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0
ESTUDIO DE POBLACIONES CON DATOS BIVARIADOS.
Cuando se miden dos variables en una sola unidad experimental; los datos
resultantes se llaman datos bivariados. Los métodos para graficar datos bivariados,
si las variables son cualitativas o cuantitativas, permiten estudiar las dos variables
DATOS BIVARIADOS
• Corresponden a la medición de dos variables en una sola unidad de observación

• Por lo general, nos interesa establecer la relación entre las dos variables.
• Al igual que los datos univariados, se utilizan las diferentes herramientas gráficas,
dependiendo del tipo de variables que se están midiendo.
• Cuando trabajamos una variable sobre dos individuos simultáneamente o dos

variables sobre un mismo individuo estamos hablando de los datos bivariados.
• Los datos bivariados se expresan a través de pares de valores, es decir pares
ordenados tipo (a, b), cuando se obtienen estos tipos de valores nos referimos a
una distribución bidimensional de la información que estamos analizando.
DISTRIBUCIÓN BIDIMENSIONAL
• Las distribuciones bidimensionales son aquellas en las que se estudian al mismo

tiempo dos variables de cada elemento de la población
TABLAS DE DATOS
• Los pares de valores se pueden contemplar en tablas de datos, estas tablas de

datos permiten condensar la información que se necesita para un análisis que de
origen a la relación entre ambos elementos, sean X y Y con una variable única o
sean X y Y variables con un mismo individuo
DIAGRAMA DE DISPERSIÓN
• El diagrama obtenido mediante el establecimiento de los pares ordenados de

ambas variables o de ambos individuos se conoce con el nombre de diagrama de
dispersión, porque allí están dispersos los datos de ambas variables, este tipo de
diagrama es muy común en el análisis de diferentes datos con respecto al tiempo
para estudios científicos, estudios demográficos, entre otros estudios
especializados. En donde se pretende establecer la relación que puede haber entre
una variable y otra, para facilitar un estudio determinado.
• Los datos que corresponden a dos tipos de individuos o a dos variables de un

mismo individuo tienen un análisis particular, estamos hablando de un análisis que
busca establecer relaciones es decir, se buscan correlaciones y a su vez se buscan
codesviaciones, es decir covarianzas.
CORRELACIÓN Y COVARIANZA
• Existe una relación entre la correlación y la covarianza, puesto que la covarianza

busca el establecimiento de una relación lineal entre las variables X y Y
• la correlación es aquello que indicará la fuerza y la dirección lineal que se establece
entre dos variables aleatorias.
• La covarianza de una variable bidimensional, es la media aritmética de los
productos de las desviaciones de cada una de las variables respecto a sus medias
respectivas.
RELACIÓN LINEAL • La covarianza entre X y Y se obtiene a través de la sumatoria

del producto entre la desviación de cada Xi con respecto a su media y la desviación
de cada Yi con respecto a su media sobre el número de datos totales de la población
o de la muestra este producto utiliza la misma cantidad de datos porque se supone
que para cada X hay una Y, si no, no existiría dicho par ordenado.
• Una vez que se define el valor de covarianza se definen los siguientes elementos
que ocurren.
• Cuando la covarianza es mayor que cero, hay una relación directa positiva es decir
una relación lineal con una pendiente mayor que cero
• Cuando la covarianza es negativa hay una correlación lineal inversa con una
pendiente menor que cero.
• Y cuando la covarianza en igual que cero no existe una relación lineal entre X y Y.
REFERENCIAS DIGITALES
https://sites.google.com/site/estadisticainfdes/unidad-de-aprendizaje-i-estadistica/1-1-importancia-del-estudio-de-la-
estadistica
https://economipedia.com/definiciones/cuantil.html

Investigacion UNIDAD 1

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Investigacion UNIDAD 1

Cargado por

Copyright:

Formatos disponibles

Instituto Estatal de Educación

ASIGNATURA: PROCESAMIENTO DE INFORMACION ESTADISTICA

ENCARGADO DEL CURSO: DR. ANTONIO JIMENEZ GUTIERREZ

TAREA: PLANEACION POR UNIDAD DIDÁCTICA. (

TAREA: INVESTIGACION DE LA PRIMERA UNIDAD

ALUMNO: ARLETH LOPEZ ANTONIO

LUGAR Y FECHA: CD. IXTEPEC. A 17 DE MAYO DEL 2022

LAS MEDIDAS DE TENDENCIA

Cuando el número de observaciones es impar:

Paramétricos: Se utilizan en distribuciones cuya forma conocemos. Es decir, la

 X → Variable sobre la que se pretenden calcular la varianza

La varianza es una medida de dispersión que representa la variabilidad de una serie

 X → Variable sobre la que se pretenden calcular la varianza

La desviación típica es otra medida que ofrece información de la dispersión respecto

 X → Variable sobre la que se pretenden calcular la varianza

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la

 X → Variable sobre la que se pretenden calcular la varianza

ESTUDIO DE POBLACIONES CON DATOS BIVARIADOS.

• Corresponden a la medición de dos variables en una sola unidad de observación

• Cuando trabajamos una variable sobre dos individuos simultáneamente o dos

• Las distribuciones bidimensionales son aquellas en las que se estudian al mismo

• Los pares de valores se pueden contemplar en tablas de datos, estas tablas de

• El diagrama obtenido mediante el establecimiento de los pares ordenados de

• Los datos que corresponden a dos tipos de individuos o a dos variables de un

• Existe una relación entre la correlación y la covarianza, puesto que la covarianza

RELACIÓN LINEAL • La covarianza entre X y Y se obtiene a través de la sumatoria

También podría gustarte