Está en la página 1de 36

TÉCNICAS DE ESTADÍSTICA

SOCIAL
Administrador de datos

Yamile Dib Moraga

Ingeniera Civil Informática

Dib Moraga, Yamile Caffa. Técnicas de Estadística Social.


Cuaderno de Aprendizaje. [PDF]. Santiago: IPVC, 2020. N° págs. 31

Cuadernos de Aprendizaje, Santiago.


Derechos Reservados Instituto Profesional Valle Central, prohibida su reproducción,
descarga o exhibición para usos comerciales. Permitida su descarga exclusivamente con
fines educacionales.

Cuaderno de Aprendizaje. Introducción a la Estadística 2/36


Tabla de contenido

I. Bienvenida. .......................................................................................................... 4

II. Introducción a la unidad ................................................................................ 5

Administrador de Datos ................................................................................................ 5

III. Tema 1. Base de Datos y Herramientas Informáticas ................................. 6

Base de Datos .................................................................................................................... 6

Herramientas Informáticas en Estadística ............................................................. 8

IV. Tema 2. Aplicación de Herramientas Informáticas en Estadística .......... 10

Gráficos en Microsoft Excel ....................................................................................... 10

Estadística descriptiva en Microsoft Excel .......................................................... 17

V. Bibliografía .................................................................................................... 34

VI. Índice de Figuras .......................................................................................... 35

Cuaderno de Aprendizaje. Introducción a la Estadística 3/36


I. Bienvenida.

Estimado estudiante te damos la bienvenida a la unidad Administrador de


Datos, la cual tiene como objetivo conocer que es una base de datos y herramientas
computacionales que apoyan el análisis estadístico en la práctica diaria. Se conforma por los
temas: 1. Base de Datos y Herramientas Informáticas y 2. Aplicación de Herramientas
Informáticas en Estadística. El tema 1, tiene como objetivo Conocer las herramientas
computacionales aplicables al área social para análisis estadísticos. El tema 2, tiene como
objetivo Aplicar herramientas informáticas de uso más frecuente en el área social para
análisis estadístico.

A continuación se presenta un cuaderno con la información necesaria de los dos temas


de la unidad, le invitamos a estudiarlo, revisar la bibliografía y vínculos de interés. Al
finalizar de estudiar la unidad con este cuaderno y la síntesis multimedia, tendrá la
preparación para realizar y aprobar las evaluaciones.

Recuerda que en Valle Online ¡Tu educación es nuestra prioridad!

Cuaderno de Aprendizaje. Introducción a la Estadística 4/36


II. Introducción a la unidad

Administrador de Datos

La estadística permite analizar datos y transformarlos en información, información que


genera conocimiento, para ello existen diferentes herramientas informáticas que apoyan y
simplifican el trabajo y análisis de la estadística descriptiva.

En esta unidad se abordarán algunas de las herramientas que se utilizan para los
cálculos y análisis estadísticos, abordando en mayor detalle Excel que es la más común entre
los usuarios.

Cuaderno de Aprendizaje. Introducción a la Estadística 5/36


III. Tema 1. Base de Datos y Herramientas Informáticas

Base de Datos

Conjunto de datos comunes que se almacenan sin redundancia para luego ser accesados
fácilmente. Es una colección de archivos relacionados que permite el manejo de la información
de alguna entidad. Cada uno de dichos archivos puede ser visto como una colección de registros
y cada registro está compuesto de una colección de campos. Cada uno de los campos de cada
registro permite llevar información de algún atributo de una entidad del mundo real.

Ejemplo:
Base de Datos: Universidad
Entidades: Alumnos, Salas, Profesores, Etc.
Atributos de la entidad Alumno: Nombre, Dirección, Teléfono, Carrera, Matricula, etc.

También una base de datos puede ser pensada como una tabla que se compone de filas
y columnas, cada fila corresponde a un registro (entidad) de la base de datos y cada columna
corresponde a un atributo de la entidad.

Figura 1: Base de Datos

Cuaderno de Aprendizaje. Introducción a la Estadística 6/36


Normalmente las bases de datos creadas por usuarios no especializados son escritas en
el programa Microsoft Excel, donde pueden crear tablas con sus registros y atributos
correspondientes.

Figura 2: Ejemplo Base de Datos en Microsoft Excel

Se puede ver que los registros (entidad) están representados en cada fila (números),
cada atributo de la entidad (registro) está representada en las columnas (letras).

En este programa podemos crear campos calculados, quiere decir que se puede obtener
un valor utilizando fórmulas o funciones, campos validados, listado de datos, se pueden realizar
filtros de datos, etc.

Cuaderno de Aprendizaje. Introducción a la Estadística 7/36


Herramientas Informáticas en Estadística

Existen diferentes programas o paquetes estadísticos, software libres y privados,


algunos más completos que otros, se puede acceder a versiones de prueba gratuitas, por un
tiempo determinado, para conocer cómo funcionan. Están diseñados para resolver problemas
del área estadística.

Existen algunos programas que si bien no están diseñados específicamente para


problemas estadísticos disponen de funcionalidades que permiten aplicarlas de manera fácil y
brindan resultados rápidos y exactos en la estadística aplicada, lo que acerca a los usuarios a su
utilización en cualquier área de trabajo.

Se describirá a continuación dos de los programas estadísticos más utilizados.

SPSS es una herramienta estadística (informática) ampliamente utilizada, permite


administrar bases de datos de manera eficiente, desarrollar perfiles de usuarios para el trabajo
diferenciado, realizar proyecciones y análisis de tendencia que permiten planificar actividades
a largo plazo. Permite un análisis integral de datos, ya que aborda las etapas de Planificación,
Elaboración de la Base de datos, Preparación y Análisis de los datos, y elaboración de informes.

Este programa estadístico tiene compatibilidad con la mayoría de los sistemas


operativos privados y de código libre.

Una de las utilidades que facilita el trabajo de los usuarios es que permite transformar
una base de datos creada en Microsoft Excel en una base de datos SPSS.

SAS es una herramienta estadística (informática) la cual proporciona un entorno de


software diseñado especialmente para el acceso, transformación y presentación de reportes de

Cuaderno de Aprendizaje. Introducción a la Estadística 8/36


datos. Incluye un lenguaje de programación de cuarta generación, con programas listos para
ser usados para manipulación de datos, almacenamiento y recuperación de información,
estadística descriptiva y creación de reportes, y una poderosa función de macros que reduce el
tiempo de programación y los problemas de mantenimiento.

Cuaderno de Aprendizaje. Introducción a la Estadística 9/36


IV. Tema 2. Aplicación de Herramientas Informáticas en Estadística

Gráficos en Microsoft Excel

Microsoft Excel nos permite crear gráficos basados en datos estadísticos recopilados
por los participantes del estudio estadístico.

La siguiente parte muestra cómo crear los diferentes gráficos en Microsoft Excel
basados en datos estadísticos, los ejemplos se realizan con pocos datos, pero esto se puede
realizar de la misma manera con un número mayor de datos.

Se utilizará la figura 2 y 3 de la primera unidad para mostrar cómo se puede automatizar


el trabajo.

Primero se escriben los datos uno por uno para luego resumirlos.

Figura 3: Ejemplo datos de encuesta escritos en Excel

Cuaderno de Aprendizaje. Introducción a la Estadística 10/36


Figura 4: Ejemplo para contar los datos de la muestra

Se puede ver en la Figura 4 que se pueden contar los datos que coinciden con la variable,
se utiliza la fórmula de Excel CONTAR.SI, indicando el rango que se considera en la muestra y
luego el valor que se desea contar. En la barra de fórmulas se puede ver la fórmula indicada y
en la celda J3, marcada en rojo, se puede ver el resultado, esto quiere decir que la frecuencia
absoluta de la variable 1,9 es 1.

La Figura 5 muestra cómo queda la tabla con todos las frecuencias calculadas y al
término de la columna se calcula la suma de las frecuencias dando el total de datos de la muestra
(n=30).

Cuaderno de Aprendizaje. Introducción a la Estadística 11/36


Lo mismo con la columna de frecuencias absolutas acumuladas, existe más de una
manera para ir sumándolas de manera automática, usted elija una de las que conoce, pero que
sea utilizando fórmulas automáticas y no manualmente ya que si hay cambios en los datos de
la tabla no se actualizará automáticamente la tabla ni el gráfico que usted cree posteriormente.

Figura 5: Ejemplo con todos los datos de frecuencia absoluta simple y acumulada calculados

Cuaderno de Aprendizaje. Introducción a la Estadística 12/36


Figura 6: Ejemplo con todos los datos seleccionados para crear gráficos

Para crear el gráfico se debe seleccionar los datos de la columna variable y Frecuencia
absoluta simple, como se muestra en la Figura 6, acceder al menú “Insertar” y seleccionar el
tipo de gráfico que se desea crear, se mostrarán diferentes tipos de gráfico a continuación
utilizando los mismos datos de la figura 5 para cada uno.

Cuaderno de Aprendizaje. Introducción a la Estadística 13/36


Gráfico lineal.

Figura 7: Ejemplo como insertar gráfico de líneas

Figura 8: Ejemplo Gráfico de Líneas

Cuaderno de Aprendizaje. Introducción a la Estadística 14/36


Para agregar Títulos se debe hacer clic sobre el cuadro de texto Título del gráfico y
escribir el nombre.

Gráfico de barras.

Figura 9: Ejemplo Gráfico de Barras

Cuaderno de Aprendizaje. Introducción a la Estadística 15/36


Gráfico de sectores.

Figura 10: Ejemplo Gráfico Circular

Diagramas de dispersión (gráficos de correlación)

Figura 11: Ejemplo Gráfico de Dispersión

Cuaderno de Aprendizaje. Introducción a la Estadística 16/36


Estadística descriptiva en Microsoft Excel

Se continuará explicando cómo seguir creando la tabla de distribución de frecuencia con


el mismo ejemplo, calculando con fórmulas las otras columnas y las medidas de centralización
y de dispersión, todo utilizando los formulas y funciones de Microsoft Excel.

Primero se calculará los valores de la columna de frecuencia relativa simple, la cual se


calcula considerando los valores de la columna de frecuencia absoluta simple dividido por el
total de datos de la muestra (n=30).

La columna de Frecuencia relativa acumulada se calcula sumando los valores de la


columna anterior, existe más de una manera para ir sumándolas de manera automática, usted
elija una de las que conoce, pero que sea utilizando fórmulas automáticas y no manualmente ya
que si hay cambios en los datos de la tabla no se actualizará automáticamente la tabla ni el
gráfico que usted cree posteriormente.

Las columnas de frecuencias relativas simple y acumulada pueden ser representadas


con valores decimales o porcentuales, en este caso se mostrarán con valores porcentuales, para
ello solo deben seleccionar la columna y dar formato decimal a las celdas.

Cuaderno de Aprendizaje. Introducción a la Estadística 17/36


Figura 12: Ejemplo Tabla de Distribución con cálculo de Frecuencia Relativa Simple

Cuaderno de Aprendizaje. Introducción a la Estadística 18/36


Figura 13: Ejemplo Tabla de Distribución con cálculo de Frecuencia Relativa Acumulada

Una vez que la tabla de frecuencia se encuentra lista se puede comenzar a calcular las
medidas de centralización y de dispersión del trabajo de investigación estadístico.

Este cálculo se realiza buscando en el menú “Inicio”, apartado “Modificar” la opción de


“más funciones” (Ver Figura 14), donde se accede a un cuadro en el que se selecciona la
categoría Estadísticas

Cuaderno de Aprendizaje. Introducción a la Estadística 19/36


Figura 14: Menú Microsoft Excel para insertar funciones

A continuación se muestra la manera de calcular las medidas de Centralización,


mediana, moda y la media de la muestra.

Cuaderno de Aprendizaje. Introducción a la Estadística 20/36


Medidas de Centralización

Media

Si consideramos la tabla de distribución de frecuencias calculamos la multiplicación de


la frecuencia absoluta por la variable en una nueva columna (columna N en el ejemplo), la suma
de los valores obtenidos dividido por el tamaño de la muestra nos entrega la Media aritmética,
como se ve en la Figura 15.

Figura 15: Ejemplo cálculo Media aritmética

Si tenemos solo los datos no ordenados en una tabla de distribución de frecuencias y


queremos calcular la media, solo se debe seleccionar los datos y calcular el promedio de ellos

Cuaderno de Aprendizaje. Introducción a la Estadística 21/36


como se ve en la figura 16. Si tenemos datos que no son numéricos Excel los omite
automáticamente.

Figura 16: Ejemplo cálculo Media aritmética para listado de datos sin ordenar

Cuaderno de Aprendizaje. Introducción a la Estadística 22/36


Mediana

Para el cálculo de la mediana en este ejemplo se debe considerar que se trata de una
muestra con tamaño total de datos par (n=30), por lo tanto se debe buscar cual es el valor de la
variable que contiene el 50% de los datos.

Revisando las figuras anteriores podemos ver en la columna de la frecuencia relativa


cumulada que el 50% de los datos se encuentra en la variable 1,96; por lo tanto, la mediana es
entonces esa variable.

En la figura 17 podemos observar que para calcular la mediana para datos no ordenados
solo se debe acceder a la función indicada en la Figura 14 y seleccionar la opción mediana,
seleccionando el rango completo de datos, automáticamente Excel omite los valores no
numéricos y nos entrega por resultado la mediana que en este ejemplo es 1,96.

Figura 17: Ejemplo cálculo Mediana para listado de datos sin ordenar

Cuaderno de Aprendizaje. Introducción a la Estadística 23/36


Moda

En el caso de la moda, se debe tener claro que esta puede ser multimodal, por lo tanto,
se utilizará la formula MODA.VARIOS como fórmula matricial, si no se selecciona como fórmula
matricial solo mostrará uno de los valores modales. Para mostrar una formula matricial se debe
seleccionar varias celdas verticalmente antes de acceder a la función y presionar
CTRL+SHIFT+ENTER en vez de presionar solo ENTER una vez que se tienen seleccionados los
datos a evaluar, esto para que se muestren todos los datos que más se repiten, en el ejemplo se
seleccionan 6 celdas antes de acceder a la función (rango para las modas D17:D22), ver la figura
18.

Figura 18: Ejemplo cálculo Moda para listado de datos sin ordenar

Cuaderno de Aprendizaje. Introducción a la Estadística 24/36


Figura 19: Cálculo Moda para listado de datos sin ordenar

Una vez que se obtiene el resultado se puede ver cuantos valores corresponden a la
moda. En la Figura 19 se puede observar que tenemos 3 modas, las tres celdas siguientes tienen
el símbolo #N/A, lo que significa que no hay más valores modales que solo esos tres.

Para el cálculo de la moda en una tabla de distribución de frecuencias se puede conocer


primero cual es la mayor frecuencia de la muestra, para ello se puede utilizar la función MAX y
seleccionar el rango de las frecuencias, en la Figura 20 se puede observar cómo se calcula el
mayor valor de frecuencia.

Cuaderno de Aprendizaje. Introducción a la Estadística 25/36


Figura 20: Cálculo de la mayor frecuencia en la tabla de distribución de frecuencias

Para conocer el número de modas se puede utilizar la función CONTAR.SI.

Cuaderno de Aprendizaje. Introducción a la Estadística 26/36


Figura 21: Cálculo de la cantidad de valores modales

Se puede ver en la Figura 22 que el número de valores modales es 3, esto quiere decir
que existen 3 valores con la máxima frecuencia 4. Se buscan las frecuencias en la tabla
obteniendo los valores 1,91-1,92-1,98 como los valores modales.

Cuaderno de Aprendizaje. Introducción a la Estadística 27/36


Medidas de Dispersión

Rango

Para el cálculo del rango en datos no agrupados se puede buscar el valor máximo y
mínimo del listado y se restan, por lo tanto como se ve en la figura 23 el valor del rango es 0,1.

Figura 22: Cálculo del rango para valores no ordenados

Si se tienen ordenados los datos en la tabla de distribución de frecuencias se puede


calcular con la misma fórmula y seleccionando toda la columna de valores de la variable o
restando el primer valor de la variable por el último valor.

Cuaderno de Aprendizaje. Introducción a la Estadística 28/36


Figura 23: Cálculo del rango para valores ordenados en tabla de frecuencias

Cuaderno de Aprendizaje. Introducción a la Estadística 29/36


Varianza

2 ̅)2 ∗ 𝑓𝑖)
∑((𝑥𝑖 − 𝑥
𝑆 =
𝑛−1

Como para el cálculo de la varianza se requiere calcular la resta entre la variable y la


media de la muestra elevado a dos, y luego el resultado se multiplica por la frecuencia absoluta
simple de cada variable, se agregarán columnas a la tabla de distribución de frecuencias.

Figura 24: Cálculo columna variable menos media aritmética

Cuaderno de Aprendizaje. Introducción a la Estadística 30/36


Figura 25: Cálculo columna variable menos media aritmética al cuadrado

Figura 26: Cálculo columna final para varianza

El cálculo de la Varianza se ve en la figura 27.

Cuaderno de Aprendizaje. Introducción a la Estadística 31/36


Figura 27: Cálculo varianza

Cuaderno de Aprendizaje. Introducción a la Estadística 32/36


Desviación Estándar

∑((𝑥𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖)
𝑆=√
𝑛−1

El cálculo de la Desviación estándar se ve en la figura 28.

Figura 28: Cálculo desviación estándar

Cuaderno de Aprendizaje. Introducción a la Estadística 33/36


V. Bibliografía

Video Cálculo de Tabla de Distribución de Frecuencias [en línea]. ]. .[Consulta: 26


de Febrero de 2017] Disponible en:
<https://www.youtube.com/watch?v=Agj1koSTA6Y>

Video Calculo Medidas de Centralización y de Dispersión [en línea]. ]. .[Consulta:


26 de Febrero de 2017] Disponible en: <https://www.youtube.com/watch?v=dGTN-
6zwAcY>

Definición de Base de Datos. Diccionario de la Real Academia Española, [Web en


línea]. . [Consulta: 26 de febrero de 2017]. Disponible en:
<http://dle.rae.es/?id=5ASmP2Z>

Figura 1: http://tics.org.mx/share/base-de-datos.png

Figura 2: https://i.ytimg.com/vi/LbWwHnAbEzQ/hqdefault.jpg

Cuaderno de Aprendizaje. Introducción a la Estadística 34/36


VI. Índice de Figuras

Figura 1: Base de Datos............................................................................................................................... 6

Figura 2: Ejemplo Base de Datos en Microsoft Excel ...................................................................... 7

Figura 3: Ejemplo datos de encuesta escritos en Excel .............................................................. 10

Figura 4: Ejemplo para contar los datos de la muestra .............................................................. 11

Figura 5: Ejemplo con todos los datos de frecuencia absoluta simple y acumulada
calculados...................................................................................................................................................................... 12

Figura 6: Ejemplo con todos los datos seleccionados para crear gráficos.......................... 13

Figura 7: Ejemplo como insertar gráfico de líneas ....................................................................... 14

Figura 8: Ejemplo Gráfico de Líneas ................................................................................................... 14

Figura 9: Ejemplo Gráfico de Barras................................................................................................... 15

Figura 10: Ejemplo Gráfico Circular ................................................................................................... 16

Figura 11: Ejemplo Gráfico de Dispersión ....................................................................................... 16

Figura 12: Ejemplo Tabla de Distribución con cálculo de Frecuencia Relativa Simple. 18

Figura 13: Ejemplo Tabla de Distribución con cálculo de Frecuencia Relativa Acumulada
........................................................................................................................................................................................... 19

Figura 14: Menú Microsoft Excel para insertar funciones ........................................................ 20

Figura 15: Ejemplo cálculo Media aritmética ................................................................................. 21

Cuaderno de Aprendizaje. Introducción a la Estadística 35/36


Figura 16: Ejemplo cálculo Media aritmética para listado de datos sin ordenar ............ 22

Figura 17: Ejemplo cálculo Mediana para listado de datos sin ordenar.............................. 23

Figura 18: Ejemplo cálculo Moda para listado de datos sin ordenar .................................... 24

Figura 19: Cálculo Moda para listado de datos sin ordenar ..................................................... 25

Figura 20: Cálculo de la mayor frecuencia en la tabla de distribución de frecuencias.. 26

Figura 21: Cálculo de la cantidad de valores modales ................................................................ 27

Figura 22: Cálculo del rango para valores no ordenados .......................................................... 28

Figura 23: Cálculo del rango para valores ordenados en tabla de frecuencias ................ 29

Figura 24: Cálculo columna variable menos media aritmética ............................................... 30

Figura 25: Cálculo columna variable menos media aritmética al cuadrado ...................... 31

Figura 26: Cálculo columna final para varianza ............................................................................ 31

Figura 27: Cálculo varianza .................................................................................................................... 32

Figura 28: Cálculo desviación estándar ............................................................................................ 33

Cuaderno de Aprendizaje. Introducción a la Estadística 36/36

También podría gustarte