Está en la página 1de 12

Paola Soto

La importancia del Análisis Estadístico

Resumen

Las estadísticas es una clasificación de las matemáticas, cuya función es la de la


recopilación, clasificación y análisis de datos. La función principal de las estadísticas,
son la de explicar un fenómeno de interés utilizando únicamente datos e información
recopilada en investigaciones. Se basa en la clasificación de datos que pueden ser
analizados desde un punto de vista cuantitativo y cualitativo para dar una explicación
concreta.

En el caso del análisis estadístico, su función principal es el la del análisis de


datos enfocado en el ámbito de los negocios. Se basa en la de gestionar cada
información recopilada en función a cada muestra de datos individuales existentes en
una serie de muestras. El siguiente trabajo de investigación tiene como objetivo
principal explicar que es el análisis estadístico. Además de explicar cómo se lleva a
cabo el tratamiento de los datos y el análisis univariado.

Palabras clave: análisis estadístico, variable cualitativo, variable cuantitativo,


análisis univariado, muestra.

Abstract

Statistics is a classification of mathematics, whose function is that of data


collection, classification and analysis. The main function of statistics is to explain a
phenomenon of interest using only data and information collected in research. It is
based on the classification of data that can be analyzed from a quantitative and
qualitative point of view to give a concrete explanation.

In the case of statistical analysis, its main function is the analysis of data focused
on the field of business. It is based on the management of each information collected
according to each sample of existing individual data in a series of samples. The main
objective of the following research work is to explain what statistical analysis is. In
addition to explaining how the data treatment and the univariate analysis are carried out.

Keywords: statistical analysis, qualitative variable, quantitative variable,


univariate analysis, sample.
Paola Soto

Introducción

Las estadísticas son la herramienta matemática más importante que existe en el


mundo de las matemáticas. En ellas, los usuarios pueden aplicar distintas técnicas para
la recopilación y análisis de datos obtenidos utilizando herramientas como encuestas.
Dichos datos obtenidos serán utilizados para un posterior análisis, el cual tendrá el
objetivo principal de explicar algún fenómeno de interés.

En el caso del análisis estadístico, este está enfocado al uso empresarial para
conocer aspectos como los cambios existentes en el mercado, número de clientes que les
gusta un tipo de marca específico, o algún otro tema que se desee resolver.

En el contexto de la inteligencia empresarial, el análisis estadístico implica


recopilar y examinar cada muestra de datos en un conjunto de elementos a partir de los
cuales se pueden extraer muestras. Una muestra, en estadísticas, es una selección
representativa extraída de una población total.

El análisis estadístico se puede dividir en cinco pasos discretos, de la siguiente


manera:

a- Describe la naturaleza de los datos a analizar.


b- Explore la relación de los datos con la población subyacente.
c- Cree un modelo para resumir la comprensión de cómo los datos se
relacionan con la población subyacente.
d- Demuestra o desaprueba la validez del modelo.

El objetivo del análisis estadístico es identificar tendencias. Un negocio


minorista, por ejemplo, podría usar el análisis estadístico para encontrar patrones en
datos de clientes no estructurados y semiestructurados que se puedan utilizar para crear
una experiencia de cliente más positiva e incrementar las ventas [ CITATION Lau15 \l
12298 ].

Desarrollo

Las variables estadísticas se pueden clasificar de dos maneras, cuantitativa y


cualitativa. Las variables cuantitativas tienen valores numéricos. Cálculos significativos
tales como el promedio y la desviación estándar se pueden hacer para variables
cuantitativas, pero no cualitativas.
Paola Soto

Las variables cualitativas, por otro lado, se pueden poner en grupos o categorías.
Por esta razón, también se les llama variables categóricas. A veces se les dan valores
numéricos discretos que son convenientes para agrupar. Pero estos números no son
útiles para hacer cálculos como la media o la desviación estándar.

Por ejemplo, los equipos deportivos se dividen en divisiones, como la División


1, la División 2, etc. Pero estos números simplemente se usan para agrupar y no se
usarían para hacer cálculos. Esto hace que las divisiones de equipos deportivos sean un
ejemplo de una variable cualitativa.

Las variables cualitativas pueden ser nominales, ordinales o dicotómicas. Si son


nominales, no hay un orden natural para las categorías a las que se asignan estas
variables, como el título universitario o el color de pelo. Si existe un orden natural, se
consideran ordinales. El nivel educativo y el nivel socioeconómico son ejemplos de
variables ordinales. Las variables dicotómicas tienen solo dos categorías. Respuestas de
una encuesta electoral que hace la pregunta, ¿Votarías por este candidato? sería un
ejemplo de una variable dicotómica. Solo hay dos categorías para la respuesta, sí y no
[ CITATION Uni121 \l 12298 ].

Tratamiento de datos

a. Variables cualitativas

Las variables cualitativas son aquellas variables que puede aparecer en una
función, algún algoritmo o una proposición. También está presente en una
formula y adopción de distintos valores. Las variables cualitativas se diferencias
de las variables cuantitativas debido a alguna característica única que las define.
Esta puede ser algún atributo, categoría o cualidad.

Las variables cualitativas poseen tres tipos de clasificaciones distintas que son la
de escala nominal, la de escala ordinal y la distribuida por intervalos.

- La escala nominal

La variable cualitativa de escala nominal corresponde a aquella variable que


no se puede definir por un orden natural existente entre categorías. Un
ejemplo de escala nominal son las variables como el caso de la raza o la
religión.
Paola Soto

- La escala ordinal

Cuando se refiere a escala ordinal, esta es la que se puede establecer


mediante relaciones de un orden entre todas sus categorías. Como ejemplo
de variables ordinales son el rango militar, la clasificación de las clases
sociales, entre otros.

- La escala distribuida por intervalos

Este tipo de variable corresponde a aquellas variables que pueden ser


tratadas como variables ordinales. Este tipo de variables pueden ser
calculados en base a su distancia numérica. Un ejemplo de ello es la
aplicación en el análisis de datos números como los años de educación que
ha percibido un conjunto de estudiantes [ CITATION Uni12 \l 12298 ].

b. Variables cuantitativas

Las variables cuantitativas por otro lado corresponden a un tipo de variable el


cual tiene la capacidad de asumir un valor numero como característica propia.
Además, tendrá la capacidad de cambiar en cualquier cantidad según se necesite
en el análisis estadístico. Las variables cuantitativas pueden ser de tipo discretas
o continuas.

Las variables cuantitativas se clasifican en dos tipos de variables que son las
variables discretas y las variables continuas.

- Las variables discretas

Las variables discretas corresponden a aquellas que tienen la capacidad de


asumir un valor numérico y que puede ser cambiado en cualquier cantidad.

- Las variables continuas

Las variables continuas por otro lado son aquellas variables que cuando
poseen valores numéricos enteros. Sin embargo, estos no pueden ser
cambiado en cualquier valor [ CITATION And16 \l 12298 ].

c. Preparación de datos

La preparación de los datos es fundamental para realizar una correcta


investigación. No realizar una preparación de los datos puede afectar
Paola Soto

considerablemente los resultados estadísticos de la investigación. La preparación


de los datos debe realizarse en base a una serie de pasos que son la revisión del
cuestionario, la edición, la posterior codificación, la posterior digitalización de
los mismos, la depuración de los datos y el posterior análisis estadístico.

- Revisión del cuestionario

Revisar el cuestionario es fundamental para realizar el correcto análisis de


los datos que se formularon utilizando como base el diseño de la
investigación. El cuestionario debe ser revisado para obtener información
real en la investigación.

- La edición de los cuestionarios

La edición de los cuestionarios es fundamental para obtener información


100% confiable. Estas deben de tener una consistencia lógica. Sus respuestas
no pueden ser incongruentes o ambiguas. La tabulación de las respuestas es
fundamental para la elaboración posterior de las tablas de los códigos

- La codificación

Cuando se habla de codificación, se habla de asignar un valor numérico a los


datos encontrados. Para ello es fundamental la utilización de una tabla de
códigos que se genera en la etapa de edición.

- La digitación

En el caso de la digitación, esta es la acción de ingresar los códigos de


respuesta, encontrados en cada pregunta en una base de datos. Esta base de
datos posee una estructura de matriz, donde las filas corresponden a aquellos
encuestados y las columnas serán las respuestas obtenidas.

- La depuración de datos

La depuración de los datos es fundamental para encontrar alguna


inconsistencia en los datos. Estos pueden ser datos fuera de rango, valores
extremos o incongruencias en las respuestas.

- Ajustes estadísticos
Paola Soto

Estos son utilizados únicamente para realizar una ponderación de datos que
se genera en los datos de la muestra. Estos serán datos más representativos
que una población [ CITATION Ped13 \l 12298 ].

Análisis Univariado

El análisis univariado corresponde a realizar un análisis de cada una de las


variables estudiadas de manera separada. En otras palabras, el análisis debe estar basado
únicamente en una única variable. Para el análisis univariado existen una serie de
técnicas como son la distribución de frecuencias en una tabla univariada y el análisis de
las medidas de tendencia central presente en las variables [ CITATION Hec99 \l 12298 ].

El procedimiento univariado se clasifica de tipo intervalo, de tipo nominal y de


tipo ordinal. Su clasificación es en base al nivel de escala de la variable.

- Con el análisis de intervalo se debe de utilizar elementos como la media


y la desviación estándar.
- Con el análisis de intervalos ordinal se debe utilizar elementos como la
mediana y el rango intercuartil
- Con el análisis nominal se debe utilizar elementos como la moda, la
frecuencia relativa y la frecuencia absoluta por categoría

El análisis de los datos unidades debe estar relacionada en base a la característica


de las propiedades de las personas con las que van a medirse. En los estudios de datos
univariados se deben de analizar los efectos de la variable independiente sobre una
única variable. Además, tiene como objetivo medir la misma variable dependiente para
cada sujeto en cada grupo.

La clasificación de las variables en los métodos univariados se dan por dos


características fundamentales que son por su naturaleza o por su escala de medición. Por
su naturaleza se encuentran las variables cualitativas y las variables continuas [ CITATION
Uni181 \l 12298 ]

a. Variable cualitativa
a. Las variables dicotómicas

Una variable dicotómica se trata de una variable de tipo binaria la cual


solo tiene la capacidad de tomar dos valores.
Paola Soto

Las variables dicotómicas están dispuestas a cumplir con una serie de


reglas. Estas son como cuando existe una variable que tiene dos
categorías. Únicamente se deben de introducir una única variable.
También se deben utilizar técnicas en el uso de las variables dicótomas y
estas tienen la capacidad de extenderse en una variable cualitativa
[ CITATION Dan12 \l 12298 ].

Como ejemplo de estas variables esta la clasificación de: sano, enfermo.

Las variables polinómicas

Las variables polinómicas son aquellas que están dispuestas a cumplir


con la regla de tener dos o más categorías. Un ejemplo de ello es la
clasificación del estado civil, que posee varios tipos que son: soltero,
casado, unido, divorciado, viudo.

b. Variable cuantitativa
a. Variables discretas

Las variables discretas corresponden a aquellas variables que no pueden


tomar como propios algunos valores que se encuentren en un mínimo
conjunto numerable. Es decir, que este tipo de variables no permite la
aceptación de cualquier tipo de valor, sino únicamente los pertenecientes
al conjunto.

Un ejemplo de variable discreta son la clasificación del número de camas


que existe en el hospital, o el número de atenciones que se generan en
consulta externa: 1,2,3,4… 500.

b. Variables continuas

Las variables continuas corresponden a aquella variable que tiene la


capacidad de adquirir cualquier tipo de valor en el marco de un intervalo
que ya haya sido predeterminado. Es importante destacar que, entre dos
valores, siempre puede haber un valor intermedio.

En el caso de las variables continua, un ejemplo clave es la clasificación


de un recién nacido por su peso: 3000 kg, 3 100 kg, 2900 kg. O por su
talla al nacer: 45,5; 40,0; 50,5; 48.5cm [ CITATION Uni12s \l 2058 ].
Paola Soto

Análisis bivariados

Los análisis son denominados como análisis bivariados, debido a la presencia de


una variable dependiente y una variable independiente. Esta herramienta es
fundamental para la descripción conjunta de dos tipos de variables. Para realizar
el análisis se debe de en primer lugar representar los datos en una tabla de
frecuencia. En segundo lugar, se debe de asignar dos valores a cada caso.

Un ejemplo de este es el análisis del peso y altura de una persona. La variable


tendrá dos valores relacionados con el peso y la altura.

a. Variable cualitativa

La información que se genera al utilizar datos cualitativos, es proporcionada


mediante una referencia que existe entre la frecuencia que se cumplan en las
variables que posean cierto tipo de características. Para el análisis cualitativo en
los datos bivariados se desarrolla la prueba de ji cuadrado o X2.

Entre los casos más importantes se encuentran características como la prueba de


frecuencias, la prueba de independencia, la prueba de bondad de ajuste, la
prueba de Pearson en base a la relación continua de Yates y la prueba de Bartlett
de varianzas homogéneas.

Un ejemplo como el caso de la bondad de ajuste, esta permite al analista


determinar la diferencia estadística que existe en la distribución de observación y
la distribución teórica. Se utiliza la siguiente formula.

2 (0 i−Ei )2
k
x =∑
i=1 Ei

- La fórmula determina que X2 es el valor estimado de Ji cuadrado en los


datos observados
- Oi corresponde al número de los casos observados en la (i) espacio
- Ei es el número de casos que se observan en la (i) espacio, cuando existe
una hipótesis nula con valor verdadero
- K es el número de categorías [ CITATION Dim12 \l 2058 ].
Paola Soto

b. Variable cuantitativa

Cuando se realice el análisis de la variable cuantitativa, se debe condicionarla a


las categorías que posea la variable cualitativa. Sus categorías además pueden
ser representadas y agrupadas en intervalos. Para utilizar un sistema cuantitativo
dentro de un sistema de relaciones lineales, se debe utilizar el concepto básico de
correlación. La correlación es aquel cociente de la división de la covarianza, la
cual se clasifica en distintos tipos de teorema de correlación como son:

- El teorema de una cantidad de varianza conjunta o a fin entre las


variables (X, Y) deben ser igual a 0. La covarianza deberá tener un valor
igual a 0, de igual forma que su correlación.
- En el caso de una cantidad de varianza conjunta entre las variables con
valor mayor que 0, y que la varianza sea menor al total, la covarianza
debe de tener un valor mayor que 0 y menor que la suma de la varianza.
- En el caso de que una cantidad de varianza de tipo conjunta entre las
variables igual al total de la varianza, son producto del comportamiento
relativo representado por las desviaciones en los puntajes de las variables
X y Y [ CITATION Dim12 \l 2058 ].

Tratamiento de los datos

a. Validación de datos

La validación de los datos estadísticos es fundamental para comprobar si los datos


obtenidos permiten realizar un análisis usando leyes estadísticas y científicas. Su
validación es realizada en base a leyes matemáticas. La validación de los datos es
realizada utilizando diferentes tipos de validez como son:

- Validez de constructo

Este tipo de validez asegura que la recolección y la experimentación con los


datos debe adjuntarse a la teoría que se está estudiando.

- Validez convergente

En la validez convergente, se refiere al hecho que la teoría requerida tiene la


capacidad de predecir que ambas medias de dos elementos se relacionan
entre sí.
Paola Soto

- Validez divergente

La validez divergente es aquella que determina que la teoría tiene la


capacidad de predecir si una variable no posee características correlacionales
con otra.

b. Datos atípicos

Los datos atípicos en estadísticas, son aquellas observaciones con valores grandes o
pequeñas que generan un efecto desproporcionado en el resultado final del análisis
estadístico. Una de las variables que más se suele afectar con datos atípicos son la
media. El valor atípico se lo puede reconocer porque este posee un valor totalmente
distinto al que poseen las demás variables.

Cuando en el análisis de los datos se genere un valor atípico, el investigador debe de


analizar de forma correcta de donde se obtuvo el valor atípico. Uno de los métodos
más factibles al análisis de un dato atípico es graficarlo.

Grafico. Análisis de un dato atípico mediante el grafico de dispersión.

Entre las posibles causas que generan un valor atípico en los datos estadísticos se
encuentran los errores de la entrada de datos, algún problema con el proceso de
investigación, algún elemento que no se consideró en el análisis de la información y
el caso de una probabilidad aleatoria [ CITATION Ped16 \l 2058 ].

c. Pruebas de normalidad

Por otro lado, las pruebas de normalidad permiten al investigador utilizar o rechazar
la hipótesis nula de que los datos son generados por una población distribuida de
forma normal. El analizador tiene la capacidad de realizar una prueba de normalidad
y elaborar una gráfica de probabilidad que le permita generar un análisis más
Paola Soto

explicativo. Las pruebas de normalidad son la herramienta más fácil, al igual que su
grafica para comprobar si los datos obtenidos son normales.

Existen varios tipos de prueba de normalidad entre los cuales destacan la prueba de
Anderson Darling, la prueba de Ryan Joiner y la prueba de Kolmogorov Smirnov.

- Prueba Anderson Darling

Esta prueba consiste en realizar una breve comparación de la función de


distribución acumulada empírica que poseen los datos de la muestra con la
distribución esperada en caso que los datos sean considerados normales. En
caso de observarse una diferencia que no refleje una normalidad, se debe
rechazar la hipótesis nula de la normalidad de la población.

- Prueba Ryan Joiner

En el caso de las pruebas de hipótesis de Ryan Joiner, se realiza una


evaluación de mediante el cálculo de la correlación de los datos y las
puntuaciones normales presentes en los datos. En caso que el coeficiente en
la correlación tenga un valor cercano a 1, existe la probabilidad que la
población sea normal. En caso que el valor se encuentre por debajo del valor
crítico, se debe rechazar la hipótesis.

- Prueba Kolmogorov Smirnov

En el caso de la prueba de Kolmogorov Smirnov, se realiza una comparación


en la función de la distribución acumulada de los datos de la muestra. Si
existe una diferencia atípica, se debe rechazar la hipótesis.

Relación entre variable (datos bivariados)

Bibliografía
Avila, H. (1999). Introducción a la metodología de la investigación. Cuauhtemoc: Instituto
Tecnoloogico de Ciudad de Cuauhtemoc.

Bello, A. (10 de Agosto de 2016). Tipos de variables. Obtenido de


http://mey.cl/apuntes/variablesunab.pdf

Jimenez, D. (2012). Las variables Dicotomicas. Mexico : Mexico.


Paola Soto

Molina, L. (4 de Abril de 2015). ¿Que es la estadistica? Obtenido de


https://tarwi.lamolina.edu.pe/~fmendiburu/index-
filer/academic/Estadistica/parte1.pdf

Moncayo, P. (2013). Preparación de los datos. Madrid: Universidad de Granada.

Sulbarán, D. (20 de Febrero de 2012). ANÁLISIS BIVARIADO DE DATOS. Obtenido de


http://saber.ucv.ve/bitstream/123456789/11400/1/An%C3%A1lisis%20bivariado
%20de%20datos.pdf

Universidad Alas Peruanas. (2 de Julio de 2012). Unidad de analisis, dato y variable. Obtenido
de
http://www.uap.edu.pe/intranet/fac/material/07/20122BX070307511070110011/201
22BX07030751107011001137200.pdf

Universidad de Granada. (22 de Abril de 2012). Análisis de datos cualitativos. Obtenido de


http://www.ugr.es/~bioestad/_private/cpfund2.pdf

Universidad Politecnica del litoral. (3 de Julio de 2018). Analisis Univariado. Obtenido de


https://www.dspace.espol.edu.ec/bitstream/123456789/19252/5/CAP%C3%8DTULO
%203.-%20AN%C3%81LISIS%20UNIVARIADO.pdf

Universidad Tecnica de Ambato. (14 de Enero de 2012). Analisis estadistico univariado,


bivariado y variables control. Obtenido de http://chitita.uta.cl/cursos/2012-
1/0000104/recursos/r-25.pdf

También podría gustarte