La Importancia Del Análisis Estadístico

Paola Soto
La importancia del Análisis Estadístico
Resumen
Las estadísticas es una clasificación de las matemáticas, cuya función es la de la

recopilación, clasificación y análisis de datos. La función principal de las estadísticas,
son la de explicar un fenómeno de interés utilizando únicamente datos e información
recopilada en investigaciones. Se basa en la clasificación de datos que pueden ser
analizados desde un punto de vista cuantitativo y cualitativo para dar una explicación
concreta.
En el caso del análisis estadístico, su función principal es el la del análisis de

datos enfocado en el ámbito de los negocios. Se basa en la de gestionar cada
información recopilada en función a cada muestra de datos individuales existentes en
una serie de muestras. El siguiente trabajo de investigación tiene como objetivo
principal explicar que es el análisis estadístico. Además de explicar cómo se lleva a
cabo el tratamiento de los datos y el análisis univariado.
Palabras clave: análisis estadístico, variable cualitativo, variable cuantitativo,

análisis univariado, muestra.
Abstract
Statistics is a classification of mathematics, whose function is that of data

collection, classification and analysis. The main function of statistics is to explain a
phenomenon of interest using only data and information collected in research. It is
based on the classification of data that can be analyzed from a quantitative and
qualitative point of view to give a concrete explanation.
In the case of statistical analysis, its main function is the analysis of data focused
on the field of business. It is based on the management of each information collected
according to each sample of existing individual data in a series of samples. The main
objective of the following research work is to explain what statistical analysis is. In
addition to explaining how the data treatment and the univariate analysis are carried out.
Keywords: statistical analysis, qualitative variable, quantitative variable,

univariate analysis, sample.
Paola Soto
Introducción
Las estadísticas son la herramienta matemática más importante que existe en el

mundo de las matemáticas. En ellas, los usuarios pueden aplicar distintas técnicas para
la recopilación y análisis de datos obtenidos utilizando herramientas como encuestas.
Dichos datos obtenidos serán utilizados para un posterior análisis, el cual tendrá el
objetivo principal de explicar algún fenómeno de interés.
En el caso del análisis estadístico, este está enfocado al uso empresarial para
conocer aspectos como los cambios existentes en el mercado, número de clientes que les
gusta un tipo de marca específico, o algún otro tema que se desee resolver.
En el contexto de la inteligencia empresarial, el análisis estadístico implica

recopilar y examinar cada muestra de datos en un conjunto de elementos a partir de los
cuales se pueden extraer muestras. Una muestra, en estadísticas, es una selección
representativa extraída de una población total.
El análisis estadístico se puede dividir en cinco pasos discretos, de la siguiente

manera:
a- Describe la naturaleza de los datos a analizar.

b- Explore la relación de los datos con la población subyacente.
c- Cree un modelo para resumir la comprensión de cómo los datos se
relacionan con la población subyacente.
d- Demuestra o desaprueba la validez del modelo.
El objetivo del análisis estadístico es identificar tendencias. Un negocio

minorista, por ejemplo, podría usar el análisis estadístico para encontrar patrones en
datos de clientes no estructurados y semiestructurados que se puedan utilizar para crear
una experiencia de cliente más positiva e incrementar las ventas [ CITATION Lau15 \l
12298 ].
Desarrollo
Las variables estadísticas se pueden clasificar de dos maneras, cuantitativa y

cualitativa. Las variables cuantitativas tienen valores numéricos. Cálculos significativos
tales como el promedio y la desviación estándar se pueden hacer para variables
cuantitativas, pero no cualitativas.
Paola Soto
Las variables cualitativas, por otro lado, se pueden poner en grupos o categorías.
Por esta razón, también se les llama variables categóricas. A veces se les dan valores
numéricos discretos que son convenientes para agrupar. Pero estos números no son
útiles para hacer cálculos como la media o la desviación estándar.
Por ejemplo, los equipos deportivos se dividen en divisiones, como la División

1, la División 2, etc. Pero estos números simplemente se usan para agrupar y no se
usarían para hacer cálculos. Esto hace que las divisiones de equipos deportivos sean un
ejemplo de una variable cualitativa.
Las variables cualitativas pueden ser nominales, ordinales o dicotómicas. Si son

nominales, no hay un orden natural para las categorías a las que se asignan estas
variables, como el título universitario o el color de pelo. Si existe un orden natural, se
consideran ordinales. El nivel educativo y el nivel socioeconómico son ejemplos de
variables ordinales. Las variables dicotómicas tienen solo dos categorías. Respuestas de
una encuesta electoral que hace la pregunta, ¿Votarías por este candidato? sería un
ejemplo de una variable dicotómica. Solo hay dos categorías para la respuesta, sí y no
[ CITATION Uni121 \l 12298 ].
Tratamiento de datos
a. Variables cualitativas
Las variables cualitativas son aquellas variables que puede aparecer en una
función, algún algoritmo o una proposición. También está presente en una
formula y adopción de distintos valores. Las variables cualitativas se diferencias
de las variables cuantitativas debido a alguna característica única que las define.
Esta puede ser algún atributo, categoría o cualidad.
Las variables cualitativas poseen tres tipos de clasificaciones distintas que son la
de escala nominal, la de escala ordinal y la distribuida por intervalos.
- La escala nominal
La variable cualitativa de escala nominal corresponde a aquella variable que

no se puede definir por un orden natural existente entre categorías. Un
ejemplo de escala nominal son las variables como el caso de la raza o la
religión.
Paola Soto
- La escala ordinal
Cuando se refiere a escala ordinal, esta es la que se puede establecer

mediante relaciones de un orden entre todas sus categorías. Como ejemplo
de variables ordinales son el rango militar, la clasificación de las clases
sociales, entre otros.
- La escala distribuida por intervalos
Este tipo de variable corresponde a aquellas variables que pueden ser

tratadas como variables ordinales. Este tipo de variables pueden ser
calculados en base a su distancia numérica. Un ejemplo de ello es la
aplicación en el análisis de datos números como los años de educación que
ha percibido un conjunto de estudiantes [ CITATION Uni12 \l 12298 ].
b. Variables cuantitativas
Las variables cuantitativas por otro lado corresponden a un tipo de variable el

cual tiene la capacidad de asumir un valor numero como característica propia.
Además, tendrá la capacidad de cambiar en cualquier cantidad según se necesite
en el análisis estadístico. Las variables cuantitativas pueden ser de tipo discretas
o continuas.
Las variables cuantitativas se clasifican en dos tipos de variables que son las
variables discretas y las variables continuas.
- Las variables discretas
Las variables discretas corresponden a aquellas que tienen la capacidad de

asumir un valor numérico y que puede ser cambiado en cualquier cantidad.
- Las variables continuas
Las variables continuas por otro lado son aquellas variables que cuando
poseen valores numéricos enteros. Sin embargo, estos no pueden ser
cambiado en cualquier valor [ CITATION And16 \l 12298 ].
c. Preparación de datos
La preparación de los datos es fundamental para realizar una correcta

investigación. No realizar una preparación de los datos puede afectar
Paola Soto
considerablemente los resultados estadísticos de la investigación. La preparación

de los datos debe realizarse en base a una serie de pasos que son la revisión del
cuestionario, la edición, la posterior codificación, la posterior digitalización de
los mismos, la depuración de los datos y el posterior análisis estadístico.
- Revisión del cuestionario
Revisar el cuestionario es fundamental para realizar el correcto análisis de

los datos que se formularon utilizando como base el diseño de la
investigación. El cuestionario debe ser revisado para obtener información
real en la investigación.
- La edición de los cuestionarios
La edición de los cuestionarios es fundamental para obtener información

100% confiable. Estas deben de tener una consistencia lógica. Sus respuestas
no pueden ser incongruentes o ambiguas. La tabulación de las respuestas es
fundamental para la elaboración posterior de las tablas de los códigos
- La codificación
Cuando se habla de codificación, se habla de asignar un valor numérico a los

datos encontrados. Para ello es fundamental la utilización de una tabla de
códigos que se genera en la etapa de edición.
- La digitación
En el caso de la digitación, esta es la acción de ingresar los códigos de

respuesta, encontrados en cada pregunta en una base de datos. Esta base de
datos posee una estructura de matriz, donde las filas corresponden a aquellos
encuestados y las columnas serán las respuestas obtenidas.
- La depuración de datos
La depuración de los datos es fundamental para encontrar alguna

inconsistencia en los datos. Estos pueden ser datos fuera de rango, valores
extremos o incongruencias en las respuestas.
- Ajustes estadísticos
Paola Soto
Estos son utilizados únicamente para realizar una ponderación de datos que
se genera en los datos de la muestra. Estos serán datos más representativos
que una población [ CITATION Ped13 \l 12298 ].
Análisis Univariado
El análisis univariado corresponde a realizar un análisis de cada una de las

variables estudiadas de manera separada. En otras palabras, el análisis debe estar basado
únicamente en una única variable. Para el análisis univariado existen una serie de
técnicas como son la distribución de frecuencias en una tabla univariada y el análisis de
las medidas de tendencia central presente en las variables [ CITATION Hec99 \l 12298 ].
El procedimiento univariado se clasifica de tipo intervalo, de tipo nominal y de

tipo ordinal. Su clasificación es en base al nivel de escala de la variable.
- Con el análisis de intervalo se debe de utilizar elementos como la media

y la desviación estándar.
- Con el análisis de intervalos ordinal se debe utilizar elementos como la
mediana y el rango intercuartil
- Con el análisis nominal se debe utilizar elementos como la moda, la
frecuencia relativa y la frecuencia absoluta por categoría
El análisis de los datos unidades debe estar relacionada en base a la característica

de las propiedades de las personas con las que van a medirse. En los estudios de datos
univariados se deben de analizar los efectos de la variable independiente sobre una
única variable. Además, tiene como objetivo medir la misma variable dependiente para
cada sujeto en cada grupo.
La clasificación de las variables en los métodos univariados se dan por dos

características fundamentales que son por su naturaleza o por su escala de medición. Por
su naturaleza se encuentran las variables cualitativas y las variables continuas [ CITATION
Uni181 \l 12298 ]
a. Variable cualitativa
a. Las variables dicotómicas
Una variable dicotómica se trata de una variable de tipo binaria la cual

solo tiene la capacidad de tomar dos valores.
Paola Soto
Las variables dicotómicas están dispuestas a cumplir con una serie de

reglas. Estas son como cuando existe una variable que tiene dos
categorías. Únicamente se deben de introducir una única variable.
También se deben utilizar técnicas en el uso de las variables dicótomas y
estas tienen la capacidad de extenderse en una variable cualitativa
[ CITATION Dan12 \l 12298 ].
Como ejemplo de estas variables esta la clasificación de: sano, enfermo.
Las variables polinómicas
Las variables polinómicas son aquellas que están dispuestas a cumplir

con la regla de tener dos o más categorías. Un ejemplo de ello es la
clasificación del estado civil, que posee varios tipos que son: soltero,
casado, unido, divorciado, viudo.
b. Variable cuantitativa
a. Variables discretas
Las variables discretas corresponden a aquellas variables que no pueden

tomar como propios algunos valores que se encuentren en un mínimo
conjunto numerable. Es decir, que este tipo de variables no permite la
aceptación de cualquier tipo de valor, sino únicamente los pertenecientes
al conjunto.
Un ejemplo de variable discreta son la clasificación del número de camas

que existe en el hospital, o el número de atenciones que se generan en
consulta externa: 1,2,3,4… 500.
b. Variables continuas
Las variables continuas corresponden a aquella variable que tiene la

capacidad de adquirir cualquier tipo de valor en el marco de un intervalo
que ya haya sido predeterminado. Es importante destacar que, entre dos
valores, siempre puede haber un valor intermedio.
En el caso de las variables continua, un ejemplo clave es la clasificación

de un recién nacido por su peso: 3000 kg, 3 100 kg, 2900 kg. O por su
talla al nacer: 45,5; 40,0; 50,5; 48.5cm [ CITATION Uni12s \l 2058 ].
Paola Soto
Análisis bivariados
Los análisis son denominados como análisis bivariados, debido a la presencia de

una variable dependiente y una variable independiente. Esta herramienta es
fundamental para la descripción conjunta de dos tipos de variables. Para realizar
el análisis se debe de en primer lugar representar los datos en una tabla de
frecuencia. En segundo lugar, se debe de asignar dos valores a cada caso.
Un ejemplo de este es el análisis del peso y altura de una persona. La variable

tendrá dos valores relacionados con el peso y la altura.
a. Variable cualitativa
La información que se genera al utilizar datos cualitativos, es proporcionada

mediante una referencia que existe entre la frecuencia que se cumplan en las
variables que posean cierto tipo de características. Para el análisis cualitativo en
los datos bivariados se desarrolla la prueba de ji cuadrado o X2.
Entre los casos más importantes se encuentran características como la prueba de

frecuencias, la prueba de independencia, la prueba de bondad de ajuste, la
prueba de Pearson en base a la relación continua de Yates y la prueba de Bartlett
de varianzas homogéneas.
Un ejemplo como el caso de la bondad de ajuste, esta permite al analista

determinar la diferencia estadística que existe en la distribución de observación y
la distribución teórica. Se utiliza la siguiente formula.
2 (0 i−Ei )2
k
x =∑
i=1 Ei
- La fórmula determina que X2 es el valor estimado de Ji cuadrado en los

datos observados
- Oi corresponde al número de los casos observados en la (i) espacio
- Ei es el número de casos que se observan en la (i) espacio, cuando existe
una hipótesis nula con valor verdadero
- K es el número de categorías [ CITATION Dim12 \l 2058 ].
Paola Soto
b. Variable cuantitativa
Cuando se realice el análisis de la variable cuantitativa, se debe condicionarla a

las categorías que posea la variable cualitativa. Sus categorías además pueden
ser representadas y agrupadas en intervalos. Para utilizar un sistema cuantitativo
dentro de un sistema de relaciones lineales, se debe utilizar el concepto básico de
correlación. La correlación es aquel cociente de la división de la covarianza, la
cual se clasifica en distintos tipos de teorema de correlación como son:
- El teorema de una cantidad de varianza conjunta o a fin entre las

variables (X, Y) deben ser igual a 0. La covarianza deberá tener un valor
igual a 0, de igual forma que su correlación.
- En el caso de una cantidad de varianza conjunta entre las variables con
valor mayor que 0, y que la varianza sea menor al total, la covarianza
debe de tener un valor mayor que 0 y menor que la suma de la varianza.
- En el caso de que una cantidad de varianza de tipo conjunta entre las
variables igual al total de la varianza, son producto del comportamiento
relativo representado por las desviaciones en los puntajes de las variables
X y Y [ CITATION Dim12 \l 2058 ].
Tratamiento de los datos
a. Validación de datos
La validación de los datos estadísticos es fundamental para comprobar si los datos

obtenidos permiten realizar un análisis usando leyes estadísticas y científicas. Su
validación es realizada en base a leyes matemáticas. La validación de los datos es
realizada utilizando diferentes tipos de validez como son:
- Validez de constructo
Este tipo de validez asegura que la recolección y la experimentación con los

datos debe adjuntarse a la teoría que se está estudiando.
- Validez convergente
En la validez convergente, se refiere al hecho que la teoría requerida tiene la

capacidad de predecir que ambas medias de dos elementos se relacionan
entre sí.
Paola Soto
- Validez divergente
La validez divergente es aquella que determina que la teoría tiene la

capacidad de predecir si una variable no posee características correlacionales
con otra.
b. Datos atípicos
Los datos atípicos en estadísticas, son aquellas observaciones con valores grandes o
pequeñas que generan un efecto desproporcionado en el resultado final del análisis
estadístico. Una de las variables que más se suele afectar con datos atípicos son la
media. El valor atípico se lo puede reconocer porque este posee un valor totalmente
distinto al que poseen las demás variables.
Cuando en el análisis de los datos se genere un valor atípico, el investigador debe de

analizar de forma correcta de donde se obtuvo el valor atípico. Uno de los métodos
más factibles al análisis de un dato atípico es graficarlo.
Grafico. Análisis de un dato atípico mediante el grafico de dispersión.
Entre las posibles causas que generan un valor atípico en los datos estadísticos se
encuentran los errores de la entrada de datos, algún problema con el proceso de
investigación, algún elemento que no se consideró en el análisis de la información y
el caso de una probabilidad aleatoria [ CITATION Ped16 \l 2058 ].
c. Pruebas de normalidad
Por otro lado, las pruebas de normalidad permiten al investigador utilizar o rechazar
la hipótesis nula de que los datos son generados por una población distribuida de
forma normal. El analizador tiene la capacidad de realizar una prueba de normalidad
y elaborar una gráfica de probabilidad que le permita generar un análisis más
Paola Soto
explicativo. Las pruebas de normalidad son la herramienta más fácil, al igual que su
grafica para comprobar si los datos obtenidos son normales.
Existen varios tipos de prueba de normalidad entre los cuales destacan la prueba de
Anderson Darling, la prueba de Ryan Joiner y la prueba de Kolmogorov Smirnov.
- Prueba Anderson Darling
Esta prueba consiste en realizar una breve comparación de la función de

distribución acumulada empírica que poseen los datos de la muestra con la
distribución esperada en caso que los datos sean considerados normales. En
caso de observarse una diferencia que no refleje una normalidad, se debe
rechazar la hipótesis nula de la normalidad de la población.
- Prueba Ryan Joiner
En el caso de las pruebas de hipótesis de Ryan Joiner, se realiza una

evaluación de mediante el cálculo de la correlación de los datos y las
puntuaciones normales presentes en los datos. En caso que el coeficiente en
la correlación tenga un valor cercano a 1, existe la probabilidad que la
población sea normal. En caso que el valor se encuentre por debajo del valor
crítico, se debe rechazar la hipótesis.
- Prueba Kolmogorov Smirnov
En el caso de la prueba de Kolmogorov Smirnov, se realiza una comparación

en la función de la distribución acumulada de los datos de la muestra. Si
existe una diferencia atípica, se debe rechazar la hipótesis.
Relación entre variable (datos bivariados)
Bibliografía
Avila, H. (1999). Introducción a la metodología de la investigación. Cuauhtemoc: Instituto
Tecnoloogico de Ciudad de Cuauhtemoc.
Bello, A. (10 de Agosto de 2016). Tipos de variables. Obtenido de

http://mey.cl/apuntes/variablesunab.pdf
Jimenez, D. (2012). Las variables Dicotomicas. Mexico : Mexico.

Paola Soto
Molina, L. (4 de Abril de 2015). ¿Que es la estadistica? Obtenido de

https://tarwi.lamolina.edu.pe/~fmendiburu/index-
filer/academic/Estadistica/parte1.pdf
Moncayo, P. (2013). Preparación de los datos. Madrid: Universidad de Granada.
Sulbarán, D. (20 de Febrero de 2012). ANÁLISIS BIVARIADO DE DATOS. Obtenido de

http://saber.ucv.ve/bitstream/123456789/11400/1/An%C3%A1lisis%20bivariado
%20de%20datos.pdf
Universidad Alas Peruanas. (2 de Julio de 2012). Unidad de analisis, dato y variable. Obtenido
de
http://www.uap.edu.pe/intranet/fac/material/07/20122BX070307511070110011/201
22BX07030751107011001137200.pdf
Universidad de Granada. (22 de Abril de 2012). Análisis de datos cualitativos. Obtenido de

http://www.ugr.es/~bioestad/_private/cpfund2.pdf
Universidad Politecnica del litoral. (3 de Julio de 2018). Analisis Univariado. Obtenido de

https://www.dspace.espol.edu.ec/bitstream/123456789/19252/5/CAP%C3%8DTULO
%203.-%20AN%C3%81LISIS%20UNIVARIADO.pdf
Universidad Tecnica de Ambato. (14 de Enero de 2012). Analisis estadistico univariado,

bivariado y variables control. Obtenido de http://chitita.uta.cl/cursos/2012-
1/0000104/recursos/r-25.pdf

La Importancia Del Análisis Estadístico

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Importancia Del Análisis Estadístico

Cargado por

Copyright:

Formatos disponibles

Paola Soto

La importancia del Análisis Estadístico

Las estadísticas es una clasificación de las matemáticas, cuya función es la de la

En el caso del análisis estadístico, su función principal es el la del análisis de

Palabras clave: análisis estadístico, variable cualitativo, variable cuantitativo,

Statistics is a classification of mathematics, whose function is that of data

Keywords: statistical analysis, qualitative variable, quantitative variable,

Las estadísticas son la herramienta matemática más importante que existe en el

En el contexto de la inteligencia empresarial, el análisis estadístico implica

El análisis estadístico se puede dividir en cinco pasos discretos, de la siguiente

a- Describe la naturaleza de los datos a analizar.

El objetivo del análisis estadístico es identificar tendencias. Un negocio

Las variables estadísticas se pueden clasificar de dos maneras, cuantitativa y

Por ejemplo, los equipos deportivos se dividen en divisiones, como la División

Las variables cualitativas pueden ser nominales, ordinales o dicotómicas. Si son

La variable cualitativa de escala nominal corresponde a aquella variable que

Cuando se refiere a escala ordinal, esta es la que se puede establecer

- La escala distribuida por intervalos

Este tipo de variable corresponde a aquellas variables que pueden ser

Las variables cuantitativas por otro lado corresponden a un tipo de variable el

- Las variables discretas

Las variables discretas corresponden a aquellas que tienen la capacidad de

- Las variables continuas

La preparación de los datos es fundamental para realizar una correcta

considerablemente los resultados estadísticos de la investigación. La preparación

- Revisión del cuestionario

Revisar el cuestionario es fundamental para realizar el correcto análisis de

- La edición de los cuestionarios

La edición de los cuestionarios es fundamental para obtener información

Cuando se habla de codificación, se habla de asignar un valor numérico a los

En el caso de la digitación, esta es la acción de ingresar los códigos de

La depuración de los datos es fundamental para encontrar alguna

El análisis univariado corresponde a realizar un análisis de cada una de las

El procedimiento univariado se clasifica de tipo intervalo, de tipo nominal y de

- Con el análisis de intervalo se debe de utilizar elementos como la media

El análisis de los datos unidades debe estar relacionada en base a la característica

La clasificación de las variables en los métodos univariados se dan por dos

Una variable dicotómica se trata de una variable de tipo binaria la cual

Las variables dicotómicas están dispuestas a cumplir con una serie de

Como ejemplo de estas variables esta la clasificación de: sano, enfermo.

Las variables polinómicas

Las variables polinómicas son aquellas que están dispuestas a cumplir

Las variables discretas corresponden a aquellas variables que no pueden

Un ejemplo de variable discreta son la clasificación del número de camas

Las variables continuas corresponden a aquella variable que tiene la

En el caso de las variables continua, un ejemplo clave es la clasificación

Los análisis son denominados como análisis bivariados, debido a la presencia de

Un ejemplo de este es el análisis del peso y altura de una persona. La variable

La información que se genera al utilizar datos cualitativos, es proporcionada

Entre los casos más importantes se encuentran características como la prueba de

Un ejemplo como el caso de la bondad de ajuste, esta permite al analista

- La fórmula determina que X2 es el valor estimado de Ji cuadrado en los

Cuando se realice el análisis de la variable cuantitativa, se debe condicionarla a

- El teorema de una cantidad de varianza conjunta o a fin entre las

Tratamiento de los datos

La validación de los datos estadísticos es fundamental para comprobar si los datos

Este tipo de validez asegura que la recolección y la experimentación con los

En la validez convergente, se refiere al hecho que la teoría requerida tiene la

La validez divergente es aquella que determina que la teoría tiene la

Cuando en el análisis de los datos se genere un valor atípico, el investigador debe de

Grafico. Análisis de un dato atípico mediante el grafico de dispersión.

- Prueba Anderson Darling

Esta prueba consiste en realizar una breve comparación de la función de