Está en la página 1de 11

ANÁLISIS EXPLORATORIO DE DATOS

DEFINICIONES

INTRODUCCIÓN
VARIABLES-ESCALAS DE MEDIDA, VARIABLES CATEGÓRICAS – TABLAS Y
GRÁFICOS

ESTADÍSTICA
Ing. Carlos Balseca C.
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
CLASE Nro. 1.1

CONTENIDO

Título Variables estadísticas y escalas de medida

Duración 90 minutos

Información general Principales características de los tipos de variables y de sus


escalas de medida

Objetivo Reconocer los diferentes tipos de variables estadísticas y


aplicar las respectivas escalas de medida.

1
CLASE Nro. 1.1

1.1 INTRODUCCIÓN.
Tener conocimientos apropiados de Estadística, así como del empleo de métodos confiables y
efectivos, garantiza siempre mejores resultados en la obtención, procesamiento, análisis e
interpretación de resultados obtenidos de la basta información, a la que en la actualidad todos
tenemos acceso tanto a nivel personal como organizacional.

Tener presente que administrar o gestionar información basados en una revisión parcial de los
datos, tomar decisiones basadas en la intuición o en simples conjeturas, sin análisis previos
estadísticos o de probabilidades, son sólo algunos de los problemas más apremiantes que
afectan a cualquier organización y más aún en el ámbito de la ingeniería.

Carecer de datos estadísticos que den sentido a nuestras decisiones en muchos casos puede ser
la causa de graves daños o serios problemas que deberán enfrentar las instituciones u
organizaciones, de las que formemos parte.

Es preciso recordar también que se debe tener cuidado con el uso de los datos estadísticos,
pues incluso, cuando la Estadística sea correctamente aplicada, los resultados obtenidos
pueden ser difícil o erróneamente interpretados por inexpertos.

1.1.1 DEFINICIÓN DE ESTADÍSTICA

Es una ciencia formal que permite observar los hechos, recolectar datos, organizar y
expresarlos cuantitativamente para procesarlos, y finalmente interpretar sus resultados para
tomar decisiones, tendientes a explicar condiciones regulares o irregulares en los fenómeno de
estudio o para hacer inferencias (predicciones) lo más acertadas posibles de fenómenos o
situaciones que aún no han ocurrido.

1.1.2 Clasificación de la Estadística:

La Estadística en su forma más general, se divide en dos grandes áreas:

 Estadística Descriptiva o Deductiva


 Estadística Inferencial o Inductiva

2
CLASE Nro. 1.1

1.1.2.1 Estadística Descriptiva o Deductiva. - Consiste en observar, registrar y procesar datos,


para obtener información con respecto a un evento en particular, a través de la apreciación de
sus características. Analiza metódicamente los datos, simplificándolos y presentándolos en
forma clara; eliminando la confusión presente en datos preliminares. La elaboración de
cuadros, gráficos e índices correctamente calculados y suficientemente claros, permitirán
encontrar patrones de comportamiento. Se limita a describir los datos que se analizan, sin
hacer inferencias en cuanto a datos no incluidos en la muestra.

1.1.2.2 Estadística Inferencial o Inductiva. - Cuando a partir del conocimiento obtenido de una
muestra se caracteriza a toda su población. Permite la generación de modelos, la realización
de inferencias y/o predicciones de los fenómenos que se investigan.

Las inferencias pueden considerarse como:

 La forma de respuesta a preguntas si/no (prueba de hipótesis),


 Estimaciones de características numéricas (estimación),
 Pronósticos de futuras observaciones,
 Descripciones de asociación (correlación), o
 Modelamiento de relaciones entre variables (análisis de regresión).
1.1.3 Terminología Estadística:

1.1.3.1 Valoración. - La Estadística establece una relación objetiva entre el observador y un


hecho bajo investigación, a partir de la expresión numérica del mismo o por una simple
caracterización del evento.

1.1.3.2 Característica. - Es el rasgo, propiedad, cualidad o atributo que presentan los hechos y
permite la identificación y diferenciación de un elemento respecto de los demás.

3
CLASE Nro. 1.1

1.1.3.3 Medición. - Medición es la valoración o contrastación de una característica por medio


de un estándar.

1.1.3.4 Apreciación. - Es el reconocimiento de una característica a través de un criterio


predefinido por el observador.

1.1.3.5 Escala. - Es la estructura numérica en la cual se establece la jerarquía correspondiente


para definir y diferenciar cada elemento valorado y, adicionalmente, posibilitar la
interpretación y comprensión de los resultados obtenidos.

1.1.3.6 Unidad elemental. - Es el objeto o sujeto que posee o ejecuta la característica que ha de
ser observada, en un hecho definido y constituye la fuente primaria o directa de información.

1.1.3.7 Población. - Es el conjunto de individuos, elementos o eventos con características


similares que serán analizados y que definen un hecho en particular. Puede entenderse
también como el conjunto de un número de mediciones u observaciones o simplemente una
gran colección de datos acerca de algo de interés. Cualquier valor obtenido de datos una
población toma el nombre de PARAMETRO.

1.1.3.7.1 Población Finita. - Cuando el conjunto de elementos es numerablemente contable y


esta cantidad se limita a una cifra en particular.

1.1.3.7.2 Población Infinita. - Cuando el conjunto de elementos es numerablemente contable,


pero no se puede expresar una cifra referencial para la totalidad de los elementos que la
conforman.

1.1.3.8 Muestra. - Es un subconjunto representativo, obtenido de forma aleatoria de la


población de interés. Cualquier valor obtenido de datos de una muestra, toma el nombre de
ESTADÍSTICO.

4
CLASE Nro. 1.1

1.1.3. Patrón. - Es un tipo de sucesos u objetos recurrentes. Podría definirse también, como
aquella serie de datos claramente identificables dentro de un conjunto mayor de ellos.

1.1.3.10 Modelo. - Son modelos matemáticos, que describen teóricamente el comportamiento


de los datos. Su éxito o fracaso depende de la precisión con la que se construya esta
representación numérica.

1.1.3.11 Dato. - Es el valor específico obtenido al observar y cuantificar una característica


cualquiera, en una unidad elemental. Se considera como el resultado individual de una
observación.

1.1.3.12 Variable. - Es el resultado de valorar una característica en un conjunto de individuos o


elementos (muestra o población), que se definen en un hecho particular.

1.1.3.13 Tipos de variables estadísticas

Existen dos tipos básicos de variables:

 Cualitativas o categóricas
 Cuantitativas o numéricas

1.1.3.13.1 Cualitativas o categóricas. - Cuando la característica a estudiar es de tipo no


numérico, se la conoce como variable cualitativa, categórica o de atributos.
Algunos ejemplos de variables cualitativas son: el género, religión, estado civil, ciudad de
nacimiento, color de ojos, etc.
Cuando los datos son cualitativos, lo importante es la cantidad o la proporción de ellos, que
correspondan a cada categoría. Por ejemplo, ¿qué cantidad o qué porcentaje de la población
son solteros?, ¿Cuántos creyentes o no creyentes hay en Ecuador?
Los datos cualitativos se resumen generalmente en tablas, gráficos de pastel y/o gráficos de
barras.
1.1.3.13.2 Cuantitativas o numéricas. - Cuando la variable que se estudia es de tipo numérico y sus
valores pueden variar dentro de un rango de números reales.
Algunas variables cuantitativas son, por ejemplo: el saldo en su cuenta bancaria, edades de los
estudiantes de un aula, vida útil de un celular, número de hijos, distancias entre ciudades, etc.

Los datos cuantitativos se resumen en tablas, gráficos de dispersión, histogramas, ojivas, de caja y
bigote, entre otros.

Las variables cuantitativas a su vez se subdividen en:

5
CLASE Nro. 1.1

 Variables Cuantitativas Discretas


 Variables Cuantitativas Continuas
1.1.3.13.2.1 Variables Cuantitativas Discretas. - Si toman sólo ciertos valores claramente
separados entre sí. Generalmente son números enteros, que se obtienen de procesos de conteo.

Ejemplos: número de camas en un hospital; número de automóviles que pasan por la autopista
en una hora, número de estudiantes en un curso de Estadística, etc.).

1.1.3.13.2.2 Variables Cuantitativas Continuas. - Las variables continuas toman cualquier valor
dentro de un intervalo específico de valores (recta numérica). Por lo general las variables
continuas son el resultado de procesos de medición. Toman cualquier valor dependiendo de la
precisión del instrumento de medida.

Ejemplos: presión del aire en una llanta, peso de una caja de tomates, cantidad de cereal en
una caja, duración de los vuelos Quito - Guayaquil, nota promedio de grado (GPA), el GPA
de un determinado estudiante puede encontrarse como 8.256927. Se acostumbra a redondear
con 2 decimales (8.26).

1.1.4 Niveles o escalas de medida

Los datos se deben clasifican por niveles de medición. El nivel de medición regirá los
cálculos que se llevarán a cabo a fin de resumir y presentar resultados coherentes. La
expresión de los resultados que pueden obtenerse de la medición, dependerá del tipo de
característica que se observe y de la forma como se desee representarlos; conforme esto, se
pueden emplear los siguientes tipos de escalas de medida:

6
CLASE Nro. 1.1

Además, determinan las pruebas estadísticas que se deben realizar.


1.1.4.1 Nominal. - Es la escala más baja o simple, se emplean en variable cualitativa, que se
clasifican en forma aleatoria, donde NO importa el orden en el que estén ubicadas en un
registro (tablas) y sólo se las cuenta. No existe una forma particular o un orden lógico o
natural para ordenarlas, son sólo etiquetas, es decir simplemente valoran las características en
forma clasificatoria con nombres o clases que se utilizan para organizar los datos en
categorías, (p.e); blancos, negros, mestizos, mulatos, etc.

1.1.4.2 Ordinal. - Es la escala inmediata superior a la anterior. Las medidas ordinales tienen
imprecisas diferencias entre valores consecutivos, existe un orden intuitivo para sus valores.
La escala ordinal, toma en cuenta la propiedad de orden o jerarquías de los datos, es decir
sirven cuando se jerarquizan los datos en categorías ordenadas en virtud de un determinado
criterio, (p.e); primero, segundo, tercero, etc.

1.1.4.3 De Intervalo. - Esta escala es superior a la ordinal. No sólo se distingue orden entre
categorías, sino que también se puede establecer diferencias, iguales, entre observaciones,
sirven cuando la valoración es respecto de una escala numérica que considera, además, las
unidades de medida (grados centígrados, metros, kg, puntajes, etc.). Con este tipo de variables
se puede realizar comparaciones de igualdad/desigualdad, y medir la distancia existente entre
cada valor de la escala, por lo que la diferencia entre valores es importante. Las variables de
intervalo carecen de un cero absoluto, siendo el cero un valor relativo o arbitrario, por lo que,
operaciones como la multiplicación y la división no son permitidas. (p.e) las escalas de
temperatura, escalas Licker, edades AC-DC, etc.

1.1.4.4 De razón o proporción.- Esta escala es superior a la de intervalo, conserva las


características de la escala de razón, es decir se distingue orden entre categorías, se establece
diferencias iguales entre observaciones, se considera unidades de medida y además
operaciones como la multiplicación y la división (comparación) son posibles, están
relacionadas a una escala numérica en la cual el cero es un valor fijo y expresa la no
existencia de la variable en cuestión; puede ser en cualquier escala y la diferencia de valores
es importante, existiendo una relación proporcional entre los valores representados, (p.e); el
puntaje obtenido en un examen, la estatura, el peso, el ingreso, las ventas, distancias,
producción, etc.

7
CLASE Nro. 1.1

1.1.6 Tablas de frecuencia: Variables cualitativas o categóricas

En el uso de la estadística, existen varios criterios para realizar un análisis; especialmente en


el caso de que la observación de un hecho genere gran cantidad de datos. Estos, pueden ser
organizarlos, con el propósito de incrementar los criterios de análisis o simplemente facilitarlo
de modo que se amplíen los elementos de la información requerida.

FUENTE: IEA. Explotación de la Encuesta de Población Activa del INE (Metodología 2005)

ni: Frecuencia absoluta, número de veces que se repite un mismo valor, o grupo de valores
dentro de una misma clase o categoría.
fi: Frecuencia relativa, cociente entre la frecuencia absoluta y el número total de datos.

pi: Frecuencia relativa en porcentaje.

1.1.7 Gráficos estadísticos:

Son representaciones gráficas de la totalidad de los datos analizados, que permiten apreciar
tendencias, magnitudes, variaciones y patrones de comportamiento. Con la estructuración de
las tablas de frecuencias, se posibilita la elaboración de gráficos que permiten tener una
apreciación más amplia sobre el comportamiento de la variable.

Los gráficos de mayor uso son los que se presentan a continuación:

8
CLASE Nro. 1.1

1.1.7.1 Gráfico de pastel. - Se emplean generalmente para variables cualitativas. Representa la


frecuencia absoluta o relativa respectiva de cada etiqueta o clase en términos del área de una
circunferencia que se divide de forma proporcional para expresar de forma global, el
porcentaje o proporción de cada categoría.

1.1.7.2 Gráfico de barras. - Se emplean para variables generalmente cualitativas y para


variables cuantitativas discretas de pocos valores. Muestran los datos de una distribución de
frecuencias, en el eje horizontal van las etiquetas de la variable y en el eje vertical los valores
de frecuencia absoluta o relativa, que tenga cada etiqueta o cada valor. Se pueden alternar los
ejes dependiendo del criterio del investigador, de igual forma el diseño del gráfico.

1.1.7.3 Gráfico de Pareto. - Es un tipo especial de gráfica de barras donde los valores
graficados están organizados de mayor a menor. Se utiliza un diagrama de Pareto para
identificar (p.e) los defectos que se producen con mayor frecuencia, las causas más comunes
de los defectos o las causas más frecuentes de quejas de los clientes.

9
CLASE Nro. 1.1

Tomado de: https://support.minitab.com/es-mx/minitab/18/help-and-how-to/quality-and-process-improvement/quality-tools/supporting-


topics/pareto-chart-basics/

REFERENCIAS BIBLIOGRÁFICAS

1. Anderson, D. Sweeney, D. y Williams, T. (2009). Estadística para Administración y


Economía. CENGAGE Learning Editores, SA. 10ma Ed.
2. Lind, D. Marchall, W. y Wathen, S. (2008). Estadística Aplicada a los Negocios y la
Economía. Mc Graw Hill. 13va Ed.
3. Montgomery, D. Runger, G. (2010). Probabilidad y Estadística aplicadas a la Ingeniería.
Mc Graw Hill. 5ta Ed.
4. Walpole, R. Myers, R. Myers, S. (2007). Probabilidad y Estadística para Ingeniería.
Pearson. 8va Ed.
5. Wackerly, D. Mendenhall, W. Scheaffer, R. (2010). Estadística matemática con
aplicaciones. CENGAGE. 7ma Ed.
6. Canovos, G. (1998). Probabilidad y Estadística Aplicaciones y Métodos. Mc Graw Hill.
1ra Ed.

10

También podría gustarte