Está en la página 1de 7

1

1.1 Conceptos y clasificación estadística

1.1.1 Tipos de estadísticas

La estadística es una rama de las matemáticas que se ocupa de reunir, organizar y analizar datos
numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de
decisiones. De modo simple, la estadística es una colección de datos numéricos que, referidos a un
colectivo, permiten la representación y análisis del mismo con el fin de inferir generalizaciones
acerca de este.

La estadística se clasifica en Estadística Descriptiva y Estadística Inferencial

Estadística Descriptiva
Estadística descriptiva. Métodos para organizar, resumir y presentar datos de manera
informativa.

La estadística descriptiva trata del recuento, ordenación y clasificación de los datos obtenidos en
las observaciones, sirve como herramienta o instrumento para describir, resumir o reducir las
propiedades de un conjunto de datos para que se puedan manejar.

Para reducir la información se construyen tablas, se representan gráficos y se calculan parámetros


estadísticos que caracterizan la distribución, de esta forma se simplifica la complejidad de todos los
datos que intervienen en la distribución.

“La Estadística Descriptiva es el estudio que incluye la obtención, recuento, ordenación


organización, procesamiento, presentación y descripción de información numérica”.

Estadística Inferencial
Por su parte, la estadística inferencial o inductiva trata de llegar a conclusiones que sobrepasan el
alcance de los datos analizados; es decir, se trata de técnicas que se emplean para inferir o deducir
características desconocidas a partir de un conjunto de datos conocidos, apoyándose
fundamentalmente en el cálculo de probabilidades.

Estadística inferencial. Los métodos usados para determinar algo acerca de la población
basándose en una muestra.

Población. Un conjunto de todos los posibles individuos, objetos o mediciones de interés


Para inferir algo acerca de la población, generalmente tomamos una muestra de la población.
Muestra. - Un subconjunto, o parte, de la población de interés.

La estadística inferencial se basa por lo tanto en la estadística descriptiva, ya que la inferencia o


deducción de las propiedades de la población entera se deriva de las características de la muestra
que es analizada con las técnicas de la estadística descriptiva.

“La inferencia estadística es una técnica mediante la cual se obtienen generalizaciones o se toman
decisiones en base a una información parcial o completa obtenida mediante técnicas descriptivas
sobre muestras”.
2

1.1.2 Fuentes de datos.

Los datos se pueden obtener por observación o por experimentación.


 Si simplemente se observa la característica de interés sin intervenir en el proceso en
estudio, se está ante un estudio observacional
 En cambio, sí se interviene en el proceso en estudio imponiendo algún tratamiento en forma
deliberada sobre las unidades de análisis a fin de observar las respuestas, se está ante un
experimento.

Las fuentes de datos son todos los documentos que de una forma u otra difunden los
conocimientos propios de un área.

Según la fuente, los datos pueden ser primarios o secundarios.


 Los datos primarios se recogen específicamente para el análisis deseado.
 Los datos secundarios ya se han compilado y están disponibles para el análisis estadístico.

Datos primarios.

Los datos primarios son aquellos que el investigador obtiene directamente de la realidad,
recolectándolos con sus propios instrumentos. Son los que el investigador o sus auxiliares recogen
por sí mismos, en contacto con los hechos que se investigan para un estudio concreto.
 Esta información no existe en el momento en que se plantea la necesidad de utilizarla, por
lo que se emplean diversas técnicas para obtenerla tales como: la observación o con
métodos experimentales o bien mediante encuestas, que posteriormente serán tratadas
con las herramientas estadísticas adecuadas.
 Los datos primarios son los más idóneos para que se puedan adaptar a los propósitos de la
investigación, sin embargo, tienen un costo elevado, superior al de los secundarios.
 Los datos primarios y los secundarios no son dos clases esencialmente diferentes de
información, sino partes de una misma secuencia: todo dato secundario ha sido primario en
sus orígenes y todo dato primario, a partir del momento en que el investigador concluye su
trabajo, se convierte en dato secundario para los demás.

Datos secundarios.

Los datos secundarios, son registros escritos que proceden también de un contacto con la
práctica, pero que ya han sido recogidos y muchas veces procesados por otros investigadores.

La ventaja de usar datos secundarios para una investigación estadística es que ya se dispone de
ellos y no es necesario recogerlos para un proyecto específico. Incluso la compra de los datos a
una compañía comercial es por lo general menos costosa que obtener datos primarios.

La desventaja de los datos secundarios es que estas fuentes no siempre cubren las necesidades
específicas del análisis y además no siempre son confiables. Esta es la razón por la que muchos
investigadores requieren obtener datos primarios orientados específicamente al asunto que se
está investigando.
3

1.1.3 Tipos de variables.

Variable cualitativa.
Si la característica o variable que se estudia no es numérica, se le llama variable cualitativa o
atributo. Ejemplos de variables cualitativas son género, religión a la que se pertenece, tipo de
automóvil que se posee, lugar de nacimiento y color de ojos.

Si los datos que se están estudiando son cualitativos, nos interesa en cuántos o en qué proporción
caen en cada categoría. Por ejemplo, ¿qué proporción de la población tiene ojos azules? ¿Cuántos
católicos y cuántos protestantes hay en México? Los datos cualitativos se resumen con frecuencia
en tablas y en gráficas de barras.

Variable cuantitativa.
Si la variable que se estudia puede ser expresada numéricamente, se le llama variable
cuantitativa. Ejemplos de variables cuantitativas son el peso de las personas, la antigüedad en
años de los trabajadores de una compañía, la vida de una batería en meses, las velocidades de los
automóviles que viajan por la autopista Veracruz a Xalapa, y el número de hijos en una familia.

Clasificación de las variables cuantitativas:


Variables discretas.
Sólo pueden asumir ciertos valores, y suele haber "huecos" entre los valores. Ejemplos de
variables discretas son el número de recámaras de una casa (1, 2, 3, 4, etc.); el número de
automóviles por hora (16,19, 30, etc.) que llegan a la salida de la autopista. Observe que una casa
puede tener 3 o 4 recámaras, pero no puede tener 3.56 recámaras. Hay un "hueco" entre los
valores posibles. Las variables discretas se obtienen, casi siempre, como resultado de un conteo.

Variables continuas.
Las observaciones obtenidas de una variable continua pueden tomar cualquier valor dentro de un
rango específico. Ejemplos de variables continuas son la presión de aire de una llanta o el peso de
un embarque de grano (que, dependiendo de la exactitud de la escala, puede ser 15.0 toneladas,
15.01 toneladas, 15.03 toneladas, etc.), el tiempo transcurrido al volar de Veracruz a Guadalajara
es otra variable de naturaleza continua. El vuelo de Veracruz a Guadalajara puede haber durado
1 hora y 30 minutos, o 1 hora 30 minutos y 45 segundos, o 1 hora 30 minutos y 45.1 segundos,
dependiendo de la exactitud del dispositivo para medir el tiempo. Las variables continuas son, en
general, el resultado de medir algo.

Los tipos de variables están resumidos en el diagrama siguiente:


4

1.1.4 Niveles de medición

El primer paso en el análisis de datos es simplemente entender lo que estos significan. Esto se
facilita clasificando cada variable según su nivel de medición. El nivel de medición se refiere a la
relación entre los valores que se asignan a los atributos de una variable.
El tipo de prueba estadística que puede utilizarse para llegar a una conclusión sobre la población
en general depende del nivel de medición de la variable considerada. El nivel de medición de una
variable no es otra cosa que la naturaleza matemática de una variable o cómo se mide una
variable.
Si queremos calcular el salario promedio de los ciudadanos de un país, podemos salir y registrar
el salario de todas y cada una de las personas para calcular el promedio o elegir un muestreo
aleatorio de toda la población y calcular el salario promedio para esa muestra, y luego usar las
pruebas estadísticas para obtener conclusiones para una población más amplia.
Los datos se pueden clasificar de acuerdo con niveles de medición. Los niveles de medición de los
datos indican, con frecuencia, qué cálculos se pueden realizar para resumir y presentar los datos
y qué pruebas estadísticas pueden llevarse a cabo.

Hay cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. El nivel de medición
"más bajo" o más primitivo es el nominal. El más alto o el que nos da más información acerca de
la observación es el nivel de medición de razón.

Datos de nivel nominal


El nivel nominal es apenas una medida. Se refiere a la cualidad más que a la cantidad. Un nivel
nominal de medición es simplemente una cuestión de diferenciar por nombre, por ejemplo,
1=hombre, 2 = mujer.

Características del nivel nominal


 No incluye ninguna medición, únicamente clasificación y conteo.
 Las categorías son mutuamente excluyentes y exhaustivas. Un objeto pertenece a una y sólo a
una categoría.
 Las categorías no tienen un orden lógico.

Ejemplos de nivel nominal


 La clasificación de los dulces M&M en seis colores es un ejemplo del nivel de medición nominal.
Clasificamos los dulces sólo por el color. No hay un orden natural. Podemos tomar primero los
dulces cafés o primeros los de color naranja, o los de cualquier otro color.
 El género es otro ejemplo de medición de nivel nominal. Supongamos que contamos el número
de estudiantes con credencial que entran a un juego de fútbol y damos el número de mujeres y
el número de hombres. Podríamos dar primero el número de hombres o primero el número de
mujeres.
 Entre otros ejemplos tenemos:
o Tipos de comida: desayuno, comida, cena
o Preferencia religiosa: 1= budista, 2= musulmana, 3= cristiana, 4= judía, 5= otra
o Orientación política: Izquierda, Derecha, Independiente.
5

Mutuamente excluyentes. Un individuo, objeto o medición pertenece única mente a una categoría.
Exhaustivas. - Cada individuo, objeto o medición debe pertenecer a una de las categorías.

Datos de nivel ordinal

El siguiente nivel de datos es el nivel ordinal. La ilustración 1-2 es una lista de las calificaciones
que los alumnos dieron al profesor James Brunner en un curso de Introducción a las Finanzas.
Cada estudiante en la clase contestó a la pregunta "¿En general cómo califica usted al maestro de
esta clase?" Esto ilustra el uso de la escala ordinal de medición. Cada categoría es más alta o mejor
que la siguiente. Esto es, "superior" es mejor que "bueno", "bueno" es mejor que "aceptable," y
así sucesivamente. Sin embargo, no podemos distinguir la magnitud de las diferencias entre
grupos. ¿Es la diferencia entre "superior" y "bueno" la misma que entre "pobre" e "inferior?" No
se puede decir. Si sustituimos "superior" por 5 y "bueno" por 4, podemos concluir que la
calificación de "superior" es mejor que la calificación de "bueno", pero no podemos agregar una
connotación a "superior" ni una connotación a "bueno" que nos dé como resultado un mayor
significado. Más aún, no podemos concluir que una calificación de "bueno" (que corresponde a
4) sea necesariamente dos veces mejor que una de "pobre" (que corresponde a 2). Sólo podemos
concluir que una calificación de "bueno" es mejor que una calificación de "pobre". Pero no
podemos concluir cuan mejor es.

Calificación Frecuencia
Superior 6
Bueno 28
Aceptable 25
Pobre 12
Inferior 3

Ilustración 1-2 Calificaciones de un profesor de finanzas

En resumen, las propiedades de los datos de nivel ordinal son:


 Las categorías de datos son mutuamente excluyentes y exhaustivas.
 Las categorías de datos están clasificadas u ordenadas de acuerdo con la característica especial
que poseen.

Ejemplo de niveles de medición ordinal:


 Clasificación: 1er lugar, 2do lugar… último lugar
 Nivel de acuerdo: No, Tal vez, Si
 Orientación política: izquierda, independiente, derecha

Datos de nivel de intervalo

El nivel de intervalo es el siguiente nivel de medición en orden ascendente. Tiene todas las
características del nivel ordinal, pero, además, la diferencia entre dos valores es de un tamaño
constante. Un ejemplo de medición del nivel de intervalo es la temperatura.

Supongamos que las temperaturas en Veracruz en tres días consecutivos de verano sean 33, 34 y
31 grados Centígrados. Estas temperaturas se pueden ordenar fácilmente, pero también
6

podemos determinar la diferencia entre temperaturas. Esto es posible porque un grado Celsius
representa una cantidad constante de medición. Diferencias iguales entre dos temperaturas son
las mismas, sin importar la posición que ocupen en la escala. Esto es, la diferencia entre 10 grados
Celsius y 15 grados es 5, la diferencia entre 50 y 55 grados es también 5 grados. Es importante
notar que 0 es sólo un punto en la escala. No representa la ausencia de la condición. Cero grados
Celsius no representa la ausencia de calor ¡sólo que hace frío! Es más, cero grados Fahrenheit en
la escala Celsius es -18 grados.

Las propiedades de la escala de intervalo son:


 Las categorías de datos son mutuamente excluyentes y exhaustivas.
 Las categorías de datos están ordenadas de acuerdo con la cantidad de la característica que
poseen.
 Diferencias iguales en la característica están representadas por diferencias iguales en los
números asignados a las categorías.

Ejemplo de niveles de medición de intervalo:


 Hora del día en un reloj de 12 horas
 Intervalo de tiempo de día – intervalos iguales; reloj analógico (12 horas), la diferencia entre la
1 y 2 pm es la misma que la diferencia entre las 11 y 12 am.

Datos de nivel de razón

El nivel de razón es el nivel de medición más alto. El nivel de razón tiene todas las características
del nivel de intervalo, pero, además, el punto 0 tiene significado y la relación entre dos números
tiene sentido. Ejemplos de mediciones de nivel de razón incluyen salarios, unidades de
producción, peso y altura. El dinero nos da una buena ilustración. Si usted tiene cero dólares
entonces no tiene dinero. El peso es otro ejemplo. Si la aguja marca cero en la escala, entonces
hay una completa ausencia de peso. La relación entre dos números también tiene sentido. Si Juan
gana $30,000 por año vendiendo seguros y Roberto gana $60,000 por año vendiendo carros,
entonces Roberto gana el doble de lo que gana Juan.

Las propiedades del nivel de razón son:


 Las categorías de datos son mutuamente excluyentes y exhaustivas.
 Las categorías de datos están ordenadas de acuerdo con la cantidad de la característica que
poseen.
 Diferencias iguales en la característica están representadas por diferencias iguales en los
números asignados a las categorías.
 El punto cero refleja la ausencia de esa característica.

Ejemplos de niveles de medición de razón:


 Longitud de una regla: pulgadas o centímetros
 Ingresos de un trabajador: dinero ganado el año pasado
 Años de experiencia laboral de operario

 Observe en la ilustración 1-3 que el señor Aguilar gana el doble que su hijo. En la familia
Ramírez, el hijo gana el doble que el padre.
7

Ingresos
Nombre Padre Hijo
Aguilar $80,000 $40,000
Román 90,000 30,000
Ramírez 60,000 120,000
Portugal 75,000 130,000

Ilustración 1-3 Combinaciones de salarios padre-hijo.

El tiempo de 24 horas tiene un 0 absoluto (medianoche); 14 horas en punto está dos veces más
lejos de la medianoche que las 7 horas en punto.

Cuestionario.
1. ¿Qué es la estadística?
2. ¿Qué es la estadística descriptiva?
3. ¿Qué es la estadística inferencial?
4. Describa los conceptos de población y muestra.
5. Explique lo que es una variable cualitativa, mencione dos ejemplos
6. Describa el significado de una variable cuantitativa.
7. ¿Qué es una variable continua? Escriba dos ejemplos.
8. Explique el concepto de una variable discreta, mencione dos ejemplos
9. Describa cada uno de los niveles de medición: nominal, ordinal, de intervalo y de
razón.
10. Mencione dos ejemplos de cada uno de los niveles de medición.

También podría gustarte