Documentos de Académico
Documentos de Profesional
Documentos de Cultura
“Algún día el conocimiento estadístico será tan necesario para ser un buen y eficiente
ciudadano, como lo es saber leer”
H.G. Wells
INTRODUCCIÓN
Casi todos los días utilizamos los conceptos estadísticos en las diversas facetas de nuestra vida. Por
ejemplo, al comenzar el día uno abre la llave de la ducha para probar la temperatura del agua y
decidir si añade más agua caliente o más agua fría y, si la temperatura es idónea empieza a bañarse.
Como segundo ejemplo, supongamos que se está en una tienda de comestible decidieron qué pizza
congelada se va a comprar. Una de las empresas productoras de pizzas cuenta con un mostrador
donde se ofrecen pequeñas pruebas de su producto. Después de probarlo, uno decide si lo compra o
no. En ambos ejemplos, se toma una decisión y se elige el curso de acción basándose en una
muestra.
Las empresas enfrentan problemas similares. Una compañía debe asegurarse de que la cantidad
promedio de cereal en el paquete de 25,5 gramos cumpla con las especificaciones de la etiqueta.
Para hacerlo, selecciona muestras periódicas del área de producción y pesa el contenido.
Dentro del ámbito empresarial se ha vuelto una regla emplear la estadística y pensar tomándola en
cuenta. Mientras más grandes sean las unidades empresariales, estas cuentan no solo con sus
propios departamentos de recopilación de datos estadísticos, sino también se convierten en
consumidores de estadísticas recopiladas por otras personas. Asimismo, para la elaboración de
documentos de prensa comercial y de gobierno se expresan en lenguaje estadístico, ya que solo de
esta forma se logra conducir de manera ordenada e inteligente estos asuntos.
A nivel nacional, un candidato a la presidencia quiere saber qué porcentaje de electores en cierta
provincia, lo apoyará en la siguiente elección. Existen diferentes formas de saber esto: puede hacer
que su equipo llame por teléfono a todas las personas registradas en el padrón y les pregunte por
quién votarán. Puede salir él mismo a la calle, detener a diez personas adultas y preguntarles por
quién van a votar. Puede seleccionar una muestra aleatoria de 1000 electores de la provincia, hablar
con ellos y, basándose en esta selección, realizar un cálculo de porcentaje de personas que votarán
por él en la elección. En este curso le mostraremos por qué motivo la tercera opción es la mejor.
Puede observarse entonces que la estadística actualmente constituye una parte integral de la vida
cotidiana; se encuentra inmersa en ámbitos tan variados como la política, la medicina, la educación,
los negocios y las áreas legales, además, constituye un recurso para describir información, una
herramienta de análisis y un medio para alcanzar conclusiones de ayuda para tomar decisiones por
lo que se considera que las actividades humanas actualmente se miden y son guiadas por la
estadística.
ESTADÍSTICA
La oficina de Censos calcula que la población de EUA será de 335 050 000 en el año
2025.
La extensión promedio de los ciclos empresariales desde 1945 es de 61.
El auto típico de EEUU recorre 11 099 millas por año. El autobús típico viaja 9 353 millas
por año, y el camión típico, 13 942 millas por año. En Canadá las cifras correspondientes
son 10 371 millas para automóviles, 19 823 millas para autobuses, y 7 001 millas para
camiones.
Los anteriores son ejemplos de estadísticas. A una colección de información numérica se le conoce
como estadísticas (en plural).
La estadística tiene un significado mucho más amplio que la mera recopilación y publicación de
información numérica. La estadística se define como:
Una primera razón para estudiar estadística, es que en todos lados encontramos información
numérica. Si se revisan periódicos, revistas, publicaciones de interés general, revistas femeninas o
revistas de deporte, se verá bombardeado con información numérica. Presentamos algunos
ejemplos:
La empresa General Electric reportó que en 1999 sus ganancias fueron de $111 630 000
(dólares), mayores que los $100 469 000 que obtuvo en 1998.
Los egresados de post grado del programa de Maestría en Administración de Empresas en
la Universidad de Notre Dame, contaron con un sueldo inicial promedio de $54 000 dólares
y 91% de ellos consiguieron trabajo a los tres meses de la graduación.
En EUA se consume mayor cantidad de café que en cualquier otro país; en promedio, 1,75
tazas diarias por persona.
¿Cómo podemos determinar si las conclusiones presentadas son razonables? ¿Acaso las muestras
fueron suficientemente grandes? ¿Cómo se seleccionaron las unidades de la muestra? Para poder ser
una persona capacitada a fin de entender esta información, se necesita saber realizar el análisis de la
información. La comprensión de los conceptos de estadística será de gran ayuda.
Una segunda razón por la cual tomar un curso de estadística es que las técnicas estadísticas se
utilizan para tomar decisiones que afectan nuestra vida diaria. He aquí algunos ejemplos:
Las compañías de seguros utilizan análisis estadístico para establecer las tarifas de los
seguros de casas, automóvil, vida y salud. Existen tablas que indican la probabilidad de que,
por ejemplo, una persona de 25 años viva un año más, cinco años más, etcétera.
Los investigadores médicos estudian las tasas de curación de enfermedades, basándose en
el uso de diferentes medicamentos y distintas formas de tratamiento. Por ejemplo, ¿cuál es
el efecto de tratar cierto tipo de daño a la rodilla con cirugía o con terapia física?
La agencia de Protección al Medio Ambiente (en EUA) está interesada en la calidad del
agua en el Lago Erie. Periódicamente toman muestras del líquido para establecer el nivel de
contaminación y mantener el nivel de calidad.
La tercera razón para tomar un curso de estadística es que el conocimiento de los métodos
estadísticos ayuda a entender por qué se toman ciertas decisiones, y aporta una mejor comprensión
respecto a la forma en la que nos afectan las decisiones.
Sin importar el tipo de trabajo que se elija, el estudiante tendrá que enfrentarse con la toma de
decisiones, para lo cual una comprensión del análisis de datos será de gran ayuda. Para poder tomar
una decisión basada en la información, se necesita:
Estadística Descriptiva
Generalmente, el estudio de la estadística se divide en dos categorías: estadística descriptiva
y estadística inferencial. La definición de estadística presentada anteriormente menciona la
“organización, presentación, análisis… de datos”. Esta área de la ciencia estadística se
conoce comúnmente como estadística descriptiva.
Estadística Inferencial
Estadística Inferencial: Conjunto de métodos utilizados para saber algo acerca de una
población, basándose en la información obtenida de una muestra.
Una población, también denominada universo, puede constar de individuos, por ejemplo
los estudiantes matriculados en la Universidad del Pacífico. Una población también puede
incluir objetos, como las llantas XB 70 producidas durante una semana en la compañía
Cooper Tire and Rubber, en Findlay Ohio, o todas las truchas que se encuentran en un
estanque. Una población también puede estar formada por un grupo de medidas, como
podrían ser los pesos de todos los jugadores de la línea defensiva del equipo de futbol
americano de la Universidad Estatal de Pensilvania o las estaturas de los jugadores de
Para la población,
Estadístico: se característica
Medida utilizan también el muestra.
de la parámetro. Este es una característica numérica de
la población. Si se realiza un censo completo de la población, se puede medir el parámetro.
Sin embargo, como ya se menciono, es muy difícil en la mayoría de las investigaciones en
la práctica, acceder a toda la población para un estudio.
El objetivo de calcular el estadístico de la muestra es estimar el valor del parámetro
correspondiente a la población. Entre los parámetros típicos se encuentran la media,
mediana, proporción y desviación estándar de la población.
La compañía Market Facts con base en Chicago pidió a una muestra de 1960
consumidores que probaron un platillo de pescado congelado producido por la
Gran parte de los trabajos de estadística se realizan con muestras. Las muestras son necesarias
debido a que con frecuencia las poblaciones son demasiado grandes para ser estudiadas en su
totalidad. Es muy costoso y demanda mucho tiempo examinar la población total, por tanto debe
seleccionarse una parte de la población, calcular el estadístico de la muestra y utilizarlo para estimar
el parámetro correspondiente de la población.
La exactitud de toda estimación es de enorme importancia. Esta exactitud depende de gran parte de
la forma como se seleccionó la muestra y del cuidado que se tenga para garantizar que la muestra
proporcione una imagen lo más parecido posible de la población. Sin embargo, con mucha
frecuencia se comprueba que la muestra no es del todo representativa y generará un error de
muestreo. Este error, es la diferencia entre el estadístico de la muestra utilizado para estimar el
parámetro en la población y el valor real pero desconocido del parámetro.
TIPOS DE VARIABLES
Existen dos tipos básicos de datos: los obtenidos a partir de una población cualitativa y los que
resultan de una población cuantitativa. Cuando la característica o variable en estudio es no
numérica, se le denomina variable cualitativa o atributo. Cuando la variable estudiada se puede
expresar numéricamente se denomina variable cuantitativa.
A su vez las variables cuantitativas pueden ser discretas o continuas. Las variables discretas pueden
asumir sólo ciertos valores y generalmente existen “brechas” o “huecos” entre ellos. Por lo común,
las variables discretas son resultado de un conteo.
Las observaciones de una variable continua pueden tomar cualquier valor dentro de un intervalo
determinado. Las variables continuas resultan generalmente de medir algo.
NIVELES DE MEDICIÓN
Los datos pueden clasificarse de acuerdo con los niveles de medición. Generalmente, el nivel de
medición de un dato determina los cálculos que se pueden realizar para resumir y presentar la
información y las pruebas estadísticas que pueden desarrollarse.
Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. El nivel “más bajo” o
más primitivo, es el nominal. El más alto, o el que proporciona la mayor cantidad de información
acerca de la observación, es el nivel de medición de razón.
Esta escala establece los grupos de acuerdo con la presencia o ausencia de un atributo o
característica, se utiliza para medir variables cualitativas cuyos valores no pueden ser
ordenados de acuerdo a la intensidad, es decir, de menor a mayor. La escala nominal sólo
permite hacer muy pocas operaciones estadísticas, tales como contar frecuencias. La única
relación que puede establecerse entre observaciones medidas en esta escala es la de
igualdad (y por lo tanto la desigualdad). Dos observaciones son iguales si están en la misma
clase.
Ejemplo:
Un ejemplo del nivel nominal de medición es la clasificación en seis colores de las lunas
M&M. Simplemente se clasifican las lunas según el color. No hay un orden natural. Esto
quiere decir que primero se puede reportar la cantidad de lunas color café, o las
anaranjadas o las de cualquier otro color.
La tabla 1 muestra un desglose del uso de telefonía de larga distancia en Estados Unidos.
Este es el nivel nominal de medición porque se cuenta el número de veces que se utilizó
cada compañía que proporciona servicio de larga distancia.
Tabla 1: Uso de la telefonía de larga distancia según el proveedor del servicio. EUA
Para poder procesar los datos generalmente se codifican las categorías en 1, 2, 3, etc.; en
este caso el 1 representa AT&T; el 2 MCI, y así sucesivamente. Esto facilita el conteo por
computadora. Sin embargo el haber asignado números a las diferentes empresas no
permite manipular números. Por ejemplo, 1+2no es igual a 3; esto es, AT&T + MCI no
es igual a Sprint.
El siguiente nivel de datos es el nivel ordinal. Se utiliza cuando se requiere colocar datos en
orden (1ero, 2do, 3ro, etc) en relación a cierto atributo. Las observaciones no solo difieren
de categoría a categoría, si no que pueden clasificarse por rangos de acuerdo con algún
criterio. Las observaciones medidas en esta escala pueden ordenarse de menor a mayor y en
consecuencia no solo admite la relación de igualdad sino además la de "mayor que"
("menor que").
En resumen, los datos de nivel ordinal tienen las siguientes propiedades:
Ejemplo:
La tabla 2 presenta las calificaciones dadas por los estudiantes al profesor James
Brunner en un curso de “Introducción a las Finanzas”. Cada estudiante responde a la
siguiente pregunta: “En general, ¿cómo califica al profesor de este curso? Esto muestra
el uso de la escala de medición ordinal. Una categoría es “más alta” o “mejor” que la
siguiente. Ello quiere decir que “Excelente” es mejor que “Bueno”, “Bueno” es mejor
que “Regular”, etc. Sin embargo no es posible distinguir algo referente a la magnitud de
la diferencia entre los grupos. ¿Acaso la diferencia entre “Excelente” y “Bueno” es la
misma que la existente entre “Malo” y “Muy malo”? Es algo que no se puede responder.
1. Las categorías para los datos son mutuamente excluyentes y colectivamente exhaustivas.
2. Las categorías en cuestión están ordenadas de acuerdo con la cantidad de la
característica que poseen.
3. Diferencias iguales en la característica se presentan por diferencias iguales en la
medición.
Ejemplo:
Supóngase que las temperaturas más altas en tres días consecutivos de invierno en la
ciudad de Boston son 28, 31 y 20 grados Fahrenheit (°F). Estas temperaturas pueden
ordenarse fácilmente pero también se puede determinar la diferencia entre las mismas.
Esto es posible gracias a que un “grado Fahrenheit” representa una unidad constante
de medición. Las diferencias iguales entre dos temperaturas son las mismas, sin importar
la posición en que se encuentre en la escala. Esto quiere decir que la diferencia entre
10°F y 15°F es 5, y la diferencia entre 50 y 55 grados también es 5. Es importante
señalar que cero es solamente un punto de la escala, y no representa la ausencia de la
condición. “Cero grados Fahrenheit no representa la ausencia de calor, sino que indica
que “hace frio”.
Es la escala más fuerte, dado que usa un sistema numérico en el que el cero es un valor que
indica ausencia de la característica que se está midiendo. Permite clasificar y ordenar. Los
intervalos son iguales. Se pueden realizar operaciones aritméticas como la multiplicación y
división. La diferencia entre dos valores es importante y de magnitud definida. Permite el
cálculo de la media geométrica, el cálculo del coeficiente de variación y las pruebas que
requieren del conocimiento del punto cero de la escala.
Las propiedades del nivel de razón son:
1. Las categorías de los datos son mutuamente excluyentes y colectivamente exhaustivas.
2. Dichas categorías tienen un intervalo u orden de acuerdo con la cantidad de la categoría
que poseen.
3. Diferencias iguales en la característica están representadas por diferencias iguales en
los números que se han asignado a las categorías mencionadas.
4. El punto o valor cero indica ausencia de la característica.
Ejemplos:
Ejemplos de la escala de razón son los salarios, las unidades de producción, el peso, los
cambios en los precios de las acciones, la distancia entre un conjunto de oficinas, etc. El
dinero es un buen ejemplo. Si se tiene cero dólares entonces no se poseen fondos. Si una
persona gana $30 000 dólares al año vendiendo seguros, y otra gana $60 000 al año
vendiendo automóviles, la segunda persona gana el doble de lo que percibe la primera.
La razón o cociente vale 2.
Desde luego hay variables que pueden medirse en más de un nivel, según el propósito de
medición. Por ejemplo la variable “antigüedad en la empresa” , es una variable medida en
escala de razón (de 0 a k días); pero también podría ser medida en escala ordinal, con
categorías: Mucha antiguedad / Regular antigüedad / Poca antigüedad.
Unidad de Observación: Es la unidad que está sujeta a medición, conocida también como unidad
elemental.
Estadístico o estadígrafo: Son también medidas de resumen que describen una característica de la
muestra y para calcular su valor se requiere de los elementos de la muestra únicamente.
POBLACIÓN.
En estadística el concepto de población va más allá de lo que comúnmente se
conoce como tal. En términos estadísticos, población es un conjunto finito o infinito
de personas, animales o cosas que presentan características comunes, sobre los
cuales se quiere efectuar un estudio determinado. En otras palabras, la población
se define como la totalidad de los valores posibles (mediciones o conteos) de una
característica particular de un grupo especificado de personas, animales o cosas
que se desean estudiar en un momento determinado. “Una población es un
conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones”. Levin & Rubin (1996).
“Una población es un conjunto de elementos que presentan una característica
común”. Cadenas (1974).
MUESTRA.
Un subconjunto cualquiera de la población . Para que la muestra nos sirva para
extraer conclusiones sobre la población deber ser representativa , lo que se
consigue seleccionando sus elementos al azar , lo que da lugar a una muestra
aleatoria. Es una parte o porción extraída de un conjunto por métodos que
permiten considerarla como representativa del mismo. Entonces, una muestra no
es más que una parte de la población que sirve para representarla. La muestra
debe obtenerse de la población que se desea estudiar; una muestra debe ser
definida sobre la base de la población determinada, y las conclusiones que se
obtengan de dicha muestra sólo podrán referirse a la población en referencia.
MUESTREO.
Procedimiento para la obtención de una muestra, el muestreo como se dijo es el
proceso de obtención de la muestra. Puede ser probabilístico y no probabilístico.
Hablamos de un muestreo probabilístico cuando los integrantes de la muestra se
escogen al azar y por lo tanto, puede calcularse con antelación la probabilidad de
obtener cada una de las muestras que pueden formarse de esa población o la
probabilidad que tiene cada elemento de la población de ser incluido en la
muestra.
PARÁMETROS.
Es una función establecida sobre los valores numéricos de una comunidad. Se
trata, por lo tanto, de una cifra representativa que permite modelizar un plano real.
La utilidad de los parámetros estadísticos se encuentra ante la dificultad para
manipular un elevado número de datos individuales de una misma sociedad. Este
tipo de parámetros permite obtener un panorama general de la población y llevar a
cabo comparaciones y predicciones. El parámetro al dato se considera como
imprescindible y orientativo para lograr evaluar o valorar una determinada
situación. A partir de un parámetro, una cierta circunstancia puede comprenderse
o ubicarse en perspectiva, los mismos suelen representarse con letras griegas. El
valor de un parámetro poblacional es un valor fijo en un momento dado. Ejemplo:
La media Aritmética = m (miu), La desviación Típica = s, (Sigma) etcétera. Por dar
otros ejemplos concretos: “Si nos basamos en los parámetros habituales, resultará
imposible comprender esta situación”, “El paciente está evolucionando de acuerdo
a los parámetros esperados”, “Estamos investigando pero no hay parámetros que
nos permitan establecer una relación con el caso anterior”, “La actuación del