Está en la página 1de 15

La importancia de la estadística

La estadística es la base del conocimiento práctico y real. Su definición.- La estadística es una de las ramas de
la ciencia matemática que se centra en el trabajo con datos e informaciones que son ya de por sí numéricos o
que ella misma se encarga de transformar en números. La estadística, si bien es una ciencia de extracción
exacta, tiene una injerencia directa en cuestiones sociales por lo cual su utilidad práctica es mucho más
comprensible que lo que sucede normalmente con otras ciencias exactas como la matemática.
A diferencia de otras ramas de la matemática que poseen una parte importante de abstracción, la estadística
tiene aplicaciones directas y concretas en la vida real ya que toma los números y cifras de diferentes
fenómenos sociales como por ejemplo la desocupación, la tasa de mortalidad, la de natalidad y muchos otros
datos incluso más complejos.
Podemos decir que la función principal de la estadística es justamente la recolección y agrupamiento de datos
de diverso tipo para construir con ellos informes estadísticos que nos den idea sobre diferentes y muy
variados temas, siempre desde un punto de vista cuantitativo y no cualitativo. Esto es muy importante de
remarcar ya que la estadística se convierte entonces en una ciencia que nos habla de cantidades (por ejemplo,
cuántas personas viven en un país por metro cuadrado) pero no nos da información directa sobre la calidad de
vida de esas personas. En este sentido podemos decir que se presentan varias limitaciones ya que no permite
conocer más que numéricamente aspectos que requieren un trabajo más complejo y profundo.
Sin embargo, a pesar de lo mencionado en el párrafo anterior, lo interesante de la estadística como ciencia es
que en muchos casos, la información cuantitativa que nos brinda nos permite conocer a ese nivel mucho
mejor a una sociedad, por ejemplo cuántas personas viven en un país, cuál es la tasa de desempleo, cuál es la
tasa de indigencia o pobreza, cuál es el nivel promedio de educación de esa sociedad, etc. Todos estos datos
numéricos son utilizados por los responsables del Estado a través de sus distintos organismos y secretarías
para luego realizar proyectos de diferente tipo que tengan que ver con mejorar esa situación o mantenerla en
el caso de que sea buena.
En algunos casos, aunque no directamente, la estadística también nos permite inferir (no conocer) la calidad
de vida de una población ya que si encontramos altas tasas de desempleo, pobreza y marginalidad podremos
suponer que la calidad de vida es muy baja.
La estadística tiene una utilidad no sólo en aspectos sociales si no que también sirve para todo tipo de
investigación científica si se tiene en cuenta que los datos estadísticos son el resultado de varios casos de
entre los cuales se toma un promedio. Así, una estadística puede servir para una investigación científica al
demostrar que un porcentaje determinado de los casos observados representó un resultado particular y no
otro. También se utiliza por ejemplo para conocer el planeta en el que vivimos y darnos datos sobre las
proporciones de recursos renovables, sobre las superficies de los países, la presencia de determinados biomas
o no, etc.
Como ocurre con cada actividad humana, las estadísticas no son perfectas y muchas veces pueden presentar
errores. Además, al ser realizadas por humanos también debemos contar con una cuota de subjetividad y esto
es lo que genera que algunos índices, al ser medidos por diferentes personas con distintas posturas políticas o
económicas, den como resultado diferentes números. Esto es muy común por ejemplo respecto a los posibles
resultados de elecciones políticas que marcan también decisiones políticas o incluso propaganda de algunas
consultoras hacia determinados candidatos.
En estos casos, las estadísticas se ven malversadas y son fraudulentas, lo cual significa un gran problema ético
y moral respecto de un sinfín de temáticas porque se considera que el público debe recibir información lo más
verídica posible especialmente si se trata de temas sensibles y que pueden influir en la calidad de vida de las
personas directamente.
La estadística y su relación con la medicina
La oficina de estadística de un establecimiento de salud se encarga de generar publicaciones en temas
sanitarios, elaboradas en colaboración con profesionales especialistas. El enfoque de estas publicaciones es
diverso e incluye revisiones descriptivas, análisis de tendencias de morbilidad y mortalidad, así como boletines
estadísticos de temas relevantes, todo con el objetivo de acertar en las decisiones de gestión para la mejora
de la atención en salud.

El estadístico se encarga de gestionar y monitorear el proceso de recolección, análisis, difusión y uso de la


información en salud, así como, aplicar las tecnologías de la información y comunicación, como instrumentos
de soporte en el proceso automatizado de los sistemas de que permitan la generación de la información ágil,
consistente y oportuna para la toma de decisiones en la planeación, operación, monitoreo y evaluación de los
servicios de salud. También es el responsable de obtener información confiable que permita contar con los
indicadores trazadores para observar las tendencias de coberturas alcanzadas a nivel del Ministerio de Salud,
direcciones regionales, direcciones de redes integradas, hospitales y en diferentes puestos y centros de salud.

Mediante Resolución Ministerial N° 0064-85-SA/DVM, se instituyó en el Perú el “Día del Estadístico de Salud»,
el 23 de abril de cada año. Quienes trabajan en esta labor se comprometen a darle sentido a los datos y estas
cifras son transformadas en información útil que permita la toma de decisiones en planes de acción y
contribuye al bienestar de la comunidad. El estadístico, con su labor brinda una información clara y fidedigna
sobre la gestión de salud no solo para el propio centro sanitario sino para la comunidad.

Sabemos que hay muchos desafíos por abordar dentro de la gestión de un centro sanitario; por ello, es
necesario dar a conocer la importancia de este instrumento de apoyo como herramienta indispensable para
una adecuada gestión administrativa.
División de la estadística
La estadística se divide en dos ramas: la estadística descriptiva, la cual se relaciona con la descripción de los
datos recopilados en una muestra, y la estadística inferencial, que se relaciona con el proceso de utilizar los
datos de una muestra para realizar inferencias y tomar decisiones respecto a la población de la cual se toma la
muestra.
En la estadística existen dos procedimientos para hacer inferencias respecto a un parámetro: la estimación de
parámetros ya sea puntual o por intervalos, y las pruebas de hipótesis. La estimación puntual es un
procedimiento que permite a partir de la información de la muestra obtener un sólo valor, con el cual se
estima el parámetro deseado, mientras que la estimación por intervalos permite obtener dos valores entre los
cuales se supone se encuentra el parámetro de interés.
Para hacer un uso correcto De las pruebas de hipótesis, es necesario verificar que se cumplan los supuestos
requeridos en éstas, ya que al no cumplirse alguno de éstos, se incurre en errores que afectan los resultados
obtenidos, por lo tanto se debe hacer un estudio formal de las implicaciones que se tendrían al aplicar las
pruebas de hipótesis cuando no se cumple algún supuesto.
Específicamente se observarán las pruebas de hipótesis para una media, una varianza y una proporción, bajo
condiciones en las cuales no se cumpla el supuesto de normalidad, con la finalidad de establecer los errores en
que se incurre y así aportar conclusiones y recomendaciones útiles para evaluar la confiabilidad de los
resultados de estas pruebas.
La finalidad de este trabajo es:
1) Analizar las implicaciones de la aplicación de las pruebas de hipótesis para una media y para una varianza,
cuando los tamaños de muestra son menores a 25 y las muestras provienen de poblaciones con distribución
Uniforme, Exponencial y Gamma, a través del análisis y comparación de los valores P y
2) Verificar la velocidad de aproximación a la distribución normal, de la proporción de éxitos en una muestra
en las pruebas de hipótesis para una proporción, a través del análisis y comparación de los valores P.
Para cumplir los objetivos de este trabajo se siguieron estos pasos:
1) Se recopilarán los conceptos y teoría necesaria para la realización de las pruebas de hipótesis.
2) Se selecciona un generador de números aleatorios, a su vez seleccionarán y aplicarán de manera arbitraria
tres pruebas estadísticas para verificar que este es confiable.
3) Se desarrollará e implantará un programa de cómputo en Excel usando Macros en lenguaje de Visual Basic,
que a través de sus módulos facilite realizar las simulaciones de las pruebas de hipótesis anteriormente
mencionadas.
4) Se diseñarán los diferentes escenarios de simulación y se realizarán simulaciones de las pruebas de
hipótesis, graficando y tabulando los resultados.
5) Se realizará una prueba de bondad de ajuste a las distribuciones de las estadísticas de prueba.
6) Se analizarán los resultados con base a los valores P y las graficas, para obtener las conclusiones.
Se concluyó que en las pruebas de hipótesis para una media al utilizar muestras de distribuciones uniformes y
gammas no se presentan alteraciones representativas en los resultados, sin embargo al utilizar muestras de
distribuciones exponenciales, la aproximación a la distribución normal es muy lenta ya que converge para
tamaños de muestra grandes.
Para el caso de las pruebas de hipótesis para una varianza, se concluyo que el uso de estas pruebas cuando las
muestras no son de distribuciones normales, deriva en resultados erróneos e incorregibles al aumentar el
tamaño de la muestra.
En el caso de las pruebas de hipótesis para una proporción, se llego a la conclusión de que existe una regla
empírica que específica el tamaño de muestra para el cual existe una buena aproximación a la normal.

PALABRAS CLAVES
Pruebas de Hipótesis.
Supuesto de normalidad.
Tamaños de muestra pequeños.
Velocidad de convergencia a la normal.
Valores P.

La estadística y su relación con la industria


¿Alguna vez te han dicho que «los datos son estadísticamente significativos, por lo que puedes confiar en
ellos»? Hoy hablaremos de la importancia de la estadística en una empresa y por qué es importante prestar
atención a los argumentos que están respaldados por ella.
Las empresas, debido a su falta de tiempo y recursos, pueden malinterpretar los resultados estadísticos y
hacer un mal análisis de datos, en ocasiones, pueden equivocarse. Interpretar estadísticas puede ser
matemáticamente desafiante, e incluso comprender las correlaciones puede llevar tiempo.
Por esta razón, las empresas a menudo dependen de recursos externos, como las empresas de investigación
de mercado y los proveedores de aplicaciones, para llevar a cabo el componente estadístico de la
investigación y presentarles los resultados. 
Esto puede ocasionar que los empresarios pueden interpretar los datos sin ser conscientes de los errores
estadísticos (o ignorarlos), y esto puede llevar a que tomen decisiones comerciales que en realidad se basan
menos en los datos, y más en las suposiciones.
Los directivos de empresas utilizan la estadística como ayuda para tomar decisiones ante la incertidumbre. 
La estadística puede utilizarse para realizar proyecciones de ventas, análisis financieros de proyectos de gasto
de capital, construir proyecciones de beneficios para un nuevo producto, establecer cantidades de producción
y hacer un análisis de muestreo para determinar la calidad de un producto. 
El uso de la estadística proporciona datos reales sobre situaciones complejas en lugar de tomar decisiones
basadas en corazonadas sin fundamento. Un directivo debe tener la capacidad de observar los datos y hacer
predicciones sobre el futuro de la empresa o de un departamento concreto. Hoy en día, cada decisión debe
estar respaldada por datos empíricos concretos, de ahí la importancia de la estadística en una empresa.
Estos son algunos que le puedes dar a la estadística dentro de una empresa:

 Medición del rendimiento


Un uso habitual de la estadística es la medición del rendimiento. Por ejemplo, se pueden recopilar datos sobre
un pequeño número de unidades de producto para hacer una estimación sobre el nivel de calidad de todo un
lote de producción; esto se conoce como muestreo estadístico y se utiliza para determinar si se acepta o se
rechaza un lote. 
Otro uso podría ser el análisis del rendimiento de la producción de un empleado para averiguar si el trabajador
está cumpliendo los estándares de productividad deseados. Si no es así, puede ser necesario realizar ajustes,
como mejoras en el equipo, cambios en el entorno de trabajo o una mejor comunicación.
 Realizar predicciones
Los gestores analizan los datos del pasado para encontrar tendencias estadísticas y hacer predicciones sobre el
futuro. 
Por ejemplo, podrían analizar las ventas anteriores de todos los productos vendidos para hacer estimaciones
sobre el volumen de ventas futuras en determinadas condiciones económicas. A su vez, estas proyecciones se
utilizarían para establecer programas de producción.
 Riesgo/rendimiento de las inversiones
El objetivo de un nuevo proyecto de inversión es optimizar el rendimiento y minimizar el riesgo. Los métodos
estadísticos pueden permitir a un gestor evaluar el proyecto en diferentes entornos económicos, cambios en
las preferencias de los consumidores y fuerza de la competencia.
 Estudios de mercado
Las empresas utilizan las estadísticas en los estudios de mercado y el desarrollo de nuevos productos. Realizan
encuestas aleatorias a los consumidores para calibrar la aceptación del mercado y el potencial de un producto
propuesto. 
Los directivos quieren saber si habrá suficiente demanda para el producto. ¿Hay suficiente demanda para
justificar el gasto en el desarrollo del producto y, en última instancia, la construcción de una planta para
producirlo? A partir del análisis estadístico, se construye un modelo de equilibrio para determinar el volumen
de ventas necesario para que el producto tenga éxito.

La estadística y su relación con la informática (computación)


Es una disciplina del conocimiento científico tecnológico, que se ocupa de estudiar el impacto de la
computación en la metodología estadística (i.e. Algoritmos, modelación gráfica, métodos inferenciales
intensivos en cálculo recursivo, análisis exploratorio de datos, evaluación de software estadístico, métodos
estadísticos en data mining, métodos estadísticos en simulación, métodos estadístico en procesamiento de
imágenes y señales etc.) Esta área aborda todos los aspectos teóricos y prácticos del modelamiento estadístico
y al mismo tiempo se ocupa de todos los cambios y aplicaciones, que la Ciencia de la Computación está
generando en ella. La estadística computacional es en verdad una disciplina, que está en la frontera de dos
disciplinas; la Ciencia de la Computación y la Estadística. Desde hace un par de décadas la Estadística y la
Ciencia de Computación proporcionan herramientas complementarias, para explorar otras Ciencias; entre las
que se destacan las Ciencias de la Tierra, las Ciencias de la Ingeniería, la Economía, y la Medicina entre otras.
Es destacable, y no siempre obvio a primera vista, la universalidad de estas dos disciplinas (Ciencias de la
Información), dado que ambas disciplinas tienen raíces comunes y la discusión de sus fronteras, es tema
abierto.
La Estadística busca como acumular y optimizar la información extraída de los datos, como recolectar los datos
para maximizar la información y como hacer inferencias de los mismos para extender nuestro conocimiento.
Por otro lado, la Ciencia de Computación, nos dice cómo calcular y procesar de manera óptima los datos,
cómo medir el costo asociado al procesamiento de la información, cómo la información y el conocimiento
pueden ser útilmente representados y como comprender los límites de lo que puede ser calculado etc.
De todo lo anterior se desprende que está disciplina puede ser considerada como parte de las Ciencias de la
Ingeniería, o bien como parte de la Computación Científica (Scientific Computing).
Finalmente el International Satistical Institute (ISI) reconoce a la Estadística Computacional como una de sus 5
secciones, la International Association Statistical Computing (IASC). Esta sección creada en 1982 cuenta entre
sus miembros a destacados académicos de Europa y los EE.UU. y además dispone de varias revistas periódicas
de corriente principal indexadas, entre las más conocidas podemos citar: Statistics and Computing,
Computational Statistics and Data Analysis, Computational Statistics, Graphical Models and Image Processing
etc, existen además numerosos libros dedicados a esta temática.

Población
es el total de individuos o conjunto de ellos que presentan o podrían presentar el rasgo característico que se
desea estudiar.
Quizá, la definición teórica de población estadística sea un poco abstracta. Por eso, sin renunciar a la
rigurosidad y precisión que requieren las variables cuantitativas, vamos a intentar abordar el concepto de
población estadística de la forma más sencilla posible.
Empezaremos por la palabra población. ¿En qué piensas cuando lees o escuchas la palabra población? Muy
probablemente en un número de personas. Por ejemplo, la población de Argentina, la población de Chile, la
población de Nueva York o la población mundial. Y dirás, ¿qué tiene que ver la población con la estadística?
Pues tiene que ver mucho. Todo se remonta a los orígenes de la palabra estadística.
Con esto en mente, seguiremos la siguiente secuencia para entender el concepto: origen de la palabra,
principales tipos de población y un ejemplo de población estadística.
La estadística nace con el objetivo de medir y cuantificar características de la vida cotidiana. Así, los gobiernos
comienzan a elaborar censos de población, tablas de mortalidad y natalidad e incluso en Roma se registraban
las tierras y propiedades que tenían los ciudadanos.
De ahí que la palabra que se utilizase y se utilice sea la de población. Pues, incialmente, se cuantifican cosas
sobre la población de un territorio.

Dentro de las poblaciones estadísticas, fundamentalemente dos tipos de poblaciones:


 Población estadística finita: Es aquella en la que el número de valores que la componen tiene un fin.
Por ejemplo, la población estadística que nos indica la cantidad de árboles de una ciudad es finita. Es
cierto que puede variar con el tiempo, pero en un instante determinado es finita, tiene fin.
 Población estadística infinita: Se trata de aquella población que no tiene fin. Por ejemplo, el número de
planetas que existen en el universo. Aunque puede que sea finito, el número es tan grande y
desconocido que estadísticamente se asume como infinito.
Adicionalmente, dentro de esta gran clasificación, existen otros tipos de poblaciones. Poblaciones según la
distribución de los datos, según el tipo de dato (cualitativo o cuantitativo), etc.

Muestra
Para explicar por qué se utiliza una muestra estadística en lugar de la población total, vamos a recurrir al
ejemplo planteado anteriormente.
Supongamos que queremos estudiar un fenómeno cualquiera. En nuestro caso, ese fenómeno es el salario
medio de los ciudadanos de un país. La población de datos está formada por todos y cada uno de los
trabajadores del país. Claro que por razones de tiempo y coste sería imposible ir preguntando a cada
trabajador cual es su salario anual. Tardaríamos mucho tiempo o necesitaríamos muchos recursos.
En este punto aparece el concepto de muestra estadística. En lugar de preguntar a los millones de
trabajadores de un país o región, tan solo recogemos una pequeña cantidad de datos. Por ejemplo,
preguntamos a 100.000 personas. Esta tarea sigue siendo complicada, pero es mucho más asequible
preguntar a 100.000 personas que preguntar a 30 millones.
Esta pequeña cantidad de datos ha de ser representativa. Es decir, debe representar adecuadamente a la
población. Si las 100.000 personas a las que preguntamos se concentran en barrios ricos, obtendremos datos
que no son representativos. El salario medio nos saldría mucho más alto de lo que es en realidad.
Si se quiere hacer una buena investigación, la calidad de la muestra estadística es esencial. De nada sirve
realizar las métricas estadísticas más complejas con los modelos más sofisticados si la muestra estadística está
sesgada. Es decir, si la muestra no es representativa.
A la hora de obtener una muestra representativa existen ciertos aspectos que el investigador debe conocer de
antemano. Entre esos aspectos se encuentran las características de una muestra representativa. Las
características de una muestra representativa son las siguientes:
 Tamaño suficientemente grande: Cuando trabajamos con muestras estamos, normalmente, trabajando
con una cantidad de datos inferior a la población. Ahora bien, para que una muestra estadística sea
representativa deberá ser lo suficientemente grande como para considerarse representativa. Por
ejemplo, si nuestra población está formada por 10 millones de datos y escogemos 10, es difícil que sea
representativa. Eso sí, no siempre a mayor tamaño la muestra es más representativa.
 Aleatoriedad: La selección de los datos de una muestra estadística debe ser aleatoria. Es decir, debe
ser totalmente al azar. Si en lugar de realizarlo al azar, realizamos un proceso de selección de datos
planificado, estamos introduciendo un sesgo a la obtención de datos. Por tanto, para evitar que la
muestra sea sesgada y, por tanto, conseguir que sea una muestra representativa, debemos hacer una
selección aleatoria.
A continuación te explicamos los diferentes tipos de muestra estadística que hay. Antes de nada cabe destacar
que se pueden dividir en dos grandes grupos, muestra probabilística y muestra no probabilística:
 Muestra probabilística: En este tipo de muestras todos los sujetos disponibles tienen las mismas
probabilidades de ser incluidos.
o Muestra aleatoria simple: Es un conjunto de variables aleatorias independientes e
idénticamente distribuidas, obtenidas a partir de la variable aleatoria X y que se distribuyen
igual que la misma.
o Muestra aleatoria sistemática: En este caso la población se enumera y se agrupa en grupos de
10 personas. Posteriormente, se selecciona a un miembro de cada grupo para elaborar la
muestra.
o Muestra aleatoria por conglomerados: La población se encuentra ya agrupada previamente y
de estos grupos se extraen los individuos para conformar la muestra.
o Muestra estratificada: En este caso la población se divide en subgrupos o estratos con base en
las variables de estratificación.
 Muestra no probabilística: En este tipo de selección de muestra todos los elementos no tienen la
misma probabilidad de ser elegidos, ya que depende del procedimiento escogido para seleccionarlos.
o Bola de nieve: En primer lugar se seleccionan a diferentes sujetos. A partir de ahí estos sujetos
colaboran para encontrar a más sujetos que tengan relación con ellos.
o Muestra por cuotas: La población es elegida en función a unas características determinadas.
o Muestra discrecional: La selección de la población la realizan los investigadores en función a su
propio criterio.
o Muestra por conveniencia: Es una muestra elegida por los propios investigadores según su
interés o cercanía.
Supongamos que queremos realizar un estudio sobre el gasto medio de las familias de Colombia en el mes de
enero. Para ello tenemos dos opciones:
1. Entrar en las cuentas bancarias de todas las familias de Colombia
2. Preguntar a una cantidad de personas representativa
La primera opción no es viable por varias razones. Primero que las familias no van a ceder sus datos y segundo
que tampoco podíamos ir familia por familia mirando los datos. Principalmente, porque la población de
Colombia se encuentra cerca de los 50 millones. Mientras, la segunda es la opción para recoger una muestra
estadística.
Lo que haremos, siguiendo las características mencionadas anteriormente, será preguntar a 100.000 familias.
Es algo complicado pero mucho más fácil que preguntar a 50 millones de colombianos. La diferencia es
considerable. Así pues, a partir de esa muestra de 100.000 familias, intentaremos calcular el gasto medio de
las familias en enero.
Los datos extraídos serán más o menos fiables según una serie de métricas que se tienen en cuenta en las
investigaciones estadísticas. Claro que, ese tipo de métricas son más avanzadas y, por ello, no las trataremos
aquí.
Otro ejemplo de muestra estadística podría ser conocer la opinión de la gente de un determinado barrio
acerca de que se cree un restaurante de comida mexicana en la zona en la que residen. Las opciones para
realizar este muestreo pueden ser consultarle a la gente en la calle para saber si irían a comer o cenar a este
nuevo restaurante.
En cambio, otra opción sería que nuestro grupo de amigos enviase entre sus grupos de conocidos un
cuestionario consultando esta información. La gente que respondiese sería la muestra.
Parámetro
Es un valor, un número, que resume y permite interpretar los datos extraídos en el estudio de una muestra
estadística. Imaginemos que hablamos de una población determinada que queremos analizar. En este caso, el
parámetro estadístico podría ser la edad media de la población en cuestión.
También, es conveniente señalar que a los parámetros estadísticos también se les conoce como estadísticos
descriptivos.
El cálculo de este parámetro, está definido mediante una fórmula aritmética. En el caso de la población, la
media presenta una fórmula que se utiliza para calcular y extraer dicho parámetro.
El parámetro estadístico es un pilar fundamental de la estadística. Gracias a los parámetros podemos conocer
la situación de la realidad, pues permite interpretar y resumir un gran número de datos que se extraen al
analizar una determinada muestra estadística.
La media, la moda, la mediana, así como las principales medidas de tendencia central, por ejemplo, son
parámetros estadísticos. Permiten interpretar unos datos que se extraen de una determinada población.
Asimismo, las medidas de posición no central, como serían los deciles, los percentiles o los cuartiles, también
son parámetros estadísticos. Clasificando a la población en grupos, nos permite interpretar datos y analizar la
población.
En resumen, hablamos de un valor que representa la realidad sobre un determinado estudio estadístico,
resumiendo y exponiendo esa gran cantidad de datos en un solo valor. Ello, mediante el uso de fórmulas
previamente definidas que permiten su cálculo.
Dicho esto, entre los principales parámetros estadísticos que existen, los principales son los siguientes:
Medidas de posición
Las medidas de posición son indicadores que permiten resumir los datos en uno solo, o dividir su distribución
en intervalos del mismo tamaño.
Dentro de las medidas de posición, podemos encontrar las medidas de tendencia central y las medidas de
posición no central.
Veamos, a continuación, las dos.
Medidas de tendencia central
Las medidas de tendencia central son parámetros estadísticos que tratan de informar sobre el centro de una
distribución de la muestra estadística o población estadística.
Así, hablamos de un parámetro utilizado para, entre otras muchas cosas, conocer en qué lugar se encuentra el
elemento promedio, o típico del grupo. Imaginemos que queremos saber qué asignatura es la preferida por
los alumnos de una clase. Para ello, podemos utilizar la moda.
Las principales medidas de tendencia central son las siguientes:
 Media: Es el valor promedio de un conjunto de datos numéricos.
 Moda: Es el valor que más se repite en una muestra estadística.
 Mediana: La mediana parte la distribución en dos, es decir, deja la misma cantidad de valores a un lado
que a otro.
Medidas de posición no central
Las medidas de posición no centrales son los cuantiles.
Los cuantiles, para hacernos una idea, realizan una serie de divisiones iguales en la distribución ordenada de
los datos. De esta forma, reflejan los valores superiores, medios e inferiores.
Imaginemos que queremos dividir una población en grupos, atendiendo a su salario. De esta forma,
podríamos utilizar los cuartiles, permitiéndonos analizar aquellos cuartiles que presentan un salario más bajo.
Los más habituales son:
 Cuartil: Es uno de los más utilizados. Divide la distribución en cuatro partes iguales.
 Quintil: Este divide la distribución en cinco partes.
 Decil: Estamos ante un cuantil que divide los datos en diez partes iguales.
 Percentil: Por último, este cuantil divide la distribución en cien partes.
Medidas de dispersión
Las medidas de dispersión son, en esencia, un valor numérico que ofrece información sobre el grado de
variabilidad de una variable.
Dentro de las medidas de dispersión, podemos encontrar las medidas de dispersión absoluta y las medidas de
dispersión relativas.
Veamos, a continuación, las dos.
Medidas de dispersión absolutas
Las medidas de dispersión absolutas vienen dadas en las mismas unidades en las que se mide la variable.
En este sentido, hablamos de medidas como las desviaciones medias, la varianza, o la desviación típica.
En el caso de la desviación típica, por ejemplo, esta ofrece información de la dispersión respecto a la media.
De la misma forma, la varianza representa la variabilidad de una serie de datos respecto a su media.
Medidas de dispersión relativas
Las medidas de dispersión relativas nos informan de la dispersión, como las de dispersión absolutas, pero lo
hacen en términos relativos, es decir, como un porcentaje.
Entre las principales medidas de dispersión relativas que conocemos, destacan el coeficiente de variación, el
índice de desviación respecto de la mediana, entre otras.
En el caso del coeficiente de variación, este nos informa sobre si una variable se mueve mucho o poco, aunque
ello, con relación a otra variable. Mientras la varianza nos indica la variación absoluta de una serie de datos, el
coeficiente de variación nos indica dicha variación, pero con relación a otra variable, por lo que hablamos de
términos relativos.

Variables
Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma
numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está
medida en centímetros.
También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300 dólares el último
año. En este caso, la variable sería el beneficio y estaría medido en dólares. Ambas variables son del tipo
cuantitativo (se expresan con un número)
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio)
expresar en forma de número. Así, otra variable que podríamos encontrarnos es el color de ojos de una
persona. Por ejemplo, Juan tiene los ojos verdes y Andrés los tiene azules. La variable sería el color de ojos y
sería una variable cualitativa. Es decir, no se expresa con número.
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de
variables:
 Variable cuantitativa: Son variables que se expresan numéricamente.
o Variable continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que
tarda un corredor en completar los 100 metros lisos.
o Variable discreta: Toman un valor finito de valores entre un intervalo de datos. Número de
helados vendidos.
 Variable cualitativa: Son variables que se expresan, por norma general, en palabras.
o Variable ordinal: Expresa diferentes niveles y orden.
o Variable nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos
puede ser azul, negro, castaño, verde, etc.
Además cada una de estas variables podría tener más subtipos, ya que tenemos variables de
tipo económico, categóricas, dicotómicas, dependientes, independientes y cardinales. Es decir, como ya
hemos dicho, muchos tipos de variables estadísticas. Por ejemplo, podríamos tener una variable estadística de
tipo cuantitativo, discreta y dependiente.
Adicionalmente, también debemos aclarar que el hecho que las variables cualitativas se expresen con nombre
no quiere decir que no puedan ser parte de un modelo matemático. Así pues, podríamos crear una variable
cuantitativa a partir de una variable cualitativa. Por ejemplo, para el color de ojos podríamos asignar un 1 si
tiene los ojos azules, un 2 si tiene los ojos verdes y un 3 si tiene los ojos marrones. O, en otros casos,
podríamos también convertir variables dicotómicas que indica SI o NO, en 1 o 0.

Probabilidades
Una de las características más especiales de los seres humanos, que nos diferencia del resto de
animales, es nuestra capacidad de “predicción”, de anticiparnos a los acontecimientos que van a
ocurrir. A veces fallamos, pero otras muchas no. Esta capacidad nos ha permitido llegar hasta donde
estamos hoy, pudiendo predecir tanto peligros como oportunidades. Piénsalo, nuestros antepasado
que eran capaces de predecir el ataque de un depredador fueron los que sobrevivieron. Ahora,
decenas de miles de años después hemos dado un paso más y nos preguntamos  ¿qué es la
probabilidad?
La probabilidad es el cálculo matemático que evalúa las posibilidades que existen de que una cosa
suceda cuando interviene el azar.
Para calcular la probabilidad, continuando con el ejemplo anterior, no hay más que contar los coches
que hay de cada color. Como 6 de los 7 coches del aparcamiento son rojos, podemos plantearlo como
una fracción: la probabilidad de que del aparcamiento salga un coche rojo será una fracción con
numerador 6 (el número de coches rojos) y denominador 7 (el número total de coches).
La probabilidad de que salga un coche rojo sería igual a 67. La probabilidad de que salga un coche
amarillo sería igual a 17. La probabilidad de que salga un coche azul sería 0, porque no hay coches
azules aparcados.
Generalizando esta idea llegamos a cómo se calcula la probabilidad: con una fracción que se suele
llamar regla de Laplace. Ponemos en el numerador el número de casos favorables y en el
denominador el número de casos posibles.
Ejemplo
Lanzar una moneda al aire
Tirar un dado
La probabilidad se utiliza en muchas áreas como las matemáticas, la estadística, la física, la economía,
las ciencias sociales, entre otras. Los primeros estudios de probabilidad se desarrollaron para resolver
problemas de juegos y es allí dónde más se nota su uso, porque te puede servir para tener más
oportunidades de ganar, o para ahorrarnos dinero (al no jugar a jueg os en los que es muy probable
perder).

Variables discretas o continuas


La manera lógica de organizar datos es crear categorías y luego asignar las observaciones a una categoría. Pero
nuestra capacidad de categorizar está limitada por la naturaleza de las variables que usamos. Además, no
todas las variables se pueden categorizar con la misma facilidad. En términos estadísticos, las variables que
interesa medir pueden ser (a) discretas o (b) continuas.
Las variables discretas son aquellas cuyas observaciones se agrupan ‘inherentemente’ o ‘naturalmente’ en
categorías, porque dichas variable por su naturaleza sólo pueden tomar ciertos valores muy específicos. El
“género” de un sujeto es un buen ejemplo de una variable discreta: los seres humanos pueden ser mujeres u
hombres, se ajustan a una u otra categoría y no hay continuidad ni puntos intermedios entre ellas. Los países o
regiones del mundo también son buenos ejemplos de variables discretas. Otro ejemplo son las calificaciones o
educación de los maestros. Podemos crear las siguientes categorías para describir esta última variable: (a)
educación primaria completa, (b) educación secundaria completa, (c) educación superior incompleta, (d)
educación superior completa y (e) educación de postgrado.
Sin embargo, existe otra clase de variables, conocidas como variables “continuas”, que no son tan fáciles de
categorizar como las variables discretas. A diferencia de las variables discretas, las variables continuas, como
su nombre lo indica, sólo se pueden agrupar en forma arbitraria en categorías, porque por su naturaleza
pueden tomar cualquier valor a lo largo de un continuo (o de una escala numérica continua). La estatura de los
habitantes de un país es un ejemplo de variable continua, así como el ingreso de las familias en dicho país. Un
buen ejemplo en el área de la educación son las “calificaciones de pruebas”, que sólo se pueden agrupar
arbitrariamente creando ‘intervalos’ artificiales, como por ejemplo 1-20, 21-40, etc. Note que los intervalos
también podrían ser 1-10, 11-20, 21-30, etc, o cualquier otro intervalo que se prefiera, ya que la variable no se
ajusta naturalmente a categorías predeterminadas como en el caso de las variables discretas.
La distinción entre variables discretas y continuas es de gran aplicabilidad en la estadística. Pero su
importancia sólo queda clara después de comprender el concepto estadístico fundamental de ‘distribución’ o
‘distribución de frecuencias’. (Los estadísticos por lo general usan la primera versión, la más corta, para
referirse a la distribución de frecuencias.)

Variables Cualitativas
Las variables cualitativas no suelen corresponderse con cifras. Sin embargo, es posible vincularlas con
números. Por ejemplo, si estamos estudiando un grupo de personas, estas pueden ser de género masculino,
femenino o ninguno de los anteriores. Cada una de estas alternativas se podrían representar con los números
0, 1 y 2, respectivamente.
Es decir, si tenemos un hombre en el listado, meteríamos en una base de datos, en la columna donde indica el
género, el número 0. Esto quiere decir, con base en nuestro criterio, que es del género masculino.
Sin embargo, lo anterior no quiere decir que el género es una variable cuantitativa porque no es una cifra, sino
una característica del sujeto de análisis.
La principal diferencia entre variable cualitativa y cuantitativa es que la primera representa una característica
del sujeto u objeto en cuestión que puede explicarse con palabras. En tanto, la variable cuantitativa se expresa
básicamente con cifras.
En ese sentido, podemos recordar, como mencionamos anteriormente, que una variable cualitativa puede
asociarse a un número con fines estadísticos. Podemos asignar, por ejemplo, al nivel escolar, universitario y
posgrado los números 1, 2 y 3, respectivamente. Pero esto no implica que el nivel de educación alcanzado deje
de ser una variable cualitativa.
Caso distinto es el de las variables cuantitativas, que sí son cifras. Un claro ejemplo de ello son la
remuneración o la edad de una persona.
Cabe señalar, además, que las variables cuantitativas son exactas. Esto, a diferencia de las variables
cualitativas que tienden a ser más relativas.
Por ejemplo, el peso de una mancuerna de gimnasio puede ser de 20 kg. Este es un valor exacto. Sin embargo,
una variable cualitativa podría ser el estado de esa mancuerna, lo cual no siempre podrá ser determinado con
precisión. Puede ser que para algunos se encuentre en relativamente buen estado y otros opinen que la
herramienta requiere mantenimiento.

Los tipos de variables cualitativas son las siguientes:


 Dicotómicas o binarias: Solo admiten dos posibilidades. Por ejemplo, nacional o extranjero.
 Politómicas: Pueden tener más de dos valores. Estas pueden, a su vez, subclasificarse en:
o Nominales: No pueden ordenarse en una jerarquía específica, por ejemplo, la profesión.
o Ordinales: Son aquellas que sí pueden ordenarse, por ejemplo, el nivel que se tiene en un
idioma: básico, intermedio, avanzado o nativo.
A continuación, se muestran algunos ejemplos de variables cualitativas:
 Podemos clasificar una muestra de personas de acuerdo a su estado civil. En este sentido, hablamos de
soltero, casado, viudo o divorciado.
 Los pasajeros de un vuelo internacional pueden estar en clase económica o ejecutiva, siendo estas dos
posibles categorías una variable cualitativa dicotómica.
 Se puede dividir, mediante un sorteo, a los estudiantes de una clase en tres grupos, cada uno
correspondiente a un color, por ejemplo, amarillo, rojo y azul. Dicho color es una variable cualitativa.
 Los habitantes de una ciudad pueden dividirse de acuerdo a su distrito o zona específica de residencia,
que también sería una variable cualitativa.
 Un grupo de ciudadanos puede ser clasificado según el estrato socioeconómico: A, B, C, D o E. Esto, en
función del rango dentro del cual se encuentra su nivel de ingresos. En este caso, por ejemplo, María
Pérez quizás gana X cantidad de euros, lo que sería una variable cuantitativa, y pertenece al nivel
socioeconómico C, lo que sería una variable cualitativa.

Variables Cuantitativas
Otra forma de entender las variables cuantitativas es como aquellas que pueden ser medibles. Así pues, es
posible ordenarlas de mayor a menor (o viceversa) y realizar operaciones matemáticas.

La principal diferencia entre variable cualitativa y cuantitativa es que la primera representa una cualidad del
sujeto u objeto que puede expresarse mediante palabras. En cambio, la segunda se expresa únicamente con
números.

Dicho esto, conviene aclarar que a las variables cualitativas también se les puede asignar un valor. Por
ejemplo, imaginemos una base de datos en la que a las personas nacionales se les asigna, para su clasificación,
el número 1, mientras que, a los extranjeros, por el mismo motivo, se les asigna el número O. No obstante,
pese a ello, esto no quiere decir que la variable es cuantitativa, pues no se trata de una variable medible.

Cabe señalar, además, que las variables cuantitativas son específicas o exactas. Esto, a diferencia de las
variables cualitativas que tienden a ser más relativas.

Por ejemplo, el peso de una maleta puede ser de 23,5 kg. Este es un valor exacto. Sin embargo, una variable
cualitativa podría ser el nivel de satisfacción del servicio en un restaurante, donde se puede pedir una
calificación del 1 al 5. No obstante, seguirá siendo una variable cualitativa y la forma de medirla será más
inexacta que en el ejemplo de la maleta. Una persona podría dudar si poner una calificación de 3 o 4 si su nivel
de satisfacción fue moderado.

Los tipos de variables cuantitativas son los siguientes:


 Variables discretas: Son aquellas que toman, solamente, determinados valores y no cualquier valor que
se encuentre entre dos de ellos. Por ejemplo, cuando una variable solo puede tomar valores enteros es
discreta. Imaginemos el número de coches que posee una persona. Un individuo no puede tener un
coche y medio.
 Variables continuas: Son aquellas que pueden tomar cualquier valor. Habitualmente, esto quiere decir
que puede tomar valores que no son enteros. Por ejemplo, el peso de una bolsa de arroz puede ser de
1,25 kg.

Un ejemplo de variable cuantitativa puede ser la remuneración de los empleados de una empresa. Esta puede
ir desde 1.500 hasta 10.000 dólares mensuales.

Con los datos de estas remuneraciones se pueden calcular indicadores como la media, mediana y moda.
Incluso, se puede hacer una comparación con otras empresas del sector.

Además de esto, también se puede analizar cómo han ido variando a lo largo del tiempo los sueldos de la
empresa. A su vez, es posible calcular el peso relativo de las remuneraciones dentro de los costes de la
empresa, y así ver la importancia de estos.

También podría gustarte