Está en la página 1de 22

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD NACIONAL EXPERIMENTAL DE LOS LLANOS


CENTRALES ROMULO GALLEGOS
AREA DE POSTGRADO
CUARTO TRIMESTRE
PROGRAMA: ESPECIALIZACION EN CIENCIAS PENALES Y
CRIMINOLOGICAS

ANALISIS ESTADISTICO DE UNA VARIABLE


Conceptos y definiciones básicas-Tipos de variables-Recogida y depuración de datos-
Construcción de tablas de frecuencia-Representación y análisis gráfico de los datos-
Interpretación: Usos y abusos-Gráficas temporales-Características numéricas-
Medidas de centralización, dispersión y posición.-Resistencia-Métodos semifraficos:
diagrama de caja-Medidas de forma, simetría y concentración-Índice de Gini-
Tipificación-Técnicas para detectar observaciones anómalas-Composición y
comparación de poblaciones-Homogeneidad-Gráficos de medias y derivaciones-
Heterogeneidad y paradoja de Simpson.

Participante: Darsi Otilia Gil Rojas

Profesor: Dr. Ali Nieto

Anaco, 01 de julio de 2022.


INTRODUCCIÓN

¿Alguna vez has intentado mirar a tu alrededor, queriendo ver el aire, pero no puedes
hacerlo? Obviamente no, es invisible para nuestros ojos, pero lo sentimos y es
nuestro soporte vital. Pese a que las estadísticas no llegan a ser esenciales para
vivir también están a nuestro alrededor, presentes en diversos aspectos de nuestras
vidas. Por esta razón, debemos aprender todo sobre el análisis estadístico.
Mediante el estudio del análisis estadístico de datos, nuestra comprensión sobre los
procesos será completamente diferente. Un minúsculo dato, una variable con la que
no contábamos o un elemento inesperado pueden ayudarnos a entender una
información que, de otra manera, no habríamos podido asimilar.
Según lo definen, desde Economipedia, la estadística se ocupa de obtener, ordenar y
analizar un conjunto de datos, para conseguir "explicaciones y predicciones" sobre
eventos observados.
Entonces, ¿dónde encaja el análisis estadístico? ¿Son sólo un estudio de
números sobre un evento determinado? Sí, pero hay muchísima más información que
debemos saber. Entonces, ¿Qué es un análisis estadístico?
El análisis estadístico va un paso más allá. Básicamente, es el proceso para interpretar
los datos numéricos que tenemos a nuestra disposición, con la finalidad de que nos
ayude a tomar decisiones. Especialmente en el mundo de los negocios.
¿Qué es el análisis estadístico? Es el procedimiento por el cual realizamos
operaciones estadísticas (suena obvio, pero si vamos a dar una información hay que
darla bien y precisa).
“Mira que te mando que te esfuerces y seas valiente, no temas ni desmayes
porque Jehová tu Dios estará contigo donde quiera que tú vayas”

(Josué 1:9)
ANÁLISIS ESTADÍSTICO DE UNA VARIABLE

1. Conceptos y definiciones básicas. 2. Tipos de variables. 3.


Recogida y depuración de datos. 4. Construcción de tablas de
frecuencia 5. Representación y análisis gráfico de los datos. 6.
Interpretación: usos y abusos. 7. Gráficas temporales. 8
Características numéricas. 9. Medidas de centralización,
dispersión y posición. 10. Resistencia. 11. Métodos semigráficos:
diagrama de caja. 12. Medidas de forma, simetría y
concentración. 13. Índice de Gini. 14. Tipificación. 15. Técnicas
para detectar observaciones anómalas. 16. Composición y
comparación de poblaciones. 17. Homogeneidad. 18. Gráficos de
medias y derivaciones. 19. Heterogeneidad y paradoja de Simpson.

Punto1.- Conceptos y de definiciones básicas.

El análisis estadístico es la técnica que consiste en realizar varias operaciones


estadísticas para cuantificar los datos y aplicar el análisis estadístico. Los datos
cuantitativos implican datos descriptivos como encuestas y datos de observación.
También se denomina análisis descriptivo.

El análisis estadístico que identifica una posible relación entre variables es una forma


básica de análisis de datos y según el tipo de variable puede llamarse asociación o
correlación.

La variable estadística es una característica o cualidad de un individuo que está


propensa a adquirir diferentes valores. Estos valores, a su vez, se caracterizan por
poder medirse. 
Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una
persona, son variables estadísticas.
Punto 2.- Tipos de variables:

La variable estadística, de acuerdo con las características que la definen, puede ser


cualitativa o cuantitativa. 

A) Variable cualitativa: Las variables cualitativas son aquellas características o


cualidades que no pueden ser calculadas con números, sino que son
clasificadas con palabras.
Este tipo de variable, a su vez, se divide en:

Cualitativa nominal: aquellas variables que no siguen ningún orden en específico.


Por ejemplo, los colores, tales como el negro, naranja o amarillo (el color de pelo de
una persona, tal como castaño, rubio o negro).

Cualitativa ordinal: aquellas que siguen un orden o jerarquía. Por ejemplo, el nivel
socioeconómico alto, medio o bajo. O la condición de un pasaporte, del tipo
aprobado, denegado o en espera.

Cualitativa binaria: variables que permiten tan solo dos resultados. Por ejemplo, sí o
no; hombre o mujer. Ante la pregunta de si una persona posee hogar propio, la
respuesta será sí o no

B) Variable cuantitativa: Las variables cuantitativas son aquellas características o


cualidades que sí pueden expresarse o medirse a través de números.

Este tipo de variable, a su vez, se divide en:


o Cuantitativa discreta: aquella variable que utiliza valores enteros y
no finitos. Por ejemplo, la cantidad de familiares que tiene una
persona, tal como 2, 3, 4 o más. La cantidad de primos que tienen una
persona, tal como 2, 4, 6 u 8.

o Cuantitativa continúa: aquella variable que utiliza valores finitos y


objetivos, y suele caracterizarse por utilizar valores decimales. Por
ejemplo, el peso de una persona, tal como 64.3 kg, 72.3 kg, etc. la
estatura de una persona, tal como 1,65 cm.

Punto 3.-Recogida y depuración de datos:

Métodos de Recaudación de Información

1. Encuesta. Una encuesta es una serie de preguntas dirigidas a los


Participantes en una investigación.
2. Entrevista.
3. Prueba.
4. Evaluaciones Fisiológicas.
5. Observaciones.
6. Revisión de Registros.
7. Muestras Biológicas.
La depuración de datos es también muy conocida por su término en inglés data
cleansing y consiste en el proceso de detección y corrección de datos incorrectos o
corruptos de una base de datos.

Pasos en la depuración de datos:


1. Paso 1: Elimina los datos duplicados e irrelevantes. ...
2. Paso 2: Corrige los errores estructurales. ...
3. Paso 3: Filtra valores atípicos no deseados. ...
4. Paso 4: Maneja los datos faltantes. ...
5. Paso 5: Validación y control de calidad.

Punto 4.- Construcción de tablas de frecuencia:

Una tabla de frecuencias muestra de forma ordenada un conjunto de datos estadísticos


y a cada uno de ellos le asigna una frecuencia que, en pocas palabras, son las veces
que se repite un número o dato. Puedes usar las tablas de frecuencias para ordenar
variables cuantitativas o cualitativas.

Para construir la tabla de frecuencias, sigue los siguientes pasos:


1) Halla el número total de elementos en el estudio (n).
2) Establece las categorías (Xi). Recuerda que las categorías no se deben superponer,
es decir, ningún dato debe pertenecer a dos categorías, y ningún dato debe quedar sin
categoría.
3) Halla las frecuencias absolutas (ni)
4) Halla las frecuencias absolutas acumuladas.
5) Halla las frecuencias relativas.
6) Halla las frecuencias relativas acumuladas.
7) Halla las frecuencias porcentuales.
8) Halla las frecuencias porcentuales acumuladas.

Punto 5.- Representación y análisis gráfico de los datos.


La representación gráfica de datos estadísticos tiene como objetivo ofrecer una visión
de conjunto del hecho sometido a investigación, de una manera más directa y
perceptible que la mera presentación de los datos numéricos.

Existen diferentes tipos de gráficas:

1. Gráfico lineal: los valores se dividen en dos ejes cartesianos perpendiculares


entre sí.
2. Gráfico de barras: se usa cuando se pretende resaltar la representación de
Porcentajes de datos que componen un total.
3. Histograma: se emplea para ilustrar muestras agrupadas en intervalos.
Son gráficos que son llevados a cabo en diferentes figuras geométricas. Por ejemplo:
el gráfico de torta o circular, el gráfico de burbujas o los gráficos araña. Cartogramas
que son gráficos estadísticos que plasman la información sobre mapas.
Punto 6.- Interpretación: usos y abusos.

La interpretación de tablas y gráficas estadísticas es útil para: Comprender la


información estadística que sobre diversos temas proporcionan los medios de
comunicación y poder evaluarla de forma crítica. Entender la realidad social,
económica y política.

Por ejemplo: Un gráfico de barras es un gráfico que usa columnas para comparar


cantidades o sumas. La palabra clave es comparación. Si puedes pensar en una
comparación cuando trabajas con un gráfico de barras, te ayudará a comprender
mejor las cosas.

Uso y abuso: Además de las gráficas de barras, histogramas, y gráficas circulares (de


pastel), existen otras gráficas que se usan en la estadística para representar datos y
analizar lo que contienen. Pero debes ser cuidadoso cuando creas o lees gráficas. Si
no fueron construidas cuidadosamente pueden ser engañosas, y a veces las personas
las hacen así a propósito.

Punto 7.- Gráficas temporales:

Los gráficos de serie temporal se crean trazando un valor agregado (ya sea un


recuento o una estadística, como la suma o el promedio) en una línea temporal. Los
valores se agregan utilizando intervalos de tiempo basados en el rango de tiempo de
los datos que se trazan.

Punto 8.- Características numéricas:

Son aquellas características que se presentan cuando los datos sólo pueden tomar


ciertos valores. Este tipo de datos no se puede medir, pero se pueden contar.
Básicamente representan información que se puede clasificar.  Por ejemplo, los
datos continuos: Los datos continuos representan mediciones y, por lo tanto, sus
valores (valores numéricos).

Punto 9.-Medidas de centralización, dispersión y posición.

 Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro
de una distribución de datos. Las medidas de dispersión, variabilidad o variación nos
indican si esos datos están próximos entre sí o sí están dispersos, es decir, nos indican
cuán esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten
apreciar la distancia que existe entre los datos a un cierto valor central e identificar la
concentración de los mismos en un cierto sector de la distribución, es decir, permiten
estimar cuán dispersas están dos o más distribuciones de datos. Estas medidas
permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos,
siendo la media aritmética el dato central más utilizado. Cuando existe una dispersión
pequeña se dice que los datos están dispersos o acumulados cercanamente respecto a
un valor central, en este caso el dato central es un valor muy representativo. En el
caso que la dispersión sea grande el valor central no es muy confiable. Cuando una
distribución de datos tiene poca dispersión toma el nombre de distribución
homogénea y si su dispersión es alta se llama heterogénea.

     Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numéricos a fin de describir los datos cuantitativos
que los forman.

 Ejemplos de ello, pueden ser: la edad promedio o la estatura promedio de los


estudiantes de la universidad o el peso promedio de las bolsas de cereal que son
llenadas por una determinada máquina en un proceso de producción o las ventas de
un negocio.
Punto 10.- Resistencia.

Las estadísticas resistentes no cambian (o cambian en una pequeña cantidad) cuando


se agregan valores atípicos a la mezcla. La resistencia no significa que no se mueva
en absoluto (eso sería «inamovible» en su lugar). Significa que puede haber un
pequeño movimiento en sus resultados, pero no mucho.

Punto 11.- Métodos semigràficos: Diagrama de caja.

Un muy buen método para ver cómo han crecido y comprobar si existen valores


extremos es el diagrama de caja.

Los diagramas de caja le permiten visualizar y comparar la distribución y la


tendencia central de valores numéricos mediante sus cuartiles. Los cuartiles son una
forma de dividir valores numéricos en cuatro grupos iguales basados en cinco valores
clave: mínimo, primer cuartil, mediana, tercer cuartil y máximo.

Interpretación del gráfico

1) Asimetría positiva o segada a la derecha si la parte más larga de la caja es la parte


superior a la mediana. Los datos se concentran en la parte inferior de la
distribución. ...
2) Asimetría negativa o sesgada a la izquierda si la parte más larga es la inferior a la
mediana.
Punto 12.- Medidas de forma, simetría y concentración.

Las medidas de forma son aquellas que nos muestran si una distribución de


frecuencia tiene características especiales como simetría, asimetría, nivel
de concentración de datos y nivel de apuntamiento que la clasifiquen en un tipo
particular de distribución.

Las medidas de forma proporcionan información sobre el aspecto de la distribución


de frecuencias (sin representarla gráficamente). Coeficiente = 0 → distribución
simétrica. Coeficiente > 0 → distribución asimétrica positiva. Coeficiente < 0 →
distribución asimétrica negativa.

Medidas de Simetría. Medidas de Simetría: Las medidas de la asimetría, al


igual que la curtosis, van a ser medidas de la forma de la distribución, es
frecuente que los valores de una distribución tiendan a ser similares a ambos lados de
las medidas de centralización.

Las medidas de concentración son medidas de reparto del total de la variable.


Trataremos de estudiar si el reparto es más o menos equitativo (el total se reparte
de forma más o menos igualitaria entre los individuos) o desigual (unos pocos
individuos concentran en sí gran parte del total).

Punto 13.- Índice de Gini.

El índice de Gini o coeficiente de Gini es una medida económica, creada por Corrado
Gini en 1912, que sirve para calcular la desigualdad de ingresos que existe entre los
ciudadanos de una población.

El coeficiente Gini es el método más utilizado para medir la desigualdad salarial. Es


una herramienta analítica que suele emplearse para medir la concentración de
ingresos entre los habitantes de una región, en un periodo de tiempo determinado.

Punto 14.- Tipificación.


 Es la operación de realizar una transformación lineal en la variable para que la
(nueva) variable transformada, tenga por media, cero, y por desviación típica, uno.

Si queremos transformar una variable Normal, en otra variable Z Normal estándar, le


restamos a y luego la dividimos entre. A este proceso, que mantiene
las probabilidades, le llamaremos tipificar una variable aleatoria continua.

Punto 15. Técnicas para detectar observaciones anómalas.

Las series económicas pueden estar influidas por una serie de procesos no
determinista, ni conocidos para el analista y que pueden incidir en que estas
observaciones presenten estructura distinta al del resto de estas series, teniendo la
capacidad de sesgar los resultados obtenidos y de afectar la capacidad de
estimaciones de los modelos. Por tanto, antes de cualquier análisis estadístico es
recomendable observar si existen datos atípicos que puedan incidir sobre los
resultados. En el siguiente ejemplo se genera una variable aleatoria x con valores
aleatorios de 100 edades de niños en un determinado centro escolar (x<-sample
(5:16,100, replace=T)) y se introducen tres valores atípicos intencionalmente en las
observaciones [10,21,33] correspondiente a las edades de 21,31 y 40 años,
respectivamente.

Las técnicas para detectar observaciones anómalas son;

Identificación a partir de gráficos

Identificación a partir de la prueba de Tukey

Identificación a partir de la prueba de Tukey ajustada


Identificación a partir de la distancia de Cooks.

Punto 16.- Composición y comparación de poblaciones

Al comparar poblaciones debe tenerse cuidado que la estructura por edad no afecte


significativamente dicha comparación. Las tasas de nacimiento y mortalidad.

La composición de una población de acuerdo con el número o proporción de varones


y mujeres en cada categoría de edades. La estructura de la población por edad y sexo
de una población es el resultado acumulativo de las tendencias retrospectivas de la
fecundidad, mortalidad y migración.

El objetivo general de comparar dos poblaciones se traduce en comparar las medias


de la variable en cada una de ellas; aunque suele tener únicamente un interés
instrumental, también se pueden comparar las varianzas.

Punto 17.- Homogeneidad.

En la estadística, se utiliza la homogeneidad para describir las propiedades


estadísticas de un conjunto de datos en particular. En esencia, esto afirma que las
propiedades estadísticas de cualquier parte de un conjunto de datos son los mismos
que cualquier otra parte.

Para considerar las dos muestras homogéneas, el valor de éste para un grado de


libertad (el usado cuando se emplean dos muestras solamente) y para un valor
habitual de confianza del 95%, no debe superar a 3,84. En caso de que c2 fuera mayor
de este valor, las muestras no serían homogéneas.
El supuesto de homogeneidad de varianzas, también conocido como supuesto de
homocedasticidad, considera que la varianza es constante (no varía) en los diferentes
niveles de un factor, es decir, entre diferentes grupos.

Punto 18.- Gráficos de medidas y derivaciones.

Una gráfica de medida muestra información relacionada con los valores de una


única variable en formato circular. Utiliza colores para indicar si el valor actual se
encuentra en el rango estándar, aviso o crítico.

Los datos son la base de un negocio eficaz. Sin datos, no sería posible obtener la
información que se necesita para llevar a cabo tareas necesarias. Además, poder leer y
analizar rápidamente los datos permite, junto con la información necesaria,
comprender en qué medida un conjunto o grupo de hechos en particular contribuyen
al éxito global y dirigir sus decisiones de manera proactiva. Por eso la visualización
de datos resulta esencial. Mediante diagramas o gráficos, logrará junto con los demás
miembros del equipo, interpretar las preguntas que plantean los datos.

Los tipos de gráficos más importantes son:

Gráfico de áreas: El gráfico de áreas muestra gráficamente datos cuantitativos. Está


basado en el gráfico de líneas (véase la definición a continuación). El área entre el eje
y las líneas normalmente se enfatiza con colores, texturas y sombreados.
Normalmente, los usuarios comparan dos o más valores con un gráfico de áreas.
Cuando hay que representar muchos valores, un gráfico de líneas suele ser más fácil
de leer. Un buen uso práctico para este tipo de gráfico es cuando hay que comparar
los cambios en el tiempo de dos a cinco valores, como en un gráfico de la evolución
anual de Cifras de ventas y gastos.
Gráfico de barras: Un gráfico de barras presenta los datos agrupados dentro de
barras rectangulares cuya longitud es proporcional a los valores que representan. Las
barras se representan horizontalmente. Un buen uso práctico para este tipo de gráfico
es cuando se tienen datos comparativos que constan de diez categorías o más, o tienen
etiquetas de categoría largas, como un gráfico de Facturación por vendedor, que
incluye muchos vendedores y muestra el nombre completo de cada uno.

Gráfico de burbujas: Los gráficos de burbujas son muy similares a los gráficos de


dispersión con un atributo adicional. Al igual que en los gráficos de dispersión, dos
de los atributos indican la ubicación de las propias burbujas en los ejes X e Y. En los
gráficos de burbujas se agrega un tercer atributo que refleja el tamaño de la burbuja.
Un ejemplo de esto sería Gastos y beneficios, donde el tamaño de la burbuja indica el
porcentaje de ventas total.

Gráfico de columnas: Un gráfico de columnas es una representación gráfica de


datos. Los gráficos de columnas muestran barras verticales que se trazan a lo largo
del gráfico, con un eje de valores que se muestra en el lado izquierdo. Un buen uso
práctico para este tipo de gráfico es cuando se tienen datos comparativos que constan
de 10 categorías o menos, y tienen etiquetas de categoría cortas, como un gráfico
de Facturación por categorías de productos, que incluye pocas categorías y con
nombres relativamente cortos.

Gráfico combinado: Con un gráfico combinado se pueden combinar diversos tipos


de gráficos, incluidos gráficos de barras, de columnas, de líneas y de áreas. Si fuera
necesario, permite comparar valores de distintos ámbitos, como por ejemplo, valores
y porcentajes. Un buen uso práctico para este tipo de gráfico es cuando se necesita
comparar diferentes tipos de valores con patrones visuales ligeramente distintos,
como por ejemplo, un gráfico de Cifras de ventas, gastos y % de beneficios a lo largo
del tiempo.
Gráfico de líneas: Un gráfico de líneas es un tipo básico y común de gráfico que
muestra la información como una serie de puntos de datos denominados
“marcadores” conectados por segmentos de líneas rectas. Los gráficos de líneas a
menudo se utilizan para visualizar la tendencia de los datos durante intervalos de
tiempo, de modo que la línea a menudo se traza cronológicamente. Un buen uso
práctico para este tipo de gráfico es cuando es preciso comparar cuántos valores han
cambiado, como por ejemplo, Existencias y categorías de productos a lo largo del
tiempo.

Gráfico de dispersión: También llamado diagrama de dispersión, diagrama de


puntos o gráfico disperso, el gráfico de dispersión es un tipo de representación gráfica
o diagrama matemático que usa coordenadas de ejes cartesianos para mostrar valores
de dos variables para un conjunto de datos. Si los puntos se codifican por colores se
puede aumentar a tres el número de variables mostradas. Los datos se muestran como
una colección de puntos, cada uno con el valor de una variable que determina la
posición en el eje horizontal y el valor de la otra variable que determina la posición
en el eje vertical. Un buen uso práctico para este tipo de gráfico es cuando se desea
representar la frecuencia de apariciones o totales en dos dimensiones, como Ventas
por región y Categorías de productos.

Gráfico circular: Un gráfico circular (o gráfico de sectores) es un gráfico estadístico


circular dividido en sectores para ilustrar proporciones numéricas. En un gráfico
circular, la longitud del arco de cada sector y, en consecuencia, su ángulo central y
área, es proporcional a la cantidad que representa. Un gráfico circular solo puede
mostrar una serie de datos. Excel utiliza como título del gráfico el identificador de la
serie (p. ej., “Flores”) y muestra los valores para esa serie como trozos proporcionales
de una tarta. Un buen uso práctico para este tipo de gráfico es cuando se desea
representar la distribución de un valor en una dimensión, como Facturación por
vendedor.
Gráfico de columnas de anchura variable: También conocido como gráfico Mekko
o Marimekko, un gráfico de columnas de anchura variable es un gráfico de barras en
el que los anchos de las columnas se ajustan a escala, de modo que el ancho total
coincide con el ancho deseado del gráfico y no hay separaciones entre las columnas.
Un buen uso práctico para este tipo de gráfico es comparar cómo se desglosa un valor
en una dimensión como porcentajes.

Gráfico de áreas 3D: Los gráficos de áreas 3D muestran la tendencia de los valores a


lo largo del tiempo u otros datos categóricos, y utilizan tres ejes (horizontal, vertical y
profundidad) que se pueden modificar. Un buen uso práctico para este tipo de gráfico
es comparar cómo se desglosa un valor en una categoría y cómo es su tendencia a lo
largo del tiempo, como en Evolución de ventas por región.

Gráfico de áreas apiladas: Los gráficos de áreas apiladas muestran la tendencia de


la contribución de cada valor a lo largo del tiempo u otros datos categóricos. Es
recomendable que especifique como tal su gráfico apilado, de modo que sus usuarios
comprendan los valores representados. Un gráfico de áreas 3D apiladas se representa
del mismo modo, pero con una perspectiva 3D y sin utilizar un tercer eje. Un buen
uso práctico para este tipo de gráfico es mostrar cómo se suman varios componentes
para obtener el valor total a lo largo del tiempo. 

Gráfico de columnas apiladas: Los gráficos de columnas apiladas muestran la


relación de las partes con el todo entre categorías, en comparación con sus similares
de modo muy parecido a los gráficos de áreas apiladas. Este tipo de gráfico requiere
al menos dos categorías dimensionales: una para las columnas apiladas y otra para la
categoría de comparación. Un buen uso práctico para este tipo de gráfico es mostrar
cómo se suman varios componentes para obtener el valor total para una categoría
específica.
 Punto 19.- Heterogeneidad y paradoja de Simpson.

En probabilidad y estadística, la paradoja de Simpson o efecto Yule-Simpson es


una paradoja en la cual una tendencia que aparece en varios grupos de datos
desaparece cuando estos grupos se combinan y en su lugar aparece la tendencia
contraria para los datos agregados.

Se denomina paradoja de Simpson al cambio en el sentido de una asociación entre


dos variables (numéricas o cualitativas) cuando se controla el efecto de una tercera
variable. Un ejemplo que se presenta habitualmente para ilustrar esa situación es la
comparación de las tasas de mortalidad de dos hospitales, que pueden favorecer de
forma global al hospital A frente al B, y sin embargo al analizarlas por
procedimientos se descubre que cambia el signo de la diferencia, debido a que los
pacientes con peor pronóstico y patologías más graves son internados en el hospital B
con mayor frecuencia. Vamos a plantear un ejemplo concreto: en un estudio
comparativo sobre tolerancia de dos fármacos antihipertensivos se determina la
presencia o no de efectos secundarios leves y se obtiene los siguientes datos:

Donde vemos que el 21.9 % de pacientes tiene algún efecto adverso en el grupo A,
frente a 17.3 % en el grupo B, diferencia importante pero que no llega al nivel de
significación estadística habitualmente aceptado, ya que p = 0.07. Pero si se separa el
estudio en pacientes ancianos (> 75 años) y el resto (< 75 años) se obtienen los
siguientes datos: ahora la proporción de efectos adversos, en los pacientes de menos
de 75 años, es 6.2 % en el grupo A, frente a 13.3 % en el grupo B, diferencia que es
importante y además estadísticamente significativa, p = 0.027, y con signo contrario a
la observada en el estudio completo.

En el otro grupo de pacientes de más edad: Pacientes > 75 años


tenemos un 27.1 % pacientes con reacciones adversas en A, frente a 30.8 % en el
grupo B, p = 0.42 Vemos que al considerar la edad (según la clasificación escogida),
la relación cambia de signo: en el estudio global era superior la tasa de efectos
adversos en el grupo A, pero al estratificar por edad en ambos casos es menor en el
grupo A que en el B.

La interpretación de una paradoja de este tipo no siempre es fácil, sobre todo cuando
hay más de dos estratos; incluso es posible que en ocasiones no tenga interpretación,
y en cualquier caso ésta depende siempre de las características de cada estudio. En
este ejemplo está claro que, para ese punto de corte en la edad (75 años), los dos
grupos de tratamiento están muy desequilibrados: la proporción de ancianos es de
75.2 % en el grupo A, frente a 22.9 % en el grupo B, y la tasa de efectos adversos en
el grupo de pacientes con menos de 75 años es del 11.6 % frente al 28 % en los
pacientes ancianos. Puesto que los datos de este ejemplo son ficticios no tiene ningún
sentido buscar una explicación, pero en una situación real la interpretación está
condicionada a cómo se diseñó el estudio, si se trata de un ensayo aleatorio, es decir
si a los pacientes les fue asignado el tratamiento de forma aleatoria o si se trata de un
estudio observacional sin esa característica de diseño.
CONCLUSIÓN
Aunque no lo parezca, la estadística es una opción que está
presente permanentemente en nuestras vidas. Independientemente de la profesión que
hayamos decidido ejercer en la vida, debemos tener ciertas nociones sobre el área,
especialmente si se quiere ver fructificar algún negocio. Los números rigen nuestra
vida en una gran medida. No sólo para realizar las compras en el supermercado,
también tienen incidencia en la gran mayoría de nuestras actividades. Y ahí es donde
precisamente, entra la estadística.
Como seres pensantes que somos, buscamos siempre conseguir el porqué de las
cosas. Por esta razón, buscamos el objetivo del análisis estadístico en diversos
ámbitos.
Pese a que pueden utilizarse estudios numéricos para interpretar contextos en el
marco de la política, sociedad e incluso de la psicología, es en el tema económico y
financiero donde más se observa su aplicación, en nuestro caso, buscamos su
aplicación n la criminología y la política criminal.
REFERENCIAS BIBLIOGRAFICAS
 Diccionario enciclopédico de derecho usual –Dr. Guillermo
Cabanellas –Editorial Heliasta, S.R.L: -21era edición revisada,
actualizada y ampliada, 1989-Buenos Aires Argentina.
 Larousse diccionario enciclopédico en color 1.999-Agruoacion
Editorial, S.A. –Buenos Aires Argentina.
 www. Google académico.
 www. Google pdf.

También podría gustarte