Está en la página 1de 39

Estudio estadistico del consumo de sustancias psicoactivas en diferentes regiones de colombia y su relacin con las defunciones

Nicole Saracino, Juan David Alonso


Universidad Javeriana, Bogota colombia

1.

INTRODUCCIN

El ser humano diariamente se enfrenta a cuestionamientos sobre los fenmenos que lo rodean y las interacciones que ocurren en los procesos que el mismo ha desarrollado. Para comprenderlos, acumula informacin sobre sus caractersticas, la clasifica, y de ser posible, la convierte en datos cuantitativos para hacer anlisis precisos sobre las variables que intervienen en ellos. Mediante la investigacin, obtiene nuevos conocimientos y desarrolla herramientas que le dan solucin a problemas o interrogantes de carcter cientfico y social. Una de estas herramientas, es precisamente la inferencia estadstica, que como proceso cientfico; estudia los fenmenos aleatorios con base en los datos que ocurren en el mundo real, e intenta, apoyada en herramientas matemticas y probabilsticas, explicar las caractersticas del fenmeno, estimar de la mejor manera posible los resultados futuros del mismo, y medir los riesgos inherentes a las estimaciones y predicciones realizadas (ALVARADO Joge Andres). La investigacin sobre un determinado tema puede requerir una gran inversin en tiempo, dinero y recursos, que la inferencia estadstica ahorra, estableciendo conclusiones generales sobre una poblacin, a partir de datos especficos obtenidos de una muestra de la misma. Particularmente en la industria, principal tema de inters de la ingeniera industrial, la inferencia estadstica permite predecir en trminos cuantitativos la forma en que podran desarrollarse los procesos de produccin, y de esta manera hacer una mejor

planeacin y organizacin de los recursos. De igual manera brinda soporte para establecer parmetros de control y establecer estndares de calidad. Dicho esto, el presente trabajo busca evidenciar la utilidad de esta disciplina, dando aplicacin a los conceptos desarrollados durante el curso, en un problema prctico relacionado con un aspecto al que nos enfrentamos actualmente. Fundamentos tericos sobre estadstica descriptiva, distribuciones mustrales y estimacin, servirn de base para clculo de tamao de muestras, la

estimacin de parmetros mediante intervalos de confianza y la realizacin de pruebas de hiptesis, que permitirn analizar los datos recolectados, y a partir de estos extraer informacin concluyente sobre la poblacin de estudio. Se busca conocer el comportamiento del consumo de sustancias psicoactivas en Colombia, principalmente el tabaco, alcohol y cocana, comparando de que manera se ve afectada la mortalidad regional. Adicionalmente se determinara la existencia de relacin o no entre el consumo de estas sustancias y el sexo o la edad de los colombianos encuestados.

2.

MATERIALES Y METODOS

Para el desarrollo de esta investigacin se tuvo en cuenta una muestra estratificada ya que por medio de esta podemos dividir la poblacin de estudio en grupos o clases que se pueden suponer iguales con respecto a la caracterstica que vamos a evaluar, en este caso consumo de sustancias psicoactivas.

Nuestra muestra est constituida por una poblacin entre 12 y 65 aos de edad, de hogares de todos los estratos socioeconmicos residentes en ciudades capitales y municipios alrededor de todo el pas.

Se seleccionaron 39.000 hogares de los cuales se seleccion una persona entre la edad mencionada anteriormente, obteniendo al final una muestra efectiva 29.164 personas. Dicha muestra est distribuida alrededor de todo el pas, comenzando con las capitales como lo son, Bogot, Medelln y Cali, y

tambin

se

tuvieron

en

cuenta

los

departamentos

ms

poblados.

2.1

TABLAS DE MUESTREO

Como lo mencionamos anteriormente la muestra total es de 29.164 personas, que a nivel de poblacin se distribuye en 38% hombres y 62% mujeres, como se observa en la tabla 1.

Tabla 1. Distribucin de la muestra segn sexo. SEXO HOMBRE MUJER TOTAL CANTIDAD 11209 17955 29164 % 38% 62% 100%

Por otro lado contamos por la clasificacin de estos datos dependiendo las edades de los evaluados. Existen 5 intervalos donde se cubren las edades entre 12 a 65 aos. Dichos datos los podemos ver en la tabla 2 .

Tabla 2. Distribucin de la muestra segn rangos de edad. INTERVALO DE EDAD 12-17anos 18-24anos 25-34anos 35-44anos 44-65anos TOTAL CANTIDAD 4281 4881 6351 5466 8185 29164 % 15% 17% 22% 19% 28% 100%

Finalmente se presenta la distribucin geogrfica de la muestra en las 27 regiones seleccionadas como se ve en la tabla 3.

Tabla 3. Distribucin de la muestra segn regin nacional. DEPARTAMENTO Bogot D.C Antioquia Orinoquia y Amazonia San Andrs y Providencia Atlntico Bolvar Boyac Caldas Cauca Cesar Crdoba Cundinamarca Choc Huila La Guajira Magdalena Meta Nario Norte de Santander Quindo Risaralda Santander Sucre Tolima Valle del Cauca TOTAL TAMANO DE LA MUESTRA 4281 3227 936 531 1528 1052 777 1094 525 740 816 1198 646 930 590 910 736 721 1035 720 895 1322 571 1077 2306 29164

2.2

GRAFICOS

Los grficos permiten una mejor interpretacin de los datos, proporcionan una idea generalizada de los resultados lo cual facilita el anlisis y la comparacin de muestras tomadas. Se utilizaran dos tipos de grficos, los cuales hemos considerado exponen de manera mas acertada el comportamiento de los datos y lo que se desea analizar. Cajas y bigotes: Son una presentacin visual que describe varias

caractersticas importantes al mismo tiempo tales como la dispersin y simetra. Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos, sobre un rectngulo alineado horizontal o verticalmente (Diagrama de cajas y bigotes) Pareto: Muestra la importancia relativa de los problemas de forma simple, rpida para interpretas y en un formato visual. Ayuda a enfocar las causas que tendrn el mayor impacto si no son resueltas. Se utiliza cuando se desea buscar las causas principales de los problemas y establecer prioridad de las soluciones (Diagrama de Pareto) Por medio de estos grficos se pretende analizar el comportamiento de la distribucin de cada psicoactivo con relacin a la regin, y as entender y determinar factores influyentes en esta tendencia.

2.3

CALCULO DE ESTIMADORES

Un estimador es un estadstico usado para estimar un parmetro desconocido de la poblacin. Para cada parmetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia, convergencia y consistencia. Para cada clase de sustancia psicoactiva escogida decidimos calcular los siguientes estimadores:

Media muestral: es el promedio de un conjunto de valores, o su distribucin.

Varianza muestral: se puede definir como el casi promedio de los cuadrados de las desviaciones de los datos con respecto a la media muestral. Su formula matemtica para el caso de datos referentes a una muestra es (varianza muestral): ( )

Desviacin estndar: Al tomar el cuadrado de las desviaciones con respecto a la media para el calculo de la varianza, las unidades en que estn dados los datos tambin se expresaran en unidades al cuadrado. Esto puede no tener sentido. Por otra parte, al tomar el cuadrado, la diferencia real entre el dato particular y la media se magnifica. Estas circunstancias condujeron a que se le hiciera una modificacin a la anterior medida y se lleg de esta manera al concepto de desviacin estndar, la cual se define como la raz cuadrada de la varianza, esto es (Desviacin):

Realizaremos la determinacion de cada estimador par cada una de las sustancias asociadas por region de colombia, lo cual nos permitira hacer un analisis de la variabilidad de los datos y posterior desarrollo de los calculos que complementan la investigacion.

2.4

CALCULO DE INTERVALOS DE CONFIANZA

Un intervalo estimador es lo que su propio nombre indica, un intervalo aleatorio, cuyos puntos extremos L 1 y L 2 son estadsticos. Esto se utiliza para determinar un intervalo numrico a partir de la muestra. Se espera que este contenga el parmetro de la poblacin que est siendo estimado. Si se ampla el intervalo, se gana error, se pierde confianza. Un intervalo de confianza de

del 95% es tal que:

. Decir que un intervalo es un

intervalo de confianza del 95% de significa que, cuando se utiliza un muestreo repetido de la poblacin, el 95% de los intervalos resultantes deber contener a ; debido al azar, el 5% no incluir la verdadera media poblacional. El grado de confianza deseado es controlado por el investigador (Estimacin). En general el calculo para el intervalo de confianza de cualquier parmetro se puede obtener a partir de: ( ( ) ( ( )) ( ) ( ( ))

Mediante es uso de los intervalos de confianza pretendemos tener una idea del comportamiento del parmetro, pues el estimador, como su nombre lo indica procura describir como podra ser el parmetro, pero aun as no es exactamente igual. Vale la pena aclarar que estos intervalos no calculan probabilidades, nos dan percepcin de entre que valores se podra encontrar el parmetro de la poblacin.

2.5

PRUEBA DE HIPOTESIS

consta de hacer una afirmacin acerca del valor que el parmetro de la poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada en alguna creencia o experiencia pasada que ser contrastada con la evidencia que nosotros obtengamos a travs de la informacin contenida en la muestra. Esto es a lo que llamamos Prueba de hiptesis.

Una prueba de hiptesis comprende cuatro componentes principales: La hiptesis nula: denotada como H0 siempre especifica un solo valor del parmetro de la poblacin si la hiptesis es simple o un conjunto de valore si es compuesta. La hiptesis alternativa: denotada como H1 es la que responde nuestra pregunta, la que se establece con base a la evidencia que tenemos.

Como las conclusiones a las que lleguemos se basan en una muestra, hay posibilidades de que nos equivoquemos. Dos decisiones correctas son posibles: Rechazar H0 cuando es falsa No rechazar H0 cuando es verdadera Dos decisiones incorrectas: Rechazar H0 cuando es verdadera No rechazar H0 cuando es falsa

Tamao de los errores al tomar una decisin incorrecta

La probabilidad de cometer error tipo I se conoce como nivel de significancia, se denota como hiptesis). Plantearemos diferentes pruebas de hiptesis para los estimadores con el fin de asegurar el comportamiento de los parmetros con respecto a lo calculado. y es el tamao de la regin de rechazo (Pruebas de

2.6

PRUEBA DE BONDAD Y AJUSTE

La prueba compara la distribucin de frecuencias observada de una variable usualmente cualitativa, pero tambin puede ser cuantitativa, con la distribucin de frecuencias de la misma variable medida en un grupo de referencia. El propsito de la prueba es averiguar si existen diferencias estadsticamente significativas entre la distribucin observada y la distribucin esperada (Prueba de bondad y ajuste). Es decir, sirve para saber si cierto conjunto de datos sigue una distribucin especifica, y analizar a que clase de distribucin se asemeja el histograma. Verificaremos si la distribucin de los datos tomados es normal haciendo uso de esta prueba, pues para efectuar varios clculos suponemos normalidad.

2.7

TABLA DE CONTINGENCIA

Se emplea para registrar y analizar la relacin entre dos o mas variables, habitualmente de naturaleza cualitativa, y as determinar si son dependientes o independientes. En esta investigacin deseamos saber si el consumo de sustancias psicoactivas se ve relacionado con la edad y el sexo de las personas de la muestra.

2.8

REGRESION LINEAL SIMPLE

Es una tcnica estadstica para estudiar la relacin entre variables, as como predecir su comportamiento. Tiene como objeto estudiar como los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir su representacin grafica es una lnea recta (Regresin lineal). Esta recta posee una formula muy simple:

El coeficiente en

es la pendiente de la recta: el cambio medio que se produce . El coeficiente es el

por cada unidad de cambio que se produce en

punto en el que la recta corta el eje vertical (Anlisis de regresin lineal). En este caso deseamos estudiar la relacin de las sustancias psicoactivas con las muertes que se presentan en cada una de las regiones asociadas, y por consiguiente poder realizar una prediccin.

2.9

REGRESION LINEAL MULTIPLE

Este procedimiento permite utilizar mas de una variable independiente. La diferencia con la regresin lineal simple es que la ecuacin de regresin ya no define una recta en el plano, sino un hiperplano en un espacio multidimensional. La ecuacin del modelo de regresin es:

De acuerdo con este modelo o ecuacin, la variable dependiente (Y) se interpreta como una combinacin lineal de un conjunto de n variables independientes (Xi), cada una de las cuales va acompaada de un coeficiente ( ) que indica el peso relativo de esa variable en la ecuacin. La ecuacin

incluye adems una constante ( ) y un componente aleatorio (los residuos: ) que recoge todo lo que las variables independientes no son capaces de explicar (Anlisis de regresin lineal mltiple). Por medio de este procedimiento, al igual que con el anterior, se estudiara la relacin de las sustancias presentadas con las muertes presentadas en las regiones de Colombia tomadas.

3.

RESULTADOS

A partir de la muestra general tomada de cierta cantidad de personas correspondientes a determinadas regiones del pas, se encuestaron con el fin de adquirir datos correspondientes a el consumo de tabaco, alcohol y cocana. Estos datos fueron clasificados segn el genero, las edades y el dominio

departamental. A cada uno de ellos se aplicaran los mtodos mencionados anteriormente para llevar a cabo el objeto de la investigacin.

3.1

ENCUESTAS

Tabaco: El tabaquismo en el mundo es, hoy por hoy, el origen de ms de cinco enfermedades mortales que han generado gran impacto en los sistemas de salud de los pases, por los altos costos asociados a los tratamientos; adems, ser la causa en el 2025 de la muerte de 10 millones de personas en el planeta. (Portafolio 2013) En primer lugar podemos ver como el 42,6% de las personas encuestadas afirmaron haber consumido tabaco, siendo significativamente mayor el consumo de tabaco en hombres con un 56,25% en comparacin con las mujeres que solo representan un 34,15% en el consumo de este tipo de sustancia. Los porcentajes y cantidades de personas segn sexo que consumen tabaco estn mostrados en la tabla nmero 4. Es necesario aclarar que al ser las muestras diferentes la suma de los porcentajes no va a ser 100%, recordemos que el nmero de hombres encuestados es diferente al de mujeres y los porcentajes mostrados a continuacin son obtenidos teniendo en cuenta cada uno de esos nmeros mencionados anteriormente. Tabla 4. Consumo de tabaco segn sexo SEXO HOMBRE MUJER TOTAL CANTIDAD 6305 6132 12437 % 56,25% 34,15% 42,6%

En la Tabla 5 se presentan los resultados para los diferentes grupos de edad definidos.

Entre los jvenes de 12 a 17 aos de edad, el consumo actual de cigarrillo es significativamente inferior al consumo de cualquiera de los otros grupos de edad, y entre estos las diferencias son muy pequeas.

Tabla 5. Consumo de tabaco segn grupo de edades en anos. INTERVALO DE EDAD 12-17anos 18-24anos 25-34anos 35-44anos 44-65anos TOTAL CANTIDAD 254 1018 1219 1000 1532 5023 % 5,93% 20,85% 19,19% 18,30% 18,72% 17,22%

Al considerar los departamentos, se observa que varios tienen un consumo de cigarrillo Similar al de Bogot, con prevalencias superiores a 20%: Caldas, Cundinamarca, Nario y Quindo. De otra parte, hay varios departamentos con tasas inferiores a 10%: Atlntico, Crdoba, Choc, Huila, Guajira, Magdalena y Sucre.

Tabla 6. Consumo de tabaco por dominio departamental.

CONSUMO DE TABACO DEPARTAMENTO # DE PERSONAS Bogot D.C 971 Antioquia 1015 Orinoquia y Amazonia 129 San Andrs y Providencia 71 Atlntico 130 Bolvar 112 Boyac 137 Caldas 251 Cauca 82 Cesar 77 Crdoba 71 Cundinamarca 271

% 22,68% 31,46% 13,78% 13,38% 8,53% 10,63% 17,59% 22,90% 15,71% 10,46% 8,71% 22,60%

Choc Huila La Guajira Magdalena Meta Nario Norte de Santander Quindo Risaralda Santander Sucre Tolima Valle del Cauca TOTAL CONSUMO DE TABACO

63 84 56 73 125 165 130 162 143 135 46 204 649 5353

9,79% 9,06% 9,54% 7,98% 16,97% 22,92% 12,60% 22,56% 15,97% 10,18% 7,97% 18,98% 28,14% 18,355%

Sumatoria de x umatoria -

5353 1660278

En esta tabla podemos observar una tercera columna la cual representa el porcentaje de personas que consumen tabaco dado el nmero de personas encuestado en cada regin. Esto quiero decir que el 22,68% de los bogotanos encuestados fuma.

Alcohol Aunque el consumo de alcohol en Colombia no supera el de Europa o pases como Canad y Estados Unidos, en Sudamrica es una de las naciones donde ms se ingieren estas bebidas: 6,3 litros de alcohol anuales por persona. De hecho, en la regin slo es superada por Venezuela, donde el consumo per cpita es 8,9 litros al ao, y Brasil, donde es de 6,9 litros. (Numa 2012) En esta seccin se presentan los resultados sobre consumo de alcohol. La Tabla 7 muestra los indicadores de consumo. 85,4% de las personas de la muestra declaran haber consumido alcohol al menos alguna vez en la vida, siendo mayor el consumo entre los hombres que entre las mujeres, 90% y 82% respectivamente. Cabe aclarar que los porcentajes tanto de hombres como mujeres es hallado teniendo en cuenta el nmero de hombres y de mujeres

que se encuestaron. En este caso 90,26% de 11209 de los encuestados equivale a 10117 hombres el cual es el nmero mostrado en la tabla. Tabla 7. Consumo de alcohol segn genero SEXO HOMBRE MUJER TOTAL CANTIDAD 10117 14795 24912 % 90,26% 82,40% 85,4%

Por otro lado contamos con los datos referentes al consumo de alcohol dependiendo el rango de edades con el que hemos venido trabajando. Como lo vemos en la tabla numero 8 podemos ver como el consumo de esta sustancia es significativamente ms alta en el rango de 18-24 aos y 25-34 aos, lo que quiere decir que en los periodos de estudio universitario y comienzos del trabajo los ciudadanos alrededor del pas tienen a consumir una mayor cantidad de alcohol. Igualmente es necesario que se entienda que cada uno de los porcentajes que aparecen en la tabla son dados teniendo en cuenta en nmero de personas que hay en cada uno de los rangos propuestos.

Tabla 8. Consumo de alcohol por rango de edades. INTERVALO DE EDAD 12-17anos 18-24anos 25-34anos 35-44anos 44-65anos TOTAL CANTIDAD 837 2257 2716 2029 2228 10068 % 19,55% 46,25% 42,77% 37,12% 27,22% 34,52%

Finalmente en la tabla numero 9 mostramos el consumo de alcohol tenido en cuenta la regin del pas, e igualmente como en el caso anterior se muestra en la tercera columna el porcentaje de personas que hacen uso de esta sustancia, basado en el nmero de personas encuestadas por regin. Tabla 9. Nmero de personas que consumen alcohol dominio departamental.

CONSUMO DE ALCOHOL DEPARTAMENTO # DE PERSONAS Bogot 1618 Antioquia 2403 Orinoquia y Amazonia 349 San Andrs y providencia 231 Atlntico 462 Bolvar 343 Boyac 364 Caldas 424 Cauca 150 Cesar 194 Crdoba 252 Cundinamarca 499 Choco 180 Huila 240 La Guajira 150 Magdalena 306 Meta 253 Nario 186 Norte de Santander 324 Quindo 212 Risaralda 310 Santander 440 Sucre 146 Tolima 340 Valle del cauca 1361 TOTAL CONSUMO ALCOHOL 11734

% 37,79% 74,47% 37,27% 43,48% 30,24% 32,61% 46,79% 38,77% 28,48% 26,20% 30,88% 41,63% 27,83% 25,80% 25,46% 33,61% 34,35% 25,81% 31,27% 29,38% 34,60% 33,30% 25,57% 31,55% 59,03% 40,24%

Sumatoria de x Cocana

11734 6013008,652

El consumo de drogas ha aumentado en Colombia especialmente entre los universitarios, advirti el coordinador residente de la ONU en el pas, Fabrizio Hochschild, al instalar un foro ciudadano sobre las drogas ilcitas en el marco de los dilogos de paz del Gobierno con las Farc. (Radio, 2013)

Finalmente observaremos los resultados obtenidos con respecto al consumo de cocana. Se observa que 2.2% de las personas encuestadas reportaron haber consumido cocana, con un consumo cuatro veces ms alto entre los hombres que entre las mujeres. Tabla 10. Al igual que en el anlisis de consumo de tabaco y alcohol es necesario aclarar que los porcentajes de hombres y mujeres son tomados teniendo en cuenta el nmero tanto de hombres como de mujeres que se encuestaron.

Tabla 10. Consumo de cocana segn gnero. SEXO HOMBRE MUJER TOTAL CANTIDAD 466 180 646 % 4,16% 1,00% 2,2%

En trminos de la edad, tal como lo muestra la siguiente tabla, la prevalencia del ltimo ao ms alta se encuentra en el grupo de 25 a 34 aos, con 1.36%, seguida del grupo de 18 a 24 aos, con 1.2%. Tabla 10. Consumo de cocana por rango de edades INTERVALO DE EDAD 12-17anos 18-24anos 25-34anos 35-44anos 44-65anos TOTAL CANTIDAD 33 59 86 19 4 201 % 0,78% 1,20% 1,36% 0,34% 0,05% 0,69%

En la Tabla 11 se muestra el uso de cocana, en funcin de los dominios departamentales. Se observan diferencias notorias entre el consumo, que van desde 0% a 0.3% en Risaralda, Choc, Norte de Santander, Huila y Magdalena, hasta cerca de 2.1% en Medelln, y mayores a 1% en San Andrs y Providencia, Quindo y Sucre.

Tabla 11. Consumo de cocana por dominio departamental.

CONSUMO DE COCAINA DEPARTAMENTO # DE PERSONAS Bogot D.C 27 Antioquia 83 Orinoquia y Amazonia 4 San Andrs y Providencia 7 Atlntico 14 Bolvar 4 Boyac 2 Caldas 9 Cauca 4 Cesar 1 Crdoba 4 Cundinamarca 3 Choc 0 Huila 1 La Guajira 2 Magdalena 1 Meta 2 Nario 3 Norte de Santander 0 Quindo 9 Risaralda 0 Santander 6 Sucre 6 Tolima 6 Valle del Cauca 20 TOTAL CONSUMO DE COCAINA 219

% 0,63% 2,58% 0,46% 1,28% 0,89% 0,42% 0,22% 0,79% 0,80% 0,17% 0,55% 0,25% 0,05% 0,06% 0,27% 0,08% 0,27% 0,37% 0,03% 1,26% 0,00% 0,48% 1,11% 0,60% 0,86% 0,75%

Sumatoria de x -

219 6628,004

3.2

GRAFICOS Y DIAGRAMAS

Tabaco

1200

1000

800

600

400

200

0 # DE PERSONAS

Del anterior diagrama se puede interpretar que la distribucin de los datos es considerablemente asimtrica por la parte superior, ya que la longitud de los bigotes es mucho mayor a la inferior. Con respecto a la composicin de la caja, se puede observar que la fraccin verde es un poco ms grande que la morada, lo cual indica que el nmero de personas comprendidas entre el 25% y el 50% son ms dispersas que las comprendidas entre el 50% y el 75%. Es importante destacar la gran longitud del bigote superior, lo cual nos indica que hay gran cantidad de valores atpicos, estos son aquellos valores que se encuentran por encima de un lmite calculado de la siguiente manera:

De lo cual se obtuvo:

Concluyendo que existen valores extremadamente atpicos, lo cual lo hace sesgada la distribucin.
100% 90% 80% 70% 60% 50% 40% 30% 1000 0 20% 10% 0% # DE PERSONAS % Acum

5000 4000 3000 2000

Se puede observar que el consumo de tabaco se concentra en la regin de Antioquia, Bogot y Valle del Cauca principalmente. Por lo cual se puede determinar que debe haber una mayor accin con respecto a la conciencia del dao que el uso de este psicoactivo puede causar en la salud de los habitantes de estas regiones. Dado que ya comenzamos a trabajar con los datos que queremos interpretar y comparar es necesario que estimemos de manera exacta los parmetros que describen esta muestra, como lo son el promedio, la varianza y la desviacin estndar muestral.

Alcohol

3000

2500

2000

1500

1000

500

0 # DE PERSONAS

En este caso la distribucin de los datos se comporta similar a la anterior, pero existe menos dispersin entre los datos compuestos en la caja. Pero aun as lo hace extremadamente asimtrica en la parte superior, debido a la longitud del bigote. Habiendo valores extremadamente atpicos:

Aunque el valor mximo en este caso es 2403, hay gran concentracin de los datos en valores considerablemente ms pequeos, lo cual lo hace muy atpico.

100% 10000 8000 6000 4000 2000 0 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% # DE PERSONAS % Acum

Al igual que con el tabaco y, las regiones que presentan mayor consumo de alcohol son Antioquia, Bogot y Valle del Cauca. Por lo tanto se reafirma el hecho de que debe haber un mayor esfuerzo de concientizacin de las consecuencias de sustancias psicoactivas en estas zonas.

Cocana

90 80 70 60 50 40 30 20 10 0 # DE PERSONAS

Al igual que en la grfica anterior se puede observar que existe gran asimetra de las distribucin, pero por el contrario, la fraccin morada de la composicin de la caja es un poco ms grande que la verde indicando que hay ms dispersin en el nmero de personas comprendidas entre el 50% y el 75%. Con respecto a los bigotes, el superior es mucho ms grande que el inferior, sealando la existencia de varios valores atpicos:

Siendo el valor mximo 83, por lo cual hay valores extremadamente atpicos y haciendo la distribucin sesgada.

100% 200 90% 80% 150 70% 60% 100 50% 40% 30% 50 20% 10% 0 0% # DE PERSONAS % Acum

como se puede observar la mayor parte del consumo de cocana se concentra en las mismas zonas anteriores, es por esto que se puede realizar una priorizacin de actividades en contra de este consumo. Al igual se puede relacionar esta causa a la densidad poblacional de estas reas con respecto a las otras tomadas en el estudio.

3.3

CALCULO Y ANALISIS DE LOS ESTIMADORES

Tabaco

Clculo y anlisis de la media muestral.

El promedio de personas que consumen tabaco en las 25 regiones seleccionadas es de 215 personas aproximadamente.

Clculo y anlisis de la varianza muestral

De acuerdo a lo anterior, es posible decir que el promedio de personas que fuman en 25 regiones del pas es de 214 personas con una varianza ajustada de 69178 personas2. Clculo y anlisis de la desviacin estndar de la muestra

El promedio muestral fue de 215 personas con una variabilidad de 263 personas de acuerdo con los clculos realizados.

Alcohol: Clculo y anlisis de la media muestral.

El promedio de personas que consumen alcohol en las 25 regiones seleccionadas es de 470 personas aproximadamente.

Clculo y anlisis de la varianza muestral

De acuerdo a lo anterior, es posible decir que el promedio de personas que beben alcohol en 25 regiones del pas es de 470 personas con una varianza ajustada de 250542 personas2.

Clculo y anlisis de la desviacin estndar de la muestra

El promedio muestral fue de 470 personas con una variabilidad de 500 personas de acuerdo con los clculos realizados. Cocana:

Clculo y anlisis de la media muestral.

El promedio de personas que consumen cocana en las 25 regiones seleccionadas es de 9 personas aproximadamente.

Clculo y anlisis de la varianza muestral

De acuerdo a lo anterior, es posible decir que el promedio de personas que consumen cocana en 25 regiones del pas es de 9 personas con una varianza ajustada de 278 personas2.

Clculo y anlisis de la desviacin estndar de la muestra

El promedio muestral fue de 9 personas con una variabilidad de 17 personas de acuerdo con los clculos realizados.

3.4

CALCULO DE INTERVALOS DE CONFIANZA

Para la estimacin de las personas que consumen sustancias psicoactivas haremos intervalos de confianza con el fin de entender el comportamiento de los parmetros poblacionales. Tabaco

Intervalo de confianza para la media poblacional de consumo de tabaco. ( (


( )

) )

( (

) )

Intervalo de confianza para la varianza poblacional de consumo de tabaco ( ( ( ( ( ( ) ) ( ) )

) )

Alcohol

Intervalo de confianza para la media poblacional del consumo de alcohol. ( (


( )

) )

) )

Intervalo de confianza para la varianza poblacional de consumo de alcohol ( ( ( ( ( ( ) ) ( ) )

) )

Cocana

Intervalo de confianza para la media poblacional del consumo de cocana. ( (


( )

) )

) )

Intervalo de confianza para la varianza poblacional de consumo de cocaina ( ( ( ( ( ( ) ) ( ) )

( )

Al elaborar los intervalos para la media, mostrados anteriormente observamos que los tres dan lmites demasiado distantes, lo cual significa que la muestra no es suficientemente grande para estimar un valor real. Al ver el tamao de la muestra en comparacin a toda la poblacin colombiana es evidente que esta no es ni siquiera la cincuentava parte del total. Esto tambin se debe a la variabilidad que existe entre los datos lo cual tambin va relacionado con el tamao de la muestra y es causante de la gran diferencia entre los lmites del intervalo. Por otro lado calculamos los intervalos de confianza pertinentes para las varianzas de cada uno de los datos tomados con el fin de conocer la dispersin de los datos en el momento de hablar de la poblacin colombiana en total y reafirmando la gran diferencia que hay entre los intervalos de la media.

3.5

PRUEBAS DE HIPOTESIS

A partir del intervalo de confianza realizado para el parametro de la media poblacional, platearemos la hipotesis de que el valor de la media poblacional sera igual al extremo superior del intervalo, o alternativamente, que sea menor a este para corroborar con lo propuesto por el intervalo. Tomando un nivel de significancia del 5%. Tabaco

obteniendo como estadstico de prueba:

y como estadstico critico:

como el estadstico de prueba es menor al estadstico critico, se rechaza la hiptesis nula, es decir se asume que la media poblacional es menor a 324, lo cual coincide con el intervalo de confianza.

Alcohol

obteniendo como estadstico de prueba

y como estadstico critico

como el estadstico de prueba es menor al estadstico critico, se acepta la hiptesis nula, es decir se asume que la media poblacional es igual a 690, lo cual coincide con el intervalo de confianza.

Cocana

obteniendo como estadstico de prueba

y como estadstico critico

como el estadstico de prueba es menor al estadstico critico, se acepta la hiptesis nula, es decir se asume que la media poblacional es igual a 16, lo cual coincide con el intervalo de confianza.

Para el anlisis de la varianza se har una prueba de hiptesis mediante la cual se verificara el comportamiento del parmetro poblacional tomando como referencia el extremo superior del intervalo de confianza.

Tabaco

obteniendo como estadstico de prueba

y como estadstico critico

como el estadstico de prueba es menor al estadstico critico, se acepta la hiptesis nula, rechazando la suposicin de que pueda ser mayor. Esto corrobora el intervalo de confianza

Alcohol

obteniendo como estadstico de prueba

y como estadstico critico

como el estadstico de prueba es mayor al estadstico critico, se dice que hay suficiente evidencia para rechazar la hiptesis nula, por lo tanto en este caso la varianza poblacional se comporta diferente a como lo propone el intervalo de confianza. Esto lo podemos asociar a la variabilidad que presentan lo datos de la muestra, ya que la densidad poblacional en las regiones de Colombia es muy cambiante.

Cocana

obteniendo como estadstico de prueba

y como estadstico critico

como el estadstico de prueba es menor al estadstico critico, se acepta la hiptesis nula, rechazando la suposicin de que pueda ser mayor. Esto corrobora el intervalo de confianza.

3.6

PRUEBA DE BONDAD Y AJUSTE

Tabaco

Como se dijo anteriormente determinaremos si el conjunto de datos del consumo de sustancias psicoactivas se distribuye de cierta manera. Para este caso determinaremos si se distribuye normalmente. Por medio del anlisis de bondad y ajuste concluimos que los datos no se distribuyen normal. Para lograr esta conclusin fue necesario hacer intervalos y calcular la amplitud para cada uno de ellos.

INTERVALOS x<46 46<x<239,8 239,8<x<433,6 433,6<x<627,4 821,2<x

Oi 0 20 2 0 3

Ei ((Oi-Ei)^2)/Ei 6,608 6,61 6,78 25,78 6,59 3,20 3,55 3,55 0,27 27,60 66,74

Cabe aclarar que son 5 intervalos dado que por medio del calculo de aseguramos que son este nmero de intervalos. El Oi representa la cantidad de datos que hay en cada intervalo y por otro lado el Ei representa la probabilidad de los intervalos multiplicados por el tamao de la muestra el cual es 25 para nuestro caso. Finalmente la sumatoria de ((Oi-Ei)^2)/Ei es el valor de prueba que utilizaremos para determinar si el conjunto de datos se distribuye normalmente. Despus de comparar el valor de prueba con el valor critico obtenido por medio de las tablas de chi-cuadrado podemos ver claramente que la hiptesis nula, la cual corresponde a que los datos se distribuyen normal, es rechazada. Alcohol y Cocana

INTERVALOS Oi X<146 146<X<597,4 597,4<X<1048,8 1048,8<x<1500,2 X>1500,2

Ei 0 22 0 1 2 6,85 7,91 6,72 2,83 0,07

((0iEi)^2)/Ei 6,85 25,0983692 6,72 1,18335689 53,2128571 93,0645832

Para el caso de alcohol y cocana se prosigui a elaborar el mismo procedimiento que el de tabaco para al final concluir lo mismo que en la primera prueba, que el grupo de datos no se distribuye de manera normal. Esto se puede concluir para cocana directamente ya que estamos tratando con las mismas regiones y con la mismo tipo de muestreo.

3.7

TABLAS DE CONTINGENCIA

Por medio de las tablas de contingencia evaluaremos si las variables son dependientes o independientes. Para esto tendremos en cuenta es sexo y los intervalos de edades. Primero evaluaremos si el consumo de tabaco tiene relacin con el sexo y con la edad. A B CONTINGENCIA TABACO SI NO TOTAL C HOMBRE 6305 4904 11209 D MUJER 6132 11823 17955 TOTAL 12437 16727 29164 Al tener la tabla de contingencia podemos hallar los valores de Oi y de Ei para posteriormente calcular el punto de prueba y por medio de las tablas determinar el punto crtico.

Oi AUC AUD BUC BUD 6305 6132 4904 11823

Ei 4780,08274 7656,91726 6428,91726 10298,0827

((Oi-Ei)^2)/Ei 486,471214 303,6956746 361,7051765 225,8063672 1377,678432

El punto de prueba es 1377,678432 mientras que el crtico 3,841 lo cual quiere decir que las variables son dependientes y tienen relacin entre s. Ahora evaluaremos la relacin de consumo que hay entre las edades y el consumo de tabaco.

C D E F G

INTERVALO DE EDAD 12-17anos 18-24anos 25-34anos 35-44anos 44-65anos TOTAL

A SI 254 1018 1219 1000 1532 5023

B NO 4027 3863 5132 4466 6653 24141

TOTAL 4281 4881 6351 5466 8185 29164

Oi AUC AUD AUE AUF AUG BUC BUD BUE BUF BUG 254 1018 1219 1000 1532 4027 3863 5132 4466 6653

Ei 737,329002 840,668735 1093,85108 941,424976 1409,7262 3543,671 4040,33126 5257,14892 4524,57502 6775,2738

((Oi-Ei)^2)/Ei 316,8286114 37,40638383 14,31844931 3,644510741 10,60552132 65,92229465 7,783118595 2,979229149 0,758310652 2,20668297 462,4531126

En este caso sucede lo mismo que con el sexo lo nico que cambia es que el crtico es, 16.919, pero aun as la conclusin es la misma. Que el consumo de tabaco depende directamente de la edad. Al realizar las otras tablas de contingencia se llega al mismo resultado. El consumo de coca y de alcohol depende tanto del gnero como de la edad, siendo los hombres los que ms consumen.

3.8

REGRESION MULTIPLE

Para el desarrollo de la regresin tendremos en cuenta las defunciones por dominio departamental, y analizaremos si dichas muertes se explican con el nmero de personas que consumen o no sustancias psicoactivas.

Departamento Bogota Antioquia Orinoquia y Amazonia San andres y providencia Atlantico Bolivar Boyaca Caldas Cauca Cesar Cordoba Cundinamarca Choco Huila La Guajira Magdalena Meta Nario Norte de Santander Quindio Risaralda Santander Sucre Tolima Valle del cauca TOTAL Xbarra VARIANZA DESVIACION

Defunciones 27698 29118 3282 210 8958 6086 6583 5904 5266 3674 4678 10616 1342 4752 1648 4307 3908 5966 6439 3200 5412 9556 2577 7412 23312 191904 7676,1600 58246135 7631,915551

Estadsticas de la regresin Coeficiente de correlacin mltiple 0,978806923 Coeficiente de determinacin R^2 0,958062992 R^2 ajustado 0,952071991 Error tpico 1670,814562 Observaciones 25 ANLISIS DE VARIANZA Promedio Grados de Suma de de los libertad cuadrados cuadrados 3 1339283192 446427731 21 58624047,3 2791621,3 24 1397907239 Valor crtico F de F 159,91701 1,279E-14

Regresin Residuos Total

Intercepcin Variable X 1 Variable X 2 Variable X 3

Coeficientes 481,1420234 -178,9216237 14,36285838 9,399008714

Error tpico 547,897701 57,8337214 3,99358525 5,98530844

Estadstico t 0,87816032 -3,0937249 3,59648222 1,57034659

Probabilidad 0,38979377 0,00550197 0,00169764 0,13128054

Inferior Superior Inferior Superior 95% 95% 95,0% 95,0% -658,27362 1620,55767 -658,27362 1620,55767 -299,19343 -58,649816 -299,19343 -58,649816 6,05774319 22,6679736 6,05774319 22,6679736 -3,0481216 21,846139 -3,0481216 21,846139

Por medio de la regresin elaborada con la herramienta de Excel podemos observar que el ajustado cuenta con un porcentaje lo suficientemente alto

para considerar que el modelo de regresin explica satisfactoriamente los datos relacionados. Este es el porcentaje de la variabilidad de la variable dependiente que es explicado por el modelo de regresin, tomando como ecuacin:

4.

CONCLUSIONES Al ser una muestra estratificada con tanta variabilidad en los datos se puede contemplar que los resultados en las pruebas realizadas no son siempre homogneos, ya que se tomaron muestras diferentes para cada una de las regiones, generando una posible interpretacin y anlisis contraria para cada una. Una forma de dar solucin a lo anterior es aumentando nuestro N para de esta manera disminuir nuestro S (desviacin estndar) y conseguir datos con menor variabilidad. Esto no se realizo durante el desarrollo del trabajo ya que se estara tratando una poblacin tan grande como lo es el numero de habitantes en Colombia y el porcentaje de los que consumen sustancias psicoactivas, haciendo que la estimacin requiera de un estudio mas profundo y elaborado. Por medio de la prueba de bondad y ajuste pudimos determinar que estos datos no se distribuyen de manera normal pero puede ser debido a la misma razn que tratamos anteriormente, por el tamao de la muestra y por la dispersin de los datos. Los datos estn concentrados en las capitales, mientras que en las otras regiones hay muy pocos datos lo cual hace que haya presencia de muchos datos extremos y por ende se presente la variabilidad que hemos venido tratando anteriormente. El consumo de sustancias psicoactivas esta ligado tanto a la edad como al genero, como se pudo observar en la prueba.

Finalmente podemos concluir que existe un relacin muy directa entre el hecho de que el consumo de sustancias psicoactivas sea un causante de muerte en las regiones estudiadas de Colombia.

REFERENCIAS Diagrama de cajas y bigotes, http://www.estadisticaparatodos.es/taller/graficas/cajas.html, 2008. Diagrama de Pareto, http://www.slideshare.net/tebanv87/diagrama-de-paretodiapositivas, agosto 29 2011. La varianza muestral, http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_130_30.h tml, 2001. La desviacin estndar muestral, http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_132_32.h tml, 2001. Estimacin, http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estimacion /estimacion.htm, 2001. Pruebas de hiptesis, http://www.biostat.jhsph.edu/~lcollado/Courses/MEyAdDG/day2/Pruebas%20de %20Hip%C3%B3tesis.pdf, 2013. Prueba de bondad y ajuste, http://www.facmed.unam.mx/deptos/salud/censenanza/planunico/spii/antologia 2012/3.pdf, 2013. Regresin lineal, http://e-stadistica.bio.ucm.es/mod_regresion/regresion_2.html, 2013. Anlisis de regresin lineal, http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/mat eriales/analisis_datosyMultivariable/18reglin_SPSS.pdf, 2013.

Anlisis de regresin lineal mltiple, http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/mat eriales/analisis_datosyMultivariable/18reglin_SPSS.pdf , 2013. El consumo de tabaco es base de varias afecciones mortales, http://www.portafolio.co/portafolio-plus/el-consumo-tabaco-es-base-variasafecciones-mortales, 2013. Colombia, tercero en consumo de alcohol, http://www.elespectador.com/noticias/salud/articulo-390021-colombia-terceroconsumo-de-alcohol, 2012. El consumo de drogas entre universitarios ha aumentado, http://www.elmundo.com/portal/noticias/gobierno/el_consumo_de_drogas_entre _universitarios_ha_aumentado.php, 2013.