2010 

Universidad de La Habana.  Facultad de Economía.  Departamento de  Estadística e Informática. 
          Profesora: MSc. Mirielys Miranda Iglesias.   

[ELEMENTOS DE  ESTADÍSTICA PARA LA  INVESTIGACIÓN.] 
 

Distribuciones probabilísticas de amplio uso estadístico. cuantitativas continuas. Probabilidades. Tema I. 4. diagramas de pastel. normal. Eventos excluyentes. binomial negativa y Poisson. diagramas de dispersión. exhaustivos. Métodos Descriptivos: Donde se analizarán los conceptos relacionados con: Población y muestra. tasa. Medidas de dispersión: varianza. Medidas de posición: media aritmética y geométrica. Medidas de porción: proporción. t’Student y F de Fisher. coeficiente de variación. Definición clásica y frecuencial de probabilidad. hipergeométrica. mediana. 2.Elementos de Estadística para la Investigación. Métodos Descriptivos.  Página 2  . la inferencia estadística y el análisis matemático. Chi cuadrado. Clasificación de las variables: cualitativas. Medidas de correlación: covarianza. a partir del estudio posterior y a profundidad. Datos y variables. gráficos de barras. moda. Distribuciones de variables discretas: Bernoulli. cuantitativas discretas. Organización de los datos y presentación de la información: tablas de frecuencia.  MATERIAL DE ESTUDIO DE LA ASIGNATURA: Curso Propedéutico. El módulo constará de 5 temas fundamentales los cuales se desglosan a continuación: 1. exponencial. ojivas. Variables aleatorias y distribuciones de probabilidad. 3. de las bondades existentes de modelos matemáticos para la medición de intangibles partiendo sobre la base de la interrelación de la Teoría Científica. Distribuciones de variables continuas: uniforme. Valor esperado y varianza de una variable aleatoria. binomial. Reglas de cálculo de probabilidades asociadas a diferentes sucesos. Clase Uno. coeficiente de correlación. histogramas. Maestría en Gestión de la Información. desviación estándar. Estadígrafos o medidas descriptivas fundamentales. complementarios e independientes. INTRODUCCIÓN Este documento tiene el objetivo de brindar los elementos didácticos preliminares al estudiante de la Maestría en Gestión de la Información para el curso introductorio. tablas de contingencia.

 Clase Uno. Manuel Ernesto Acosta Aguilera. Tema I. Saludos: Los profesores: MSc. Estimador y estimación: Estimación puntual. Mirielys Miranda Iglesias. Distribuciones muestrales. Muestreo y estimación. MSc. Error máximo admitido.  5. Muestreo estratificado. Error de estimación.Elementos de Estadística para la Investigación.  Página 3  . Muestreo aleatorio simple. Por otra parte. con y sin reposición. Tamaño mínimo de muestra. así como desaparezcan las dificultades encontradas a lo largo. de la travesía. Estimación por intervalos e intervalos de confianza. así como se utilizará el Excel como software para la interpretación de los resultados. Muestreo por conglomerados. Marco muestral. el estudiante deberá asistir a todas las conferencias para que logre el dominio necesario de todas las herramientas brindadas en el curso. Métodos Descriptivos. Muestreos probabilísticas v.s muestreos opináticos. En los ejercicios a utilizar en cada tema se escogerán ejemplos temáticos del campo de la Gestión de Información con el objetivo de evidenciar la gran aplicación de los contenidos impartidos.

Cuantitativos: Se refiere a cantidades tales como estatura. en general se consideran todas las unidades de interés (seres vivos o no). El objetivo de este tema es caracterizar y organizar la información a partir de la organización. Variables discretas: Son valores. Muestra: Cualquier subconjunto de la población. presentación y reducción de la información. Puede clasificarse en Cualitativa o Cuantitativa. Cualitativas: También llamadas atributos. recolección. Métodos Descriptivos. 2.  Tema I: Métodos Descriptivos. ii. 6. i.Elementos de Estadística para la Investigación. determinados. definidos y que generalmente representan a observaciones susceptibles de conteo y son valores enteros. El estudio de la Estadística. ingresos. Clase Uno. como ciencia comienza a surgir en el siglo XVI paralelo al desarrollo de las probabilidades. y se refieren a cualidades tales como: el color del pelo. convirtiéndola de esta manera en datos estadísticos. Variables: Es la medición de la característica cuantitativa. números de hijos etc. i. Sus métodos de análisis se clasifican en: Métodos Descriptivos e Inferencia estadística. tabulación. 4. nivel escolaridad etc. Tema I. Muestreo: Procedimiento mediante el cuál se extrae una muestra de la Población. peso. 1. la cual debe escogerse de manera representativa según las características propias de la población correspondiente. CONCEPTOS BÁSICOS. Población: Recolección del total de individuos o elementos que se presentan en el objeto de estudio. de los ojos. 3. el estado civil. las cuales se pueden clasificar en Discretas y Continuas. Censo: Estudio y análisis de todos los elementos que componen la población. Característica: Es el aspecto de interés o el objeto de estudio en la población.  Página 4  . 5.

Tema I.Elementos de Estadística para la Investigación. en tablas de frecuencias. A partir de la definición de los conceptos claves se describen a continuación.  ii. objetos de estudio en el siguiente curso. los métodos y estadígrafos descriptivos. Variables continuas: Las que generalmente representan a observaciones susceptibles de medición y por tanto pueden tomar cualquier valor en un cierto intervalo de los números reales. dando inicio al programa a partir de la recolección de la información y la tabulación u organización de esta. Clase Uno. Métodos Descriptivos.  Página 5  .

Frecuencias: Constituyen los elementos de análisis de la información. ii. Frecuencias Absolutas: Es el número de veces ni que se repite el valor en la variable cumpliéndose que ∑ ni = n. Frecuencias Relativas: Se denota como fi y constituye el cociente de la Frecuencia Absoluta sobre el Total de la Tema I. TABULACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN A PARTIR DE LA DISTRIBUCIÓN DE FRECUENCIAS. Clase Uno. se determina que en el caso de que las variables sean continuas su tabulación se realizará a través de la construcción de clases o intervalos de la propia variable. donde n corresponde al total de elementos dentro de una muestra. de la diferencia entre el valor máximo y el mínimo obtenido de la variable objetivo. se leen directamente los valores observados. Recorrido: Constituyen los valores que toma la variable objetivo en el caso de la variable discreta constituyen todos lo valores recorridos por la variable y en el caso de las continuas.Elementos de Estadística para la Investigación. Se clasifican en Frecuencias: Absolutas. 2. ii. 3. De esta forma. Organizados: ordenamiento en tablas: es decir. i. se denota como R y se calcula a través. 2.  Página 6  . Relativas y Acumuladas en dependencia de la información que se agrupe. presentación en su forma primaria. Construir las tablas de frecuencias atendiendo a la clasificación de la variable en estudio Discreta o Continua. Puede clasificarse en Organizada y No organizada atendiendo a: i. Determinar el Recorrido y las Frecuencias de la Variable: se entiende en este procedimiento los siguientes objetivos. Métodos Descriptivos.  PROCESO DE RECOLECCIÓN. Clasificar la recolección realizada de los datos. Recolección simple o no organizada: es decir listado de los datos. Para comprender el procedimiento a realizar con los datos recolectados se procederá de la siguiente manera: 1. 1.

y así sucesivamente hasta Fk = 1 y se interpreta como el % o la proporción de valores que son menores o iguales al Xi. Nk = n 6.. Ni ≥ 0 =n =1 0 ≤ fi ≤ 1. N1 = n1 por lo cual n1 = N1 < N2 < N3 . . N3 = n1 + n2 + n3 y así. 4. F1 = f1 por lo cual f1 = F1 < F2 < F3 . 0 ≤ Fi ≤ 1 5. Frecuencias Acumuladas: Se denotan en letra mayúscula y en dependencia de la información agrupada debido a que pueden acumularse tanto las frecuencias absolutas como las relativas. en este caso: fi = ni / n. 3. Representación Gráfica: Para las frecuencias absolutas y relativas simples.< Nm 8. F3 = f1 + f2 + f3. Interpretándose como: el número de observaciones menores o iguales al Xi. F2 = f1 + f2. Propiedades de las Frecuencias Acumuladas: 1. N2 = n1 + n2. Métodos Descriptivos.  Muestra. 3. sucesivamente hasta Nk=n.  Página 7  .. En el caso del las frecuencias relativas se denota como Fi y cumple que: F1 = f1. Fk = 1 7. Por lo cual su interpretación nos brinda la proporción de veces que se repite el valor de la variable correspondiente en el total de la muestra recogida y siempre se cumple que: ∑ fi = 1.. Clase Uno.Elementos de Estadística para la Investigación. ni ≥ 0 2. Por lo que si se agrupan las frecuencias absolutas entonces se denota la acumulada como Ni y cumple que: N1 = n1.< Fm Tema I. se utiliza como representación gráfica el Histograma y Polígono de frecuencias considerando en la ordenada: ni ó fi y en la abscisa: los límites de clases..

se utiliza como representación gráfica la Ojiva.  Página 8  . ya que estas son aquellas que pueden tomar cualquier valor en un intervalo. Determinar la amplitud de las clases. Clase Uno. y prácticamente es imposible considerar todos y cada uno de los valores que toma la variable. e incluyendo siempre el límite superior de cada clase como el límite inferior de la clase posterior y así sucesivamente hasta que la totalidad de los Xi estén recogidos en intervalos. Nótese que sólo se incluirán en una ocasión los valores de Xi iguales a cualquier límite superior y siempre se agruparan en este intervalo. considerando en la ordenada: Ni ó Fi y en la abscisa: los límites de clases. la cual se denota c y se calcula a través de la razón. al ser variables continuas su medición y recolección es más compleja por lo que se regulan seis pasos para el manejo de esta información en una tabla de intervalos o clases. 1. Definir la cantidad de clases o intervalos pertinentes para la interpretación de la información. Determinar el Recorrido de la variable.  Representación Gráfica: Para las frecuencias absolutas y relativas acumuladas. 3. Tema I. Procedimiento Adicional para la construcción de tablas de Frecuencias para Variables Continuas: Se les denomina intervalos de clases a: las agrupaciones parciales del recorrido de la variable. Métodos Descriptivos. 2. se expresa en función de R y n. 4. Específicamente. En el caso de que k sea una fracción se aproxima siempre a la unidad inmediata superior. como es el caso de la variable discreta.Elementos de Estadística para la Investigación. con el objetivo de no inducir errores de medición por omisión o duplicidad de la información recogida. Conformación de los intervalos o clases: Se forman cada clase comenzando siempre por el X mínimo + c. c = R / k. Generalmente se agrupan las observaciones correspondientes a variables continuas. R. el cual se denota k y generalmente.

MARCA DE CLASE. Determinación de la marca de la clase: la cual se denota como x´ y constituye el valor promedio de cada intervalo.Elementos de Estadística para la Investigación. Tema I. Métodos Descriptivos. Tarjado: Inclusión de las observaciones en los intervalos correspondientes en cantidades exactas. TAMAÑO DEL INTERVALO Y CONSTRUIR UNA TABLA DE FRECUENCIA PARA DATOS AGRUPADOS. Posteriormente de realizar la tabla de intervalos se procederá sin distinción a realizar la correspondiente tabla de Frecuencias. 6. LÍMITE DE CLASE.  Página 9  . • SABER CONSTRUIR UNA TABLA DE FRECUENCIA PARA DATOS SIN AGRUPAR • CONOCER QUE ES UNA CLASE. RESUMEN DE LAS HABILIDADES A EVALUAR: • DISTINGUIR ENTRE UNA OBSERVACIÓN DISCRETA Y CONTINUA. Clase Uno.  5. es la magnitud a relacionar posteriormente en las medidas descriptivas para el caso de las variables continuas concretamente.

0 10 20 20 10 30 20 10 40 20 40 30 20 00 00 20 20 30 00 30 Generalmente los datos que se organizan en tablas pero no se agrupan. haciendo distinción entre los distintos niveles de organización de los datos y la clasificación de la variable objetivo: EJEMPLO #1 Se tiene los datos recopilados acerca de la variable X: número de visitantes que accedieron diariamente durante 20 días.15 0.  A continuación se realizará un ejemplo para la comprensión de los conceptos brindados hasta el momento.Elementos de Estadística para la Investigación. así: n1 = 4 indica que hay 4 días de los escogidos para la muestra donde la página web de la MGI no fue visitada. Tema I. Xi: # de Visitantes Xi 0 10 20 30 40 tarjado //// /// //// /// //// // ni: # de días con similares características ni 4 3 7 4 2 fi 0.10 Ni 4 7 14 18 20 Fi 0.35 0. a la página web de la Maestría de GI.20 0.70 0.20 0. Clase Uno.20 0.  Página 10  .90 1. Métodos Descriptivos. TABLA DE FRECUENCIA O DISTRIBUCION DE FRECUENCIAS.00 Se definirá entonces por ejemplo para la interpretación de las frecuencias absolutas: Interpretación: "ni" indica las veces que se repite el valor de la variable. sólo a partir de la interpretación de sus Frecuencias se pueden desglosar la importancia de los mismos. n3 = 7 indica que hay 7 días de los escogidos para la muestra donde la página web de la MGI fue accedida exactamente por 20 visitantes.35 0.

H5 = 1.35 indica que en el 35% de los días escogidos para la muestra.10 indica que sólo en el 10% de los días escogidos en la muestra. f5= 0. va acumulando) Se definirá entonces por ejemplo para la interpretación de las frecuencias relativas y acumuladas: Interpretación: “Fi”: indican el % del número de observaciones menores o iguales al í-esimo valor de la variable.  Página 11  . la página fue accedida por 20 visitantes. (Como se observa. la página web de la MGI fue accedida hasta 40 visitantes. la página fue accedida por 40 visitantes.35 indica que sólo en el 35% de los días escogidos en la muestra. H3 = 0. la página web de la MGI fue accedida hasta los 20 visitantes. N3 = 14 indica que en 14 días de los escogidos para la muestra.  Se definirá entonces por ejemplo para la interpretación de las frecuencias relativas: Interpretación: “fi”: indican las veces que se repite el valor de la variable pero en porciento. Se definirá entonces por ejemplo para la interpretación de las frecuencias absolutas y acumuladas: Interpretación: “Ni”: indican el número de observaciones menores o iguales al í-esimo valor de la variable.00 indica que en el 100% de los días escogidos para la muestra. Métodos Descriptivos. la página web de la MGI fue accedida hasta 20 visitantes. f3 = 0. (Como se observa. Tema I.Elementos de Estadística para la Investigación. Clase Uno. va acumulando) N5 = 20 indica que en los 20 días escogidos para la muestra. la página web de la MGI fue accedida hasta los 40 visitantes.

 Métodos Descriptivos. Condiciones a cumplir: 1.Elementos de Estadística para la Investigación. se AGRUPA donde se encuentre dicho valor como el límite superior. como límite inferior del intervalo. 5. Clase Uno. Determinar el Recorrido de la Variable R= Xmáx – Xmín= 48-20=28 3. Hallar la Marca de la Clase (X´i): Es el promedio de los límites de las clases. Se designará.5 30. por lo tanto debe agruparse por intervalos para su correcta interpretación. Construir los intervalos de clases. 4. RECORDAR: cuando una observación coincide con un límite de clase.5 37. Y ya se está en condiciones de construir la tabla de frecuencia. Delimitar los Límites de los Intervalos. 46 39 34 33 32 36 41 26 32 36 43 28 30 27 32 42 30 31 34 41 28 30 26 21 37 39 25 33 47 28 26 23 30 43 40 36 20 38 38 31 29 30 48 47 23 31 24 38 35 36 A partir de la información anterior se puede afirmar que la variable objetivo es CONTINUA. Se debe comenzar por el menor valor e incluir todos los valores de la variable. 6.  Página 12  . Lj-1 20 27 34 Li 27 34 41 Tarjado IIIII IIIII IIIII IIIII IIIII IIII IIIII IIIII III Xi 23. por Li-1 y como límite superior Li. Amplitud de la Clase (C)= R/K = 28 / 4 = 7. En este caso se utiliza K=4 2. considerando por el investigador a priori la cantidad de intervalos a considerar (K). Organizar los datos a partir de la nueva distribución de intervalos.  EJEMPLO #2 Los siguientes valores corresponden al presupuesto destinado para I+D en miles de unidades monetarias reflejado en una encuesta realizada en Internet para 50 instituciones.5 ni 10 19 14 fi 10/50 19/50 14/50 Ni 10 29 43 Fi 10/50 29/50 43/50 Tema I.

Indica que 29 de las instituciones encuestadas destinan como presupuesto para I+D HASTA 34 mum.58. Tema I. ó que 19 instituciones del total encuestada utilizaron como promedio 30.Elementos de Estadística para la Investigación.20.5 mum para el presupuesto de I+D. Indica que el 58% de las instituciones encuestadas destinan como presupuesto para I+D HASTA 34 mum.  41 48 IIIII II 44.5 mum para el presupuesto de I+D. nunca se utiliza la marca de la clase. f2 = 0. Clase Uno. Indica que hay 19 instituciones del total encuestada que destinan como presupuesto para I+D entre 27 y 34 mum. H2= 0. Métodos Descriptivos. Indica que el 20% de las instituciones encuestadas destinan como presupuesto para I+D entre 27 y 34 mum.  Página 13  ... ó que el 20% de las instituciones encuestadas utilizaron como promedio 30.5 7 7/50 50 50/50 Se definirá entonces por ejemplo para la interpretación de las frecuencias: acumuladas n2 = 19. N2 = 29. RECORDATORIO: las frecuencias acumuladas sólo se interpretan utilizando el límite superior del intervalo.

Sign up to vote on this title
UsefulNot useful