Está en la página 1de 41

1.-ESTADSTICA DESCRIPTIVA (D1) 1.1.-CONCEPTO, CLASIFICACIN Y CAMPO DE APLICACIN DE LA ESTADSTICA.

Si bien no hay una definicin de estadstica exacta, se puede decir que la "estadstica es el estudio de los mtodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias cientficas partiendo de tales datos". Esta definicin cubre gran parte de la actividad del cientfico. Es importante observar que el objeto del que realiza el anlisis estadstico son los datos y las observaciones cientficas por s mismos, mas que el material qumico que interviene en el estudio. Por lo tanto no es posible trazar lmites rgidos entre la qumica, la estadstica y la matemtica. La estadstica se puede dividir en 2 categoras, la "estadstica descriptiva" y la "inferencia estadstica". La estadstica descriptiva implica la abstraccin de varias propiedades de conjuntos de observaciones, mediante el empleo de mtodos grficos, tabulares numricos. Entre estas propiedades, estn la frecuencia con que se dan varios valores en la observacin, la nocin de un valor tpico o usual, la cantidad de variabilidad en un conjunto de datos observados y la medida de relaciones entre 2 mas variables. El campo de la estadstica descriptiva no tiene que ver con las implicaciones o conclusiones que se puedan deducir de conjuntos de datos. La estadstica descriptiva sirve como mtodo para organizar datos y poner de manifiesto sus caractersticas esenciales con el propsito de llegar a conclusiones. La inferencia estadstica se basa en las conclusiones a la que se llega por la ciencia experimental basndose en informacin incompleta. Por ejemplo, Mendel al estudiar la manera como diferan entre s las plantas de guisantes en altura, color de las semillas, color de las vainas y color de las flores, tuvo que hacer sus conclusiones necesariamente basndose en un grupo de plantas relativamente poco numeroso comparado con toda la poblacin de plantas de guisantes de un tipo particular.

(D2) ESTADISTICA:
Es la rama de la matematicas que se ocupa de reunir,organizar y analizar datos numericos,y que ayuda a resolver problemas como el diseo de experimentos y toma de decisiones. La estadistica se clasifica en 2 ramas:

1)Estadistica descriptiva 2) Estadistica imperencial 1.-Estadistica descriptiva La estadistica descriptiva se refiere ala parte del estudio que incluye obtencion,organizacin,presentacin y descripcion de la informacion numerica. la

2.-Estadistica imperencial La estadistica imperencial es una tecnica mediante la cual se obtiene generalizaciones o se toman decisiones en base a una informacin parcial o incompleta obtenida mediante tecnicas descriptivas. Campo de aplicacion: en la actualidad se aplica en las ciencias sociales, en las ciencias naturales. (fisicas,metereologicas) en la industria (Produccion y control de calidad) en la administracion industrial (Recursos humanos, materiales, tiempos y movimientos etc.) en la economia, en las finanzas (inversiones,bolsas de valores) en la agricultura (periodo de siembra, calendario de lluvia)en el comercio, en la educacin,en la medecina, etc.

(D1) 1.2.- POBLACIN Y MUESTRA ALEATORIA.


Poblacin: El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. Una poblacin es un conjunto de elementos que presentan una caracterstica comn. El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado nmero de elementos.

Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo llamada muestra. Muestra: "Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla". "Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos "Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin para hacer referencias sobre la poblacin que est representada por la muestra. En consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo. Muestra aleatoria: muestra elegida independientemente de todas las dems, con la misma probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de otros y con la misma probabilidad.

(D2) POBLACIN Y MUESTRA

Una poblacin est determinada por sus caractersticas definitorias. Por lo tanto, el conjunto de elementos que posea esta caracterstica se denomina poblacin o universo. Poblacin es la totalidad del fenmeno a estudiar, donde las unidades de poblacin poseen una caracterstica comn, la que se estudia y da origen a los datos de la investigacin.

Entonces, una poblacin es el conjunto de todas las cosas que concuerdan con una serie determinada de especificaciones. Un censo, por ejemplo, es el recuento de todos los elementos de una poblacin. Cuando seleccionamos algunos elementos con la intencin de averiguar algo sobre una poblacin determinada, nos referimos a este grupo de elementos como muestra. Por supuesto, esperamos que lo que averiguamos en la muestra sea cierto para la poblacin en su conjunto. La exactitud de la informacin recolectada depende en gran manera de la forma en que fue seleccionada la muestra. Cuando no es posible medir cada uno de los individuos de una poblacin, se toma una muestra representativa de la misma. La muestra descansa en el principio de que las partes representan al todo y, por tal, refleja las caractersticas que definen la poblacin de la que fue extrada, lo cual nos indica que es representativa. Por lo tanto, la validez de la generalizacin depende de la validez y tamao de la muestra. Leyes del mtodo de muestreo. El mtodo de muestreo se basa en ciertas leyes que le otorgan su fundamento cientfico, las cuales son:

Ley de los grandes nmeros: si en una prueba, la probabilidad de un acontecimiento o suceso es P, y si ste se repite una gran cantidad de veces, la relacin entre las veces que se produce el suceso y la cantidad total de pruebas (es decir, la frecuencia F del suceso) tiende a acercarse cada vez ms a la probabilidad P. Clculo de probabilidades: La probabilidad de un hecho o suceso es la relacin entre el nmero de casos favorables (p) a este hecho con la cantidad de casos posibles, suponiendo que todos los casos son igualmente posibles. El mtodo de establecer la probabilidad es lo que se denomina clculo de probabilidad.

De estas dos leyes fundamentales de la estadstica, se infieren aquellas que sirven de base ms directamente al mtodo de muestreo:

Ley de la regularidad estadstica: un conjunto de n unidades tomadas al azar de un conjunto N, es casi seguro que tenga las caractersticas del grupo ms grande. Ley de la inercia de los grandes nmeros: esta ley es contraria a la anterior. Se refiere al hecho de que en la mayora de los fenmenos, cuando una parte vara en una direccin, es probable que una parte igual del mismo grupo, vare en direccin opuesta.

Ley de la permanencia de los nmeros pequeos: si una muestra suficientemente grande es representativa de la poblacin, una segunda muestra de igual magnitud deber ser semejante a la primera; y, si en la primera muestra se encuentran pocos individuos con caractersticas raras, es de esperar encontrar igual proporcin en la segunda muestra.

Tipos de muestras. Muestreo aleatorio simple: la forma ms comn de obtener una muestra es la seleccin al azar. es decir, cada uno de los individuos de una poblacin tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la muestra es viciada. Para tener la seguridad de que la muestra aleatoria no es viciada, debe emplearse para su constitucin una tabla de nmeros aleatorios. Muestreo estratificado: una muestra es estratificada cuando los elementos de la muestra son proporcionales a su presencia en la poblacin. La presencia de un elemento en un estrato excluye su presencia en otro. Para este tipo de muestreo, se divide a la poblacin en varios grupos o estratos con el fin de dar representatividad a los distintos factores que integran el universo de estudio. Para la seleccin de los elementos o unidades representantes, se utiliza el mtodo de muestreo aleatorio. Muestreo por cuotas: se divide a la poblacin en estratos o categoras, y se asigna una cuota para las diferentes categoras y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra debe ser proporcional a la poblacin, y en ella debern tenerse en cuenta las diferentes categoras. El muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la seleccin de las categoras. Muestreo intencionado: tambin recibe el nombre de sesgado. El investigador selecciona los elementos que a su juicio son representativos, lo que exige un conocimiento previo de la poblacin que se investiga. Muestreo mixto: se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las unidades de la muestra en forma aleatoria y despus aplicar el muestreo por cuotas. Muestreo tipo: la muestra tipo (master simple) es una aplicacin combinada y especial de los tipos de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituir el mdulo general del cual se extraer la muestra definitiva conforme a la necesidad especfica de cada investigacin

(Ejercicios) ESPASIO MUESTRAL

Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas al azar, si son partidarias o no de consumir un determinado producto. a) Escribe el espacio muestral asociado a dicho experimento, utilizando la letra "s" para las respuestas afirmativas y "n" para las negativas. b) Qu elementos del espacio muestral anterior constituyen el suceso " al menos dos de las personas son partidarias de consumir el producto"? c) Describe el suceso contrario de "ms de una persona es partidaria de consumir el producto"

2.- Lanzar un dado y una moneda a la vez = {A1, A2, A3, A4, A5, A6, SI, S2, S3, S4, S5, S6}

Para el caso de que el experimento sean arreglos de un solo conjunto entonces el n del espacio muestral es igual a la combinacin. 4.- En una caja hay 3 canicas rojas y 8 canicas verdes se pide obtener los espacios muestrales de los siguientes experimentos: a) Extraer una canica roja = {Rl, R2, R3 } b) Extraer 2 canicas rojas = {RIR2, RIR3, R2R3} c) Extraer una canica = {R1,R2,R3,V1,V2,V3,V4,V5,V6,V7,V8}

(D1) 1.3 OBTENCIN DE DATOS ESTADSTICOS.


Recoleccin de Datos Los datos se necesitan para: Proporcionar la introduccin imprescindible para un estudio de investigacin. Medir el desempeo en un servicio o proceso de produccin en curso. Ayudar en la formulacin de cursos alternativos de accin en un proceso de toma de decisiones. Satisfacer nuestra curiosidad. Los datos pueden concebirse como informacin numrica necesaria para ayudarnos a tomar una decisin con ms bases en una situacin particular. Existen muchos mtodos mediante los cuales podemos obtener los datos necesarios. Primero, podemos buscar datos ya publicados por fuentes gubernamentales, industriales o individuales. Segundo, podemos disear un experimento. En tercer lugar, podemos conducir un estudio. Cuarto, podemos hacer observaciones del comportamiento, actitudes u opiniones de los individuos en los que estamos interesados.

Utilizacin de fuentes de datos publicadas. Sin importar la fuente utilizada, se hace una distincin entre el recolector original de los datos y la organizacin o individuos que compilan stos en tablas y diagramas. El recolector de datos es la fuente primaria; el compilador de los datos es la fuente secundaria. Obtencin de datos mediante investigacin de encuesta. Existen bsicamente dos tipos de variables aleatorias que producen dos tipos de datos: categricas y numricas. Las variables aleatorias categricas producen respuestas categricas, mientras que las variables numricas producen respuestas numricas. Las variables numricas pueden considerarse como discretas o continuas. Los datos discretos son respuestas numricas que surgen de un proceso de conteo, mientras que los datos continuos son respuestas numricas que surgen de un proceso de medicin. La necesidad de definiciones operacionales. Una definicin operacional proporciona un significado a un concepto o variable que puede comunicarse a otros individuos. Es algo que tiene el mismo significado ayer, hoy y maana para todos los individuos.

(D2) OBTENCIN DE DATOS Recoleccin de la Informacin La manera ms formal de proceder a la bsqueda de informacin es seguir los lineamientos del mtodo cientfico. La estadstica resulta de gran utilidad en el manejo de informacin. El proceso consiste en: Recoger la informacin. Tabularla. Presentarla. Analizarla.

El aspecto medular del manejo de informacin es la recoleccin, ya que el procesamiento de datos depende de la confiabilidad que aqulla pueda tener. Mtodos de recoleccin de datos Encuestas: La informacin se recoge por muestras, por lo que no se aplica a la poblacin total. Censos: La informacin se recoge en forma general a toda la poblacin. Registros: La informacin es continua. Se recoge a medida que se va produciendo.

Tcnicas de recoleccin Entrevistas. Aplicacin de cuestionarios. Observacin.

Mtodos para el recuento Listas. Cuando son pocas las unidades y no se manejen ms de dos escalas. Palotes. Consiste en poner, en una hoja de trabajo, un "palote" por cada unidad que se cuenta. No se utiliza para gran nmero de observaciones. Tarjetas simples. La informacin por individuos se registra en una tarjeta. El nmero de unidades es corto. La clasificacin por variables se hace rpidamente, ordenando las tarjetas en tantos grupos como categoras resulten. Se recomienda utilizar para menos de 500 casos y menos de 12 variables. Mecanizada. El cmputo e impresin de resultados pueden obtenerse por computadora

(D1) 1.4 DATOS NO AGRUPADOS.


Tendencia central: la tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia central se conocen como medidas de posicin. Dispersin: se refiere a la extensin de los datos en una distribucin, es decir, al grado en que las observaciones se distribuyen. 1.4.1 Medidas de Tendencia central La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comnmente empleadas son : Media aritmtica

Mediana Moda Media geomtrica Media armnica Los cuantiaos

1.4.2 Medidas de dispersin. Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentracin de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.

(D2) DATOS NO AGRUPADOS


Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener informaciion directamente de ellos. Ejemplos: 5,7,2,15,2,6,12,5,5,20,10. numero de personas que ayudaron a una causa

(EJERCICIOS) DATOS NO AGRUPADOS


Ejemplo para el clculo de la media.

Sean los siguientes valores las calificaciones la asignatura de matemticas de estudiantes de primer ao: 10 8 6 8 6 6 6 9 9 7.5 10 10 7 7.5 7 7.5 6 8 8 9.5 9.5 9.5 10 5 10 6.5 8 10 8 7.5

Sumando los valores de las 30 calificaciones y dividindolas entre los 30 datos obtendremos:

x=

x
n

240 =8 30

por lo que la media de calificaciones obtenida por el grupo considerado es igual a 8.

Podemos comprobar el teorema con las calificaciones presentadas, a continuacin se presenta la tabla de diferencias x xi

810=2 88=0 86=2

8-8=0 8-6=2 8-7.5=0.58-7=1

8-7.5=0.58-8=0 8-9.5=- 8-10=-2 8-10=-2 1.5

8-6=2 8-9=-1 8-10=-2 8-7.5=0.58-6=2 8-6=2 8-9=-1 8-10=-2 8-7=1 8-8=0

8-9.5=- 8-10=-28-6.5=1.58-8=0 1.5 8-9.5=- 8-5=3 8-8=0 1.5 8-7.5=0.5

Observamos que efectivamente se puede ver de manera inmediata que

( x x ) =0
i

como fue demostrado en el teorema.

Un teorema a considerar es el siguiente, el cual nos indica como cambia la media cuando a cada variable la trasladamos una constante, es decir, para cada medicin xi le sumamos una cantidad, y i = xi + c .

Teorema. La media de x al ser traslada o remplazada por una cantidad constante para cada una de las medidas se modifica de la forma y = x + c

Demostracin. Sea una muestra de n mediciones x1 , x 2 , x3 , , x n a las que se les remplaza sumndoles una cantidad c, es decir,

y1 = x1 + c, y 2 = x 2 + c, y 3 = x3 + c, , y n = x n + c

, por lo que al obtener la media

para xi + c tenemos

yi = =

( x
n

+ c) +

n xi

c =
n

nc =x+ = n = x +c lo que demuestra el teorema.

(D1) 1.5 DATOS AGRUPADOS.


1.5.1 Tabla de distribucin de frecuencias Distribucin de Frecuencias, comnmente llamada tabla de frecuencias, se utiliza para hacer la presentacin de datos provenientes de las observaciones realizadas en el estudio, estableciendo un orden mediante la divisin en clases y registro de la cantidad de observaciones correspondientes a cada clase. Lo anterior facilita la realizacin de un mejor anlisis e interpretacin de las caractersticas que describen y que no son evidentes en el conjunto de datos brutos o sin procesar. Una distribucin de frecuencias constituye una tabla en el mbito de investigacin. La distribucin de frecuencias puede ser simple o agrupada. La distribucin de frecuencias simple es una tabla que se construye con base en los siguientes datos: clase o variable (valores numricos) en orden descendente o ascendente, tabulaciones o marcas de recuento y frecuencia. Por ejemplo, si se construye una distribucin de frecuencias sobre los resultados finales que arroj la evaluacin de un curso de planeacin estratgica para estudiantes de administracin correspondientes al semestre agosto-diciembre de 1998, se tienen los siguientes datos brutos: 86, 80, 84, 84, 74, 88, 87, 84, 74, 77, 77, 82, 68, 78, 67, 74, 66, 86, 65, 88,69 se procede a organizarlos en forma ascendente o descendente y se tiene en orden descendente: 88, 88, 87, 86, 86, 84, 84, 84, 82, 80, 78, 77, 77, 74, 74, 74, 69, 698, 67, 66, 65 posteriormente se registran en una tabla de distribucin de frecuencias simple. La distribucin de frecuencias agrupadas es una tabla que contiene las columnas siguientes: intervalo de clase, puntos medios, tabulacin frecuencias y frecuencias agrupadas. Los pasos para disearla son: 1.- Se localizan el computo mas alto y el mas bajo de la serie de datos. 2.-Se encuentra la diferencia entre esos dos cmputos. 3.- La diferencia obtenida se divide entre nmeros nones tratando de encontrar un cociente cercano a 15 pero no mayor. Lo anterior indica cuantas clases va a tener la distribucin de frecuencias agrupadas y cul va a ser la magnitud del intervalo de clase. 4.- Se determina el primer intervalo de clase y posteriormente se van disminuyendo los lmites del intervalo de clase de acuerdo al valor de la magnitud establecida previamente. 1.5.2 Medidas de Tendencia Central

La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Las medidas de tendencia central comnmente empleadas son : Media aritmtica.- La media no es ms que la suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone. Mediana.- Es la observacin equidistante de los extremos Moda.- Valor de la variable que presenta una mayor frecuencia. Media geomtrica .- Se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto fiinal se le calcula la raz "n" (siendo "n" el total de datos de la muestra). Media armnica.- Se utiliza para el promedio de rendimientos y velocidades. La Media Armnica de una serie de nmeros es el reciproco de la media aritmtica del recproco de esos nmeros.

1.5.2 Medidas de dispersin. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras. Medidas de dispersin absolutas Varianza ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones. Desviacin Tpica (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza Recorrido o rango muestral (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Coeficiente de variacin de Pearson: Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica 1.5.4 Cuantiles

Los cuantiles completan el cuadro de los parmetros de una distribucin. En cierto modo pueden ser considerados como medidas de centralizacin (de hecho la mediana es uno de ellos) y tambin como medidas de dispersin (algunas pueden construirse a partir de ellos) pero en realidad son medidas de posicin. Se define el cuantil p como aquel valor de la variable (que puede estar o no en la muestra) que supera al p% de los datos de la muestra; resultan tiles slo cuando la muestra es numerosa y permiten saber en que posicin se encuentra un valor dado con respecto al conjunto de una muestra o poblacin. Se definen entre los ms importantes: Los cuartiles, que definen las cuartas partes de la muestra mediante tres cortes: el primer cuartil deja por debajo al 25% de la distribucin, el segundo coincide con la mediana y el tercero deja por debajo al 75% de la distribucin. No tienen mucho sentido en muestras pequeas, pero en nuestro ejemplo valdran respectivamente 0, 1 y 3.5 (que estn situados en las posiciones tercera y media, sptima y dcima y media de los datos ordenados). Los deciles, que dan nueve cortes para definir de diez en diez por ciento los valores de la distribucin; as, el primer decil deja por debajo una dcima parte de la distribucin, el segundo dos dcimas partes, etc., hasta nueve deciles. Los percentiles, que son como los deciles pero de uno en uno por ciento, y por tanto son noventa y nueve; por ejemplo, el percentil 37 deja por debajo al 37% de la distribucin, y est claro que no tienen sentido en muestras tan pequeas como la de nuestro ejemplo, ya que trece elementos no se pueden partir en cien partes. Todos los cuantiles son definibles sobre variables cuantitativas o sobre cualitativas ordinales, porque requieren siempre que los datos estn ordenados. Los cuantiles ms prximos al percentil 50, como la propia mediana o los cercanos a ella, pueden considerarse como parmetros de centralizacin y sin embargo los ms lejanos al centro ayudan a medir la dispersin; por ejemplo, si restamos el tercer cuartil menos el primero obtenemos el rango intercuartlico, que es una medida de dispersin. Con el rango intercuartlico estamos midiendo la extensin que nos cubre la mitad central de nuestros datos; recurdese que el RANGO era la extensin cubierta por toda la muestra ordenada (se define como mximo menos mnimo), mientras que el RANGO INTERCUARTILICO es la extensin cubierta por la mitad central de los datos ordenados, excluyendo la cuarta parte inicial (los que son inferiores al primer cuartil) y la cuarta parte final (los que son superiores al tercer cuartil).

(EJERCICIOS) DATOS AGRUPADOS

Para datos agrupados la expresin de la media cambia ligeramente, como se muestra a continuacin Ejemplo:

Sean los siguientes datos 1, 1, 2, 2, 4, 4, 5, 2, 3, 2, 3, 4, 1, 2, 1. La media para dichos datos es aproximadamente igual a 2.4666, es decir,

x=

x
n

1+1+ 2 + 2 + 4 + 4 + 5 + 2 + 3 + 2 + 3 + 4 +1+ 2 +1 2.4666 15

Sin embargo, el mismo resultado podemos obtener si tomamos la frecuencia con que aparecen los datos, en este caso:

Dato
xi

Frecuencia
fi

Producto de frecuencias y datos


f i xi

1 2

4 5

4 10

3 4 5

2 3 1

6 12 5

La obtencin de la media finalmente se convierte en

x=

1 (1)( 4 ) + ( 2)( 5) + ( 3)( 2 ) + ( 4 )( 3) + ( 5)(1) 2.4666 xi f i = n 15

para la obtencin de la media cuando las frecuencias estn sujetas a la eleccin de clase bajo los mtodos mostrados, se realiza de igual manera, la nica diferencia existe en determinar el valor xi como el punto medio de cada clase, veamos el siguiente ejemplo.

Supongamos que una clnica de salud, obtiene una tabla de edades de las personas que son atendidas en un fin de semana, para los que presentan la siguiente tabla. Cul ser el promedio de edades de los enfermos que acudieron a recibir atencin mdica?

Tabla de frecuencias reportadas por la clnica

Clases (Datos en aos)

Punto medioFrecuencias de cada de clase xi 15 25 35 45 55 65 75 cadaclase


fi

10 x < 20

8 20 14 8 2 2 1 55 enfermos atendidos

20 x < 30
30 x < 40

40 x < 50
50 x < 60

60 x < 70
70 x < 80

Por lo que el promedio de personas a las que se les dio servicio es de:

x=

(15)( 8) + ( 25)( 20) + ( 35)(14) + ( 45)( 8) + ( 55)( 2) + ( 65)( 2) + ( 75)(1)


53

32.45 aos

Determine tamao de intervalo Max min # intervalos 234 12 20 130 40 15 90 9 10 493 290 18 145 56 15 195 40 20 Solucin Tabla Max min #intervalos Alcanze 234 12 20 223

A/N 11.15

t 11

130 40 15 90 9 10 493 290 18 145 56 15 195 40 20 Observe las frecuencias. Tabla X f 56-60 4 61-65 6 66-70 9 71-75 11 76-80 15 81-85 19 86-90 21 91-95 22 96-100 21 101-105 19 106-110 15 111-115 11 116-120 9 121-125 6 126-130 4 Total 192

91 82 204 90 156

6.06 8.20 11.33 6.00 7.80

6 8 11 6 8

fr .0208 .0312 .0468 .0572 .0781 .0989 .1093 .1145 .1093 .0989 .0781 .0572 .0468 .0312 .0208 .9991

fa 4 10 19 30 45 64 85 107 128 147 162 173 182 188 192

fra .0208 .0520 .0988 .1560 .2341 .3333 .4423 .5568 .6661 .7650 .8431 .9003 .9471 .9783 .9991

Hacer f, fa, fr, fra. Datos (Use N = 5) 54, 63, 91, 87, 26, 13, 29, 50, 42, 31, 81, 67, 47, 49, 41, 31, 70, 42, 31, 18, 60, 75, 86, 90, 68, 22, 27, 69, 51, 44, 34, 72, 57, 59, 13, 63, 95, 73, 56, 25, 43, 93, 67, 41, 42, 93, 57, 71, 11, 40. Solucin Paso I: Ordenar los datos; hay 50 datos 11, 13, 13, 18, 22, 25, 26, 27, 29, 31, 31, 31, 34, 40, 41, 41, 42, 42, 42, 43, 44, 47, 49, 50, 51, 54, 56, 57, 57, 59, 60, 63, 63, 67, 67, 68, 69, 70, 71, 72, 73, 75, 81, 86, 87, 90, 91, 93,

93, 95. Es evidente que el Mximo es igual al 95 y el Mnimo es igual a 11. Por lo tanto el alcance es: A = Max - min + 1 = 95 - 11 + 1 = 85. El problema indica que hay que usar cinco intervalos, i.e., N = 5. Por lo tanto, el tamao t de los intervalos ser t = A/N = 85/5 = 17. Paso II: Determinar el primer intervalo: Se toma el mnimo y se le suma t - 1: 11 + 16 = 27. Por lo tanto, el primer intervalo ser de 11 a 27. Con esta informacin escribimos los intervalos restantes. Paso III: Construir los intervalos de la distribucin de frecuencias y determinar las frecuencias. Tabla del Problema 14. Intervalo f fa fr fra 11-27 8 8 .16 .16 28-44 13 21 .26 .42 45-61 10 31 .20 .62 62-78 11 42 .22 .84 79-95 8 50 .16 1.00 Suma 50 1.00

Hacer f, fa, fr, fra, alcance. Datos (Use N = 10) 130, 117, 98, 90, 78, 70, 56, 129, 116, 98, 87, 78, 69, 56, 129, 114, 98, 86, 78, 69, 56, 125, 114, 98, 85, 76, 69, 54, 125, 110, 98, 85, 76, 67, 54, 125, 109, 96, 84, 76, 67, 53, 125, 109, 96, 83, 72, 64, 53, 120, 109, 93, 83, 72, 64, 52, 120, 107, 92, 83, 72, 62, 52, 118, 100, 91, 83, 71, 62, 50, Solucin Note que los nmeros estn en orden; hay 70 datos. Primero se determina el alcance: A = 130 - 50 + 1 = 81. Segundo se determina el tamao del intervalo: t = 81/10 = 8.1; por lo tanto se usa t = 8.

Tercero, el primer intervalo es de 50 a 57. Tabla Intervalo 50-57 58-65 66-73 74-81 82-89 90-97 98-105 106-113 114-121 122-129 130-137 Suma

f 10 4 10 6 9 6 6 5 7 6 1 70

fa 10 14 24 30 39 45 51 56 63 69 70

fr .1428 .0571 .1428 .0857 .1285 .0857 .0857 .0714 .1000 .0857 .0142 .9996

fra .1428 .1999 .3427 .4284 .5569 .6426 .7283 .7997 .8997 .9854 .9996

(D1) 1.6 GRAFICOS


Gran parte de la utilidad que tiene la Estadstica Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de informacin depender de la presentacin de los datos, siendo la forma grfica uno de los ms rpidos y eficientes, aunque tambin uno de los que ms pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones bsicas al realizar las grficas. Existen tambin varios tipos de grficas, o representaciones grficas, utilizndose cada uno de ellos de acuerdo al tipo de informacin que se est usando y los objetivos que se persiguen al presentar la informacin. Entonces, mencionaremos algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier grfica a fin de que la informacin sea transmitida de la manera ms eficaz posible y sin distorsiones: 1. El eje que represente a las frecuencias de las observaciones (comnmente el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera podra

dar impresiones errneas al comparar la altura, longitud o posicin de las columnas, barras o lneas que representan las frecuencias. 2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la grfica deben ser iguales. 3. El tipo de grfico debe coincidir por sus caractersticas con el tipo de informacin o el objetivo que se persigue al representarla, de otra manera la representacin grfica se convierte en un instrumento ineficaz, que produce ms confusin que otra cosa, innecesario o productor de malinterpretaciones. Por ejemplo, si se desea representar la proporcin de poblacin masculina en un pas conviene ms usar una grfica de pastel o circular que una grfica de barras al compararla contra la poblacin femenina; por un lado se puede apreciar dicha proporcin, por el otro se aprecia cul de las dos poblaciones es mayor. Hay un punto que conviene remarcar: existe software que permite la construccin rpida y eficiente de grficas a partir de bases de datos o hojas de clculos, pero no importa cun bonita, bien delineada, bien coloreada o bien presentada est una grfica, si no se han tomado en cuenta consideraciones de este tipo que tienen que ver ms sobre el objetivo de estas herramientas y la Estadstica: la transmisin eficiente de la informacin.

Tipos de grficos Para las distribuciones de frecuencias la representacin grfica ms comn es el histograma. Un ejemplo es el que se presenta a continuacin y que representa el nmero de "visitas" que ha tenido este hipertexto de acuerdo a la hora de la visita.

En el eje horizontal (o de las abscisas) se representan los intervalos de los datos, marcndose de manera continua las fronteras entre cada uno de los stos. De esta manera, el histograma est compuesto rectngulos, cuyo nmero coincide con la cantidad de intervalos considerados, el ancho de la base de cada uno de esos rectngulos es la misma siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la frecuencia de cada intervalo. Es importante observar que resulta difcil utilizar este tipo de representacin cuando existen intervalos abiertos o cuando los intervalos no son iguales entre s. Otra observacin es la amplitud de los intervalos, que se puede establecer utilizando la regla de Sturges, pues al cambiarla la presentacin visual de un histograma puede variar. Un applet que muestra cmo el nmero de clases y su ancho pueden hacer variar fue desarrollado por Webster West de la Universidad del Sur de Carolina. El programa Excel no permite crear de manera automtica histogramas, pues proporciona el ancho de las columnas de tal manera que quedan separadas. Sin embargo, existe la manera de hacerlas. Un tipo de grfico muy parecido al histograma es la grfica de columnas. Para este tipo de grfica, elaboradas con rectngulos tambin, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del histograma, no es necesario tener una escala horizontal continua, por lo que los rectngulos (o barras) no tienen que aparecer juntas entre s.

Otra observacin pertinente es que se pueden representar en la misma grfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una grfica con varias series, correspondiendo cada una de ellas a cada observacin de la muestra (o poblacin), y tenindose una grfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre s, pero distinta de las dems. El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos de preparatoria. Las series (cada una de las calificaciones parciales) estn coloreadas con diferente color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con respecto a los dems. Es interesante observar que la escala horizontal no es continua (es nominal).

Existe la posibilidad, y si los recursos lo permiten, de representar grficos compuestos de una manera "tridimensional", es decir, con grficos que posean no slo dos ejes, sino tres; y en los que los rectngulos son sustitudos por prismas de base rectangular (ocasionalmente el software en el mercado permite utilizar prismas cuya base son polgonos regulares de ms de cuatro lados, pirmides o cilindros). Un ejemplo es el siguiente:

donde se representa el porcentaje del PIB gastado en docencia e investigacin por cinco pases en el lapso de 1988 a 1999 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12). Es importante considerar que este tipo de grficos puede complicarse mucho, haciendo que la informacin sea menos legible. Tambin es posible realizar grficas de barras horizontales, los cuales se parecen mucho a las grficas de columnas, con la salvedad importante de que la funcin de los ejes se intercambian y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases. Es muy comn que este tipo de grficos se utilicen para ilustrar el tamao de una poblacin dividida en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la poblacin de un pas ficticio llamado "Timbuctulandia":

A este tipo de grficos en particular se le llama pirmide de edades por su forma. Incluso, cuando se compara la poblacin masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la poblacin de un sexo y el lado derecho para el otro, el resultado es una "pirmide" casi simtrica (depender de la poblacin en particular). Cuando los datos se relacionan entre s, es decir, cuando podemos decir que existe cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional, la evolucin del peso o estatura de una persona a travs del tiempo, el desempeo acadmico de un estudiante a lo largo de su instruccin escolar, las variaciones presentadas en la medicin realizada en algn experimento cada segundo o minuto) se pueden utilizar las grficas de lneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, unindose consecutivamente con lneas:

Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de cinco observaciones anuales. Al igual que en el caso de las grficas de columnas (y de otras ms) es posible presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un individuo). Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas, es el polgono de frecuencias. La diferencia fundamental entre ambas es que en el polgono de frecuencias se aaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra despus de la ltima. El resultado es que se "sujeta" la lnea por ambos extremos al eje horizontal y lo que podra ser una lnea separada del eje se convierte, junto con ste, en un polgono. El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigacin durante el ao de 1990 en cinco pases (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

El Excel no crea automticamente polgonos de frecuencias, sino que produce grficas de lneas. Sin embargo, es posible arreglrselas para hacerlas. Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas, existen las ojivas mayor que y las ojivas menor que. Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por sto la aplicacin de la tcnica es parcial): 1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el extremo izquierdo; para la ojiva menor que, con el derecho. 2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor. Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga, en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el nmero de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de observaciones antes de la hora que seala la frontera). Si se utiliza una distribucin porcentual acumulativa entonces se obtiene una ojiva (mayor que o menor que segn sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribucin porcentual:

En ocasiones, al comparar dos series de observaciones (o de datos) se utiliza una

llamada grfica de reas, la cual consiste en rellenas el rea que se encuentre debajo de las lneas que resultan de una grfica de lneas. El ejemplo que se presenta es la comparacin del total de las especies de las familias del orden Carnivora y las que estn amenazadas, en Mxico, (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):58):

Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con respecto al total, es decir, cuando se est usando una escala categrica, conviene utilizar una grfica llamada de pastel o circular. Por ejemplo, para ilustrar la matrcula en licenciatura (en Mxico) por reas de conocimiento en el ao de 1992 se puede usar algo as como sigue (Fuente: ANUIES,1995):

De hecho, si se desea resaltar una de las categoras que se presentan, es vlido tomar esa "rebanada" de la grfica y separarla de las dems:

Hay que tomar algunas precauciones al utilizar este tipo de grficos. Por un lado, comparar dos grficos circulares (por ejemplo, si se quisieran comparar las proporciones de matrculas en licenciatura por reas de conocimiento en licenciatura para dos aos distintos) resulta muy difcil y, por tanto, no es muy aconsejable. Por otro lado, en ocasiones existen categoras con pocas frecuencias (por ejemplo, dos o tres con frecuencias relativas menores al 1% cada una), haciendo que la grfica resulte "pesada" y las etiquetas se encimen. Una posible solucin es juntarlas en una sola categora (por ejemplo, la tpica "otras" o "varias"), pero entonces habra que

ponderar si se hace una grfica extra con dichas observaciones nicamente, haciendo la anotacin pertinente, o simplemente se ignoran por no resultar significativas. Actualmente, y mucho en los medios masivos de comunicacin, se utilizan grficos para ilustrar los datos o los resultados de alguna investigacin. Regularmente se utilizan dibujos para representar dicha informacin, y el tamao o el nmero de estos dibujos dentro de una grfica queda determinado por la frecuencia correspondiente. A este tipo de grfica se le llama pictograma y stos son dos ejemplos:

El de la izquierda representa la poblacin de los Estados Unidos (cada hombrecillo representa a dos millones de habitantes), el de la derecha representa la masa de tres planetas de nuestro sistema solar tomando como unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus tiene masa menor y Neptuno tiene ms 17 veces ms masa que la Tierra). Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo de grficas, las posteriores s. Otros programas contemporneos (como el Corel Draw o el Harvard Graphics) s son capaces. Cuando se pretende ilustrar la dispersin de las observaciones realizadas, y as trabajar algunas cosas como correlaciones se puede utilizar una grfica de dispersin. Por ejemplo, el ejemplo de la izquierda es la dispersin que se presenta al comparar el nmero de tesis doctorales en ciencias exactas contra el nmero de total de tesis doctorales (todo en Mxico) en observaciones anuales entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

La grfica de la derecha es resultado de comparar el dimetro (en miles de kilmetros) de los planetas interiores del nuestro sistema solar contra sus densidades (en gramos por centmetro cbico). Es interesante observar que los puntos parecen "seguir" una lnea imaginaria que se asemeja a una recta, con excepcin de un caso atpico: Mercurio. Uno de los usos de este tipo de grficas es precisamente encontrar si las observaciones siguen algn patrn lineal (una lnea de tendencia) o si existen valores atpicos. Para el caso del Excel, el programa es capaz de graficar las lneas de tendencias que siguen un conjunto de datos. Un tipo de grfico similar a las grficas de dispersin son las grficas de burbujas, en las cuales se presenta la dispersin de las observaciones de la misma forma que aqullas, pero se le aade la posibilidad de visualizar otra variable representada en el tamao del punto, pues stos se convierten en crculos (burbujas) con radios proporcionales a las magnitudes que representan.

Este ejemplo compara la distancia que existe en cada uno de los planetas interiores de nuestro sistema solar al Sol contra el tiempo que necesitan para recorrer sus rbitas, y el tamao de las burbujas indica la masa de cada planeta. Adems existen otros tipos de grficos, cada uno con caractersticas particulares que les proporcionan cierta intencionalidad para su uso, como son las grficas de radar y las grficas polares. 1. Mtodos grficos: Primero definir lo que es un grfico o diagrama en estadstica Un diagrama es una especie de esquemtico, formado por lneas, figuras, mapas, utilizado para representar, bien datos estadsticos a escala o segn una cierta proporcin, o bien los elementos de un sistema, las etapas de un proceso y las divisiones o subdivisiones de una clasificacin. Entre las funciones que cumplen los diagramas se pueden sealar las siguientes:

Hacen ms visibles los datos, sistemas y procesos Ponen de manifiesto sus variaciones y su evolucin histrica o espacial. Pueden evidenciar las relaciones entre los diversos elementos de un sistema o de un proceso y representar la correlacin entre dos o ms variables. Sistematizan y sintetizan los datos, sistemas y procesos. Aclaran y complementan las tablas y las exposiciones tericas o cuantitativas. El estudio de su disposicin y de las relaciones que muestran pueden sugerir hiptesis nuevas.

Algunos de los diagramas ms importantes son el diagrama en rbol, diagrama de reas o superficies, diagrama de bandas, diagrama de barras, diagrama de bloques,

diagrama circular, diagrama circular polar, diagrama de puntos, diagrama de tallo y hoja diagrama, histogramas y grficos de caja y bigote o boxplots. 2.1 Grficos univariados: Para trabajar los grficos univariables debemos primero saber lo que es el anlisis estadstico univariable y despus de esto trabajaremos los mtodos pedidos El anlisis estadstico que opera con datos referentes a una sola variable o distribucin de frecuencias y pretende determinar sus propiedades estadsticas. El a.e.u. proporciona al analista medidas representativas de la distribucin o promedios, ndices de dispersin de los datos de la distribucin, procedimientos para normalizar los datos, medidas de desigualdad de unos datos en relacin con otros y por ultimo medidas de la asimetra de la distribucin.

Grficos de puntos: Es una variacin del diagrama lineal simple el cual esta formado por lneas rectas o curvas, que resultan de la representacin, en un eje de coordenadas, de distribuciones de frecuencias, este construye colocando en el eje x los valores correspondientes a la variable y en el eje de las ordenadas el valor correspondiente a la frecuencia para este valor. Proporciona principalmente informacin con respecto a las frecuencias. Este se usa cuando solo se necesita informacin sobre la frecuencia. Cuando la muestra se agrupa por intervalos se trabaja con la marca de clase del intervalo de clase, la marca de clase es el punto medio del intervalo EJ: Duracin de tubos de nen X(horas) Xm 300-400 400-500 500-600 600-700 700-800 350 450 550 650 750 F 2 6 10 8 4 30

Grficos de tallo y hoja: es una forma rpida de obtener una representacin visual ilustrativa del conjunto de datos, para construir un diagrama de tallo y hoja primero se debe seleccionar uno ms dgitos iniciales para los valores de tallo, el dgito o dgitos finales se convierten en hojas, luego se hace una lista de valores de tallo en una columna vertical. Prosiguiendo a registrar la hoja por cada observacin junto al valor correspondiente de tallo, finalmente se indica las unidades de tallos y hojas en algn lugar del diagrama, este se usa para listas grandes y es un mtodo resumido de mostrar los datos, posee la desventaja que no proporciona sino los datos, y no aparece por ningn lado informacin sobre frecuencias y dems datos importantes. Ej: realice un diagrama de tallo y hoja para los siguientes datos de distancias en yardas de una cancha de golf 6435 6464 6433 6470 6526 6527 6506 6583 6605 6694 6614 6790 6770 6700 6798 6770 6745 6713 6890 6870 6873 6850 6900 6927 6936 6904 7051 7005 7011 7040 7050 7022 7131 7169 7168 7105 7113 7165 7280 7209

Diagramas de barras: nombre que recibe el diagrama utilizado para representar grficamente distribuciones discretas de frecuencias no agrupadas. Se llama as porque las frecuencias de cada categora de la distribucin se hacen figurar por trazos o columnas de longitud proporcional, separados unos de otros. Existen tres principales clases de grficos de barras: Barra simple: se emplean para graficar hechos nicos Barras mltiples: es muy recomendable para comprar una serie estadstica con otra, para ello emplea barras simples se distinto color o tramado en un mismo plano cartesiano, una al lado de la otra Barras compuestas: en este mtodo de graficacion las barras de la segunda serie se colocan encima de las barras de la primera serie en forma respectiva.

El diagrama de barras proporciona informacin comparativa principalmente y este es su uso principal, este diagrama tambin muestra la informacin referente a las frecuencias Ej: CIUDAD A B C TEMPERATURA 12 18 24

TIENDA A B

Enero 800 700

Febrero Marzo 600 500 700 600

abril 900 1000

mayo 1100 900

Junio 1000 1200

Histogramas: Se emplea para ilustrar muestras agrupadas en intervalos. Esta formado por rectngulos unidos a otros, cuyos vrtices de la base coinciden con los limites de los intervalos y el centro de cada intervalo es la marca de clase, que representamos en el eje de las abscisas. La altura de cada rectngulo es proporcional a la frecuencia del intervalo respectivo. Esta proporcionalidad se aplica por medio de la siguiente formula Altura del rectngulo = frecuencia relativa/longitud de base El histograma se usa para representar variables cuantitativas continuas que han sido agrupadas en intervalos de clase, la desventaja que presenta que no funciona para variables discretas, de lo contrario es una forma til y practica de mostrar los datos estadsticos. EJ: X 118-126 126-134 134-142 142-150 150-158 158-166 166-174 174-182 Xm 122 130 138 146 154 162 170 178 F 2 3 8 12 7 5 2 1 40

Diagramas de caja o boxplots: los pasos para construirlo son los siguientes: dibujar y marcar un eje de medida horizontal construir un rectngulo cuyo borde izquierdo esta arriba del cuarto inferior y cuyo borde derecho esta arriba del cuarto superior dibujar un segmento de recta vertical dentro de la caja arriba de la mediana prolongar rectas desde cada extremo de la caja hasta las observaciones ms lejanas que estn todava a menos de 1.5fs de los bordes correspondientes dibujar un circulo abierto para identificar cada observacin que caiga entre 1.5fs y 3fs del borde al cual esta ms cercano estas se llaman puntos inusuales suaves dibujar un circulo de lnea llena para identificar cada observacin que caiga a mas de 3fs del borde ms cercano, estas se llaman puntos inusuales extremos donde fs= cuarto superior cuarto inferior este diagrama se usa cuando se necesita la mayor informacin acerca de la distribucin de los datos, la ventaja que posee con respecto a los dems diagramas es que este grfico posee caractersticas como centro y dispersin de los datos, y la principal desventaja que posee es que no presenta ninguna informacin acerca de las frecuencias que presentan los datos EJ: Para los siguientes datos realice un diagrama de caja: 2.68 3.06 4.31 4.71 5.71 5.99 6.06 7.04 7.17 7.46 7.50 8.27 8.42 8.73 8.84 9.14 9.19 9.21 9.39 11.28 15.19 21.06

Grficos de sectores: es un grfico que se basa en una proporcionalidad entre la frecuencia y el ngulo central de una circunferencia, de tal manera que a la frecuencia total le corresponde el ngulo central de 360. Para construir se aplica la siguiente formula: X = frecuencia relativa * 360/ frecuencia relativa Este se usa cuando se trabaja con datos que tienen grandes frecuencias, y los valores de la variable son pocos, la ventaja que tiene este diagrama es que es fcil de hacer y es entendible fcilmente, la desventaja que posee es que cuando los valores de la variable son muchos es casi imposible o mejor dicho no informa mucho este diagrama y no es productivo, proporciona principalmente informacin acerca de las frecuencias de los datos de una manera entendible y sencilla. EJ: Representar mediante un grfico de sectores la frecuencia con que aparece cada una de las cinco vocales en el presente prrafo: Vocal a e 20 i 4 o 6 u 3 46

Frecuencia 13

2.2 grficos bivariados: Para trabajar los diagramas de dispersin, primero debemos saber que es el anlisis estadstico bivariable y las ventajas que este tiene El anlisis estadstico bivariable es aquel anlisis que opera con datos referentes a dos variables y pretende descubrir y estudiar sus propiedades estadsticas. El anlisis estadstico bivariable se orienta fundamentalmente a la normalizacin de los valores o frecuencias ce los datos brutos, determina la existencia, direccin y grado de la variacin conjunta entre las dos variables, lo que se realiza mediante l calculo de los coeficientes de correlacin pertinentes, calcula la covarianza o producto de las desviaciones de las dos variables en relacin a sus medias respectivas y por ultimo establece la naturaleza y forma de la asociacin entre las dos variables en el caso de las variables de intervalo.

Diagrama de dispersin: es un diagrama que representa grficamente, en un espacio de ordenadas, los puntos de dicho espacio que corresponden a los valores correlativos de una distribucin bivariante conjunta, estos diagramas deben usarse cuando tenemos un anlisis estadstico bivariable, sea una tabla de datos de doble entrada, la ventaja que tienen es que se puede graficar de una forma sencilla una distribucin bivariante conjunta y la desventaja principal es que no funciona si sucede que una dupla se repita EJ: X A B C D E 2 4 5 3 2 Y 3 1 4 6 8

También podría gustarte