Está en la página 1de 32

ING.

Nstor Gutirrez Reyes


~1~

ndice
Hoja de presentacin del alumno...3

Conceptos de estadstica, poblacin, muestra y obtencin de datos estadsticos.4 y 5

Medidas de tendencia central...6

Medidas de dispersin...9

Tabla de distribucin de frecuencia.....10

Cuartiles...11

Grficos....12

Cajas y alambres... 14

Diagrama de Pareto...16

Ejercicios realizados en clase y de tarea.....18 Reflexiones..30 Resumen de sierre.31 rea de evaluacin del profe....33

~2~

Presentan juicios de evaluacin acerca del desempeo integral, valoran el logro de objetivos y el desarrollo de competencias y establecen metas futuras de desarrollo personal y profesional .

Conceptos Qu es la estadstica?
ESTADSTICA es el arte de realizar inferencias y sacar conclusiones a partir de datos Imperfectos. Los datos son generalmente imperfectos en el sentido que aun cuando posean informacin til no nos cuentan la historia completa. Es necesario contar con mtodos que nos permitan extraer informacin a partir de los datos observados para comprender mejor las situaciones que los mismos representan.

Estadstica descriptiva
La estadstica descriptiva es un conjunto de procedimientos que tienen por objeto presentar masas de datos por medio de tablas, grficos y/o medidas de resumen. De acuerdo a lo anterior, la estadstica descriptiva es la primera etapa a desarrollar en un anlisis de informacin.

~3~

POBLACIN
Total de sujetos o unidades de anlisis de inters en el estudio

MUESTRA
una medida resumen calculada sobre la muestra

Obtencin de datos estadsticos

~4~

Medidas de tendencia central


Media Media ponderada. Media geomtrica. Media armnica.


~5~

Mediana. Moda.

La media aritmtica es el valor obtenido por la suma de


todos sus valores dividida entre el nmero de sumandos. Por ejemplo, las notas de 5 alumnos en una prueba: nio 1 2 3 cantidad 4 5 nota 6,0 Primero, se suman las notas: 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6 3,1 Luego el total se divide entre la de alumnos: 7,0 27,6/5=5,52 6,1

Media ponderada
La media ponderada es una medida de tendencia central, que es apropiada cuando en un conjunto de datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los dems datos. Se obtiene del cociente entre la suma de los productos de cada dato por su peso o ponderacin y la suma de los pesos

Ejemplo
Datos: Pesos: Media Ponderada:

~6~

Media geomtrica
En matemticas y estadstica, la media geomtrica de una cantidad arbitraria de nmeros (por decir n nmeros) es la raz n-sima del producto de todos los nmeros, es recomendada para datos de progresin geomtrica, para promediar razones, inters compuesto y nmeros ndices

EJEMPLO

Por ejemplo, la media geomtrica de 2 y 18 es Otro ejemplo, la media de 1, 3 y 9 sera

La media armnica,
Denominada H, de una cantidad finita de nmeros es igual al recproco, o inverso, de la media aritmtica de los recprocos de dichos valores y es recomendada para promediar velocidades.

MEDIANA
Es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que stos estn ordenados de menor a mayor.7

~7~

EJEMPLO
la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana

Moda
es el valor con una mayor frecuencia en una distribucin de datos.

Las medidas de dispersin,


Tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.

~8~

Rango estadstico
El rango o recorrido estadstico es la diferencia entre el valor mximo y el valor mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con R. Requisitos del rango

Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo

Ejemplo
Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de:

Medio rango o Rango medio


El medio rango o rango medio de un conjunto de valores numricos es la media del menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia, el medio rango es:

Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente frmula sera:

~9~

Es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media)

TABLA DE DISTRIBUCION DE FRECUENCIA

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q 2 coincide con la mediana.

~ 10 ~

Clculo de los cuartiles 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresin

. Nmero impar de datos 2, 5, 3, 6, 7, 4, 9

Nmero par de datos 2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.

L i es el lmite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. F i-1 es la frecuencia acumulada anterior a la clase del cuartil. a i es la amplitud de la clase.

~ 11 ~

Grficos estadsticos Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente los hechos esenciales y compararlos con otros.

Tipos de grficos estadsticos


Barras Lneas Circulares reas Cartogramas Mixtos Histogramas Otros Dispersograma Pictogramas

CAJAS Y ALAMBRES
La grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los cuartiles primero y

~ 12 ~

tercero (recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier dato o caso que no se encuentre dentro de este rango es marcado e identificado individualmente EJEMPLO DISTRIBUCIN DE EDADES Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas. 36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS Para calcular los parmetros estadstico, lo primero es ordenar la distribucin 20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor y el siguiente: Q1=(24 + 25) / 2 = 24,5 Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguiente: me= Q2 = (33 + 34)/ 2 =33,5 Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3N / 4 = 15, resulta Q2=(39 + 39) / 2 = 39

~ 13 ~

DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1) La primera parte de la caja a (Q1, Q2), La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por (Q3, Xmx).

El diagrama de Pareto, tambin llamado curva 80-20 o Distribucin C-AB, es una grfica para organizar datos de forma que estos queden en orden descendente, de izquierda a derecha y separados por barras. Permite, pues, asignar un orden de prioridades. El diagrama permite mostrar grficamente el principio de Pareto (pocos vitales, muchos triviales), es decir, que hay muchos problemas sin

~ 14 ~

importancia frente a unos pocos graves. Mediante la grfica colocamos los "pocos vitales" a la izquierda y los "muchos triviales" a la derecha. El diagrama facilita el estudio de las fallas en las industrias o empresas comerciales, as como fenmenos sociales o naturales psicosomticos, como se puede ver en el ejemplo de la grfica al principio del artculo. Hay que tener en cuenta que tanto la distribucin de los efectos como sus posibles causas no es un proceso lineal sino que el 20% de las causas totales hace que sean originados el 80% de los efectos. El principal uso que tiene el elaborar este tipo de diagrama es para poder establecer un orden de prioridades en la toma de decisiones dentro de una organizacin. Evaluar todas las fallas, saber si se pueden resolver o mejor evitarlas

~ 15 ~

~ 16 ~

MEDIDAS DE VOLTAJE REALIZADAS EN CASA DURANTE 10 DIAS DOS VECES AL DIA


FECHA DIA VOLTAJE MAANA NOCHE HORA MAANA NOCHE AM PM 19:00 07:00 19:00 07:00 19:00 07:00 19:00 07:00 19:00 07:00 19:00 07:00 19:00 07:00 19:00 07:00 19:00 07:00 19:00

28/01/13 29/01/13 30/01/13 31/01/13 01/02/13 02/02/13 03/02/13 04/02/13 05/02/13 06/02/13

LUNES MARTES MIERCOLES JUEVES VIERNES SABADO DOMINGO LUNES MARTES MIERCOLES

123.7 V 123.1 V 122.1 V 122.8 V 119.7 V 123.1 V 119.6 V 123.3 V 122.9 V

122.0 122.6 123.3 122.5 121.1 119.4 122.5 119.3 121.6 122.5

V V V V V V V V V V

-Media -Mediana -Moda -Cuartil 1 -Cuartil 2 -Cuartil 3 -Varianza muestral y desviacin estndar -Valor mnimo -Valor mximo -Lmite inferior -Lmite superior -Diagrama de cajas y alambres

~ 17 ~

Ordenacin de menos a mayor


# 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Volt 119.3 119.4 119.6 119.7 121.1 121.1 121.6 122 122.5 122.5 122.5 122.5 122.6 122.8 123.1 123.1 123.3 123.3 123.7

X=

+
N

+ +

119.3+119.4+119.6+119.7+121.1+121.1 121.6+122.0+122.5+122.5+122.5+122.5 122.6+122.8+123.1+123.1+123.3+123.3+123.7 19


~ 18 ~

2315.7 121.878947 19

MEDIANA

MODA

~ 19 ~

Cuartil 1 = Q 1 = 25 (N + 1) /100
Q 1 = 25(19+1)/100= 5 Q 1 =121.1 + (121.1-121.9) 0.5 Q 1 =121.1 + (0.8) 0.5 Q 1 =121.1 + 0.4 Q 1 =121.4

Cuartil 2 =

Q2

50 (N + 1) /100

Q 2 = 50(19+1)/100= 10 Q2 = Q2 = Q2 = Q2 = 122.5 + (122.5 121.9) 0.5 122.5 + (0.6) 0.5 122.5 + (0.3) 122.8 Q3 75 (N + 1) /100

Cuartil 3 =

Q 3 = 75(19+1)/100= 15 Q3 = Q3 = Q3 = Q3 = 123.1 + (123.1-121.9) 0.5 123.1 + (1.2) 0.5 123.1 + (0.6) 123.7

~ 20 ~

2 2 2 2 2

2 2 2 2 2

2 2 2 2 2 2

2 2

19 (2.6) 2 +(2.5) 2+(2.3) 2+(2.2) 2+(0.8) 2+(0.8) 2+(0.3) 2+(0.1) 2+(0.6) 2 (0.6) 2 +(0.6) 2+(0.6) 2+(0.7) 2+(0.9) 2+(1.2) 2+(1.2) 2+(1.4) 2+(1.8) 2 19 2 (21.2) 19 = 23.65 119.3 123.7 2.3 Q 1 - 1.5 (IQR) =121.4-1.5= 119.9 Q 3 + 1.5. (IQR) = 123.7-1.5=122.2

~ 21 ~

Diagrama de cajas y alambres


Limite Superior = 122.2

Valor mximo = 123.7

Q3 = 123.1

Q2 = 122.8

Q1 = 121.4

Valor mnimo = 119.3

Lmite inferior= 119.9

~ 22 ~

Actividad 3 realizado por equipo de cuatro integrantes juntando todos los voltajes medidos para sacar: -Cuartil 1 -Cuartil 2 -Cuartil 3 110.7, 119.7, 123.2, 125.3, 126.3, 127.3, 128.9, 110.9, 120.9, 123.3, 125.3, 126.4, 127.4, 129.1, 111.4, 114.8, 115.4, 115.6, 117.7, 117.8, 118.8, 118.9, 121, 121.6, 122.1, 122.1, 122.5, 122.8, 123.1, 123.1, 123.3, 123.5, 123.6, 123.6, 123.7, 124, 124.4, 124.5 , 125.3, 125.5, 125.6, 125.6, 125.7, 125.7, 125.8, 125.9, 126.4, 126.5, 126.5, 126.5, 126.9, 127, 127.3, 127.3, 127.5, 127.6, 127.9, 128.1, 128.6, 128.7, 128.8, 128.9, 129.4, 129.6, 134, 135, 135.3.

Q1 = 25(n+1) 100 = Q1 = 25 (67 + 1) 100 = 17 Q1 = Q1 = Q1 = Q1 = 122.1 + (122.5 122.1) 0.5 122.1 + (0.4) 0.5 122.1 + 0.2 122.3 Q2 = 50(n+1) 100 = Q2 = 50(67+1) 100 = 34 Q2 Q2 Q2 Q2 = = = = 125.3 + (125.5-125.3) 0.5 125.3 + (0.2) 0.5 125.3 + 0.1 125.4

Q2 = 75(n+1) 100 = Q3 = 50(67+1) 100 = 51 Q3 = Q3 = Q3 = Q3 = 127.3 + (127.4-127.3) 0.5 127.3 + 0.1) 0.5 127.3 + 0.05 127.35 ~ 23 ~

110.7 135.3 127.35 122.3=5.05 Q 1 - 1.5 (IQR) =122.3-1.5=120.8 Q 3 + 1.5. (IQR) = 127.35-1.5=125.85

Diagrama de cajas y alambres


Limite Superior = 125.85

Valor mximo = 135.3

Q3 = 127.35

Q2 = 125.4

Q1 =122.3

Valor mnimo = 110.7

~ 24 ~

Lmite inferior= 120.8

Actividad 3 Datos dictados de la medicin de voltaje por el docente realizados por un compaero:
119 , 119 , 119 , 119.1 , 119.3 , 119.3 , 119.5 , 119.5 , 119.7 , 119.8 , 120.2 , 120.5 , 122 , 122.1 , 122.1 , 122.1 , 122.1 , 122.2 , 122.2 , 122.2 , 122.3 , 123.1 , 123.1 , 123.1 , 123.4

-Cuartil 1 -Cuartil 2 -Cuartil 3 -Valor mnimo -Valor mximo -Lmite inferior -Lmite superior -Diagrama de cajas y alambres Q1 = 25 (N+1) 100= Q1 = 25 (25+1) 100 = 6.5 Q1 = 119.7 + (119 119.7) 0.5 Q1 = 119.7 + (-0.7) 0.5 Q1 = 119.7 + (-0.35) Q1 = 119.3 Q2 = 50 (N+1) 100= Q2 = 50 (25+1) 100=13 Q2 = 122 + (122.1 -122) 0.5 Q2 = 122 + (0.1) 0.5 Q2 = 122 + 0.05 Q2 = 122.0 Q3 = 75 (N+1) 100= ~ 25 ~

Q3 = 75 (25+1) 100= 19.5 Q3 = 122 IQR: Q3- Q1 122-119.3 = 2.9 Lmite inferior: Q1 1.5 (IQR) = 114.95 Limite Superior: Q3 + 1.5 (IQR) = 126.55 Valor mnimo: 119 Valor mximo: 123.4 Diagrama

de cajas y alambres
LS= 126.53
Valor maximo=123.4

Q3= 122.2 Q2= 122

Q1 = 119.5 Valor mnimo = 119 Lmite Inferior= 114.95 ~ 26 ~

Problema 1 En una planta donde se fabrican resistencias elctricas, se tiene un desperdicio del 15% de la produccin mensual, entre las muchas posibles causas se determina lo siguiente: De un total de 70 entrevistados, 14 presentan problemas de actitud, 20 falta de experiencia, 10 falta de conocimiento, 25 falta de supervisin y 1 falta de trabajo en equipo. Falta de supervisin Falta de experiencia Actitud Falta de conocimiento Falta de trabajo en equipo TOTAL 25 20 14 10 1 70

FRECUENCIA RELATIVA 0.3571 0.2857 0.2 0.1428 0.01428

RECUENCIA ACUMULADA 0.3571 0.6428 0.8428 0.9856 1

~ 27 ~

DIAGRAMA DE PARETO
1.2 120.00%

100.00%

0.8

80.00%

FRECUENCIA RELATIVA 0.6 60.00% % acumulado RECUENCIA ACUMULADA

0.4

40.00%

0.2

20.00%

0 1 2 3 4 5

0.00%

~ 28 ~

REFLEXIONES DE LO QUE APRENDI Reforc los conocimientos que ya traa de la prepa, aprend cosas nuevas como lo que es un cuartil y como se calcula as como sacar los que es caja y alambre y por ultimo a hacer un diagrama de Pareto en Excel No me he aprendido de memoria todas las formulas pero leyndolas puedo desarrollarlas.

~ 29 ~

Resumen de sierre
Estadstica descriptiva es aquella parte de la ciencia estadstica que tiene por objeto describir y analizar un determinado colectivo sin pretender sacar conclusiones de tipo ms general. La Estadstica Inductiva, es aquella parte de la ciencia estadstica que, basndose en los resultados obtenidos del anlisis de una muestra de la poblacin, infiere, induce o estima las leyes de comportamiento de la poblacin a la cual pertenece la muestra. Poblacin o universo: es la totalidad de elementos, personas o cosas cuyas caractersticas se trata de estudiar La Muestra Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla, esta es una coleccin de algunos elementos de la poblacin, pero no de todos. El censo: es aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. Encuesta: son las observaciones realizadas por muestreo, es decir son observaciones parciales. Variables: Es la caracterstica que estamos midiendo. Existen dos categoras o tipo de variables: Variable cualitativa: Es aquella que expresa un atributo o caracterstica, ejemplo: Rubio, moreno, etc. Variable cuantitativa: Es aquella que podemos expresar numricamente: edad, peso, n. de hijos, etc. Frecuencia absoluta: Llamaremos as al nmero de repeticiones que presenta una observacin. Se ~ 30 ~

Frecuencia relativa: Es la frecuencia absoluta dividida por el nmero total de datos, se suele expresar en tanto por uno, siendo su valor isimo En estadstica se utiliza las representaciones grafica como lo son Diagrama de barras: se utiliza para frecuencias absolutas o relativas, acumuladas o no, de una variable discreta Histograma: Igual que el anterior en cuanto al tipo de frecuencias que se pueden utilizar. La diferencia que es para las variables continuas. Diagrama de escalera: se utiliza para frecuencias acumuladas Pictograma: que se suele utilizar para expresar un atributo Polgono de frecuencias, es la recta que une los extremos de las variables de

~ 31 ~

AREA DE EVALUCION DEL PROFESOR


OBSERVACIONES:

~ 32 ~