Está en la página 1de 36

UNIDAD ACADEMICA Nº 01

Nombre de la Unidad: Estadística Descriptiva

Introducción.
La Estadística es la ciencia encargada de recolectar, organizar, resumir e
interpretar datos de un proyecto o estudio, en los últimos años ha cobrado gran
relevancia en todas las disciplinas ya que suministra los mejores instrumentos en
el propósito de toda investigación cuyo fin es el de probar mediante la observación
de los hechos empíricos la implicación teórica que establecemos entre los
mismos.

Objetivo General de la Unidad: Instruir al estudiante en definiciones, escalas de


medición, procesamiento de una encuesta, manejo y interpretación de variables
cualitativas y cuantitativas.

Objetivos Específicos de la unidad:


 Realizar una breve descripción del método científico y el papel de la
estadística en toda investigación.
 Establecer la secuencia en la elaboración de un instrumento de medición
“encuesta” su procesamiento resumen e interpretación de datos
cualitativos.
 Definir, calcular e interpretar medidas: De tendencia central, dispersión,
sesgo y curtosis.

RESUMEN

En ciencias e Ingeniería la estadística juega un papel fundamental ya que a


partir de mediciones y datos se toman decisiones en un proceso, es por
esto que el ingeniero civil necesita de estadísticos en una muestra o
parámetros si se dispone de un censo; también es importante resaltar que
la estadística brinda elementos básicos para un proceso de investigación
científica.

GLOSARIO
Población: Cuando se dispone de todos los elementos de un objeto de
estudio (Censo)
Muestra: Subconjunto de la población.
Marco de Muestreo: Listado de unidades muéstrales de la población.

Página 1 de 36
Variable : Característica que al ser medida en diferentes individuos adopta
resultados heterogéneos.
Estadístico: Medida cuantitativa de una muestra cuyo objetivo es inferir
acerca de la población objetivo.
Parámetro : Medida cuantitativa de una población.

Desarrollo temático.
1.1 El método científico y conceptos básicos en estadística.
1.2 Recolección, organización, resumen e interpretación en variables cualitativas,
pictogramas y tablas de contingencia.
1.3 Resumen e interpretación en variables cuantitativas, histogramas , diagramas
de tallos y hojas , diagrama de caja y bigotes ,
1.4 Medidas de tendencia central
1.5 Medidas de dispersión
1.6 Sesgo y curtosis .
1.7 Autoevaluación
1.7 Referencias bibliográficas

Página 2 de 36
UNIDAD 1: Estadística Descriptiva

1.1 El método científico y conceptos básicos en estadística.

La estadística es la ciencia que recolecta, organiza resume e interpreta datos de


un estudio o proyecto especifico, iniciaremos con los conceptos y metodologías de
la investigación científica.

El problema 1

La investigación científica inicia cuando se ha obtenido cierta cantidad de


conocimiento, pero de dicho conocimiento hay algo que no sabemos. Puede
deberse a que no tengamos la información suficiente para contestar la pregunta o
bien , que la información que tenemos se halle en un estado de desorden que no
podemos relacionarla adecuadamente con el problema.

Fuentes del problema

Los problemas surgen por tres posibles causas : primera , Una laguna en el
conocimiento, segundo, resultados contradictorios y tercero explicación de hechos.

Características de los problemas

Los problemas deben ser resolubles y sus repuestas verificables es decir es


posible determinar si la proposición es verdadera o falsa a partir de la evidencia
tomada y es posible determinar el grado de probabilidad de esta.

Implicación de los problemas

Todos los problemas se inician por una pregunta que debe tener los siguientes
componentes: Una descripción ( El que) , Unas discriminación ( El cual ) , un
registro histórico y bibliográfico (El cuándo y dónde hay información ) , El proceso (
Como se puede resolver) , la explicación (el por que) y una aplicación (el para
que).

Si se plantea correctamente el problema de investigación se tiene una gran


proporción de éxito en la investigación que se emprenda.

Tomado de: Psicología experimental enfoque metodológico, F.J. Mc Guigan ,


Editorial trillas México 1971

Página 3 de 36
Conceptos Básicos en Estadística.

Una vez formulado el problema nos enfrentamos a la toma de la evidencia que


ratifique o invalide mi hipótesis (proposición o conjetura acerca de una o más
poblaciones) , si es posible acceder a todos los elementos del objeto de estudio se
dice que tenemos un censo , en general no es fácil y a veces imposible tener
acceso todos los elementos de la población , por lo que en general se toma una
muestra ( subconjunto de la población) con el ánimo de inferir acerca de la
población.

En el siguiente documento se hace una explicación detallada del muestreo sus


objetivos , fases y ventajas:
http://www.slideshare.net/emmanuelbuap/muestreo-15361912

Variables en Estadística.

Podemos definir como variable, una característica que al ser medida en diferentes
elementos (individuos o cosas) se obtienen valores diferentes.

Tipos de Variables:

Se tiene básicamente dos : Cualitativas que son aquellas que no se les puede
asignar valor numérico y Cuantitativas en las cuales su escala de medición es
numérica. En el siguiente cuadro sinóptico se describen los tipos de variables
según su clasificación:

Página 4 de 36
  No min al : No hay diferencia s entre sus clases (opciones que toma la var iable )
  Ejemplos : EstadoCivil , Raza, genero, etc
 
 Ordinal : Existe una jerarquia entre las clases
 
Cualitativ as  Ejemplo : Estructura organica de la iglesia : Papa , arsovisposovispos,
 
 sacerdotes.
  Razon : Se le asigna una escala de medicion a las clases
 
  Ejemplo : En una escala de 0 a 100 establesca su gusto por las suguientes
 bebidas Coca cola y Colombiana


Variables 

  Discretas : Son aquellas que toman valores enteros
  Ejemplo : Numero de hijos

Cuantitati vas
 Continuas : Son aquellas que toman los reales
  Ejemplo : Estatura , Fuerza, Re sistencia en P.S .I .






1.2 Recolección, organización, resumen e interpretación en variables


cualitativas

Ejercicio de aplicación de un proyecto descriptivo de opinión

Problema
¿Existe una relación entre la actitud y aptitud con el desempeño académico en
Matemáticas?

Población Objetivo
Estudiantes de ingeniería Universidad Piloto de Colombia Grupo 15 de
Probabilidad 2013-1.

Variables Independientes
Actitud: Definida de modo básico como el gusto por una actividad
Aptitud: Del latín “ aptus = capaz para” en el lenguaje común la aptitud se refiere a
la capacidad de una persona para realizar adecuadamente una tarea, en
psicología engloba tanto capacidades cognitivas como procesos.
Para la valoración de estas variables se empleara como instrumento de medición
una encuesta

Variable Dependiente
Desempeño académico en Matemáticas.

Página 5 de 36
Objetivo General
Realizar un diagnostico de las posibles causas de la mortalidad académica en
Matemáticas con el fin de formular planes de acción y prevención.

Objetivos específicos
 Recopilar, organizar y resumir información del desempeño académico y del
gusto por la matemáticas
 Realizar una encuesta donde se trate de medir las causas de la mortalidad
académica.
 Con base a los resultados obtenidos, formular planes de acción y
socializarlos con los docentes de las asignaturas.

Referentes teóricos2:

Actitud
 “En esencia, las actitudes son percepciones acerca de las personas, las
cosas o los hechos ambientales; asimismo, en la medida en que dirigen la
conducta, tienen cualidades motivacionales. Al definir las actitudes debe
tomarse en cuenta, fundamentalmente, el modo en que “disponen” al
individuo para que conciba el mundo y reaccione ante él de determinadas
maneras”. Los expertos en psicología mencionan por lo menos cuatro
componentes para las actitudes. Así, una actitud hacia la matemática que
refleje aprecio e interés por esta ciencia, hace referencia a una componente
afectiva de la actitud hacia esta disciplina. Mientras que referencias hacia la
organización, modo de empleo de las capacidades generales y hábitos de
trabajo hacia esta disciplina, evidencian un componente cognitivo de la
actitud hacia las matemáticas.
 Desde los comienzos de la psicología social, en 1924, se han propuesto
muchas definiciones para el termino actitud, desde las mas simples, como
la enunciada por Bem en 1972, como “lo que gusta y lo que no gusta”,
hasta las mas elaboradas: “como medio de la experiencia, que ejerce una
influencia rectora o dinámica en la respuesta del individuo a todos los
objetos y situaciones con los que se relaciona”, dada por Allport (1935);
pasando por definiciones variadas que obedecen a los momentos históricos
de la psicología

Página 6 de 36
Medición de actitudes
La actividad científica durante los años 1920 y 1940, inspirada en el modelo
experimental de la física, hizo que los científicos sociales asumieran como único
procedimiento para validar el conocimiento las reglas metodológicas de esta
corriente. Esta tendencia cuantificadora, el uso de las encuestas y el aumento de
las investigaciones psicológicas llevaron al desarrollo de las escalas de actitud
como un instrumento en la medición de actitudes.

Escalas de actitud
Elejabarrieta e Iñiguez, 1984, se pueden definir técnicamente como: Instrumentos
de medición que permiten acercarse a la variabilidad afectiva de las personas
respecto a cualquier objeto psicológico.

Tipos de Escala
Clásicamente se consideran 3 tipos de escalas:
 Escalas tipo Thurstone
La consideración en 1928 de Louis Thurstone: de la opinión como un
indicador indirecto de la expresión verbal de la actitud de los sujetos hacia
las cosas, lo llevó a diseñar junto a E. J. Chave, un instrumento para medir
actitudes, conocido hoy en día como escala de actitud tipo Thurstone. En
esta escala se presenta a una muestra representativa de la población una
serie de enunciados que, se cree, son pertinentes para medir el grado de
acuerdo/desacuerdo, favorabilidad/desfavorabilidad hacia cierto objeto; es
decir los sujetos no expresan su opinión sino que manifiestan su grado de
favorabilidad a cada enunciado.
 Escala tipo Likert
En 1932, Likert plantea un proceso de elaboración más breve y sencillo que
Thurstone; su técnica acepta expresamente que las actitudes pueden
medirse a través de manifestaciones verbales. Los individuos pueden
situarse en la variable de actitud desde el polo más favorable al más
desfavorable, de tal manera que la variación de las respuestas será debida
a diferencias individuales de los sujetos.
 Thurstone – Likert
Considerando las respuestas: En las escalas Thurstone se pide a los
sujetos que emitan sus respuestas con dos alternativas Si/No; mientras
que, en Likert se presentan distintas alternativas desde la más favorable a
la más desfavorable. Los modelos más habituales varían entre dos y siete
respuestas, siendo el número más común el de cinco.
Desde el punto de vista de la medición: La técnica Likert asume un nivel de
medida ordinal, mientras Thurstone considera una escala de intervalo.

Página 7 de 36
En la actualidad, de entre las múltiples técnicas de observación que se conocen
(entrevistas, cuestionarios, test proyectivos, observaciones de la conducta, etc.), el
instrumento de medida de actitudes es la escala de actitud, porque como indica
Gairín 1987, presentan las ventajas que citamos a continuación:
 Permiten el anonimato.
 Proporcionan tiempo al encuestado para pensar acerca de
 las respuestas antes de responder.
2
Tomado
de:http://ima.usergioarboleda.edu.co/pelusa/pelusa%282%29/documento
s/Cursillo_Cali.pdf

APTITUD.

La aptitud o "facultad" (del latín aptus = capaz para), en psicología, es cualquier


característica psicológica que permite pronosticar diferencias interindividuales en
situaciones futuras de aprendizaje. Carácter o conjunto de condiciones que hacen
a una persona especialmente idónea para una función determinada.

Mientras que en el lenguaje común la aptitud sólo se refiere a la capacidad de una


persona para realizar adecuadamente una tarea, en psicología engloba tanto
capacidades cognitivas y procesos como características emocionales y de
personalidad. Hay que destacar también que la aptitud está estrechamente
relacionada con la inteligencia y con las habilidades tanto innatas como adquiridas
fruto de un proceso de aprendizaje.

JUSTIFICACION

Para el ingreso a un programa de ingeniería generalmente no se abordan


exámenes de actitud y aptitud en Matemáticas, motivo por el cual algunos
estudiantes con dificultades en estas dos variables ,presentaran un bajo
rendimiento situación que puede originar deserción.

PROCEDIMIENTO

 Se realizara una encuesta a la población objetivo con escalas de medición


que traten de identificar y validar el proyecto.
 En la encuesta se tuvieron en cuenta las siguientes variables de
agrupación: Sexo ( Femenino, Masculino) , Estudio en Colegio ( Oficial ,
Privado)

 Para la medición de aptitudes y actitudes se tuvieron en cuenta : escalas


Thurstone – Likert ,con el objeto de que en las escalas Thurstone se pide a
los sujetos que emitan sus respuestas con dos alternativas Si/No; mientras

Página 8 de 36
que, en Likert se presentan distintas alternativas desde la más favorable a
la más desfavorable. Las de tipo Likert fueron: Como fue su desempeño
académico ( notas) para las matemáticas durante el bachillerato ( Bueno ,
Regular, Malo) y Como ha sido su desempeño académico ( notas) para las
matemáticas desde su ingreso a la facultad ( Bueno , Regular, Malo) . Las
de tipo Thurstone fueron: Le gustaron las matemáticas durante el
bachillerato ( si, no) y Le han gustado las matemáticas en la Universidad ( si
, no)
 Para la verificación de la variable de respuesta se trabajo con una escala
Thurstone : Considera usted que debido a las anteriores razones se da el
bajo desempeño en matemáticas en los estudiantes de su facultad ( si , no)
 Una vez aplicado el instrumento se organizo la información en una base de
datos así:

Página 9 de 36
 Nota : Se codificaron las clases asi: Sexo : Femenino 1 , Masculino 2;
Estudio en colegio: Privado 2, Publico 1 ; Como fue su desempeño
académico ( notas) para las matemáticas durante el bachillerato ( Bueno
“1” , Regular “2”, Malo”3”) ; Como ha sido su desempeño académico (
notas) para las matemáticas desde su ingreso a la facultad (Bueno “1” ,
Regular “2”, Malo”3”) ; Le gustaron las matemáticas durante el bachillerato (
si “1”, no”2”) y Le han gustado las matemáticas en la Universidad ( si”1” ,
no”2”) y por ultimo: Considera usted que debido a las anteriores razones se

Página 10 de 36
da el bajo desempeño en matemáticas en los estudiantes de su facultad ( si
“1”, no “2”)

Resumen de las variables de agrupación

El resumen en este tipo de variables se realiza mediante una tabla de


distribución de frecuencias así:

Por ejemplo en el sexo

Clase Frecuencia Absoluta Frecuencia Relativa


Femenino 12 (12/36)*100=33%
Masculino 24 (24/36)*100=67%
Sumatoria Σ= 36

Un grafico puede ser el pictograma en forma de pastel

Distribucion por sexo

Femenino
12
33%

Masculino
24
67%

De la misma forma

Distribucion del Grupo por Tipo de


Colegio

Oficial
10
28%

Privado
26
72%

Página 11 de 36
El resumen de las preguntas para todo el grupo fue:
Aptitud
Desmpeño Academico ( Notas)
Desempeño Academico
durante el Bachillerato (Notas) En la Universidad

Malo
Malo
11% 11%

Regular Bueno
31% Bueno Regular 50%
58% 39%

Actitud

Le gustaron las Matematicas Le han gustado las Matematicas


Durante el Bachillerato desde el Ingreso al Programa

No
No
22%
36%

Si Si
64% 78%

Considera usted que debido a las anteriores


razones se da el bajo desempeño en
matemáticas en los estudiantes de su facultad

No
17%

Si
83%

Página 12 de 36
Tablas de Contingencia

Consiste en realizar la relación entre dos o mas variables, por ejemplo si se desea
analizar el desempeño académico en el bachillerato por genero tendríamos:

Como se observa a los hombres les fue un poco mejor en el buen desempeño
(63%) contra las damas ( 50%) .

Página 13 de 36
Tambien podemos analizar la relacion para la pregunta desempeño academico
que han tenido en la universidad por generos .

También podemos concluir que el desempeño de los estudiantes consultados les


ha ido mejor a los hombres con un 58% y las mujeres solamente obtienen un 33 %
en las asignaturas de matemáticas .

Como se observa se pueden obtener muchas tablas de contingencia y de esta


manera se les “pregunta a los datos” con el objeto de analizar y responderse a la
pregunta que sirvió de base para el problema de estudio.

1.3 Resumen e interpretación en variables cuantitativas.

Para la descripción de variables cuantitativas tenemos herramientas como el


histograma, la distribución de frecuencias acumuladas, el diagrama de tallos y
hojas , el esquema de caja y bigotes y las medidas de: tendencia central ,
dispersión , asimetría y curtosis.

1.3.1 Histograma
Se refiere a un diagrama de barras donde se observa la distribución de la variable,
su construcción se ilustrara mediante un ejemplo:

Para la aceptación por parte de la interventoria de una placa de entrepiso se


tomaron muestras que al fallarlas su resistencia a compresión en ( P.S.I) fue:

Página 14 de 36
Primer paso
Se calcula el rango de los datos mediante la diferencia entre el mayor y el menor.

Rango  3074  2395


Rango  679

Segundo Paso
Se establece el numero de clases o intervalos donde se va a distribuir el rango,
existen muchas formas de calcularlo pero en general puede ser a criterio del
profesional que este evaluando, se recomienda que no se exceda de 15 intervalos
de clase así se tengan bastantes observaciones, un criterio aproximado puede ser
la raíz cuadrada del numero de observaciones aproximándola al entero mayor, en
este caso:

n  50
N º deIntervalos  50  7.07107  8
Tercer paso
Establecemos el intervalo de clase, mediante el cociente entre el rango y el
número de intervalos así:

Rango
Intervalo de clase 
N º de Intervalos
679
Intervalo de clase   84,875
8
Cuarto paso
Construimos una tabla de distribución de frecuencias contando los datos de cada
intervalo así:

Página 15 de 36
Nota: Hay que tener en cuenta que por ejemplo en el primer intervalo se deben
contar los datos entre 2395 y 2479 y en el segundo intervalo desde 2480 y 2564 ,
es decir no realizar doble conteo.

El grafico basado en la tabla es:

Histograma
12

10 10
10
9

8
Nº de Muestras

7 7

4
4

2
2
1

Resistencia a la Compresion en (P.S.I)

La línea negra que une los centros de cada clase se denomina polígono de
frecuencias.

Podemos concluir que los mayores porcentajes esta en los rangos de : 2395 a
2564 con un 34% de las cincuenta observaciones y entre 2650 a 2819 tenemos un
38% , es claro que la variable tiene una distribución bastante irregular.

1.3.2 Distribución de frecuencias acumuladas

Es muy similar al histograma la diferencia radica en que se grafica la acumulación


de frecuencias así:

Página 16 de 36
Frecuencia Absoluta Acumulada
60 100%
86% 50
50
74% 78% 43
39
40 37
54%
30 27
34% 36%
17 18
20
20%
10
10

La línea que une las frecuencias acumuladas se llama curva de ojiva.


Una lectura que se puede dar es que el 54% de las muestras están entre 2395 y
2734 P.S.I.

1.3.3 Diagrama de tallos y hojas


Se trata de un grafico que en el tallo se colocan las unidades principales y las
hojas se repiten de acuerdo a las observaciones asi:

Página 17 de 36
Es de anotar que la mayor concentración de datos esta el rango de 2400 y 2473
P.S.I.

1.3.4 Diagrama de caja y bigotes


Consiste en elaborar una caja entre el cuartil uno y el cuartil tres dentro de la caja
se ubica la mediana , y como bigotes los valores mínimo y máximo.

Cuartiles
Se trata de dividir la muestra ordenada en cuatro partes donde la posición para el
primer cuartil es:

n 1
Q1    
 4 4
Donde
n  N º de datos
En este caso
 50 1 
Q1    
 4 4
51
Q1   12,75
4
Es decir entre la posición 12 y 13 la cuarta parte o el primer 25% será (
interpolando):

Página 18 de 36
Por lo tanto el primer 25% de las muestras están entre 2395 y 2533.
El segundo cuartil
n 1
Q2  2 *   
 4 4
Q2  2 *12,75  25,5

El segundo cuartil que también se llama la mediana e indica que el 50% de los
datos está por debajo de este valor y el otro 50% de los datos son mayores.

La mitad de las observaciones están por debajo de 2714.5 (P.S.I) y las muestras
restantes son mayores.

El Tercer cuartil
n 1
Q3  3 *   
 4 4
Q3  3 *12,75  38,25

Página 19 de 36
El 75% de las muestras o las tres cuartas partes de las muestras están entre 2395
y 2852,5.

El diagrama de caja y bigotes será:

La interpretación puede ser: la mayor concentración de datos será donde la caja


sea más estrecha en este caso hay más muestras entre la mediana 2714,5 y
2852,5. También se observa la mayor dispersión de datos entre el tercer cuartil
2852,5 y el valor máximo 3074.

1.4 Medidas de tendencia central

Nos indican un valor representativo de una muestra o población, las principales


son:

Página 20 de 36
1.4.1 Media aritmética o promedio : Se refiere al fiel de la balanza es decir si
colocáramos los datos ordenados del menor al mayor el fulcro es el promedio:

Es la medida de tendencia central mas usada, sus ventajas son: la suma de las
desviaciones ( datos menos la media ) es igual a cero , la media de una muestra
es igual a la media ponderada de las submuestras y la mas importante la suma de
los cuadrados de las desviaciones es mínima , con respecto a otras medidas de
tendencia central , la desventaja : ser muy sensible a valores extremos.

Formula
n

x i
x i 1
n
Donde
x  Media Aritmetica o promedio
xi  Datos
n  Tamaño de la muestra

Página 21 de 36
Ejemplo:
Si tomamos los datos del ejemplo de: Para la aceptación por parte de la
interventoria de una placa de entrepiso se tomaron muestras que al fallarlas su
resistencia a compresión en ( P.S.I) fue:

El promedio es:
50

 3023  2815  2759  ...............  2425


x i 1

50
x  2711.56 P.S .I

Media aritmética para datos agrupados

Si tenemos la distribución de frecuencias también podemos aproximar el promedio


mediante:

x
x c * Fi
n
Donde
x  Media Aritmetica o promedio
xc  Intervalo Medio de clase
Fi  Frecuencia Absoluta
n  Tamaño de la muestra

Ejemplo: Retomando el ejemplo de las resistencias medidas, tendremos:

Página 22 de 36
Frecuencia
Intervalos de Clase XC XC*Fi
Absoluta Fi
2395_2479,875 2437,4375 10 24.374,38
2479,875_2564,75 2522,3125 7 17.656,19
2564,75_2649,625 2607,1875 1 2.607,19
2649,625_2734,5 2692,0625 9 24.228,56
2734,5_2819,375 2776,9375 10 27.769,38
2819,375_2904,25 2861,8125 2 5.723,63
2904,25_2989,125 2946,6875 4 11.786,75
2989,125_3074 3031,5625 7 21.220,94
Σ= 50 135.367,00
20%

135367
x  2707.34
50 14%

Como se observa es similar a la media tomando todos los datos (2711.56) , pero
hay que tener en cuenta que la media de los datos agrupados es una
aproximación a la de desagrupados.

Media Ponderada 4%
2%
A partir del concepto de la media para datos agrupados podemos extenderlo con
esta medida en la que básicamente se le asigna un peso o ponderación a cada
dato.

Formula

x * p i i
xp  i 1

p i

Donde
x p  Media Ponderada
xi  Datos
pi  Ponderacio n o peso para cada dato

Ejemplo :

Página 23 de 36
Para la asignación de una licitación se tendrá en cuenta el proponente que este
más cerca del promedio del pecio propuesto, ponderado con los años de
experiencia certificada en obras similares. Una vez abiertas las propuestas se
tienen los siguientes datos:

AÑOS DE
PROPONENTE PRECIO ( Miles) "xi" EXPERIENCIA xi*pi
"Pi"
Compañía "A" 15328 5 76640
Compañía "B" 13890 8 111120
Compañía "C" 17326 15 259890
Compañía "D" 16280 12 195360
Σ= 40 643010

643010
xp   16075,25
40
La tabla de diferencias

PRECIO ( Miles)
PROPONENTE Dif con la xp
"xi"

Compañía "A" 15328 -747,25


Compañía "B" 13890 -2185,25
Compañía "C" 17326 1250,75
Compañía "D" 16280 204,75

Entonces la compañía a la que se adjudicaría seria la “D” , como se observa no es


precio más alto ni el más bajo , tampoco la que cuenta con más ni menos años de
experiencia , se equilibran ambas variables.

1.4.2 Mediana: Se define como el valor central de los datos ordenados, tenemos
dos situaciones:
20%
a) Si el numero de datos es impar tendremos una sola posición que ocupara la
mediana y se tomara el valor de esta posición.
b) Si el número de datos es par la mediana será ocupada por dos posiciones y se 20%
tomara el promedio aritmético de los valores en dichas posiciones. 18%

La posición se calcula asi: 14%

Página 24 de 36
4%
2%
n 1
P  
 2 2
Donde
n  N º de datos
La ventaja que tiene esta medida de tendencia central es que no se deja sesgar
por valores extremos.

Ejemplo.

Retomando el mismo ejemplo de las resistencias:


1) Calculamos la posición:
 50 1  51
P    25.5
 2 2 2
2) Ordenamos los datos:

Posicion Dato Posicion Dato


1 2395 24 2703
2 2413 25 2714
3 2422 26 2715
4 2425 27 2723
5 2435 28 2737
6 2445 29 2759
7 2454 30 2769
8 2458 31 2770
9 2468 32 2788
10 2473 33 2801
11 2509 34 2806
12 2512 35 2813
13 2540 36 2815
14 2545 37 2816
15 2553 38 2847
16 2561 39 2868
17 2562 40 2909
18 2576 41 2910 Posicion Dato
19 2664 42 2917 47 3040
20 2675 43 2989
21 2679 44 3004
48 3045
22 2696 45 3004 49 3057
23 2702 46 3023 50 3074

Según la posición la mediana estará entre los la datos de la posición 25 y 26


entonces.
2714  2715
Me   2714,5
2

Página 25 de 36
Que se puede interpretar como que el 50% de las muestras están por debajo de
este valor y el restante por encima del mismo.

1.4.3 Moda : También se le denomina modo o valor modal y se define como el


dato que más se repite , presenta grandes desventajas , la más importante es que
puede haber muestras que tengan más de una moda ( bimodal o multimodal) y en
ocasiones se pueden tener modas sumamente sesgadas para tomarla como
valores representativos de la muestra.

Ejemplo:
Con el mismo ejemplo de las resistencias:

M O  3004
Como se aprecia si tomáramos este dato como valor representativo de la muestra
tendría un sesgo altísimo.

1.3.5.4 Media Geométrica: Se define como la raíz enésima del producto de los
datos así:
n
Mg  n
x
i 1
i

Donde
M g  Media geometrica
n  Tamaño de la muestra
  Pr oducto
xi  Datos
Las ventajas que tiene no es muy influenciable por datos extremos y se usa
generalmente cuando los valores que se están trabajado siguen una progresión
geométrica o aproximadamente geométrica, ( por ejemplo el calculo de un valor
representativo a una serie de porcentajes : tasas ) , sus desventajas es que si uno
de los datos es cero su calculo dará cero.

Ejemplo:
Con el mismo ejemplo de las resistencias aunque no sería del todo acertado tomar
como valor representativo de estos datos la media geométrica , se ilustrara para
demostrar que en general da más bajo que la media aritmética :
M g  50 2395 * 2413 * ................ * 3074
M g  2704.11
Si la comparamos con la media aritmética (2711,56) efectivamente es menor.

Página 26 de 36
1.4.5 Media Armónica: Es otro estadígrafo de posición se debe utilizar cuando las
variables medidas son de proporción inversa (velocidades, aceleración, Tiempos
que demoran trabajadores en realizar una actividad etc).

n
xA  n
1

i 1 x i
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura aunque no sería del todo
acertado tomar como valor representativo de estos datos la media geométrica , se
ilustrara para demostrar que en general da el estadígrafo más bajo:

50
xA  50
 1 1 1 
  2395  2413  ..............  3074 
i 1

50
xA 
0,000417537  0,000414422  ............  0,000325309
50
xA   2696,70
0,018541173
Como se observa da mas bajo que el promedio y las media geométrica.

1.5 Medidas de Dispersión

Nos determinan la variabilidad de un proceso ya que con las medidas de


tendencia central no tenemos un resumen adecuado de la naturaleza de la
muestra.

1.5.1 Rango
Simplemente es la diferencia entre el mayor valor y el menor , si este intervalo es
alto existirá bastante dispersión entre los datos de la muestra.

Rango  x máx  x mín

Página 27 de 36
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos:

Rango  3074  2395


Rango  679

1.5.2 Varianza y desviación estándar

Son las medidas de dispersión mas utilizadas en estadística, nos determina como
se agrupan o se dispersan los datos alrededor de un promedio.

Formula de la Varianza

 x 
n
2
i x
S2  i 1

n 1
Donde
S 2 : Varianza
xi : Datos
x : Media Artimetica
n : Numero de datos
Tiene el inconveniente que las unidades ( de la variable) quedan al cuadrado , por
lo tanto su interpretación no es clara , simplemente si es muy alta existirá gran
dispersión , y si es baja los datos estarán bastante agrupados respecto al
promedio. Para evitar el inconveniente tenemos la desviación estándar que es la
raíz de la varianza.

 x 
n
2
i x
S i 1

n 1
Donde
S : Desviacion Es tan dar
xi : Datos
x : Media Artimetica
n : Numero de datos
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos:

Página 28 de 36
xi x  x x  x
i i
2

2395 -316,56 100210,234


2413 -298,56 89138,0736
2422 -289,56 83844,9936
2425 -286,56 82116,6336
2435 -276,56 76485,4336
2445 -266,56 71054,2336
2454 -257,56 66337,1536
2458 -253,56 64292,6736
2468 -243,56 59321,4736
2473 -238,56 56910,8736
2509 -202,56 41030,5536
2512 -199,56 39824,1936
2540 -171,56 29432,8336
2545 -166,56 27742,2336
2553 -158,56 25141,2736
2561 -150,56 22668,3136
2562 -149,56 22368,1936
2576 -135,56 18376,5136
2664 -47,56 2261,9536
2675 -36,56 1336,6336
2679 -32,56 1060,1536
2696 -15,56 242,1136
2702 -9,56 91,3936
2703 -8,56 73,2736
2714 2,44 5,9536
2715 3,44 11,8336
2723 11,44 130,8736
2737 25,44 647,1936
2759 47,44 2250,5536
2769 57,44 3299,3536
2770 58,44 3415,2336
2788 76,44 5843,0736
2801 89,44 7999,5136
2806 94,44 8918,9136
2813 101,44 10290,0736
2815 103,44 10699,8336
2816 104,44 10907,7136
2847 135,44 18343,9936
2868 156,44 24473,4736
2909 197,44 38982,5536
2910 198,44 39378,4336
2917 205,44 42205,5936
2989 277,44 76972,9536
3004 292,44 85521,1536
3004 292,44 85521,1536
3023 311,44 96994,8736
3040 328,44 107872,834
3045 333,44 111182,234
3057 345,44 119328,794
3074 362,44 131362,754

x  2711,56
Sumas 0 2023922,32

Por lo tanto la varianza será:

Página 29 de 36
2023922,32
S2 
50  1
S 2  41304,54

Su interpretación será : el valor representativo de la muestra es de 2711.56 P.S.I.


con una dispersión de 41304.54 ( P.S.I) al cuadrado.

La desviación estándar será:

S  41304,54
S  203,24
Cuya interpretación es : el valor representativo de la muestra es de 2711.56 P.S.I.
con una dispersión de todos los datos con respecto a la media de 203.24 ( P.S.I).

1.6 Asimetría o sesgo

Este estadígrafo nos permite identificar si los datos se distribuyen de manera


uniforme con respecto al promedio tendremos tres casos.

Asimetría negativa: Nos indica que en la distribución de la variable existen más


datos superiores al promedio.

Asimetría Positiva: Nos indica que en la distribución de la variable existen más


datos inferiores al promedio.

Página 30 de 36
Formula
3
n 
n x x
CA    i
n - 1n - 2 i 1  s 

Donde
CA : Coeficient e de Asimetria
n : Numero de Datos
xi : Datos
x  Pr omedio
s : Deviacion Es tan dart

Si el coeficiente de asimetría da negativo se dice que la distribución de la variable


tiene cola derecha, y el caso contrario cola Izquierda , si da cero se dice que la
distribución es simétrica.

Página 31 de 36
Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos la siguiente tabla:

xi x  x
i 
3
 xi  x 

 s 
2395 -316,56 -3,77895284
2413 -298,56 -3,17028442
2422 -289,56 -2,89213835
2425 -286,56 -2,80317406
2435 -276,56 -2,51983126
2445 -266,56 -2,25625561
2454 -257,56 -2,03534769
2458 -253,56 -1,94198374
2468 -243,56 -1,72116005
2473 -238,56 -1,61732105
2509 -202,56 -0,99006664
2512 -199,56 -0,946725
2540 -171,56 -0,60152194
2545 -166,56 -0,55044698
2553 -158,56 -0,47488043
2561 -150,56 -0,40656705
2562 -149,56 -0,39851964
2576 -135,56 -0,296755
2664 -47,56 -0,0128153
2675 -36,56 -0,00582133
2679 -32,56 -0,00411203
2696 -15,56 -0,00044878
2702 -9,56 -0,00010408
2703 -8,56 -7,4718E-05
2714 2,44 1,7305E-06
2715 3,44 4,8493E-06
2723 11,44 0,00017835
2737 25,44 0,00196135
2759 47,44 0,01271854
2769 57,44 0,02257598
2770 58,44 0,02377574
2788 76,44 0,05320659
2801 89,44 0,08523123
2806 94,44 0,10033935
2813 101,44 0,12434579
2815 103,44 0,13184659
2816 104,44 0,13570753
2847 135,44 0,29596762
2868 156,44 0,45608604
2909 197,44 0,91687216
2910 198,44 0,93087425
2917 205,44 1,03290024
2989 277,44 2,54396181
3004 292,44 2,97929622
3004 292,44 2,97929622
3023 311,44 3,59854164
3040 328,44 4,22057372
3045 333,44 4,41627849
3057 345,44 4,91044934
3074 362,44 5,67168008

x  2711,56
S= 203,2351769
Sumas 0 6,21936346

Página 32 de 36
50
CA  * 6,21936346
50 - 150 - 2
CA  0,132214359

Como el coeficiente dio mayor que cero podemos interpretar como, que en la
distribución existen más datos ponderados por debajo del promedio (2711.56)
tiene cola izquierda.

1.6.1 Curtosis.

Este último estadígrafo nos permite determinar el grado de concentración que


presentan los valores con respecto al promedio. Por medio del Coeficiente de
Curtosis, podemos determinar si existe una gran concentración de valores
(Leptocúrtica), una concentración simétrica (Mesocúrtica) ó una baja
concentración (Platicúrtica).

Formula
n n  1 3n  1
4
n 
xi  x 
2

n - 1n - 2n  3 
Cu    
 s  n  2 n  3
i 1  
Donde
Cu : Curtosis
n : Numero de Datos
xi : Datos
x  Pr omedio
s : Deviacion Es tan dart

Página 33 de 36
Si el coeficiente de curtosis da negativo se dice que la distribución de la variable
es plana ( platicurtica) , y el caso contrario apuntada ( leptocurtica) , si da cero se
dice que la distribución es mesocurtica.

Ejemplo:
Con el mismo ejemplo de las resistencias a la rotura tendríamos la siguiente tabla:

Página 34 de 36
xi x  x
i
 s 
4
 xi  x 
 
 
2395 -316,56 5,88611346
2413 -298,56 4,6572652
2422 -289,56 4,12058381
2425 -286,56 3,95245336
2435 -276,56 3,42895627
2445 -266,56 2,95926869
2454 -257,56 2,57939674
2458 -253,56 2,42285516
2468 -243,56 2,0626633
2473 -238,56 1,89843173
2509 -202,56 0,98677749
2512 -199,56 0,92960502
2540 -171,56 0,50777186
2545 -166,56 0,45111506
2553 -158,56 0,37049217
2561 -150,56 0,30119163
2562 -149,56 0,2932691
2576 -135,56 0,1979387
2664 -47,56 0,00299897
2675 -36,56 0,0010472
2679 -32,56 0,00065878
2696 -15,56 3,4359E-05
2702 -9,56 4,8959E-06
2703 -8,56 3,147E-06
2714 2,44 2,0776E-08
2715 3,44 8,208E-08
2723 11,44 1,0039E-05
2737 25,44 0,00024551
2759 47,44 0,00296882
2769 57,44 0,00638061
2770 58,44 0,00683668
2788 76,44 0,02001185
2801 89,44 0,03750867
2806 94,44 0,04662603
2813 101,44 0,06206424
2815 103,44 0,06710556
2816 104,44 0,06973839
2847 135,44 0,19723876
2868 156,44 0,35107161
2909 197,44 0,89072789
2910 198,44 0,90891099
2917 205,44 1,04410579
2989 277,44 3,47280808
3004 292,44 4,28698122
3004 292,44 4,28698122
3023 311,44 5,51444797
3040 328,44 6,82069538
3045 333,44 7,24561526
3057 345,44 8,34631901
3074 362,44 10,1146059

x  2711,56
S= 203,235177
Sumas 0 91,8109017

Página 35 de 36
El coeficiente de curtosis será:

5050  1 350 - 1
2
Cu  * 91,81090174 -
50 - 150 - 250  3 50  250  3
Cu  -1,074949346

La interpretación es que la distribución es plana ( platicurtica) en el contexto del


problema podemos establecer que los datos en general están alejados de la
media .

1.8 REFERENCIAS BIBLIOGRÁFICAS

 Probabilidad y Estadística para Ingeniería y Ciencias , Walpole , Myres ,


Myres Ye .Steven, Octava Edición , Pearson Educacion 2007. p 1-28.
 Apuntes de Clase Probabilidad y Estadística, Ing. Néstor Humberto Agudelo
Díaz. 1998-2013.

Página 36 de 36

También podría gustarte