Unidad I EstadisticaDescriptiva

marianasuarez@ucla.edu.
ve
Septiembre, 2008
2
UNIDAD I
ESTADÍSTICA DESCRIPTIVA
Contenido Programático
Estadística y sus objetivos
Conceptos
 Población y Muestra
 Análisis deductivo e inductivo
 Variables continuas y discretas
 Recolección y manejo de datos
 Distribuciones de frecuencia
 Histogramas y Polígonos de Frecuencias
 Distribuciones de frecuencias Acumuladas
 Curvas de frecuencia
Medidas de tendencia central
 Media, mediana y Moda
Medidas de dispersión
 Varianza, Desviación tìpica y Coeficiente de Variación.
Objetivo Terminal
Al finalizar la unidad I los alumnos deberán ser capaces de aplicar las técnicas
y métodos de Estadística descriptiva en la resolución de situaciones referentes al área
de Ingeniería.
Estrategia de enseñanza:
 Exposición de conceptos
 Resolución de problemas
 Foros
 Taller presencial
Estadística Ing. Mariana Suárez P.

3
UNIDAD I: ESTADÍSTICA DESCRIPTIVA.
ESTADÍSTICA COMO CIENCIA
La Estadística es una ciencia basada en una teoría axiomática (la teoría de la

probabilidad) similar a la matemática, por tanto, provee métodos y técnicas para
realizar estudios (investigación del comportamiento de variables) y extraer
conclusiones de manera científica para una población, a partir de muestras
probabilísticas.
Así como otras ciencias, la estadística comprende un conjunto de concepciones

teórico-metodológicas para recopilar, organizar, presentar, describir, analizar e
inferir respecto a un conjunto de datos, a fin de utilizar esta información para la
deducción de conclusiones y/o para tomar decisiones racionales ( con objetividad
científica ). Esta importante ciencia facilita el estudio de datos masivos, para obtener
conclusiones valederas y efectuar predicciones razonables.
En un sentido más restringido, el término estadística se utiliza para denotar los

datos numéricos, como por ejemplo, se habla de estadística de empleos, estadísticas
de accidentes, etc. Sin duda se habrá oído la frase <<se puede demostrar cualquier
cosa mediante la estadística>>; porque existe una teoría general de la estadística
aplicable a cualquier campo de estudio, en el cual se desee realizar investigaciones.
La estadística es la ciencia de la aproximación científica y por eso se aplica en

todas las áreas del conocimiento.
Los métodos estadísticos, forman hoy en día una parte importante en todos los
campos de la ciencia, y se han ido desarrollando rápidamente en psicología, economía
y sociología, así como, también en medicina, biología y física (la parte cuántica o la

4
moderna teoría atómica y la relatividad están basadas, en muchos aspectos, en la

teoría de la probabilidad)
En este curso explicaremos los métodos estadísticos aplicados en la Ingeniería

Civil ya que durante el ejercicio profesional el Ingeniero se enfrenta a gran cantidad
de datos, que deben ser transformados en información a ser clasificada y analizada.
Estadística y sus objetivos.
El objetivo de la Estadística es crear y aplicar modelos matemáticos para

estudiar las poblaciones; muchos de estos modelos matemáticos están basados en el
comportamiento de los fenómenos de tipo aleatorio (fenómenos cuyos resultados, en
muchos casos, dependen del azar). En este sentido pueden distinguirse algunas
actividades como las siguientes:
 Recoger información en forma de observaciones numéricas y basar nuestra

decisión estadística en el estudio y análisis de ellas.
 Distinguir entre los métodos de estadística deductiva y estadística inductiva.
(que los definiremos mas adelante)
 Realizar predicciones acertadas con un mínimo de variabilidad
MÉTODOS DE LA ESTADÍSTICA.
La estadística presenta dos tipos de métodos, el deductivo o descriptivo y el

inductivo o inferencial.
El análisis estadístico deductivo o descriptivo es el método estadístico que

consiste en describir y analizar grupos de datos, tal y como se comportan en la

5
realidad sin hacer predicción alguna. Para describir un conjunto de datos se

representan gráficamente sobre ejes de coordenadas, se determinan medidas de
tendencia central, medidas de dispersión, y otro tipo de medidas que sirvan para
“describir” la masa de datos.
El análisis inductivo o inferencial, es el método estadístico que consiste en

realizar generalizaciones de una población a partir de una o más muestras. Tiene
como fin obtener conclusiones sobre los parámetros, en base a estadísticas de las
muestras. Para inferir estadísticamente se aplican dos técnicas estadístico-
matemáticas como son: la Estimación (por intervalos de Confianza) y las Pruebas de
hipótesis, además de otras que no son objeto de estudio en esta asignatura.
Inferir estadísticamente significa, obtener conclusiones a partir de medidas

estadísticas muestrales. En el caso de la Ingeniería Civil, la inferencia estadística es
fundamental para solucionar probables problemas, pues conociéndose apenas una
parte de la población se puede concluir sobre su comportamiento general, con
determinado grado de confianza. Por otra parte se utilizan las técnicas inferenciales,
que veremos en la unidad III, para tomar decisiones razonables y científicamente
demostrables.
Lo inductivo y lo descriptivo son cualidades de la mente humana, la ciencia

canaliza estas cualidades de inducción y descripción a través de métodos en el estudio
de los fenómenos. La estadística es el lenguaje matemático de la ciencia en la
actualidad.
POBLACION Y MUESTRA.
Antes de comenzar todo estudio hay que definir el protocolo de la

investigación y dentro de este, se encuentra la definición del marco de la

6
investigación, la definición de población y muestra, métodos a emplear, definición de

las variables a estudiar, método de recolección de la información, de los datos y su
procesamiento, las conclusiones y las recomendaciones.
La población se define como un conjunto de individuos u objetos que tengan

características comunes observables. Constituyen una población o universo la
totalidad de los elementos u observaciones que se desean estudiar.
Por ejemplo, una población de hombres de una ciudad, la población de

estudiantes de la UCLA, la población de vigas y columnas metálicas producidas por
una fábrica, etc.
La muestra se define como cualquier subconjunto o parte de la población

definida. En general es imposible obtener todos los elementos que forman la
población a investigar; bien sea porque el número de elementos es demasiado grande,
los costos son muy altos o porque se tienen limitaciones de tiempo para la realización
del trabajo científico. Por ello, en Estadística se trabaja generalmente con
subconjuntos de observaciones de la población denominados muestras y estas
muestras deben ser representativas de la población. Por ejemplo, pequeñas cantidades
de concreto en moldes cilíndricos, extraídas de un volumen mayor que se va utilizar
en la construcción de una edificación, y del cual se desea conocer la calidad y
resistencia, medidas a través de variables específicas.
VARIABLES CONTINUAS Y DISCRETAS.
En estadística se estudian magnitudes cualitativas y cuantitativas. En

Ingeniería utilizamos magnitudes cuantitativas, es decir, variables, y las variables son
magnitudes susceptibles de medición. Se entiende por variable una magnitud que
asume valores en diferentes puntos de observación, en un determinado intervalo.

7
En el campo de la investigación de cualquier fenómeno es necesario observar

y recolectar información de alguna característica del fenómeno en estudio; a estas
características las denominamos variables. Las variables, así como en Matemática,
son de dos tipos, continuas y discretas, de esta manera se puede orientar las vías a
seguir en un estudio estadístico.
Las variables continuas son magnitudes para las cuales solo se establece una
escala y difieren en cifras infinitesimales. Por ejemplo la longitud, el peso, el
volumen, la temperatura, etc.; y las variables discretas son magnitudes específicas, no
aceptan valores intermedios entre ellos. Por ejemplo el número de hijos de un
matrimonio, el número de pétalos de una flor, el número de pernos estructurales en
una caja, etc.
Estos dos tipos de variables, originan distintas distribuciones con sus leyes de
comportamiento respectivas, las cuales estudiaremos en la unidad II.
Actividad de control:
 Dé ejemplos de población y muestra
 Dé ejemplos de variable continua
 Dé ejemplo de variable discreta
DISTRIBUCIONES DE FRECUENCIAS.
Se entiende por distribución de frecuencias a la organización de los datos de la

variable en la muestra, en clases, generalmente iguales, denominadas intervalos de
clase, de esta manera tenemos dos tipos de distribución.
 Distribución de frecuencias para datos no agrupados:

8
Consiste en organizar los datos en orden jerárquico en forma creciente en

cuanto a la magnitud, y luego proceder a realizar los cálculos de los estadísticos
descriptivos. Se puede realizar con la herramienta de la hoja de cálculo: Excel y
con cualquier paquete estadístico disponible en el mercado.
 Distribuciones de frecuencias para datos agrupados:
Consiste en organizar los datos en intervalos de clase generalmente con igual

amplitud, considerando la cantidad de datos que se encuentran en cada intervalo;
esta cantidad recibe el nombre de frecuencia de clase, que es el número de veces
que se cuentan valores de la variable en el intervalo de clase.
“No existen criterios científicos para establecer el número ideal de intervalos

de clase. En general se adoptan cantidades impares entre 5 y 15. Algunos autores
recomiendan un numero de intervalos igual a √n, donde n representa la cantidad
de datos de la muestra, limitados a un mínimo de 5 intervalos.” (Rubens A.
Danta, 2002, pp76)
PROCEDIMIENTO PARA LA CONSTRUCCIÓN DE UNA

DISTRIBUCIÓN DE FRECUENCIA.
 En la actualidad, en este mundo informatizado se hace uso de cualquiera de

los paquetes estadísticos que existen en el mercado, a saber SPSS, NCSS60
entre otros (ver manual de procedimiento para mayor información).
 El procedimiento tradicional, mediante el uso de la formula de Sturges, para

determinar el número de clases (m) m= 1+3,322 log (n), donde n es el número
total de datos de la muestra. Esta es una fórmula empírica y de poco uso en la

9
actualidad. (Ver procedimiento del profesor Gustavo Guedez en material

mimeografiado: Elementos de Estadística y sus aplicaciones,2004p12)
 El criterio del investigador de elegir el número de clases a usar entre 5 y 15

clases como se mencionó anteriormente y cada clase con una amplitud que
considere conveniente.
HISTOGRAMAS.
Es la representación gráfica de las frecuencias absolutas y/o relativas a través

de un diagrama de barras sobre ejes cartesianos, donde en el eje de las abscisas se
representan los intervalos de clases (IC) y en el eje de las ordenadas, las frecuencias
absolutas (fi) y/o relativas (hi) para cada intervalo de clase. En primer lugar se traza
una recta horizontal para representar el eje de medida, seguidamente marcamos los
intervalos de clase y arriba de cada intervalo de clase se traza un rectángulo cuya área
es proporcional a la frecuencia de ese intervalo.
Los histogramas pueden ser de varias formas. Un histograma unimodal es
aquel que se eleva a un solo pico y luego declina. Un histograma bimodal tiene dos
picos diferentes y un histograma con más de dos picos se dice que es multimodal.
También el histograma es simétrico si la mitad izquierda de su área es igual a la mitad
derecha y se dice que es asimétrico cuando una de las dos mitades es más grande que
la otra.
Este dibujo o histograma es particularmente útil cuando se tiene un gran

número de datos, ya que, proporciona una primera idea del comportamiento y forma
de agruparse.
POLIGONO DE FRECUENCIA.

10
Este se construye dibujando segmentos de línea que unen los puntos medios
de la parte superior de cada columna del histograma.
DIAGRAMA DE FRECUENCIAS ACUMULADAS (OJIVA)
Es la representación grafica de la distribución de las frecuencias acumuladas

hasta el límite superior de cada clase, de los valores de la variable, es decir, se toma el
límite superior de cada clase lo representamos en el eje de las abscisas, ubicamos en
el eje de las ordenadas el correspondiente valor de la frecuencia acumulada (Fi) se
interceptan estos valores y por último, unimos por segmentos de líneas cada
intercepción y se obtiene gráficamente el diagrama de frecuencias acumulada. Se le
llama ojiva porque el gráfico tiene forma de J.
La ojiva es más importante que los histogramas porque es la equivalente,

como veremos mas adelante, a la función de distribución (probabilidades
acumuladas). Se usa para calcular las medidas de posición: la mediana, los quartiles,
deciles y percentiles.
Como conclusión: una vez calculada la tabla de distribución de frecuencias se

procede a representar gráficamente su contenido; utilizando histogramas, polígonos
de frecuencia y diagramas de frecuencias acumuladas.
CURVAS DE FRECUENCIAS.
De la guía de estudio del profesor Gustavo Guedez he extraído lo siguiente:

“A medida que aumenta el tamaño de la muestra se puede lograr elegir
intervalos de clase más pequeños, lo que conlleva a que el polígono de frecuencia
pueda estar formado por gran cantidad de segmentos rectos que aproximan en
conjunto a una curva. De la distribución de frecuencia de una muestra se obtienen

11
indicios acerca de la curva de distribución de probabilidad de la población asociada a

ella.”(Estadística y aplicaciones. 2004,p16.)
 Seleccione un conjunto de 30 datos
 Represente gráficamente el conjunto de datos
 Realice una distribución de frecuencias para datos agrupados para el
conjunto de datos seleccionados por Ud.
MEDIDAS DE TENDENCIA CENTRAL.
El solo hecho de representar gráficamente un conjunto de observaciones o

medidas no es suficiente para determinar el carácter de una distribución, por eso
existen diversas características que sirven para describir u obtener una mayor
información de una distribución. En esta parte se definen ciertos valores que se usan,
con mucha frecuencia para tal fin y además se explicará como se eligen y se utilizan
ciertas medidas alternativas. Todo esto debido a que se ha verificado que muchos
datos tienen una tendencia a concentrarse en torno a ciertos valores particulares,
denotando una regularidad estadística.
Luego estas medidas son denominadas medidas de tendencia central,

tienden a ubicarse hacia el centro de la distribución y son: la media aritmética, la
mediana y la moda.
El valor central se refiere a la ubicación al centro de la distribución.
LA MEDIA ARITMÉTICA

12
La media de una variable aleatoria X es el valor esperado de X o esperanza

matemática de X, representada por E(X). Es uno de los promedios más importantes.
Los promedios generalmente se definen como las medidas que reflejan la posición
que asumen los valores de la variable en una distribución.
La media aritmética se expresa, en términos descriptivos, a través de una

fórmula que representa el cociente de la suma de todas las observaciones de la
variable en la distribución, dividida por el número total de ellas; dicha fórmula se
indica como sigue:
n xi
X = ∑i=1 n .
Propiedades de la media aritmética
1.- Es un valor tal que la suma de las desviaciones de las observaciones

respecto a ella es cero, es decir:
n
X = ∑i=1 ( xi−x ) = 0.
2.- Si se utiliza una media aritmética arbitraria, digamos “A”; las

desviaciones de los valores de la distribución, respecto a ella serán de la forma
siguiente:
di = xi – A
Y se cumplirán las igualdades siguientes:
∑ di
X =A+ N

13
∑ di
El segundo término de la expresión anterior, es decir N , se conoce con
el nombre de “factor de corrección”.
Esta propiedad nos permite afirmar que, la media aritmética de una muestra
aumentará (o disminuirá) una cantidad, si a cada elemento de la muestra se suma (o
resta) esa misma cantidad.
3.- La suma de los cuadrados de las desviaciones de los valores de la

distribución con respecto a la media aritmética es un valor mínimo ( en comparación
con la suma de los cuadrados de las desviaciones de los valores de la distribución con
respecto a una media arbitraria, u otro valor)
n n
X = ∑i=1 ( xi−x ) 2
< ∑i=1 ( xi− A ) 2
4.- La media aritmética de una muestra quedará multiplicada (o dividida)

por una constante, si a cada elemento de dicha muestra se multiplica o divide por esa
constante.
La media aritmética es un valor que se ve afectado por los valores extremos,
es decir, si la serie presenta valores muy grandes entonces la media tenderá a
aumentar y, si por el contrario en la serie existen valores muy pequeños entonces la
media tenderá a disminuir.
La media poblacional se representa por μ y la media muestral por x .
LA MEDIANA es el punto sobre el eje de observaciones que deja un área

igual a cada lado de la distribución, es decir, es el dato central de un conjunto de

14
observaciones; por tal motivo, es un valor posicional. La mediana no se ve afectada

por los valores extremos de la serie de datos, en comparación con la media.
Cálculo de la mediana.
Para datos no agrupados se siguen los siguientes pasos:

 Se ordena el conjunto de datos de menor a mayor
 Si el número de datos es impar el valor de la mediana es el dato central.
 Si el número de datos es par el valor de la mediana es la media de los dos
datos centrales.
Para datos agrupados en una distribución de frecuencias se sigue el siguiente

procedimiento:
Se parte del criterio que la mediana divide el diagrama de frecuencia
acumulada en dos partes iguales. Esto me da la posición nada más (ver gráfico
siguiente)
Fi
Fi
fi
n/2
F(i-1)
Li Med Ls
Clase de la mediana: c
donde se ubica el valor medianal
Por relaciones de triángulos.

15
n
fi 2
c
=
n
−F(i−1 )
Med −Li Med =
Li+C[ ]
2
−F (i−1)
fi
n
=
2 La mitad del número de observaciones que da la ubicación en la clase
medianal (es lo primero que se calcula para saber en que clase se va a ubicar la
mediana)
Li= limite inferior de la clase medianal.
F(i-1)= frecuencia acumulada hasta la clase anterior a la clase de la mediana
fi= frecuencia absoluta de la clase medianal
C= amplitud de clase
n= número de datos
La posición en el diagrama de frecuencias acumuladas es la definición

matemática de la mediana, porque viene de la función de la distribución en ese
intervalo y el valor de la mediana por la fórmula es un valor aproximado por
geometría y es un valor empírico.
MEDIDAS ALTERNATIVAS
CUARTIL: Divide el conjunto de datos de la distribución en cuatro partes iguales
kn
Qk =
Li+C
4
[−F (i−1)
fi ]
Li= limite inferior de la clase que contiene el cuartel k.
F(i-1)= frecuencia acumulada anterior a la clase que contiene el cuartel k.

16
DECIL: Divide el conjunto de datos de la distribución en diez partes iguales
kn
Dk =
Li+C
10
[−F (i−1)
fi ]
Li= limite inferior de la clase que contiene el decil k
F(i-1)= frecuencia acumulada anterior a la clase que contiene el decil k
PERCENTIL: Divide el conjunto de datos de la distribución en cien partes iguales
kn
Pk =
Li+C [
100
−F (i−1)
fi ]
Li= limite inferior de la clase que contiene el percentil k
.F(i-1)= frecuencia acumulada anterior a la clase que contiene el percentil k
LA MODA Es el valor que se presenta mas frecuentemente en un conjunto de

observaciones. En el histograma es el punto medio del intervalo de clase que tiene la
mayor frecuencia, punto en torno al cual existe la mayor concentración de datos.
Si la variable es discreta la moda Mo=Xi; donde Xi es el elemento que más se
repite en la nuestra. Si la variable es continua y para datos agrupados la moda se
puede calcular analíticamente de la siguiente manera:
Δ1
Moda=
Li+C
[ Δ1+Δ2 ]
Li : Límite inferior de la clase que tiene mayor frecuencia absoluta
C : Amplitud de clase

17
Δ1= fi - f(i-1)
Δ2= fi - f(i+1)
fi: frecuencia absoluta de la clase modal
f(i-1): frecuencia absoluta de la clase anterior a la clase modal
f(i+1): frecuencia absoluta de la clase siguiente a la clase modal.
La moda al igual que la mediana se ve menos afectada por valores extremos

con respecto a la media, porque se refieren al centro y le prestan mas importancia a
los valores centrales, que a los extremos, es decir, son medidas de posición, mientras
que la media es una medida matemática.
La moda y la mediana son importantes porque en distribuciones abiertas

donde no se puede calcular la media aritmética, que es el mejor promedio en términos
matemáticos, se necesita una medida de posición, se utiliza la mediana y la moda que
son medidas de posición. Ejemplo cuando una persona se mide la tensión arterial, los
valores normales están entre 8 y 12. Se posiciona entre esos dos valores nada más.
Relación entre media, mediana y moda.
Cuando se disponga de distribuciones unimodales existe la siguiente relación:
Moda=3Med-2Media x̄
 Determine las medidas de tendencia central del conjunto de 30 datos
que utilizó en la actividad anterior y concluir al respecto

18
 Determinar las medidas de tendencia central con los datos del

problema 2-4 del libro texto Estadística para Ingenieros. John Kenedy ,
Editorial harper & row latinoamericana, año 1982 Mexico
MEDIDAS DE DISPERSION.
En estadística un promedio en si mismo no da una clara descripción o la

información suficiente de una distribución. Por la razón que se puede observar en los
siguientes histogramas:
x̄ x̄ x̄
x̄ x̄
Los gráficos muestran un grupo de distribuciones con igual media aritmética,
aunque evidentemente difieren en su apariencia general, por lo tanto el
comportamiento de los datos u observaciones es diferente en cada uno de ellos; existe
otra medida que ayuda a describir la forma de la distribución y es la que indica cómo
las observaciones se separan del promedio. Esta medida se llama dispersión,
extensión o variabilidad. Por lo general se desea tener una medida de la
variabilidad, que será grande si las observaciones están distantes de la media y
pequeña si están cercanas a ella. Con las medidas de dispersión vamos a estudiar el

19
hecho de que los datos u observaciones, en general, tienden a concentrarse en torno a

un valor central.
Las medidas de dispersión mas utilizadas son la varianza, la desviación

típica y el coeficiente de variación.
VARIANZA.
Es una medida de variabilidad que refleja el grado de alejamiento o dispersión

de los valores de la variable con respecto a un valor central, en este caso el valor
central es la media aritmética.
La varianza, se define como la suma de los cuadrados de las desviaciones de
los valores con respecto a la media X , dividida por el número total de
observaciones. En símbolos, X 1−X , es la desviación de la primera observación
con respecto a la media; X 2− X , es la desviación de la segunda observación con

respecto a la media y así sucesivamente.
La fórmula de la varianza, que representaremos simbólicamente por δ2, es:
2 2 2 ∑ ( Xi− x̄ )2
( X 1− x̄ ) +( X 2− x̄ ) +. . .. .. .+( Xn− x̄ ) i =1
δ 2= =
N N
Se observa que la varianza es casi la media de los cuadrados de las

desviaciones y seria la media aritmética de estas cantidades. Ocasionalmente se
considerará la varianza como la desviación cuadrática media.

20
Si se conoce una población (finita) formada por N observaciones Xi, la media

en la ecuación seria μ, la desviación respecto a la media es (Xi – μ), entonces la
varianza o desviación cuadrática media esta dada por:
2
∑ ( Xi−μ )2
δ= i=1
N Donde: N= número de observaciones
μ = media poblacional
(Xi – μ) = desviaciones respecto a la

media población de cada observación.
En muchos casos se divide por n-1 en lugar de N a fin de usar la varianza δ 2,

en los métodos inferenciales donde es necesaria la medición de variabilidad.
Este cambio se hace cuando no se conoce la media poblacional ( μ ) y se tiene

que trabajar con el uso de muestras, es decir, se deben realizar los cálculos de la
varianza con la media muestral ( X ), por lo tanto se sustituye N por (n-1) en el

denominador, la ecuación de la varianza sería:
2
∑ ( X i− X )2
s= i=1
n−1
n = número de datos de la muestra.
X = media muestral o media de la muestra.
Xi = valores observados en la muestra
(Xi - X̄ ) = desviación de cada dato respecto a la X .

21
Cuando se trabaja con valores grandes de N no es muy necesario considerar

este ajuste de N por n-1, pero cuando se trabaja con muestras sí porque es un ajuste
que se utiliza en los métodos de muestreo, y porque es un parámetro que se estima.
DESVIACIÓN ESTÁNDAR O DESVIACIÓN TÍPICA
Se define como la raíz cuadrada positiva de la varianza. Así la desviación

típica viene dada por:
 Si se trabaja con la población, entonces S, es:
S= √ ∑i=1 ( Xi−μ )2
N
Si se trabaja con muestras:
S= √ ∑i=1 ( Xi− X̄ )2
n−1
Estas dos expresiones se usan cuando se realiza el análisis con datos no

agrupados.
Cuando los datos están agrupados en una tabla de distribución de frecuencia la

varianza y la desviación típica para el caso muestral vienen dada por:
2
∑ fi( xi− x̄ )2
δ=
2 ∑ fi ( Xi− x̄ )
n−1 s= √ n−1
En donde:
fi = frecuencia absoluta de la clase.

22
Xi = punto medio de la clase.
La desviación típica es la medida fundamental de dispersión y es la que

siempre vamos a usar para identificar junto con la media un conjunto de datos con
respecto a otro conjunto de datos, es decir es como si le diéramos un nombre y un
apellido a cada conjunto de datos o resultados de un experimento.
La ventaja de la utilización de la desviación típica como medida de variación

es que posee la misma unidad de la media, facilitándose de esa forma su
interpretación.
COEFICIENTE DE VARIACIÓN
Es otra de las medidas de dispersión mas utilizadas e indica cuanto representa

la desviación típica en relación a la media, toda vez que la desviación típica se pueda
considerar alta o baja cuando es comparada con la media. El coeficiente de variación
es una medida relativa de dispersión y se obtiene de la razón entre la desviación típica
y la media, o sea,
s
V= X .
En algunos casos es conveniente expresar la dispersión de los resultados en

forma porcentual (relativos); lo que hacemos es multiplicar por 100 la razón de la
desviación típica y la media
s
V = x 100
X “En general se considera:

23
Una dispersión baja cuando V < 0,10

Intermedia cuando 0,10 < V < 0,30
Alta cuando V > 0,30.”
(Rubens A. Danta, 2002,pp80)
Esta medida se usa generalmente para comparar el sentido de la dispersión

entre dos o más distribuciones
CONCLUSION.
Cuando un Ingeniero se enfrente a un conjunto de resultados de un

experimento en una investigación, o a un conjunto de observaciones en el campo
laboral, ya tiene la capacidad de saber qué hacer con esa información, si el análisis
descriptivo es el que se aplica. Primero se clasifican y organizan en clases los datos,
se representan gráficamente, determinan las medidas de tendencia central, y por se
determinan las medidas de dispersión. Este procedimiento conlleva a conocer el
carácter de una distribución, es decir, el comportamiento de un conjunto de datos y
obtener la información suficiente con la cual se puede describir y dar conclusión
valedera, técnica y científicamente demostrable de la variable en estudio.
 Determine las medidas de dispersión al conjunto de 30 datos que
utilizó en la actividad anterior y concluir al respecto
 Determinar las medidas de dispersión con los datos del problema 2-4
del libro texto Estadística para Ingenieros John Kenedy , Editorial
harper & row latinoamericana, año 1982 México

24
Auto evaluación
Indique la (s) palabra (s) correcta (s) en los siguientes planteamientos siguiendo un
sentido lógico:
1. La Mediana y la Moda son medidas__________________________________

2. El análisis descriptivo consiste en ___________________________________
3. El objetivo general de la Estadística es _______________________________
4. La Media aritmética se ve afectada por valores_________________________
5. Distribución de frecuencia es_____________________ de los
_____________________en _______________________________________.
6. La desviación típica tiene las mismas unidades que _____________________
7. Los tipos de variables son__________________________________________
8. La muestra es _______________________________ de la población.
9. En un análisis descriptivo se debe evitar usar menos de ______clase para
datos agrupados.
10. El histograma es la representación gráfica de las
______________________________________________________________
Selección simple y múltiple.

25
Indique para cada uno de los planteamientos que se presentan a continuación

marcando con un círculo la, propuesta correcta:
 Las medidas de tendencia central son:
1. Medidas posiciónales
2. Valores centrales
3. Medidas que concentran la mayos cantidad de datos
4. Todas la anteriores
 Las medidas de dispersión son:
1. Medidas de extensión, de variabilidad
2. Desviaciones cuadráticas
3. Ninguna de las anteriores
 La Estadística es:
1. La ciencia basada en axiomas
2. La ciencia de la aproximación
3. La ciencia que facilita el estudio de datos masivos
 En un estudio o experimento se definen:
1. Población y muestra
2. Variable a estudiar
3. Métodos a usar

26
Autoevaluación ( respuestas)
Completación
1. De posición
2. Describir
3. Poblaciones
4. Por valores extremos
5. la organización de los datos en clases
6. Subconjunto
7. Seis (06)
8. Frecuencias absolutas
Selección simple y múltiple
 4
 1
 1,2,3
 1,2,3

27

Unidad I EstadisticaDescriptiva

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Unidad I EstadisticaDescriptiva

Cargado por

Copyright:

Formatos disponibles

marianasuarez@ucla.edu.

Estadística Ing. Mariana Suárez P.

UNIDAD I: ESTADÍSTICA DESCRIPTIVA.

ESTADÍSTICA COMO CIENCIA

La Estadística es una ciencia basada en una teoría axiomática (la teoría de la

Así como otras ciencias, la estadística comprende un conjunto de concepciones

En un sentido más restringido, el término estadística se utiliza para denotar los

La estadística es la ciencia de la aproximación científica y por eso se aplica en

Estadística Ing. Mariana Suárez P.

moderna teoría atómica y la relatividad están basadas, en muchos aspectos, en la

En este curso explicaremos los métodos estadísticos aplicados en la Ingeniería

Estadística y sus objetivos.

El objetivo de la Estadística es crear y aplicar modelos matemáticos para

 Recoger información en forma de observaciones numéricas y basar nuestra

La estadística presenta dos tipos de métodos, el deductivo o descriptivo y el

El análisis estadístico deductivo o descriptivo es el método estadístico que

Estadística Ing. Mariana Suárez P.

realidad sin hacer predicción alguna. Para describir un conjunto de datos se

El análisis inductivo o inferencial, es el método estadístico que consiste en

Inferir estadísticamente significa, obtener conclusiones a partir de medidas

Lo inductivo y lo descriptivo son cualidades de la mente humana, la ciencia

Antes de comenzar todo estudio hay que definir el protocolo de la

Estadística Ing. Mariana Suárez P.

investigación, la definición de población y muestra, métodos a emplear, definición de

La población se define como un conjunto de individuos u objetos que tengan

Por ejemplo, una población de hombres de una ciudad, la población de

La muestra se define como cualquier subconjunto o parte de la población

VARIABLES CONTINUAS Y DISCRETAS.

En estadística se estudian magnitudes cualitativas y cuantitativas. En

Estadística Ing. Mariana Suárez P.

En el campo de la investigación de cualquier fenómeno es necesario observar

Se entiende por distribución de frecuencias a la organización de los datos de la

 Distribución de frecuencias para datos no agrupados:

Estadística Ing. Mariana Suárez P.

Consiste en organizar los datos en orden jerárquico en forma creciente en

 Distribuciones de frecuencias para datos agrupados:

Consiste en organizar los datos en intervalos de clase generalmente con igual

“No existen criterios científicos para establecer el número ideal de intervalos

PROCEDIMIENTO PARA LA CONSTRUCCIÓN DE UNA

 En la actualidad, en este mundo informatizado se hace uso de cualquiera de

 El procedimiento tradicional, mediante el uso de la formula de Sturges, para

Estadística Ing. Mariana Suárez P.

actualidad. (Ver procedimiento del profesor Gustavo Guedez en material

 El criterio del investigador de elegir el número de clases a usar entre 5 y 15

Es la representación gráfica de las frecuencias absolutas y/o relativas a través

Este dibujo o histograma es particularmente útil cuando se tiene un gran

Estadística Ing. Mariana Suárez P.

DIAGRAMA DE FRECUENCIAS ACUMULADAS (OJIVA)

Es la representación grafica de la distribución de las frecuencias acumuladas

La ojiva es más importante que los histogramas porque es la equivalente,

Como conclusión: una vez calculada la tabla de distribución de frecuencias se

De la guía de estudio del profesor Gustavo Guedez he extraído lo siguiente:

Estadística Ing. Mariana Suárez P.

indicios acerca de la curva de distribución de probabilidad de la población asociada a

MEDIDAS DE TENDENCIA CENTRAL.

El solo hecho de representar gráficamente un conjunto de observaciones o

Luego estas medidas son denominadas medidas de tendencia central,

El valor central se refiere a la ubicación al centro de la distribución.

Estadística Ing. Mariana Suárez P.

La media de una variable aleatoria X es el valor esperado de X o esperanza

La media aritmética se expresa, en términos descriptivos, a través de una

Propiedades de la media aritmética

1.- Es un valor tal que la suma de las desviaciones de las observaciones