Está en la página 1de 34

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN SUPERIOR


UNIVERSIDAD NACIONAL EXPERIMENTAL RAFAEL MARÍA BARALT
NÚCLEO GENERAL ALMIDIEN MORENO ACOSTA, SAN FRANCISCO
PROGRAMA DE ADMINISTRACIÓN
UNIDAD CURRICULAR ESTADISTICA I

UNIDAD FINAL

Presentado por:

JACINTO VILLARREAL, C.I. 30.770.849, SECCION: 301711

SAN FRANCISCO

25/02/2021
INTRODUCCION

l presente trabajo va referido al tema de la Estadística, que se puede definir es


la estudio de datos masivos de individuos, grupos, series de hechos, etc. y
deducir de ello gracias al análisis de estos datos unos significados precisos o
unas previsiones para el futuro. También se refiere a la importancia, métodos e
importancia de la estadística ya que está relacionada con el estudio de
proceso cuyo resultado es más o menos imprescindible y con la finalidad de
obtener conclusiones para tomar decisiones razonables de acuerdo con tales
observaciones La Estadística se ocupa de los métodos científicos para
recolectar, organizar, resumir, presentar y analizar datos, así como de sacar
conclusiones válidas y tomar decisiones con base en este análisis, así también
realizar predicciones a cerca del conjunto del cual se han seleccionado dichos
datos. El empleo cuidadoso de los métodos estadísticos permite obtener
información precisa de los datos
DESARROLLO

Presentación de datos estadísticos: Datos Brutos, Datos Ordenados:


serie estadística, Datos Tabulados, Datos Agrupados. Ejemplo.

La presentación de datos estadísticos constituye en sus diferentes modalidades


uno de los aspectos de más uso en la estadística descriptiva. A partir podemos
visualizar a través de los diferentes medios escritos y televisivos
de comunicación masiva la presentación de los datos estadísticos sobre
el comportamiento de las principales variables económicas y sociales,
nacionales e internacionales.

1-Presentación escrita: Esta forma de presentación de informaciones se usa


cuando una serie de datos incluye pocos valores, por lo cual resulta más
apropiada la palabra escrita como forma de escribir el comportamiento de los
datos; mediante la forma escrita, se resalta la importancia de las informaciones
principales.

2-Presentación tabular: Cuando los datos estadísticos se presentan a través


de un conjunto de filas y de columnas que responden a un ordenamiento
lógico; es de gran eso e importancia para el uso e importancia para el usuario
ya que constituye la forma más exacta de presentar las informaciones. Una
tabla consta de varias partes, las principales son las siguientes:

Título: Es la parte más importante del cuadro y sirve para describir todo él
contenido de este.

Encabezados: Son los diferentes subtítulos que se colocan en la parte superior


de cada columna.
Columna matriz: Es la columna principal del cuadro.

Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen


en la tabla.

Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de


estos.

Frecuencias. Tipos de Frecuencias. La frecuencia estadística es la cantidad


de veces que se repite una observación durante la realización de
un muestreo. Este concepto suele explicarse junto con un ejemplo que ilustre a
qué hace referencia el término frecuencia estadística en cada caso.
Supongamos que se realiza un muestreo aleatorio mediante una encuesta que
consta de una sola pregunta y 3 opciones de respuesta, y que la encuesta se
hace a un grupo de 20 personas. Cinco personas responden con la opción 1,
diez con la opción 2 y cinco con la opción 3. Recordemos que la frecuencia
estadística es la cantidad de veces que se repite una observación; es decir, en
este ejemplo, la frecuencia estadística sería de cinco para la opción 1, de diez
para la opción 2 y de cinco para la opción 3. Nótese que la sumatoria de las
frecuencias estadísticas, en este caso, es igual al total de personas
encuestadas. Esto significa que la frecuencia estadística es la manera en que
se distribuyen las respuestas de las personas.

Tipos de frecuencia estadística

En estadística, podemos identificar 4 tipos de frecuencias: absoluta, relativa,


absoluta acumulada y relativa acumulada.

Frecuencia absoluta

 Artículo principal: Frecuencia absoluta.

Se le llama frecuencia absoluta al número de veces que se repite una variable


en un experimento. Esta se representa con fi ó ni. 
Frecuencia relativa

Representa la cantidad de veces que se repite una observación, expresada


como proporción de la muestra. Es decir, es el resultado de dividir el valor de la
frecuencia absoluta por el tamaño de la muestra estadística.

Esta se representa con fi .y se define como f = n/N, siendo n el número de


veces que se repite la respuesta y N el tamaño de la muestra. Su valor se
expresa como porcentaje.

Frecuencia absoluta acumulada

La frecuencia acumulada es aquella que se obtiene al sumar todas las


frecuencias absolutas inferiores o iguales al valor en cuestión. Se representa
con Ni .

Frecuencia relativa acumulada

En esta se tiene en cuenta la sumatoria de todas las frecuencias relativas


inferiores o iguales al valor en cuestión. Se representa con Fi ó Hi .

Distribuciones de Frecuencias: Distribución de Frecuencias para Datos


Nominales o Discretos. Ejemplo.

Las distribuciones o tablas de frecuencias permiten resumir los datos en


una tabla que recoge:

• Valores de la variable o modalidades del atributo,

• Frecuencia absoluta o número de veces que aparece cada valor o modalidad


en la muestra,

• Porcentaje de veces que aparece cada valor de la variable o modalidad del


atributo sobre el total de observaciones,

• Porcentaje válido calculado sobre el total de observaciones excluidos los


valores missing,
• Porcentaje acumulado hasta cada uno de los valores de la variable ordenados
de menor a mayor. Este porcentaje tiene interpretación sólo en los casos en
que la variable sea susceptible de medida por lo menos en una escala ordinal.

Gráficos Estadísticos: Diagrama de barras, Histograma, Diagrama de


Pastel, La Ojiva. Ejemplo.

Proporciona al lector o usuario mayor rapidez en la comprensión de los datos,


una grafica es una expresión artística usada para representar un conjunto de
datos.

De acuerdo al tipo de variable que vamos a representar, las


principales graficas son las siguientes:

Histograma: Es un conjunto de barras o rectángulos unidos uno de otro, en


razón de que lo utilizamos para representar variables continuas.

Polígono de frecuencias: Esta grafica se usa para representar los puntos


medios de clase en una distribución de frecuencias

Gráfica de barras: Es un conjunto de rectángulos o barras separadas una de


la otra, en razón de que se usa para representar variables discretas; las barras
deben ser de igual base o ancho y separadas a igual distancia. Pueden
disponerse en forma vertical y horizontal.

Gráfica lineal: Son usadas principalmente para representar datos clasificados


por cantidad o tiempo; o sea, se usan para representar series de tiempo o
cronológicas.

Gráfica de barra 100% y gráfica circular: se usan especialmente para


representar las partes en que se divide una cantidad total.

La ojiva: Esta grafica consiste en la representación de las frecuencias


acumuladas de una distribución de frecuencias. Puede construirse de dos
maneras diferentes; sobre la base "menor que" o sobre la base "o más". Puede
determinar el valor de la mediana de la distribución.
En estadística denominamos gráficos a aquellas imágenes que, combinando la
utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema De referencia (coordenadas), permiten
presentar información cuantitativa.

La utilidad De los gráficos es doble, ya que pueden servir no sólo como


sustituto a las tablas, sino que también constituyen por sí mismos una
poderosa herramienta para el análisis De los datos, siendo en ocasiones el
medio más efectivo no sólo para describir y resumir la información, sino
también para analizarla.

En este trabajo solo nos vamos a centrar únicamente en los gráficos como


vehículo de presentación de datos, sin abordar su otra faceta como
herramienta de análisis.

Distribución de frecuencia

Gráficos estadísticos

Los gráficos son medios popularizados y a menudo los más convenientes para
presentar datos, se emplean para tener una representación visual de la
totalidad de la Información. Los gráficos estadísticos presentan los datos en
forma de dibujo de tal modo que se pueda percibir fácilmente los hechos
esenciales y compararlos con otros.

Gráficos de barras horizontales

Representan valores discretos a base de trazos horizontales, aislados unos de


otros. Se utilizan cuando los textos correspondientes a cada categoría son muy
extensos.

 para una serie

 para dos o más series


Gráficos de barras proporcionales

Se usan cuando lo que se busca es resaltar la representación de los


porcentajes de los datos que componen un total. Las barras pueden ser:

Verticales

Horizontales

Medidas Tendencia Central: La Media Aritmética o Promedio, La Mediana,


La Moda. Ejemplos de cada uno. Las medidas de tendencia central son
medidas estadísticas que pretenden resumir en un solo valor a un conjunto de
valores. Representan un centro en torno al cual se encuentra ubicado el
conjunto de los datos. Las medidas de tendencia central más utilizadas
son: media, mediana y moda. Las medidas de dispersión en cambio miden el
grado de dispersión de los valores de la variable. Dicho en otros términos las
medidas de dispersión pretenden evaluar en qué medida los datos difieren
entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten
describir un conjunto de datos entregando información acerca de su posición y
su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente


dependiendo de la forma en que se encuentren los datos. Si los datos se
encuentran ordenados en una tabla estadística diremos que se encuentran
“agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”.

Según este criterio, haremos primero el estudio de las medidas estadísticas


para datos no agrupados y luego para datos agrupados.

Medidas de tendencia central

Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética
o promedio aritmético. Se representa por la letra griega µ cuando se trata del
promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del
promedio de la muestra. Es importante destacar que µ es una cantidad fija
mientras que el promedio de la muestra es variable puesto que diferentes
muestras extraídas de la misma población tienden a tener diferentes medias.
La media se expresa en la misma unidad que los datos originales: centímetros,
horas, gramos, etc.

Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el


estadígrafo será:

Estos cálculos se pueden simbolizar:

Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de


la segunda observación y así sucesivamente. En general, con “n”
observaciones, Yi representa el valor de la i-ésima observación. En este caso
el promedio está dado por

De aquí se desprende la fórmula definitiva del promedio:

Desviaciones: Se define como la desviación de un dato a la diferencia entre el


valor del dato y la media:

Ejemplo de desviaciones:

Una propiedad interesante de la media aritmética es que la suma de las


desviaciones es cero.

Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la
variable que ocupa la posición central, cuando los datos se disponen en orden
de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o
inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la
mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de


los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana
es (9+11)/2=10.

Moda
La moda de una distribución se define como el valor de la variable que más se
repite. En un polígono de frecuencia la moda corresponde al valor de la
variable que está bajo el punto más alto del gráfico. Una muestra puede tener
más de una moda.

Medidas de dispersión

Las medidas de dispersión entregan información sobre la variación de la


variable. Pretenden resumir en un solo valor la dispersión que tiene un conjunto
de datos. Las medidas de dispersión más utilizadas son: Rango de variación,
Varianza, Desviación estándar, Coeficiente de variación.

Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor
de la variable.

La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz


cuadrada, la desviación estándar. La varianza se representa con el símbolo σ²
(sigma cuadrado) para el universo o población y con el símbolo s2 (s
cuadrado), cuando se trata de la muestra. La desviación estándar, que es la
raíz cuadrada de la varianza, se representa por σ (sigma) cuando pertenece al
universo o población y por “s”, cuando pertenece a la muestra. σ² y σ son
parámetros, constantes para una población particular; s2 y s son estadígrafos,
valores que cambian de muestra en muestra dentro de una misma población.
La varianza se expresa en unidades de variable al cuadrado y la desviación
estándar simplemente en unidades de variable.

Fórmulas
Donde µ es el promedio de la población.

Donde Ȳ es el promedio de la muestra.

Consideremos a modo de ejemplo una muestra de 4 observaciones


Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las
medidas de dispersión:

s2 = 34 / 3 = 11,33 Varianza de la muestra

La desviación estándar de la muestra (s) será la raíz cuadrada de 11,33 = 3,4.

Interpretación de la varianza (válida también para la desviación estándar): un


alto valor de la varianza indica que los datos están alejados del promedio. Es
difícil hacer una interpretación de la varianza teniendo un solo valor de ella. La
situación es más clara si se comparan las varianzas de dos muestras, por
ejemplo varianza de la muestra igual 18 y varianza de la muestra b igual 25. En
este caso diremos que los datos de la muestra b tienen mayor dispersión que
los datos de la muestra a. esto significa que en la muestra a los datos están
más cerca del promedio y en cambio en la muestra b los datos están más
alejados del promedio.

Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la
desviación estándar de la muestra expresada como porcentaje de la media
muestral.

Es de particular utilidad para comparar la dispersión entre variables con


distintas unidades de medida. Esto porque el coeficiente de variación, a
diferencia de la desviación estándar, es independiente de la unidad de medida
de la variable de estudio.

Medidas de Dispersión: Rango, Desvío, La Varianza ( σ^2 ), La Desviación


Típica o Estándar (σ), Interpretación y comprensión de la Desviación
Estándar, Ejemplo.

LA VARIANZA (S2 ó δ2 ):

La varianza es una medida de dispersión relativa a algún punto de referencia.


Ese punto de referencia es la media aritmética de la distribución. Más
específicamente, la varianza es una medida de que tan cerca, o que tan lejos
están los diferentes valores de su propia media aritmética. Cuando más lejos
están las Xi de su propia media aritmética, mayor es la varianza; cuando más
cerca estén las Xi a su medio menos es la varianza. Y se define y expresa
matemáticamente de la siguiente manera:

La varianza para datos no agrupados

Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza


denotada usualmente por la letra minúscula griega δ (sigma) elevada al
cuadrado (δ2)y en otros casos S2 según otros analistas, se define como: el
cuadrado medio de las desviaciones con respecto a su media aritmética"

Matemáticamente, se expresa

Ejemplo:

Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber:


18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las edades, se
obtuvo 25.4 años, encontrar la varianza de las edades de estos estudiantes:

Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:

    ( Xi - )2

Xi ( Xi - )

18 (18 – 25.5)=-7.4 (-7.4)2=54.76

23 (23 – 25.5)=-2.4 (-2.4)2= 5.76

25 (25 – 25.5)=-0.4 (-0.4)2= 0.16

27 (27 – 25.5)= 1.6 ( 1.64)2= 2.16

34 (34 – 25.5)= 8.6 ( 8.6)2 =73.96

Total xxxx 137.20

Respuesta: la varianza de las edades es de 27.4 años


La varianza para datos agrupados

Si en una tabla de distribución de frecuencias. Los puntos medios de las clases


son X1, X2, … , Xn; y las frecuencias de las clases f1, f2, … , fn; la varianza se
calcula así:

Σ(Xi-)2f1

δ2 = ----------------

Σfi

Sin embargo la formula anterior tiene algún inconveniente para su uso en la


práctica, sobre todo cuando se trabaja con números decimales o cuando la
media aritmética es un número entero. Asimismo cuando se trabaja
con máquinas calculadoras, La tarea de computar la varianza se simplifica
utilizando la formula de computación que se da a continuación:

ΣXi2fi - [(ΣXifi)2/N]

δ2 = ----------------------------

N donde N=Σfi

Ejemplo:

Se tienen los datos de una muestra de 30 cuentas por cobrar de la


tienda Cabrera’s y Asociados dispuestos en una tabla de distribución de
frecuencias, a partir de los cuales se deberá calcular la varianza, para lo cual
se construye la siguiente tabla estadística de trabajo, si se calculó
anteriormente la media aritmética y se fijó en 43.458 (ver ejemplo del calculo en
"media aritmética para datos agrupados) de la siguiente manera

  Punto fi Xi2 Xifi X2fi


medios
clases
Xi

7.420 – 21.835 14.628 10 213.978 146.280 2,139.780


21.835 – 36.250 29.043 4 843,496 116.172 3,373.984

36.250 – 50.665 43.458 5 1,888.598 217.270 9,442.990

50.665 – 65.080 57.873 3 3,349.284 173.619 10,047.852

65.080 – 79.495 72.288 3 5,225.555 216.864 15,676.665

79.495 – 93.910 86.703 5 7,533.025 433.965 37,665.125

Total XXX 30 19,053.936 1,304.190 78,346.396

= 21,649.344 / 30 = 721.645

Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645

 Propiedades de la varianza :

 s siempre un valor no negativo, que puede ser igual o distinta de 0. Será


0 solamente cuando Xi=

 La varianza es la medida de dispersión cuadrática optima por ser la


menor de todas.

 Si a todos los valores de la variable se le suma una constante la


varianza no se modifica. Veámoslo:

Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que   


)

 Si todos los valores de la variable se multiplican por una constante la


varianza queda multiplicada por el cuadrado de dicha constante.
Veámoslo:
Si a xi’ = xi · k tendremos (sabiendo que   )

 Si en una distribución obtenemos una serie de subconjuntos disjuntos, la


varianza de la distribución inicial se relaciona con la varianza de cada
uno de los subconjuntos mediante la expresión

Siendo

Ni è el nº de elementos del subconjunto (i)

S2i è la varianza del subconjunto (i)

1.3.- LA DESVIACIÓN ESTÁNDAR (S ó δ)

Es una medida de la cantidad típica en la que los valores del conjunto de


datos difieren de la media. Es la medida de dispersión más utilizada, se le
llama también desviación típica. La desviación estándar siempre se calcula con
respecto a la media y es un mínimo cuando se estima con respecto a este
valor.

Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz


cuadrada positiva de esta. A la desviación se le representa por la letra
minúscula griega "sigma" ( δ ) ó por la letra S mayúscula, según otros analistas.

Cálculo de la Desviación Estándar

δ = √δ2 ó S = √S2

Ejemplo:

Del cálculo de la varianza de las edades de cinco estudiantes universitarios de


primer año se obtuvo δ2=27.44, como la desviación estándar es la raíz
cuadrada positiva, entonces δ = √27.44 = 5.29 años.
Igual procedimiento se aplica para encontrar le desviación estándar de
las cuentas por cobrar de la Tienda Cabrera’s y Asociados, recordemos que la
varianza obtenida fue de 721.645, luego entonces la desviación estándar es
igual a δ =√721.645 = 26.86 balboas.

 Propiedades de la Desviación Estándar

A su vez la desviación estándar, también tiene una serie de propiedades que


se deducen fácilmente de las de la varianza (ya que la desviación típica es la
raíz cuadrada positiva de la varianza):

 La desviación estándar es siempre un valor no negativo S será siempre ³


0 por definición. Cuando S = 0 è X = xi (para todo i).

 Es la medida de dispersión óptima por ser la más pequeña.

 La desviación estándar toma en cuenta las desviaciones de todos los


valores de la variable

 Si a todos los valores de la variable se le suma una misma constante la


desviación estándar no varía.

 Si a todos los valores de la variable se multiplican por una misma


constante, la desviación estándar queda multiplicada por el valor
absoluto de dicha constante.

1.4.- El Coeficiente de Variación de Pearson (C.V.)

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en


un valor representativo, las medidas de dispersión nos dicen hasta que punto
estas medidas de tendencia central son representativas como síntesis de
la información. Las medidas de dispersión cuantifican la separación, la
dispersión, la variabilidad de los valores de la distribución respecto al valor
central. Distinguimos entre medidas de dispersión absolutas, que no son
comparables entre diferentes muestras y las relativas que nos permitirán
comparar varias muestras.

El problema de las medidas de dispersión absolutas es que normalmente son


un indicador que nos da problemas a la hora de comparar. Comparar muestras
de variables que entre sí no tienen cantidades en las mismas unidades, de ahí
que en ocasiones se recurra a medidas de dispersión relativas.

Un problema que se plantea, tanto la varianza como la desviación estándar,


especialmente a efectos de comparaciones entre distribuciones, es el de la
dependencia respecto a las unidades de medida de la variable. Cuando se
quiere comparar el grado de dispersión de dos distribuciones que no vienen
dadas en las mismas unidades o que las medias no son iguales se utiliza el
llamado "Coeficiente de Variación de Pearson", del que se demuestra que
nos da un número independiente de las unidades de medidas empleadas, por
lo que entre dos distribuciones dadas diremos que posee menor dispersión
aquella cuyo coeficiente de variación sea menor., y que se define como la
relación por cociente entre la desviación estándar y la media aritmética; o
en otras palabras es la desviación estándar expresada como porcentaje
de la media aritmética.

Definición del Coeficiente de Variación

Donde: C.V. representa el número de veces que la desviación típica contiene a


la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y
menor la representatividad de la media.

 Propiedades del Coeficiente de Variación :

 Si a todos los valores de la variable se le suma una misma constante el


coeficiente de variación queda alterado.

Ejemplo:

Suponga que Usted trabaja en una compañía de ventas, que ofrece como
premio de incentivo al mejor vendedor del trimestre anterior las entradas al
palco empresarial en la serie final de béisbol de las grandes ligas en
los Estados Unidos (E,E,U,A,).
De los registros de ventas se tienen los siguientes datos de ventas, expresados
en porcentajes de cumplimiento de las metas fijadas mensualmente:

Vendedor A 95 105 100

Vendedor B 100 90 110

El promedio trimestral de cumplimiento de las metas de ventas de ambos


vendedores es igual y equivale al 100%, pero Ud. Sólo le puede dar el premio
de incentivo a uno de ellos. ¿Cuál usted escogería?. ¿En base a que criterio’.
Explique.

Este problema se resuelve utilizando el coeficiente de variación, para estos


efectos es necesario encontrar la desviación estándar trimestral de las ventas
de cada uno de la siguiente manera:

Vendedor A

Xi ( Xi -  ) ( Xi -  )
2

95 95 – 100 = -5 (-5)2 =
25

105 105 – 100 = 5 ( 5)2 = 25

100 100 – 100 = 0 ( 0)2 = 0

Total XXX 50

La desviación estándar es δ=√(50/3) = √16.667 = 4.08, luego entonces el


coeficiente de variación es igual a:

δ 4.08

C.VA= --------- = ----------- = 0.0408

 100

Vendedor B

Xi ( Xi -  ) ( Xi -  )2
100 100 – 100 = 0 ( 0 )2 = 0

90 90 – 100 = -10 (-10)2 =


100

110 110 – 100 = 10 ( 10)2 =


100

Total XXX 200

La desviación estándar es δ=√(200/3) = √66.667 = 8.16, luego entonces el


coeficiente de variación es igual a:

Respuesta: Dado que el vendedor A tiene menor coeficiente de variación,


A él le corresponde recibir el premio de incentivo.

LABORATORIO

(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de


un parcial)

Problema #1: Datos no agrupados

Calcule el rango, la varianza y la desviación estándar de las observaciones que


se presentan a continuación.

63 45 39 55 69 21 50 25 33 25

Problema #2:

Un profesor hace un examen a tres estudiantes y las puntuaciones resultantes


(Xi) son: 73, 75 y 77.

I. Hallar la media, la varianza y la desviación estándar de


esta población de valores

II. En la clase hacía un calor terrible, y hubo alarma por la amenaza de


incendio durante el examen. El profesor quisiera aumentar las
puntuaciones para tener en cuenta estas condiciones desafortunadas de
ambientación. Un primer aumento suma 10 puntos a cada puntuación.
Sea Yi = Xi+10. Halle , δ2 y δ.

III. Un segundo aumento incrementa cada puntuación en un 10%. Sea Pi


=1.1 (Xi). Halle , δ2 y δ.

IV. El último aumento es una combinación de los dos primeros. Este es,
cada puntuación se incrementa en un 10% y luego se suman 10 puntos
más. Sea Zi = 1.1 (Xi)+10. Halle . δ2 y δ.

Problema #3: Datos Agrupados

La distribución de frecuencias que se presenta a continuación muestra el


tiempo que se necesita para envolver 130 paquetes que fueron enviados por
correo en Macondo.

Calcule el rango, la varianza y la desviación estándar de la siguiente


distribución de frecuencias de los datos:

Tiempo No. de paquetes

(en minutos) envueltos

0.5 a menos de 1.0 6

1.0 a menos de 1.5 12

1.5 a menos de 2.0 30

2.0 a menos de 2.5 42

2.5 a menos de 3.0 28

3.0 a menos de 3.5 12

Total 130

Problema #4: Coeficiente de Variación

Los datos a continuación describen las distribuciones de puntuaciones en


determinados grupos ocupacionales sometidos a la prueba general de
clasificaciones del ejército durante el último año.
Ocupaciones N  S Rango

Contador 172 128.1 11.7 94-157

Abogado 94 127.1 10.9 96-157

Periodista 45 124.5 11.7 100-157

Vendedor 492 109.2 16.3 42-149

Plomero 128 102.7 16.0 56-139

Camionero 817 96.2 19.7 16-149

Campesino 817 91.4 20.7 24-141

Carpintero 77 89.0 19.6 45-145

Compare los resultados obtenidos para cada grupo ocupacional utilizando el


coeficiente de variación y el rango o recorrido. Comente los resultados.

Problema #5: Coeficiente de Variación

La tabla a continuación indica los salarios básicos por hora (en unidades


monetarias) en abril 200X para ciertas categorías ocupacionales de obreros
sindicalizados en cierto sector de la construcción. Determine cuál es la
ocupación en la que existe la mayor variación en los salarios básicos y cuál es
la que muestra la menor variación. Para hacer estas comparaciones deberá
utilizar el coeficiente de variación.

Salarios básicos por hora, según tipo de trabajo y lugares encuestados

Ocupación A B C D

Albañiles 6.290 7.375 5.750 7.500

Carpinteros 5.900 7.020 5.370 6.660

Electricistas 7.500 7.600 6.700 7.335

Pintores 7.170 6.735 4.750 6.110

Enyesadotes 5.920 7.045 5.940 6.825

Plomeros 8.000 4.450 6.250 7.080


Ayudantes 4.020 4.780 3.180 4.700

Regla práctica del intervalo: Valores Comunes e Infrecuentes, Teorema de


Chebyshev, Estandarización, Puntuaciones Z y valores infrecuentes,
Coeficiente de Variación (CV).

El Teorema de Chebyshev es considerado una desigualdad probabilística,


proporciona un límite superior a la probabilidad de que la desviación absoluta
de una variable correspondiente o aleatoria, de su medida, excede un umbral
dado. En general, el Teorema de Chebyshev se usa para medir la dispersión
de los datos para cualquier distribución.

El Teorema de Chebyshev explica que al menos 1-1/k2 de datos de una


muestra deben caer dentro de K, que es las desviaciones estándar de estándar
de la media. En cualquier ejercicio o prueba, el K es un número real positivo
mayor que uno.

En un conjunto de datos que se distribuye, o se encuentra en forma de curva


de campana, este posee unas ciertas características interesantes que vale la
pena resaltar. Uno de ellos se ocupa de la propagación de los datos, cuando se
encuentra en relación con el número de la desviación estándar de la media.

Cuando sucede una distribución normal, se sabe que al menos un 68% de los
datos es una desviación estándar de la media. Por otro lado, el 95% son dos
desviaciones están de la media, y el 99% aproximadamente se encuentra
dentro de las tres desviaciones estándar de la media.

Sin embargo, si el conjunto de estos datos no se logra distribuir


adecuadamente, en forma de curva de campana, entonces la cantidad
diferente podría encontrarse dentro de una desviación estándar. El Teorema de
Chebyshev es el encargado de explicar una manera de saber qué fracción de
datos se encuentra dentro de las desviaciones estándar K de la media para
cualquier conjunto de datos en específico.
Medidas de Orden: Percentiles: Percentiles en Serie de Datos Ordenados,
Percentiles en Datos Tabulados, Percentiles en Datos Agrupados, Deciles
y Cuartiles.

Los cuantiles son medidas de posición que se determinan mediante


un método que determina la ubicación de los valores que dividen un conjunto
de observaciones en partes iguales.

Los cuantiles son los valores de la distribución que la dividen en partes iguales,


es decir, en intervalos que comprenden el mismo número de valores. Cuando
la distribución contiene un número alto de intervalos o de marcas y se requiere
obtener un promedio de una parte de ella, se puede dividir la distribución en
cuatro, en diez o en cien partes.

Los más usados son los cuartiles, cuando dividen la distribución en cuatro
partes; los deciles, cuando dividen la distribución en diez partes y los centiles o
percentiles, cuando dividen la distribución en cien partes. Los cuartiles, como
los deciles y los percentiles, son en cierta forma una extensión de la mediana.

Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):

Como los cuartiles adquieren su mayor importancia cuando contamos un


número grande de datos y tenemos en cuenta que en estos casos
generalmente los datos son resumidos en una tabla de frecuencia. La fórmula
para el cálculo de los cuartiles cuando se trata de datos agrupados es la
siguiente: k= 1, 2,3

Correlación: Tipos de correlación, Proporcionalidad, Diagrama de


dispersión, Coeficientes de correlación, Coeficientes de correlación de
Pearson, Coeficientes de correlación de Spearman, Intensidad de la
correlación. Ejemplo de cada uno.
El término correlación se utiliza generalmente para indicar la correspondencia o
la relación recíproca que se da entre dos o más cosas, ideas, personas, entre
otras.

En tanto, en probabilidad y estadística, la correlación es aquello que indicará


la fuerza y la dirección lineal que se establece entre dos variables aleatorias.

Se considera que dos variables de tipo cuantitativo presentan correlación la


una respecto de la otra cuando los valores de una ellas varíen
sistemáticamente con respecto a los valores homónimos de la otra.

Por ejemplo, si tenemos dos variables que se llaman A y B, existirá el


mencionado fenómeno de correlación si al aumentar los valores de A lo hacen
también los valores correspondientes a B y viceversa.

De todas maneras, vale aclarar que la correlación que pueda darse entre dos
variables no implicará por si misma ningún tipo de relación de causalidad. Los
principales elementos componentes de una correlación de este tipo serán: la
fuerza, el sentido y la forma.

Análisis de correlación

El análisis de correlación emplea métodos para medir la significación del grado


o intensidad de asociación entre dos o más variables. Normalmente, el primer
paso es mostrar los datos en un diagrama de dispersión. El concepto de
correlación está estrechamente vinculado al concepto de regresión, pues, para
que una ecuación de regresión sea razonable los puntos muéstrales deben
estar ceñidos a la ecuación de regresión; además el coeficiente de correlación
debe ser:

 Grande cuando el grado de asociación es alto (cerca de +1 o -1, y


pequeño cuando

 Es bajo, cerca de cero.

 Independiente de las unidades en que se miden las variables.


Diagrama de dispersión

Un diagrama de dispersión se emplea cuando existe una variable que está bajo
el control del experimentador. Si existe un parámetro que se incrementa o
disminuye de forma sistemática por el experimentador, se le denomina
parámetro de control o variable independiente = eje de x y habitualmente se
representa a lo largo del eje horizontal. La variable medida o dependiente = eje
de y usualmente se representa a lo largo del eje vertical. Si no existe una
variable dependiente, cualquier variable se puede representar en cada eje y el
diagrama de dispersión mostrará el grado de correlación (no causalidad) entre
las dos variables.

Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las


variables con un intervalo de confianza determinado. La correlación puede ser
positiva (aumento), negativa (descenso), o nula (las variables no están
correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea
de tendencia") con el fin de estudiar la correlación entre las variables. Una
ecuación para la correlación entre las variables puede ser determinada
por procedimientos de ajuste. Para una correlación lineal, el procedimiento de
ajuste es conocido como regresión lineal y garantiza una solución correcta en
un tiempo finito.

Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo,


es su capacidad para mostrar las relaciones no lineales entre las variables.
Además, si los datos son representados por un modelo de mezcla de
relaciones simples, estas relaciones son visualmente evidentes como patrones
superpuestos.

El diagrama de dispersión es una de las herramientas básicas de control de


calidad, que incluyen además el histograma, el diagrama de Pareto, la hoja de
verificación, los gráficos de control, el diagrama de Ishikawa y el diagrama de
flujo.

Coeficiente de correlación de Pearson

El coeficiente de correlación de Pearson es un índice que mide la relación lineal


entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la
correlación de Pearson es independiente de la escala de medida de las
variables

El coeficiente de correlación entre dos variables aleatorias X e Y es el cociente

El valor del índice de correlación varía en el intervalo [-1, +1]:

 Si r = 1, existe una correlación positiva perfecta. El índice indica una


dependencia total entre las dos variables denominada relación directa:
cuando una de ellas aumenta, la otra también lo hace en proporción
constante.

 Si 0 < r < 1, existe una correlación positiva.

 Si r = 0, no existe relación lineal. Pero esto no necesariamente implica


que las variables son independientes: pueden existir todavía relaciones
no lineales entre las dos variables.

 Si -1 < r < 0, existe una correlación negativa.

 Si r = -1, existe una correlación negativa perfecta. El índice indica una


dependencia total entre las dos variables llamada relación inversa:
cuando una de ellas aumenta, la otra disminuye en proporción
constante.

Coeficiente de determinación

En un modelo de regresión lineal el coeficiente de determinación se interpreta


como el porcentaje de variación de la variable dependiente

El coeficiente de determinación, r2 - la proporción de la variación total en la


variable dependiente Y que está explicada por o se debe a la variación en la
variable independiente X.
El coeficiente de determinación es el cuadrado del coeficiente de correlación, y
toma valores de 0 a 1.

Ejemplo:

Dan Ireland, presidente de la sociedad de alumnos de la Universidad de


Toledo, está preocupado por el costo de los libros. Para tener un panorama del
problema elige una muestra de 8 libros de venta en la librería. Decide estudiar
la relación entre el número de páginas del libro y el costo. Calcule el coeficiente
de correlación.

Regresión lineal

Abordaremos en esta página las distribuciones bidimensionales. Las


observaciones se dispondrán en dos columnas, de modo que en cada fila
figuren la abscisa x y su correspondiente ordenada y. La importancia de las
distribuciones bidimensionales radica en investigar cómo influye una variable
sobre la otra. Esta puede ser una dependencia causa efecto, por ejemplo, la
cantidad de lluvia (causa), da lugar a un aumento de la producción agrícola
(efecto). O bien, el aumento del precio de un bien, da lugar a una disminución
de la cantidad demandada del mismo.

Si utilizamos un sistema de coordenadas cartesianas para representar la


distribución bidimensional, obtendremos un conjunto de puntos conocido con el
diagrama de dispersión, cuyo análisis permite estudiar cualitativamente, la
relación entre ambas variables tal como se ve en la figura. El siguiente paso, es
la determinación de la dependencia funcional entre las dos variables x e y que
mejor ajusta a la distribución bidimensional. Se denomina regresión lineal
cuando la función es lineal, es decir, requiere la determinación de dos
parámetros: la pendiente y la ordenada en el origen de la recta de
regresión, y=ax+b.

La regresión nos permite además, determinar el grado de dependencia de las


series de valores X e Y, prediciendo el valor y estimado que se obtendría para
un valor x que no esté en la distribución.
Vamos a determinar la ecuación de la recta que mejor ajusta a los datos
representados en la figura. Se denomina error ei a la diferencia yi-y, entre el
valor observado yi, y el valor ajustado y= axi+b, tal como se ve en la figura
inferior. El criterio de ajuste se toma como aquél en el que la desviación
cuadrática media sea mínima, es decir, debe de ser mínima la suma

El extremo de una función: máximo o mínimo se obtiene cuando las derivadas


de s respecto de a y de b sean nulas. Lo que da lugar a un sistema de dos
ecuaciones con dos incógnitas del que se despeja a y b.
El coeficiente de correlación es otra técnica de estudiar la distribución
bidimensional, que nos indica la intensidad o grado de dependencia entre las
variables X e Y. El coeficiente de correlación r es un número que se obtiene
mediante la fórmula.

El numerador es el producto de las desviaciones de los valores X e Y respecto


de sus valores medios. En el denominador tenemos las desviaciones
cuadráticas medias de X y de Y.

El coeficiente de correlación puede valer cualquier número comprendido entre


-1 y +1.

· Cuando r=1, la correlación lineal es perfecta, directa.

· Cuando r=-1, la correlación lineal es perfecta, inversa

· Cuando r=0, no existe correlación alguna, independencia total de los valores


XeY

Experimento aleatorio, Espacio Muestral (S), Eventos, Espacios


Homogéneos.

Experimento aleatorio

Es la reproducción controlada de un fenómeno; y cuyo resultado depende del


azar. Ejemplos:

 Lanzamiento de un dado.

 Lanzamiento de una moneda.

Un experimento aleatorio puede ser repetido bajo las mismas condiciones, y se


puede describir el número de resultados posibles.

Espacio muestral (S)


Es el conjunto de todos los resultados posibles de un experimento aleatorio.

 Si se lanza un dado, el espacio muestral está compuesto por los


siguientes elementos: S={1, 2, 3, 4, 5, 6}.

 Si se lanza una moneda que tiene dos caras: perro (P) y gato (G), el
espacio muestral está compuesto por: S={P, G}.

 Si se lanzan dos monedas, el espacio muestral está compuesto


por: S={(P, P), (P, G), (G, P), (G, G)}.

 Si se lanza un dado y una moneda, el espacio muestral está compuesto


por: S={(1,P),(1,G),(2,P),(2,G),(3,P),(3,G),(4,P),(4,G),(5,P),(5,G),(6,P),
(6,G)}

Evento o suceso

Conjunto de uno o más resultados del experimento aleatorio.

 Si A = {obtener un número 5 al lanzar un dado}, entonces, A={5}.

 Si B = {obtener un número mayor que 3 al lanzar un dado},


entonces, B={4, 5, 6}.

 Si C = {obtener un número par al lanzar un dado}, entonces, C={2, 4, 6}.

 Si D = {obtener al menos 1 gato al lanzar 2 monedas},


entonces, D={(P, G), (G, P), (G, G)}

Probabilidad

Probabilidad es un valor entre 0 y 1, que indica la posibilidad relativa de que


ocurra un evento. El valor de la probabilidad se calcula mediante la siguiente
fórmula:

Técnicas de Conteo, Principio fundamental de conteo, Orden y


Reposición, Diagrama del árbol.
Son estrategias utilizadas para determinar el número de posibilidades
diferentes que existen al realizar un experimento.  Por ejemplo: al lanzar un
dado veremos cuantas probabilidades hay de que salga un número a favor, si
tienen 6 caras los dados cual sería la probabilidad de que saliera un cierto
número. Entonces sirve para contar el número de casos favorables o posibles y
así podemos ver cuantas combinaciones diferentes se pueden tener.

¿Qué es un diagrama de árbol? Es un método gráfico para identificar todas


las partes necesarias para alcanzar algún objetivo final. En mejora de la
calidad, los diagramas de árbol se utilizan generalmente para identificar todas
las tareas necesarias para implantar una solución.

Definición de Probabilidad, Definición Clásica de Probabilidad,


Propiedades de las probabilidades, Probabilidad y Frecuencia Relativa.

Concepto de probabilidad clásica.

Es el número de resultados favorables a la presentación de un evento dividido


entre el número total de resultados posibles. Asignación de probabilidad "a
priori", si necesidad de realizar el experimento.

La probabilidad clásica o teórica se aplica cuando cada evento simple del


espacio muestral tiene la misma probabilidad de ocurrir.

Se entiende por probabilidad frecuentista a la frecuencia relativa de un


evento esperada en el largo plazo o luego de una secuencia de ensayos.
Cuantas más veces se repita el experimento, al final las posibilidades de que
ocurra cada uno de los sucesos será regular.
Probabilidad del suceso imposible es cero. 3 La probabilidad de la unión de
dos sucesos es la suma de sus probabilidades menos la probabilidad de su
intersección. 4 Si un suceso A está incluido en otro suceso B, entonces
la probabilidad de A es menor o igual a la probabilidad de B.

CONCLUSION

Los conceptos antes mencionados han sido analizados e investigados de tal


manera de hacer más fácil su comprensión y entendimientos ya que la
estadística es la ciencia que trata de entender, organizar y tomar decisiones
que estén de acuerdo con los análisis efectuados.

Es recomendable tomar en cuenta que la estadística es muy importante en la


vida social y laboral del hombre ya que publica información.

Es una herramienta indispensable para la toma de decisiones. También es


ampliamente empleada para mostrar los aspectos cuantitativos de una
situación.
BIBLIOGRAFIA

https://www.monografias.com/trabajos93/tecnicas-conteo/tecnicas-
conteo.shtml

https://es.slideshare.net/JoanFernandoChipia/experimentos-aleatorios-
espacio-muestral-y-eventos

https://www.monografias.com/trabajos27/datos-agrupados/datos-
agrupados.shtml

https://www.monografias.com/trabajos43/medidas-dispersion/medidas-
dispersion2.shtml

También podría gustarte