Está en la página 1de 22

Universidad Abierta y a Distancia de

México.

Licenciatura en Matemáticas

Actividad 1
Unidad 1

Docente:
Materia: Estadística I
Nombre del alumno: Gustavo Hernandez Garacia
Matricula: ES1821004569
1.- Investiga: (realiza una descripción de media cuartilla de cada inciso)
a) Estadística.

La estadística es una rama de las matemáticas con origen remoto y en continua


evolución y desarrollo. Hasta el siglo XVII se entendía por estadística la
recopilación de datos para la administración del Estado. Ya en el Imperio Romano
se hizo enumeración y recuento de soldados, medios de trasporte, riquezas .. y se
tiene constancia de que en tiempos de César Augusto se realizo un censo de la
población. De status, o estado de las cosas, parece derivarse la palabra
estadística.

La estadística a diferencia de la matemática no genera resultados exactos, los


resultados siempre tienen asociada un grado de incertidumbre o error. La
estadística trata de lograr una aproximación de la realidad, la cual es siempre
mucho más compleja y rica que el modelo que podemos abstraer. Si bien esta
ciencia es ideal para describir procesos cuantitativos, tiene serios problemas para
explicar “por qué” cualitativo de las cosas

b) Estadística descriptiva.
La estadística descriptiva está formada por procedimientos empleados para
resumir y describir las características importantes de un conjunto de mediciones.
Si el conjunto de mediciones es toda la población, sólo es necesario sacar
conclusiones basadas en la estadística descriptiva. No obstante, podría ser
demasiado costoso o llevaría demasiado tiempo enumerar toda la población.
Quizá enumerar la población la destruiría, como en el caso de la prueba de
“tiempo para falla”. Por éstas y otras razones, quizá el lector sólo tenga una
muestra de la población que, al verla, usted desee contestar preguntas acerca de
la población en su conjunto

c) Estadística inferencial.
La estadística inferencial está formada por procedimientos empleados para hacer
inferencias acerca de características poblacionales, a partir de información
contenida en una muestra sacada de esta población
El objetivo de la estadística inferencial es hacer inferencias (es decir, sacar
conclusiones, hacer predicciones, tomar decisiones) acerca de las características
de una población a partir de información contenida en una muestra.
d) Probabilidad.
La probabilidad es simplemente qué tan posible es que ocurra un evento
determinado.
Cuando no estamos seguros del resultado de un evento, podemos hablar de la
probabilidad de ciertos resultados: qué tan común es que ocurran. Al análisis de
los eventos gobernados por la probabilidad se le llama estadística.

e) Combinatoria.
La Combinatoria es una herramienta que nos permite contar el número de
situaciones que se pueden dar al someter a un conjunto finito a las acciones de
ordenar y/o elegir entre sus elementos

Combinatoria sin repetición


Se entiende por combinatoria sin repetición, a los diferentes conjuntos que se
pueden formar con «n» elementos, seleccionados de x en x. Cada conjunto se
debe diferenciar del anterior en al menos uno de sus elementos (el orden no
importa) y estos no se pueden repetir.
La combinatoria sin repetición es de uso común en estadística y matemáticas.
Esta se ajusta a muchas situaciones de la vida real y su aplicación es bastante
sencilla.
¿Como calcular la combinatoria sin repetición?
La formula de la combinatoria sin repetición es:

()
C n , x= n =
n!
x x ! ( n−x ) !
Donde
n =Observaciones totales
x = Numero de elementos seleccionados

Combinatoria con repetición


Se entiende por combinatoria con repetición a los diferentes conjuntos que se
pueden formar con «n» elementos, seleccionados de x en x, permitiendo que
estos se puedan repetir. Cada conjunto se debe diferenciar del anterior en al
menos uno de sus elementos (el orden no importa).
La combinatoria con repetición es de uso común en estadística y matemáticas.
Esta se ajusta a muchas situaciones de la vida real y su aplicación es
relativamente sencilla.
Cómo calcular la combinatoria con repetición?
Su fórmula de cálculo es la siguiente:
( n+ x−1 ) !
( x )
CR n , x = n+ x−1 =
x ! ( n−1 ) !
n≥ x

Donde
n =Observaciones totales
x = Numero de elementos seleccionados

f) Series de tiempo. O series temporales


Las series temporales se pueden clasificar según sus características estadísticas
en cuatro grandes tipos.
Reconocer, interpretar y saber analizar los grandes tipos de series temporales es
esencial para realizar modelos econométricos fiables.
1.- Media constante y varianza acotada o constante

Los rendimientos de los activos financieros en general, suelen ser procesos


estocásticos estacionarios. En un lenguaje menos técnico y más sencillo, son
procesos con una media constante y una varianza acotada. El gráfico anterior
representa el cambio porcentual diario de un activo financiero sin mucha
volatilidad.
2.- Media constante y varianza creciente

Las acciones de algunas empresas que presentan volatilidad, las materias primas
o incluso el mercado de divisas (FOREX) presentan este tipo de comportamiento.
La media es más o menos constante a lo largo del periodo pero se caracterizan
por cambios grandes en una u otra dirección.

3.- Media no constante y varianza acotada o constante


El ejemplo anterior bien podría ser la evolución de la tasa de desempleo en una
época de fuerte recesión económica que dura varios años. La varianza es
constante o acotada, es decir, se mantiene en niveles muy parecidos en todo el
periodo pero la media se mantiene creciente. Si en lugar de la tasa de desempleo,
hubiésemos escogido la tasa de empleo tendríamos la misma serie pero
decreciente. Las características de la serie serían exactamente las mismas.
4.- Media creciente o decreciente y varianza creciente
Un buen ejemplo podría ser un país pobre que se encuentra en desarrollo. Pasado
cierto tiempo, su desarrollo comienza a acelerarse debido a los avances
tecnológicos y socio culturales. De ahí que la tendencia sea cada vez más
pronunciada. También es un comportamiento típico en datos de serie temporal de
una burbuja financiera.
Para finalizar cabe destacar que una serie temporal puede ser de dos tipos a la
vez. Es decir, durante algunos periodos ser del tipo 1 y durante otros periodos ser
del tipo 3. Lo habitual es que dependiendo del fenómeno se clasifique en un tipo u
otro. No obstante, hemos de tener en cuenta que tratándose de variables
económicas no hay nada seguro.

g) Software Estadístico “R”


R es una herramienta informática (específicamente, un lenguaje computacional)
sumamente potente para realizar distintos cálculos científicos, numéricos y
estadísticos, así como para crear gráficas y figuras de gran calidad. R, de hecho,
tiene hoy en día gran popularidad entre la comunidad académica y entre distintos
profesionales. Esto no es casual puesto que R es un excelente producto que,
entre una gama de virtudes, es gratuito, relativamente fácil de operar y cuenta con
una gran comunidad de internet que contribuye a resolver dudas y problemas, sin
costo alguno. La finalidad de este artículo es mostrar algunas de las principales
características de R y dar una breve historia de él, mencionar algunas de sus
aplicaciones y comentar acerca de su posicionamiento relativo respecto a otras
herramientas informáticas similares. Finalmente, se invita al lector al uso de R
para que sea una útil herramienta para resolver sus propios problemas.

2.- Investiga:
a) La historia de la Estadística.
La palabra Estadística procede del vocablo “Estado”, pues era función principal de
los Gobiernos de los Estados establecer registros de población, nacimientos,
defunciones, impuestos, cosechas... La necesidad de poseer datos cifrados sobre
la población y sus condiciones materiales de existencia han debido hacerse sentir
desde que se establecieron sociedades humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la
civilización han existido formas sencillas de estadística, pues ya se utilizaban
representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y
paredes de cuevas para contar el número de personas, animales o ciertas cosas
b) Culturas de la antigüedad que tengan registros estadísticos de sus poblaciones.

La isla Cerdeña se encontraron grabados en monumentos toscos signos que


servían para llevar la cuenta del ganado y la caza

Los babilonios usaban pequeñas tablillas de arcilla para la recopilación de datos

Los egipcios analizaban los datos de población y renta documentados en papiros


en el año 3050 a.C.

En china existían los censos chinos ordenados por el emperador Tao hacia el año
2.200 a.C.

En la Edad Media, en el año 762, Carlomagno ordenó la creación de un registro de


todas sus propiedades, así como de los bienes de la iglesia

c) Menciona a los grandes matemáticos de todos los tiempos que establecieron a


la Estadística como herramienta al servicio del hombre.

Curiosamente, Graunt no conocía los trabajos de B. Pascal » (1.623-1.662) ni de


C. Huygens (1.629-1.695) sobre estos mismos temas. Un poco más tarde, el
astrónomo Edmund Halley (1.656- 1.742) presenta la primera tabla de mortalidad
que se puede considerar como base de los estudios contemporáneos. En dicho
trabajo se intenta establecer el precio de las anualidades a satisfacer a las
compañías de seguros. Es decir, en Londres y en París se estaban construyendo,
casi de manera simultánea, las dos disciplinas que actualmente llamamos
estadística y probabilidad.

d) En la actualidad, menciona cinco estudios científicos en los cuales la estadística


es una ciencia fuerte e indispensable.

e) Investiga 10 procesos científicos modernos, en donde la estadística estudia


estadística descriptiva
f) Investiga 10 procesos científicos modernos, en donde la estadística estudia
estadística inferencial.
g) Investiga 10 procesos de la vida del hombre moderno donde se analizan datos
a través de las Series de Tiempo.

3.- Responde:
¿Cuál es la estadística paramétrica?
La estadística paramétrica es una rama de la estadística inferencial que
comprende los procedimientos estadísticos y de decisión que están basados en
distribuciones conocidas. Estas son determinadas usando un número finito de
parámetros

Menciona 3 ejemplos de métodos paramétricos.

¿Cuál es la estadística no paramétrica?


La estadística no paramétrica es la rama de la estadística que engloba las pruebas
y modelos estadísticos cuya distribución de probabilidad F de los estadísticos
asociados se le supone única bajo algunas condiciones de regularidad.

Menciona algún método no paramétrico.

¿Comenta el por qué la estadística, depende los estudios de probabilidad?

La probabilidad es una rama de las matemáticas, cuyo objeto de estudio son


variables aleatorias (que son valores que dependen básicamente del azar o de la
posibilidad de que puedan o no ocurrir), que busca establecer las características y
propiedades matemáticas (definiciones, teoremas y consecuencias) de tales
variables. Su método es de tipo deductivo, esto es, partiendo de ciertas
definiciones y propiedades básicas establecidas de antemano, conocidas como
axiomas, se van deduciendo las propiedades de los objetos de interés, y cuyos
resultados se establecen como teoremas, que son proposiciones ciertas o
verdaderas que pueden y deben ser demostradas. En este sentido, la probabilidad
es afín a otras ramas de las matemáticas tales como el álgebra, el análisis
matemático, la geometría o la topología.

Por su parte la estadística es otra rama de las matemáticas cuyo objeto de estudio
son los datos, es decir valores o atributos que tienen los objetos del estudio de
nuestro interés, por ejemplo: personas, máquinas o números de una acción
financiera, siendo su propósito describir la estructura de los datos, mediante el
desarrollo de números resumen, tales como promedios o varianzas, así como
mediante el establecimiento de cierto tipo de gráficas, como histogramas o
diagramas de pastel, que son materia de estudio de la estadística descriptiva, y
realizar inferencias, es decir generalizaciones, sobre alguna variable de interés de
una muestra hacia la población analizada. Por ejemplo, si tomamos una muestra
de estudiantes de la UNAM para conocer el ingreso promedio de todos los
alumnos, en este caso se lleva a cabo un estudio de estadística inferencial.

¿Por qué la Estadística y la Probabilidad van de la mano?


Existen, confusiones acerca de la diferencia, similitud y nexo entre la probabilidad
y la estadística, y con mucha frecuencia se piensan como conceptos sinónimos o
equivalentes. Este asunto no es de menor importancia y adquiere una gran
relevancia cuando esto se traduce en potenciales errores conceptuales y
operativos, ya que si no conocemos cual es el nicho y la gama de aplicación de
cada una de estas áreas se pueden cometer importantes errores al respecto.

Un ejemplo es el siguiente: supongamos que se llevará a cabo un ejercicio de


acopio de información, mediante un proceso de aplicación de encuestas a una
muestra de estudiantes de la UNAM con la finalidad de conocer su punto de vista
acerca de la implementación de una nueva política académica, por ejemplo, subir
el estándar académico de una nota mínima aprobatoria de 7 a 8. El proceso del
diseño de muestreo es una tarea en estricto sentido probabilística, y dependiendo
del esquema que se proponga (muestreo aleatorio simple, muestreo estratificado,
muestreo por conglomerados, muestreo en varias etapas, etc.), será como se
acopie la información, lo cual impacta a la calidad misma de los datos.

Ahora bien, la disposición resumida de los resultados de la encuesta, dados en


tablas, gráficas, u otros formatos, es de naturaleza eminentemente estadística. Si
el analista, estudiante o el panel de encargados de dicho estudio no tuvieran un
marco conceptual claro acerca de estas diferencias, podría por ejemplo,
cometerse el error de tratar de aplicar herramientas de naturaleza estadística en el
proceso de diseño de muestras (cuando todavía no es el tiempo para ello) o tratar
de aplicar resultados de la probabilidad en pasos que ya no la requieran, y que
incluso hasta entorpecerían el resultado integral del estudio.

4.- Definir:
Inferir
La inferencia estadística es el conjunto de métodos y técnicas que permiten
inducir, a partir de la información empírica proporcionada por una muestra, cual es
el comportamiento de una determinada población con un riesgo de error medible
en términos de probabilidad.
Muestra
Es un subconjunto o parte del universo o población en que se llevará a cabo la
investigación. Hay procedimientos para obtener la cantidad de los componentes
de la muestra como fórmulas, lógica y otros que se vera más adelante. La muestra
es una parte representativa de la población.

Muestra representativa
Una muestra representativa es una pequeña cantidad de personas que refleja, con
la mayor precisión posible, a un grupo más grande. Entonces podemos aplicar, por
ejemplo, una encuesta online a una muestra de la población buscando que sea lo
más representativa de nuestra población objetivo.

Población.
Es el conjunto de personas u objetos de los que se desea conocer algo en una
investigación. "El universo o población puede estar constituido por personas,
animales, registros médicos, los nacimientos, las muestras de laboratorio, los
accidentes viales entre otros". (PINEDA et al 1994:108) En nuestro campo pueden
ser artículos de prensa, editoriales, películas, videos, novelas, series de televisión,
programas radiales y por supuesto personas.
5.- Realiza un cuadro comparativo y/u organizativo de:
Fórmulas de Medidas de Tendencia Central y Medidas de Dispersión, para
población y muestra, y para datos agrupados y no agrupados.

6.- Investiga la definición de:

Media
presenta el reparto equitativo, el equilibrio, la equidad. Es el valor que tendrían los
datos, si todos ellos fueran iguales. O, también, el valor que correspondería a cada
uno de los datos de la distribución si su suma total se repartiera por igual.
Mediana
se ordenan todos los datos, de menor a mayor, la mediana es el valor que ocupa
la posición central. Si el número de datos es par, la mediana es la media aritmética
de los dos centrales.
Moda
es el valor que más se repite o, lo que es lo mismo, el que tiene la mayor
frecuencia.
Varianza
es una medida de dispersión que representa la variabilidad de una serie de datos
respecto a su media.
Covarianza
La covarianza es el valor que refleja en qué cuantía dos variables aleatorias varían
de forma conjunta respecto a sus medias.
Nos permite saber cómo se comporta una variable en función de lo que hace otra
variable. Es decir, cuando X sube ¿Cómo se comporta Y? Así pues, la covarianza
puede tomar los siguiente valores:
Covarianza (X,Y)  es menor que cero cuando “X” sube e “Y” baja. Hay una relación
negativa.
Covarianza (X,Y)  es mayor que cero cuando “X” sube e “Y” sube. Hay una
relación positiva.
Covarianza (X,Y)  es igual que cero cuando no hay relación existente entre las
variables “X” e “Y”.

Desviación estándar

La desviación estándar o desviación típica es una medida que ofrece información


sobre la dispersión media de una variable. La desviación estándar es siempre
mayor o igual que cero.

Desviación media
desviación media de un conjunto de datos, es la media aritmética de los valores absolutos de lo
que se desvía cada valor respecto a la media aritmética.

Desviación típica
La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación. La desviación típica se representa por .

Medidas de posición
Las medidas de posición relativa se llaman en general cuantiles y se pueden
clasificar en tres grandes grupos: Cuartiles, quintiles, deciles, percentiles.
 
Las medidas de posición como los cuartiles, quintiles, deciles y percentiles dividen
a una distribución ordenada en partes iguales. Para calcular las medidas de
posición es necesario que los datos estén ordenados de menor a mayor.
Cuartil
son  los  tres  valores  de  la  variable  de  una  distribución que  la  dividen  en
cuatro  partes iguales, es decir, al 25%, 50% y 75%. Para calcular el valor de uno
de los cuatro Cuartiles, se utiliza la fórmula:.
Q k=k (n /4)
En donde:
 
Qk = Cuartil número 1, 2, 3 ó 4
n = total de datos de la distribución.
 
Se advierte que la posición del segundo cuartil corresponde a la ubicación de la
mediana, es decir que el segundo cuartil será siempre igual a la mediana.

Percentil
Los percentiles (Pn): son los noventa y nueve valores de la variable de una
distribución que la dividen en cien partes iguales es decir, al 1%, al 2%... y al 99%
de los datos. Los percentiles se designan por P1, P2,... P99
P50 coincide con la mediana.

Decil
Corresponden a los 9 valores que dividen a estos en 10 partes iguales es decir, al  10%, al
20%... y al 90%. Los Deciles se designan por D1, D2,..., D9
Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

σ
C . V .=
X
El coeficiente de variación se suele expresar en porcentajes

σ
C . V .= .100
X
El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas,
siempre que sus medias sean positivas.

Diagrama de caja
El diagrama de caja es un gráfico utilizado para representar una variable
cuantitativa (variable numérica). El gráfico es una herramienta que permite
visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría,
los valores extremos, la posición de la mediana, etc. Se compone de:
 Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3).
Dentro de la caja una línea indica dónde se encuentra la mediana (segundo
cuartil Q2)
 Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y
otro que empieza en el tercer cuartil y acaba en el máximo.
 Los datos atípicos (o valores extremos) que son los valores distintos que no
cumplen ciertos requisitos de heterogeneidad de los datos

Coeficiente de correlación
La correlación, también conocida como coeficiente de correlación lineal (de
Pearson), es una medida de regresión que pretende cuantificar el grado de
variación conjunta entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal
que el conjunto de puntos representados se aproxima a una recta.

Coeficiente de determinación
El coeficiente de determinación, se define como la proporción de la varianza total
de la variable explicada por la regresión. El coeficiente de determinación, también
llamado R cuadrado, refleja la bondad del ajuste de un modelo a la variable que
pretender explicar.
Es importante saber que el resultado del coeficiente de determinación oscila entre
0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a
la variable que estamos intentando explicar. De forma inversa, cuanto más cerca
de cero, menos ajustado estará el modelo y, por tanto, menos fiable será.
Regresión lineal
La regresión lineal simple consiste en generar un modelo de regresión (ecuación
de una recta) que permita explicar la relación lineal que existe entre dos variables.
A la variable dependiente o respuesta se le identifica como Y y a la variable
predictora o independiente como X.
diagrama de dispersión
El Diagrama de dispersión es una herramienta utilizada cuando se desea realizar
un análisis gráfico de datos bivariados, es decir, los que se refieren a dos
conjuntos de datos. El resultado del análisis puede mostrar que existe una relación
entre una variable y la otra.
Distribución de probabilidad
Una distribución de probabilidad la podemos concebir como una distribución
teórica de frecuencia, es decir, es una distribución que describe como se espera
que varíen los resultados. Dado que esta clase de distribuciones se ocupan de las
expectativas son modelos de gran utilidad para hacer inferencias y tomar
decisiones en condiciones de incertidumbre.
Función de probabilidad
Se define la función de probabilidad de la variable aleatoria X como la que
asocia una probabilidad pi a cada valor posible de X ( x 1 , x 2 , … …. , x n ) .respecto
a las probabilidades, se cumple siempre que:

0 ≤ pi ≤1 p1 + p2+ p 3+ …+ pn=∑ pi=1
i

Función de distribución
Sea X una variable aleatoria discreta cuyos valores suponemos ordenados de
menor a mayor. Llamaremos función de distribución de la variable X , y
escribiremos F ( x ) a la función:

F ( x )=P( X ≤ x)

La función de distribución asocia a cada valor de la variable aleatoria la


probabilidad acumulada hasta ese valor.

Función de densidad de probabilidad.


a función de densidad de probabilidad ayuda a identificar regiones de mayores y
menores probabilidades para valores de una variable aleatoria.
7.- Desarrollo de problemas:
Problema 1:
Calcula todas las medidas de tendencia central y de dispersión, que analizaste en
el pdf de la Unidad 1, del curso de Estadística I.
2 4 7 7 5 9 5 8 3 5 7 3 2

Media
Es la suma de todas los valores entre el numero total de datos
2+4 +7+7+5+ 9+5+8+ 3+5+7+3+2 67
x= = =5.15
13 13
moda
Num. de clases clases frecuencia
1 2 2
2 3 2
3 4 1
4 5 3
5 7 3
6 8 1
7 9 1

Por lo tanto como hay dos valores con la misma frecuencia la moda toma dos
valores
^x =5
^x =7
Mediana
Para calcular la mediana es el dato central ordenado de menor a mayor
2
2
3
3
4
5
5
5
7
7
7
8
9
El dato que esta iluminado en azul es la mediana
Media recortada al 5%
Eliminamos los extremos el 5% ósea un dato:
2
2
3
3
4
5
5
5
7
7
7
8
9
Ahora calculamos la media
2+3+3+ 4+5+5+ 5+7+7+7+ 8 56
x= = =5.09
13−2 11

num de clases clases frecuencia X-x (X-x)^2 (X-x)^2(f)


1 2 2 -3.15 9.9225 19.845
2 3 2 -2.15 4.6225 9.245
3 4 1 -1.15 1.3225 1.3225
4 5 3 -0.15 0.0225 0.0675
5 7 3 1.85 3.4225 10.2675
6 8 1 2.85 8.1225 8.1225
7 9 1 3.85 14.8225 14.8225
  total 13   suma= 63.6925

Varianza
n

∑ f (x ¿¿i−x)2
2 i=1
s= ¿
n−1
Sustituimos
2 63.6925
s= =5.3077
13−1
Entonces la varianza es 5.3077
Para calcular la desviación típica usamos la ecuación para una muestra


n

∑ f ( x¿ ¿i−x)2
i=1
s= ¿
n−1
Sustituimos
s= √5.3077=2.3038
Entonces la desviación típica o desviación estándar es 2.3038
Para calcular el coeficiente de variación utilizamos la siguiente ecuación
s
cv = (100)
x
Sustituimos
2.3038
cv = ( 100 )=44.73 %
5.15

Entonces el coeficiente de variación es 44.73%

Problema 2:
Observa la siguiente tabla de datos ordenada por intervalos:
Clase interval Frecuencia
o
1 25-37 4
2 37-49 6
3 49-61 17
4 61-73 25
5 73-85 13

marca de
Frecuenci
marca de clase por
Clase intervalo a
clase(x) frecuenci
(f )
a
1 25-37 4 31 124
2 37-49 6 43 258
3 49-61 17 55 935
4 61-73 25 67 1675
5 73-85 13 79 1027
    65   4019

Para calcular la media utilizamo la siguiente ecuacion

x=
∑ ( x )( f )
n
Sustituimos
4019
x= =61.83
65
Por lo tanto la media es 61.83
Para calcular la mediana primero el numero de datos lo dividimos entre 2 el
numero de datos
65
posicion= =32.5
2
Luego hacemos la frecuencia absoluta acumulada

marca de frecuencia
Frecuenci marca de clase por absoluta
Clase intervalo
a clase frecuenci acumulad
a a (F)

1 25-37 4 31 124 4
2 37-49 6 43 258 10
3 49-61 17 55 935 27
4 61-73 25 67 1675 52
5 73-85 13 79 1027 65
    65   4019

Buscamos el 32.5 en la frecuencia acumulada como no está buscamos el


siguiente que es el 52

Y utilizamos la siguiente formula

mediana=limite inferior +amplitud ( posicion−frecuencia anterior


frecuencia de posicion )
Sustituimos

mediana=61+12 ( 32.5−27
25 )
=61+12 (
25 )
5.5
=61+ 2.64=63.64

Por lo tanto la mediana es 63.64


Moda
La moda la buscamos en la frecuencia absoluta es el dato que mas se repite
Entonces utilizamos la siguiente formula
moda=61+12
( 25−17
)
( 25−17 ) + ( 25−13 ) (
=61+12
12
12+12 )
=61+12
12
24 ( )
¿ 61+6=67

Por lo tanto la moda es 67

Calcula todas las medidas de tendencia central y dispersión que estudiaste en el


pdf de la Unidad 1, del curso de Estadística 1.

Problema 3:
Dado los datos: (no agrupados)
4 3 19 17 3 11 8
7 6 2 10 2 9 6
4 24 7 9 9 2 4
7 11 4 7 5 7 9
3 5 11 6 3 5 4
9 3 14 15 11 8 1

a) Ordénalos por intervalos.


b) Calcula todas las medidas de tendencia central y dispersión que conozcas.
Apóyate en el pdf de la Universidad.

Problema 4.
Se realiza una investigación en un Bachillerato tecnológico a 165 adolescentes de
15 a 17 años, donde se les preguntó, el número de horas a la semana (de lunes a
domingo) que pasan viendo videos en la nueva red social Tik Tok.
Los resultados arrojaron los siguientes datos (horas a la semana)
32 50 51 36 37 23 38 40 30 34 17
39 47 37 30 46 48 44 45 40 29 29
49 32 42 53 33 62 48 57 47 28 40
38 36 37 37 36 40 25 58 45 52 48
37 43 38 39 42 41 33 52 32 42 46
47 52 32 42 23 40 59 46 22 48 45
34 41 26 27 36 38 36 30 31 62 40
34 34 35 40 34 39 46 39 32 46 33
40 40 42 29 38 32 31 37 32 37 33
37 33 46 36 31 40 37 42 41 36 46
35 52 30 58 40 35 61 40 23 50 37
47 31 52 41 55 41 34 37 31 45 53
41 46 29 32 40 43 43 49 32 29 39
29 32 35 47 38 37 46 33 49 41 46

Con los datos expuestos, Calcular y/o elaborar:


a) Ordénalos por intervalos.
b) La media. Moda, Mediana, Rango, Varianza, Desviación estándar, Desviación
media y Coeficiente de variación.
c) Tabla de frecuencias con la información que creas sea la más conveniente,
Diagrama circular, Gráfica de barras, Gráfica de ojiva ascendente.
d) Realiza una conclusión de la información que observas en la gráfica de barras.
¿Encuentras alguna característica que se puede analizar?
e) ¿Cómo se le llamaría a la forma de la distribución de datos en gráfica de
barras?

Fuentes de consulta
María Teresa González Manteiga y Alberto Pérez de Vargas. (2009). Estadística
Aplicada Una visión Instrumental. España: Diaz de Santos.

William Mendenhall, Robert Beaver, Barbara M. Beaver, . (2006). introducción a la


probabilidad y Estadística Decima tercera edición. EUA: CENGAGE Learning.
Rodríguez Silva, José Luis Ángel(2019). ¿Qué puede hacer el software R para
resolver tus problemas? Revista digital universitaria(RDU). Vol. 20, núm. 3 mayo-
junio. Sitio web:
http://www.revista.unam.mx/2019v20n3/que-puede-hacer-el-software-r-para-
resolver-tus-problemas/
José Luis Ángel Rodríguez. (2014). diferencia hay entre la probabilidad y la
estadística? . 14/04/2020, de UNAM Sitio web:
http://www.revista.unam.mx/vol.15/num9/art72/#

También podría gustarte