Está en la página 1de 22

UNIVERSIDAD CENTROAMERICANA “JOSÉ SIMEÓN CAÑAS”

Facultad de Ciencias Económicas y Empresariales


Departamento de Matemáticas

Estadística I / Estadística Aplicada

Proyecto Parte 1

  

Sección:
01 
Nombre y número de grupo:
“Los Avengers” 04

Estudiantes: 
Diego Alejandro Castellanos Funes     00234719
Gabriela Guadalupe López Villalobos     00031519
Adolfo Mefiboset Molina Arévalo            00139819
Fátima Mercedes Monterrosa Arias       00403316
Carlos Iván Pablo Artiga                        00152518

Catedrática:
 Licda. Iris Roxana Palacios
Instructor:
 Guillermo Daniel López Henríquez 

Antiguo Cuscatlán, viernes 30 de abril del 2021


Objetivos.

General:

1. Realizar y obtener información requerida a través de una encuesta con datos a evaluar según en
el proyecto a todos nuestros conocidos a fin de llegar al menos a 50 respuestas y realizar los
cálculos de mediana, media, moda, desviación muestral y varianza.

Específicos:

1. Recolectar datos de la muestra, sobre si poseen vehículos y cuantos para realizar los cálculos de
media, mediana, moda, desviación muestral y varianza.
2. Conocer la moda del medio de transporte más utilizado en la muestra de población evaluada. 
3. Conocer los datos del tiempo invertido en las redes sociales en la muestra evaluada y realizar los
cálculos de mediana, media, moda, desviación muestral y varianza.
Introducción.

La estadística se ocupa de recolectar, organizar, resumir, presentar y analizar datos, así como de sacar
conclusiones válidas y tomar decisiones con base en este análisis, así también realizar predicciones
acerca del conjunto o muestra del cual se han seleccionado dichos datos. El empleo cuidadoso de los
diferentes elementos estadísticos permite obtener información precisa de los datos.

En el presente trabajo se presentan los datos obtenidos de la encuesta realizada, sus respectivos
resultados y análisis de los mismo. Para lo cual se han aplicado los diferentes temas vistos en clase
relacionando los datos recolectados y sacando conclusiones adecuadas y lógicas.
Marco teórico.

La estadística.
La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto
de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados. Se basa
básicamente en métodos, procedimientos y fórmulas que permiten recolectar información para luego
analizarla y extraer de ella conclusiones relevantes para el estudio. Se puede decir que es la Ciencia de
los Datos y que su principal objetivo es mejorar la comprensión de los hechos a partir de la información
disponible (Roldán, 2017).

Tipos de estadística.

Roldán (2017) define que los tipos de estadística se puede subdividir en dos grandes ramas: descriptiva e
inferencial.

 Estadística descriptiva: Se refiere a los métodos de recolección, organización, resumen y


presentación de un conjunto de datos. Se trata principalmente de describir las características
fundamentales de los datos y para ellos se suelen utilizar indicadores, gráficos y tablas.
 Estadística inferencial: Se trata de un paso más allá de la mera descripción. Se refiere a los
métodos utilizados para poder hacer predicciones, generalizaciones y obtener conclusiones a
partir de los datos analizados teniendo en cuenta el grado de incertidumbre existente.

Además, según Roldán (2017) la estadística inferencial, a su vez, se subdivide a su vez en dos grandes
tipos: estadística paramétrica y no paramétrica.

 Estadística paramétrica: Se caracteriza porque asume que los datos tienen una determinada
distribución o se especifican determinados parámetros que deberían cumplirse. Así por ejemplo,
en un análisis paramétrico podemos trabajar bajo el supuesto de que la población se distribuye
como una Normal (hay que justificar nuestro supuesto) y luego sacar conclusiones bajo el
supuesto que esta condición se cumple.
 Estadística no paramétrica: En ella no es posible asumir ningún tipo de distribución subyacente
en los datos ni tampoco un parámetro específico. Un ejemplo de este tipo de análisis es la
prueba binomial.
Importancia de la estadística.

Lo interesante de la estadística como ciencia es que, en muchos casos, la información cuantitativa que
nos brinda nos permite conocer a ese nivel mucho mejor a una sociedad, por ejemplo, cuántas personas
viven en un país, cuál es la tasa de desempleo, cuál es la tasa de indigencia o pobreza, cuál es el nivel
promedio de educación de esa sociedad, etc. Todos estos datos numéricos son utilizados por los
responsables del Estado a través de sus distintos organismos y secretarías para luego realizar proyectos
de diferente tipo que tengan que ver con mejorar esa situación o mantenerla en el caso de que sea una
situación favorable a los ciudadanos (Bembibre, 2011).

Además, según Bembibre (2011), en algunos casos, de manera indirecta, la estadística también nos
permite inferir (no conocer) la calidad de vida de una población ya que si encontramos altas tasas de
desempleo, pobreza y marginalidad podremos suponer que la calidad de vida es muy baja.

La estadística tiene una utilidad no sólo en aspectos sociales sino que también sirve para todo tipo
de investigación científica si se tiene en cuenta que los datos estadísticos son el resultado de varios
casos de entre los cuales se toma un promedio. Así, una estadística puede servir para
una investigación científica al demostrar que un porcentaje determinado de los casos observados
representó un resultado particular y no otro. Como último ejemplo, también se utiliza para conocer el
planeta en el que vivimos y darnos datos sobre las proporciones de recursos renovables, sobre las
superficies de los países, la presencia de determinados biomas o no, etc. (Bembibre, 2011).

Variables cualitativas.
Una variable cualitativa es un tipo de variable estadística que describe las cualidades, circunstancias o
características de un objeto o persona, sin hacer uso de números. De esta manera, las variables
cualitativas permiten expresar una característica, atributo, cualidad o categoría no numérica. Por
ejemplo, el sexo de una persona es una variable cualitativa, ya que es masculino o femenino (Variable
cualitativa, 2019).

La variable cualitativa puede ser nominal, ordinaria o binaria:

 Nominal: Variable que no es representada por números ni tiene algún tipo de orden, y por lo
tanto es matemáticamente menos precisa. Por ejemplo, son variables nominales los colores:
negro, azul, rojo, amarillo, naranja, etc.
 Ordinaria: La variable cualitativa ordinaria, también conocida como variable cuasi cuantitativa,
es representada por una modalidad que no requiere números, pero sí consta de un orden o un
puesto. Por ejemplo, el nivel socioeconómico: alto, medio, bajo.
 Binaria: La variable cualitativa binaria trabaja con valores específicos del tipo binario. Por
ejemplo, el sexo de una persona será masculino o femenino.

Variables cuantitativas.
Una variable cuantitativa es aquella variable estadística que, a diferencia de la cualitativa, puede
expresarse a través de cifras. Por esta razón, estas pueden analizarse con métodos estadísticos. Otra
manera de entender lo que son las variables cuantitativas es entenderlas como aquellas que pueden ser
medibles, pues, es posible ordenarlas de mayor a menor (o viceversa) y realizar operaciones
matemáticas (Westreicher, 2021).

Además, según Westreicher (2021), la principal diferencia con las variables cualitativas es que las
variables cuantitativas no representan una cualidad del sujeto u objeto que puede expresarse en
palabras, sino que pueden representarse con números y las variables cuantitativas pueden ser:

 Discretas: Son aquellas que toman, solamente, determinados valores y no cualquier valor que se
encuentre entre dos de ellos. Por ejemplo, cuando una variable solo puede tomar valores
enteros es discreta. Por ejemplo, el número de coches que posee una persona. Un individuo no
puede tener un coche y medio.
 Continuas: Son aquellas que pueden tomar cualquier valor. Habitualmente, esto quiere decir
que puede tomar valores que no son enteros. Por ejemplo, el peso de una bolsa de arroz puede
ser de 1,25 kg.

Tabla de distribución de frecuencias.

Según Serra (2014), la tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la
distribución de los datos mediante sus frecuencias. Sirve como herramienta que permite ordenar los
datos de manera que se presentan numéricamente las características de la distribución de un conjunto
de datos o muestra y se utiliza para variables cuantitativas o cualitativas ordinales. Cabe distinguir entre:

 Tabla de frecuencias con datos no agrupados.


 Tabla de frecuencias con datos agrupados.
Para las tablas de frecuencias con datos no agrupados, el proceso de construcción, según Serra (2014) es
el siguiente:

1. En la primera columna se ordenan de menor a mayor los diferentes valores que tiene


la variable en el conjunto de datos.
2. En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y
las frecuencias absolutas acumuladas.
3. Las cuarta y quinta columna contienen las frecuencias relativas y las frecuencias relativas
acumuladas.
4. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima), representando
la frecuencia relativa y la frecuencia relativa acumulada como tanto por cien.
Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.

Por otro lado, Serra (2014) afirma que, para las tablas de frecuencias con datos agrupados, el proceso de
construcción es el siguiente:

1. Se fija cuántos intervalos o clases se desean.


2. Se obtiene el rango o recorrido “R” de los datos. Es la diferencia entre el dato mayor y el menor
del conjunto de valores que toma la variable a tabular:
R=límite superior−límite inferior
3. Se determina el ancho del intervalo, dividiendo el rango o recorrido entre el número de
intervalos que se desean:
Recorrido
Ancho de cada intervalo=
N ° de intervalos
4. Se forman los diferentes intervalos o clases, partiendo del valor mínimo dado. Cada intervalo
tendrá unos extremos a y b separados por el ancho de cada intervalo.
5. Cada intervalo está representado por la llamada marca de clase. Es la media entre sus extremos:
l i+l s
x i=
2
6. A partir de la columna de las clases, se formarán las columnas de las frecuencias.
Tipos de frecuencias.

Existen varios tipos de frecuencias, pero las más comunes y utilizadas, según Serra (2014), son las
siguientes:

 Frecuencia absoluta (fi): La frecuencia absoluta de un valor es el número de veces que el valor
está en el conjunto (x1, x2, …, xn). La suma de las frecuencias absolutas de todos los elementos
diferentes del conjunto debe ser el número total de sujetos  N .
 Frecuencia absoluta acumulada (Fi): La frecuencia absoluta acumulada de un valor Xi del
conjunto (x1, x2, …, xn) es la suma de las frecuencias absolutas de los valores menores o iguales a
Xi.
 Frecuencia relativa (fr): La frecuencia relativa de un valor Xi es la proporción de valores iguales
a Xi en el conjunto de datos (x1, x2, …, xn). Es decir, la frecuencia relativa es la frecuencia
absoluta dividida por el número total de elementos N.
 Frecuencia relativa porcentual (fr %): Se designa multiplicando por 100% el resultado de la
frecuencia relativa.

Medidas de tendencia central.

La mayor parte de las series de datos muestran una clara tendencia a agruparse alrededor de un cierto
punto central. Así pues, dada cualquier serie de datos particular, por lo general es posible seleccionar
algún valor o promedio típico para describir toda la serie de datos. Este valor descriptivo típico es
una medición de tendencia central o de ubicación. Cinco tipos de promedios a menudo usados como
mediciones de tendencia central. Por el momento, los que nos interesan son la media aritmética, la
mediana y la moda (Jauregui, 2016).

Media aritmética.

Según Jauregui (2016), la media aritmética es el promedio o medición de tendencia central de uso más
común. Se calcula sumando todas las observaciones de una serie de datos y luego dividiendo el total
entre el número de elementos involucrados.

La expresión algebraica para datos no agrupados puede describirse como:

x 1+ x 2 + x 3+ x 4+ …+ x n
x́=
N
 Donde N es el número total de datos.

La expresión algebraica para datos agrupados puede describirse como:

x 1 f 1+ x 2 f 2 + x 3 f 3 +…+ x n f n
x́=
f 1 +f 2 + f 3 +…+ f n

 Donde xn es la marca de clase y fn es la frecuencia respectiva.

La mediana.

Por otro lado, Jauregui (2016) afirma que la mediana es el valor medio de una secuencia ordenada de
datos. Si no hay empates, la mitad de las observaciones serán menores y la otra mitad serán mayores.
Además, la mediana no se ve afectada por ninguna observación extrema de una serie de datos. Por
tanto, siempre que esté presente una observación extrema es apropiada usar la mediana en vez de la
media para describir una serie de datos.

Según Jauregui (2016), para calcular la mediana de una serie de datos recolectados en su forma sin
procesar, primero debemos poner los datos en una clasificación ordenada. Después usamos la fórmula
de punto de posicionamiento:

n+1
2

Para encontrar el lugar de la clasificación ordenada que corresponde al valor de la mediana, se sigue una
de las dos reglas:

1. Si el tamaño de la muestra es un número impar, la mediana se representa mediante el valor


numérico correspondiente al punto de posicionamiento, la observación ordenada es (n+1) /2.
2. Si el tamaño de la muestra es un número par entonces el punto de posicionamiento cae entre
las dos observaciones medias de la clasificación ordenada. La mediana es el promedio de los
valores numéricos correspondientes a estas dos observaciones medias.

En el caso de los datos agrupados, la expresión algebraica que se usa es la siguiente:

Posición−Total de datos anteriores alintervalo mediano


~
x=l i +C ( frecuencia del intervalo mediano )
 Donde l i es el límite inferior del intervalo mediano y C es el ancho del intervalo mediano.
Y la fórmula para obtener C es:

C=Ls −Li

 Donde Ls es el límite superior del denominado intervalo mediano y Li es el límite inferior de


este mismo intervalo.

La moda.

La moda o modo es simplemente el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la moda no se ve
afectada por la ocurrencia de los valores extremos (Jauregui, 2016).

En el caso de los datos agrupados, la clase modal es el intervalo o clase que tiene la mayor frecuencia.

Medidas de posición.

Las medidas de posición son valores que permiten dividir el conjunto de datos en partes porcentuales
iguales y se usan para clasificar una observación dentro de una población o muestra. Las  medidas de
posición más usuales y que nos interesan por el momento son los cuartiles, los deciles y los percentiles
(Suárez, s.f.).

Cuartiles.

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo
del cual quedan las tres cuartas partes (75%) de los datos (García, s.f.).

En el caso de los datos no agrupados, para encontrar el cuartil deseado, primero se ordenan los n datos
de menor a mayor. Luego, con la siguiente fórmula se encuentra la posición del cuartil:

ⅈ ( n+14 )
 Donde ⅈ puede tomar el valor de 1 (Q 1), 2 (Q 2) o 3 (Q 3). Sin embargo, si la posición cae entre
dos valores, se toma como cuartil la media de ambos valores.

Ahora bien, en el caso de los datos agrupados, la fórmula a utilizar es la siguiente:

Q k =Li +C ( Posición−Frecuencia acumulada anterior alintervalo cuartílico


Frecuencia del intervalo cuartílico )
 Donde Li es el límite inferior del intervalo cuartílico y C es el ancho del intervalo cuartílico.

Deciles.

Según García (s.f.), los deciles son ciertos números que dividen la sucesión de datos ordenados en diez
partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2, ...,
D9, que se leen primer decil, segundo decil, etc.

En el caso de los datos no agrupados, para encontrar el decil deseado, primero se ordenan los n datos
de menor a mayor. Luego, con la siguiente fórmula se encuentra la posición del decil:

k ( n+101 )
 Donde k puede tomar el valor de 1 ( D 1), 2 ( D2), 3 ( D 3) y así sucesivamente hasta el valor de 9 (
D9). Sin embargo, si la posición cae entre dos valores, se toma como decil la media de ambos
valores.

Por otro lado, en el caso de los datos agrupados, la fórmula a utilizar es la siguiente:

D k = Li +C ( Posición−Frecuencia acumulada anterior al intervalo decílico


Frecuencia del intervalo decílico )
 Donde Li es el límite inferior del intervalo decílico y C es el ancho del intervalo decílico.

Centiles o percentiles.
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las
personas cuando atienden características tales como peso, estatura, etc. Los percentiles son algunos
números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son
los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,
... P99), leídos primer percentil, ..., percentil 99 (García, s.f.).

En el caso de los datos no agrupados, para encontrar el percentil deseado, primero se ordenan los n
datos de menor a mayor. Luego, con la siguiente fórmula se encuentra la posición del percentil:

k ( n+1001 )
 Donde k puede tomar el valor de 1 ( P1), 2 ( P2), 3 ( P3) y así sucesivamente hasta el valor de 99 (
P99). Sin embargo, si la posición cae entre dos valores, se toma como percentil la media de
ambos valores.

Y, en el caso de los datos agrupados, la fórmula a utilizar es la siguiente:

Pk =Li +C ( Posición−Frecuencia acumulada anterior alintervalo percentílico


Frecuencia del intervalo percentílico )
 Donde Li es el límite inferior del intervalo percentílico y C es el ancho del intervalo percentílico.
Cálculos. Colocar las unidades respectivas. Por ejemplo, media: 5.3 años.
Trabajar con redondeo a 2 decimales.

Variables a analizar, cada resultado cuenta con base de información proporcionada de la encuesta
realizada (Proyecto de estadística 1, 2021).

2. Edad en años cumplidos.

3. Sexo.
4. Municipio donde reside.

5. Departamento
donde reside.
6. Estatura en centímetros.

7. Peso en libras.
8. Incluyéndose a usted, ¿cuántas personas viven en su casa?

9. Edad de los
miembros
que residen en
su casa, sin
incluirse
usted.
10. Años desde que inició su vida laboral. Si no ha iniciado su vida laboral, coloque cero.

11. Desde la primaria o parvularia, ¿Cuántos años de estudio ha realizado en toda su vida?
12. ¿Posee hermanos/as? En caso de si coloque el
número de hermanos que posee sin contarse a

usted.

13. ¿Cuántos vehículos posee en casa? Si no posee vehículos, coloque cero.


14. Medio de transporte que se usa habitualmente.
15. Horas que dedica diariamente en las redes sociales.

Conclusiones.

Como equipo de trabajo de la materia de estadística I con base al proyecto fase 1, hicimos una encuesta
realizada a 58 personas en la plataforma de Google Forms, donde recolectamos y obtuvimos
información para desarrollar cálculos de los temas visto en clases como las medidas de tendencia central
(media aritmética, mediana y moda) y las medidas de dispersión (desviación muestral y variación) y las
medidas de posición (cuartiles, deciles y percentiles). 

La encuesta constaba de 13 preguntas asignadas, más 3 preguntas adicionales de interés que el grupo
iba a elegir para agregar a la lista y hacer un total de 16 preguntas, una de estas es ¿cuántos vehículos
posee en su casa?, y la analizamos  como una pregunta cuantitativa discreta para realizar sus respectivos
cálculos, la siguiente se trata de conocer el medio de transporte que más utilizan donde la moda resultó
“carro propio”; y la última se refería a conocer nuestra muestra poblacional el tiempo que invierte en las
redes sociales.
 De esta forma conocimos a nuestra muestra poblacional, aprendimos y pusimos en práctica los temas
que ya vimos en las clases, apoyándonos de las sugerencias de nuestra catedrática.

Referencias bibliográficas.

Bembibre, C. (2011). Estadística. Importancia.org. Obtenido de t.ly/URg8

García, A. (s.f.). Medidas de posición para datos agrupados y no agrupados: cuartiles, deciles y
percentiles. (Monografía de pregrado). Universidad Tecnológica de Bolívar, Cartagena.

Jauregui, M. (2016). Medidas de tendencia central: media, mediana, moda, rango y eje medio.
Aprendiendo Administración. Obtenido de t.ly/C8my

Proyecto de estadística 1. (19 de abril de 2021). Drive. Obtenido de Drive:

Roldán, P. (2017). Estadística. Economipedia. Obtenido de t.ly/2Y4S

Serra, B. (2014). Tabla de frecuencias. Universo Formulas. Obtenido de t.ly/8DoA


Suárez, J. (s.f.). Medidas de posición, de tendencia central y dispersión. Tomi.digital. Obtenido de
t.ly/wyGm

Variable cualitativa. (2019). Recuperado de t.ly/Vg2c

Westreicher, G. (2021). Variable cuantitativa. Economipedia. Obtenido de t.ly/N172

También podría gustarte