Está en la página 1de 25

KARLA IDALIA ROSALES

GONZÁLEZ
Estadística Descriptiva
22 de febrero de 2023
Recopilación de Datos
Datos
Son colecciones de cualquier cantidad de observaciones
relacionadas.
Por ejemplo:
• El número de teléfonos que diferentes empleados instalan en
un día
• El número de teléfonos que instala un trabajador dado
durante un día en una semana

Una colección de datos se conoce como conjuntos de datos; una sola


observación es un dato puntual.
Datos Cualitativos y Cuantitativos
CUALITATIVOS:
a. Arrojan respuesta categórica
b. Miden cualidades
c. Se les puede asignar después
un valor numérico (codificarlas)

CUANTITATIVOS:
a. Producen respuestas numéricas
b. Miden cantidades
c. Se puede tratar un dato
cuantitativo como cualitativo
(categorizando)
Recolección de datos
Los especialistas en estadística seleccionan
sus observaciones de manera que todos los
grupos relevantes estén representados en los
datos.
Por ejemplo:
1. Se desea determinar el mercado
potencial de un nuevo producto
2. Los analistas escogen 100
consumidores de cierta área geográfica
y deben tener la certeza de que este
grupo de personas representen distintas
variables como nivel de ingresos, raza,
nivel educativo y vecindario.
Conceptos Básicos
1. Estadística es la ciencia que se encarga de planear estudios y
experimentos, obtener datos y luego organizar, resumir, presentar,
analizar e interpretar esos datos para obtener conclusiones basadas en
ellos.
2. Población es el conjunto completo de todos los individuos, las cosas o los
eventos sobre los que se quiere investigar con respecto a una
particularidad dada. A la población le correspondería la colección
completa de datos, casi siempre imposible de elaborar por su tamaño u
otras condiciones, sobre los cuales se harán inferencias.
3. Censo es el conjunto de datos de todos los miembros de la población
4. Muestra es un subconjunto de miembros seleccionados de una población
Conceptos Básicos
Recolección de datos
• Es la actividad que consiste en la recopilación de información dentro
de un cierto contexto.

Procesamiento de datos
• Consiste en trabajar con lo recolectado para convertirlo en
conocimiento útil.

Las variables en la investigación representan un concepto de vital


importancia dentro de un proyecto.
Conceptos Básicos

Variable dependiente
• Cambios sufridos por los sujetos como consecuencia de la
manipulación de la variable independiente. Propiedad o característica
que se trata de cambiar mediante la manipulación de la variable
independiente. Las variables dependientes son las que se miden.
Variable Independiente
• Fenómeno al que se le va a evaluar su capacidad para influir, incidir o
afectar a otras variables. Es decir, es aquella característica o
propiedad que se supone ser la causa del fenómeno estudiado.
Ejemplo de variables

Como influye la música clásica en la presión arterial de los pacientes

Variable Dependiente

"la presión arterial de los pacientes" (cambio sufrido por la variable independiente)

Variable Independiente
"la música clásica" (que es la que manipula la variable dependiente)
Recolección de datos

Los datos pueden provenir de observaciones


reales o de registros elaborados con otros
propósitos.

Por ejemplo: Facturación e informes médicos


• El hospital registra el número de pacientes
que utilizan los servicios de rayos X.
Los datos pueden ayudar a los responsables de tomar El conocimiento de tendencias derivado de la
decisiones a hacer suposiciones razonadas acerca de experiencia previa puede, también, permitir a los
las causas y, por tanto, de los efectos probables de ciudadanos conscientes anticipar resultados posibles
ciertas características en situaciones dadas. y actuar en consecuencia.

Recolección de datos

Una investigación de mercado puede revelar que


determinado producto es preferido por amas de casa
de origen afroamericano de las comunidades
Ejemplo:
suburbanas, con ingresos y educación promedio. Por
lo tanto, los textos publicitarios del producto serán
dirigidos a esta audiencia.
Los administradores ¿De dónde vienen los
deben tener mucho datos? ¿la fuente es
cuidado y cerciorarse que tendenciosa?, es decir,
¿los datos apoyan o
los datos empleados ¿es posible que exista
Recolección de datos contradicen otras
estén basados en interés en proporcional
evidencias que se tienen?
suposiciones e datos que conduzcan a
interpretaciones cierta conclusión más que
correctas. a otras?

¿hace falta alguna


¿la conclusión es lógica? ¿Cuántas observaciones
evidencia cuya ausencia
¿Se ha llegado a se tienen? ¿representan a
podría ocasionar que se
conclusiones que los todos los grupos que se
llegue a una conclusión
datos no confirman? desea estudiar?
diferente?
Ejemplos
1. Para estudiar cuál es el candidato presidencial por el cual votarán los
peruanos en las próximas elecciones, se toma una muestra de 3500 personas
de todo el país. La pregunta es la siguiente, ¿por quién votará en las próximas
elecciones presidenciales? Determine la población y muestra.
2. Un estudiante de estadística quiere conocer si los profesores de su
universidad, UNAM, prefieren dictar clases con ropa formal o con ropa
informal. Para ello, realiza una encuesta a 120 profesores de la UNAM elegidos
de forma aleatoria. Identifique la población y muestra.
3. Un profesor desea realizar un análisis estadístico de las notas del examen final
de matemáticas de sus alumnos de último año. Por ello, coloca todas las notas
obtenidas en Excel y usa las funciones y herramientas estadísticas. La
información obtenida, ¿pertenece a la muestra o a la población?
Tabulación de Datos

1. Los datos se agrupan en clases si son cualitativos o discretos, o en


intervalos de clase (de igual longitud, generalmente) si son continuos
(o discretos con muchos valores distintos).
Número adecuado de intervalos

k=1 + 3.322 log n


Siendo n el número total de datos. Si los datos no están agrupados en intervalos, también
denotaremos por k al número de datos (o de categorías diferentes.

Amplitud de Intervalo de Clase


𝒍𝒊 , 𝒍𝒊+𝟏 𝒅𝒊 = 𝒍𝒊+𝟏 − 𝒍𝒊
Marca de Clase de Intervalo
𝑙𝑖 + 𝑙𝑖+1
𝑙𝑖 , 𝑙𝑖+1 𝑥𝑖 =
2

Frecuencia absoluta de la clase i-ésima


𝑓𝑖 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝑐𝑜𝑛𝑡𝑒𝑛𝑖𝑑𝑎𝑠 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑒𝑙𝑙𝑎

Frecuencia Relativa de la clase i-ésima


𝑓𝑖
ℎ𝑖 =
𝑛
Porcentaje de la clase i-ésima
𝟏𝟎𝟎% = 𝟏𝟎𝟎 𝒉𝒊

Frecuencia absoluta acumulada de la clase i-ésima


𝐹𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ + 𝑓𝑖

Frecuencia relativa acumulada de la clase i-ésima


𝑓𝑖
𝐻𝑖 = ℎ1 + ℎ2 + ℎ3 + ⋯ + ℎ𝑖 =
𝑛

Distribución de frecuencias: tabla conteniendo las distintas clases y frecuencias


correspondientes a cada una de ellas
EJEMPLO
1. Elaborar una tabla de frecuencias a partir de las temperaturas
máximas registradas en el mes de agosto en la ciudad de Bogotá.
Representaciones Gráficas
Variables Cualitativas

1. Diagrama de barras: se sitúan en el eje horizontal las clases y sobre


cada una de ellas se levanta un segmento rectilíneo (o un rectángulo)
de altura igual a la frecuencia (absoluta o relativa) o al porcentaje de
cada clase.
2. Gráfico de sectores: se divide el área de un círculo en sectores
circulares de ángulos proporcionales a las frecuencias absolutas de
las clases.
Variables Cuantitativas con datos no agrupados

1. Diagrama de barras: se sitùan en el eje horizontal los diferentes resultados de


la variable y sobre cada uno de ellos se levanta un segmento rectilíıneo de
altura igual a la frecuencia (absoluta o relativa) o al porcentaje de cada
resultado.
2. Polígono de frecuencias: se sitúan los puntos que resultan de tomar en el eje
horizontal los distintos valores de la variable y en el eje vertical sus
correspondientes frecuencias (no acumuladas), uniendo después los puntos
mediante segmentos rectilíıneos.
3. Gráfico de frecuencias acumuladas: es la representación gráfica de las
frecuencias acumuladas, para todo valor numérico. Siempre es una gráfica en
forma de escalera.
Variables cuantitativas con datos agrupados

1. Histograma: se sitúan en el eje horizontal los intervalos de clase y sobre cada


uno se levanta un rectángulo de área igual o proporcional a la frecuencia
absoluta.
2. Polígono de frecuencias: se sitúan los puntos que resultan de tomar en el eje
horizontal las marcas de clase de los intervalos y en el eje vertical sus
correspondientes frecuencias (no acumuladas), uniendo después los puntos
mediante segmentos rectilíneos.
3. Gráfico de frecuencias acumuladas: es la representación gráfica de las
frecuencias acumuladas para todo valor numérico, teniendo en cuenta que
dentro de cada intervalo de clase se supone que el número de observaciones
se distribuye uniformemente. Siempre es un polígono.

También podría gustarte