Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TECNOLÓGICO DE CAMPECHE
Nombre de la asignatura:
Clave de la asignatura:
Grupo:
Matrícula: 22470126.
Unidad 4.
Docente:
Fecha:
1
¿Qué es la Estadística moderna? ¿Por qué estudiarla?
Es una ciencia que enseña a una persona a pensar de forma lógica, por lo tanto,
consigue desarrollar habilidades para la resolución de operaciones y tomar
decisiones. Algunos de los temas más predominantes para niños de primaria
deben ser: fracciones, operaciones simples, sumas.
La estadística para su mejor estudio se ha dividido en dos ramas las cuales son:
estadística descriptiva y estadística inferencial.
2
estadística ha sido un cambio en el énfasis de los métodos que sirven para
generalizarlas. En otras palabras, la estadística inferencial investiga y analiza
una población partiendo de una muestra tomada.
3
física o mental del participante en comparación a la población en general. Las
pruebas pueden ser administradas en persona, por escrito o por un medio
electrónico.
● Evaluaciones Fisiológicas: Son medidas en que las características físicas de un
participante son registradas, como la presión arterial, ritmo cardíaco o fortaleza
física. En una investigación relacionada con la salud, la evaluación fisiológica
puede utilizarse para determinar el estado de salud de un participante antes,
durante o después de ser parte en un estudio.
● Observaciones: Las observaciones son registros tomados que no requieren
participación. Estos registros se hacen mientras los participantes están
involucrados en conductas rutinarias y se utilizan como un indicador de lo que los
participantes hacen, en lugar de apoyarse completamente en los relatos de
participantes sobre su propia conducta.
● Revisión de Registros: La revisión de registros tiene lugar cuando un investigador
examina y extrae información de documentos que contienen datos sobre el
participante. Los registros revisados en una investigación pueden ser públicos o
privados. Ejemplo de ello es un investigador recolectando información acerca de
un padecimiento a partir de los historiales médicos de los pacientes.
● Muestras Biológicas: Las muestras biológicas son sustancias que son tomadas de
una persona y se utilizan para medir información fisiológica. Un ejemplo sería
hacer un examen de sangre para determinar el contenido de azúcar en un
paciente diabético.
4
¿En qué consiste el principio “BEBS” (Basura Entra, Basura Sale) o “GIGO”
(en inglés)?
5
● Cuestionarios o encuestas: Consiste en obtener datos directamente de los
sujetos de estudio a fin de conseguir sus opiniones o sugerencias. Para lograr
los resultados deseados con esta técnica es importante tener claros los
objetivos de tu investigación.
Cuestionario cerrado: sirve para obtener gran cantidad de información, pero las
respuestas de las personas son limitadas.
6
● Historial de conversaciones: Guardar las conversaciones que se generan en el
chat de tu sitio web, en las redes sociales, chatbots, correos electrónicos,
incluso llamadas y videollamadas con los clientes es también una técnica
eficiente de recolección de datos.
7
Propiedades que describen una serie numérica de datos:
Las propiedades clave que describen una serie numérica de datos son:
8
● Media Ponderada: Similar a la media aritmética, pero en este caso, se asigna
un peso a cada valor antes de calcular la media. Esto significa que algunos
valores pueden tener más influencia en el resultado final que otros. Se calcula
multiplicando cada valor por su peso correspondiente, sumando estos
productos y luego dividiendo entre la suma total de los pesos.
● Mediana: Es el valor que divide el conjunto de datos en dos partes iguales: la
mitad de los valores estarán por encima de la mediana y la otra mitad por
debajo. Para calcularla, primero debes ordenar los datos de menor a mayor y
luego encontrar el valor que está en la mitad de la lista. Si hay un número
impar de valores, la mediana será ese valor exacto; si el número de valores es
par, la mediana será el promedio de los dos valores centrales.
● Moda: Es el valor que más se repite en un conjunto de datos. Puede haber
una moda (monomodal) si solo hay un valor que se repite con mayor
frecuencia, o incluso varios valores que se repiten con la misma frecuencia
máxima (multimodal). También es posible que no haya una moda si todos los
valores son diferentes.
Estas medidas son útiles para resumir y comprender las características centrales
de un conjunto de datos. Dependiendo de la distribución de los datos y el contexto
del análisis, diferentes medidas pueden ser más apropiadas para resaltar ciertos
aspectos.
Ventajas de la media:
9
Desventajas:
Ventajas de la moda:
● No requiere de cálculos.
● Se puede emplear tanto en cálculos cualitativos como cuantitativos.
● No se ve para nada influenciada por algún valor extremo.
● Puede ser de gran utilidad cuando tenemos valores distintos en
agrupaciones.
● Se pueden calcular en clases de extremo abierto.
Desventajas:
Ventajas de la mediana:
10
● Su influencia por valores extremos es nula, ya que sólo lo influyen los
valores centrales.
● Se puede aplicar para realizar un cálculo de datos cuantitativos, hasta
datos con clase extrema abierta.
● Admite la escala ordinal. Convirtiéndola en la medida de tendencia
central más representativa en toda clase de variables.
Desventajas:
11
● Rango: El rango es la diferencia entre el valor máximo y el valor mínimo en un
conjunto de datos. Proporciona una idea de la amplitud total de los valores. Es
una medida simple y directa, pero puede verse fuertemente influenciada por
valores atípicos y no considera la distribución intermedia de los datos.
● Varianza: La varianza mide la dispersión de los valores respecto a la media
aritmética. La varianza es útil para entender cuánto varían los valores
individuales en relación con la media, pero debido a que las diferencias se
elevan al cuadrado, su interpretación puede ser menos intuitiva.
● Desviación Estándar: La desviación estándar es la raíz cuadrada de la
varianza. Mide la dispersión promedio de los valores en relación con la media.
La desviación estándar se expresa en las mismas unidades que los datos
originales, lo que la hace más interpretable que la varianza.
● Coeficiente de Variación: El coeficiente de variación es una medida de
dispersión relativa que se calcula dividiendo la desviación estándar por la
media aritmética, y luego multiplicando por 100 para expresarlo como un
porcentaje. Esta medida es especialmente útil cuando deseas comparar la
dispersión entre conjuntos de datos que tienen diferentes escalas y medias.
Un coeficiente de variación más bajo indica una menor dispersión en relación
con la media.
12
Datos agrupados, medidas de tendencia central:
Los datos agrupados son conjuntos de datos que han sido organizados en
categorías o grupos, en lugar de tratarse como valores individuales. Las medidas
de tendencia central son estadísticas utilizadas para describir el valor central o
típico de un conjunto de datos. Estas medidas incluyen la media aritmética
(promedio), la mediana y la moda, y proporcionan una idea de dónde se
concentran los valores en un conjunto de datos agrupados.
13
por la media agrupada y multiplicando por 100. Permite comparar la dispersión
relativa entre conjuntos de datos agrupados.
Cuartiles: Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales
Deciles: Los deciles son ciertos números que dividen la sucesión de datos
ordenados en diez partes porcentualmente iguales. Son los nueve valores que
dividen al conjunto de datos ordenados en diez partes iguales, son también un
caso particular de los percentiles, ya que podemos definir Decil como "percentil"
cuyo valor que indica su proporción es un múltiplo de diez. Percentil 10 es el
primer decil, percentil 20 el segundo decil, etc”
Percentiles o centiles: Los percentiles son, tal vez, las medidas más utilizadas
para propósitos de ubicación o clasificación de las personas cuando atienden
características tales como peso, estatura, etc. Los percentiles son ciertos números
que dividen la sucesión de datos ordenados en cien partes porcentualmente
14
iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de
datos ordenados. Sencillamente Percentil es el valor del recorrido de una variable,
bajo el cual se encuentra una proporción determinada de la población.
Una distribución de frecuencia relativa describe los porcentajes del número total
de observaciones correspondiente a cada categoría. Una distribución de
frecuencia relativa no nos indica cuál es el número de observaciones en cada
categoría, sino cuál es el porcentaje de observaciones en cada categoría.
15
Los porcentajes son utilizados para representar las frecuencias relativas como un
valor proporcional a 100. Se realiza la multiplicación de las frecuencias relativas
por 100, lo cual nos proporciona el correspondiente porcentaje. Este método
facilita una comprensión más intuitiva acerca de la proporción que cada valor o
intervalo representa en relación al total del conjunto de datos.
16
Un Polígono de Frecuencia es el nombre que recibe una clase de gráfico que se
crea a partir de un histograma de frecuencia. Los histogramas emplean columnas
verticales para reflejar las frecuencias, los polígonos de frecuencia se forman
uniendo los puntos más altos de cada una de las columnas del Histograma.
17
En este caso la Ojiva es la línea azul, pero se ha dejado el Histograma, por dos
razones: (1) Para visualizar un histograma de Frecuencias Acumuladas; y, (2)
Para tener una visión más clara de lo que representa la Ojiva.
Cabe destacar que las Ojivas también se pueden hacer a la inversa, comenzando
con la mayor y terminando con la menor frecuencia.
Estos 3 tipos de gráficos son muy útiles y son fáciles de interpretar cuando
estamos trabajando con tablas de frecuencia.
18
➔Simétrica: Una distribución es simétrica cuando los valores se distribuyen de
manera equitativa a ambos lados de su punto central (generalmente la media,
mediana o moda). En una distribución simétrica, el lado izquierdo y el lado
derecho son similares en forma y tamaño.
➔Asimétrica: Una distribución es asimétrica cuando no es simétrica. En este caso,
los valores se acumulan más hacia uno de los lados de la distribución, lo que
resulta en una apariencia desigual. Puede ser asimétrica positiva (cola larga en el
lado derecho) o asimétrica negativa (cola larga en el lado izquierdo).
➔Sesgada: El sesgo se refiere a la dirección hacia la cual se inclina la distribución.
Una distribución sesgada hacia la derecha (positivamente sesgada) tiene una
cola larga en el lado derecho y tiende a tener valores más bajos en el lado
izquierdo. Una distribución sesgada hacia la izquierda (negativamente sesgada)
tiene una cola larga en el lado izquierdo y valores más bajos en el lado derecho.
Medidas de forma:
Las medidas de forma son indicadores estadísticos que describen la forma de una
distribución de datos. Dos medidas comunes de forma son la curtosis y la
asimetría.
19
colas en relación a una distribución normal. Por otro lado, si la curtosis es baja
quiere decir que las colas son más ligeras. Una distribución con alta curtosis se le
llama leptocúrtica mientras que aquella con baja curtosis se denomina
platicúrtica.
➔Asimetría: La medida de asimetría evalúa la falta de simetría en una distribución,
es decir, qué tanto se inclina hacia un lado. Una asimetría positiva (a la derecha)
indica que hay más valores altos y extendidos en la cola de la distribución. Por
otro lado, una asimetría negativa (hacia izquierda) señala mayor presencia de
valores bajos en dicha cola. Cuando los valores están uniformemente
equilibrados sin favoritismos por algún extremo se consideran simétricos con
cercan í a cero su grado de asimetría composición global
Teorema de Chebyshev:
El teorema de Chebyshev indica que para cualquier k> 1, al menos 1- 1/k 2 de los
datos está dentro de k desviaciones estándar de la media. Como se ha indicado,
20
el valor de k debe ser mayor que 1. Utilizando esta fórmula y conectando el valor
2, obtenemos un valor resultante de 1- 1/2 2, que es igual al 75%.
https://youtu.be/K9ICF8bl7vM
21