Está en la página 1de 37

Estadística I, Guía semana I

Plantel Toluquilla
• El maestro enviará el plan de trabajo con las Actividades y/o Proyectos a realizar de la semana en turno
cada día de clase para ser entregados según el día y fecha establecidos.
• El plan de trabajo deberá contener los apoyos en los que se basaran los alumnos (PDF, Manuales, enlaces
a plataformas o links de videos a utilizar) para el desarrollo de las actividades. Las Investigaciones no serán
en su totalidad en páginas de Internet.
Criterios para evaluación:
* Las actividades o Proyectos entregados en el horario establecido y con los requerimientos solicitados se
calificarán al 100%.
* El alumno solamente previa entrega de su recibo de pago (o bien previo convenio autorizado por el Director)
recibirá su calificación de la semana.
Cualquier queja con respecto a calificaciones o problemas con Profesores; Favor de comunicarse con su
Coordinadora según su turno.

Dudas y/o aclaraciones con respecto a pagos y convenios de pagos:


Director: Adrián Centeno. Celular: 33 1143 0091 adrian.centeno@edusmart.mx

Reglamento de la clase:
 No celular en la banca o mano del alumno.
 No gorra, ni nada que cubra la cara del alumno (excepto cubre boca).
 Uso obligatorio de playera de la escuela, se negará acceso a quién no le porte.
 No platicar y usar palabras altisonantes en clase.
 Los envases de vidrio están prohibidos, sólo envases de plástico para beber.
 No comer durante la clase.
 No bromas o jugar en el salón durante la clase.
 No subir los pies a las bancas, ni rayarlas.
 Sentarse de manera decora y correcta

1
Estadística I, Guía semana I

Las aplicaciones principales de la estadística en la vida diaria


1. En el campo laboral: La estadística suele ser empleada en distintas áreas del campo laboral. La
planeación estratégica de una organización se apoya fundamentalmente en estudios de pronósticos y de
presupuestos.
2. En la preferencia por ciertas marcas: Los consumidores de bienes y servicios generalmente
manifiestan preferencia por ciertas marcas del mercado. Esta tendencia es producto del pensamiento
estadístico según el cual la durabilidad, la calidad y el nivel de satisfacción es representado en mayor
medida por estas marcas.
3. En las finanzas personales: La planificación financiera de una persona es el vívido ejemplo de la
aplicación de la estadística en la vida diaria. La relación entre los ingresos y los egresos determinan la
situación actual de la persona. Estos datos sirven de fundamento histórico para la planificación de
compromisos sucesivos (proyecciones) que requieren el trazado de ciertas estrategias para ser logrados.
4. En los deportes: Los récords de los deportistas son elaborados en función de su desempeño por
cantidad de juegos o partidos en los cuales hayan participado. En el caso de los jugadores de béisbol, su
desempeño se mide por su porcentaje de bateos, carreras anotadas y bases robadas. En el caso de los
futbolistas delanteros, el patrón de referencia es la cantidad de goles por partidos jugados.
5. Apuestas deportivas: Los pronósticos de las apuestas deportivas están determinados por los datos
que se recaban y que la estadística se encarga de analizar. Es decir, una casa de apuesta tendrá cuotas
más altas o más bajas en función a lo que la estadística considere más probable que ocurra.
6. En las ventas: El mundo de las ventas es planificado en función a análisis pormenorizados sobre las
necesidades de los consumidores, sus gustos y sus preferencias. La medición de la calidad del servicio, del
nivel de satisfacción de los clientes y las propias estrategias de ventas es determinada por la aplicación de
técnicas estadísticas.
7. Optimización de rutas: La información estadística es esencial para calcular las rutas de transporte y
optimizarlas. Pueden ser desde las rutas de reparto de empresas de logística al tráfico aéreo de aviones
comerciales.
8. Audiencia de las cadenas: A día de hoy, no existe un receptor que pueda controlar con exactitud la
audiencia de las cadenas de televisión.

2
Estadística I, Guía semana I

3
Estadística I, Guía semana I

Tema Día I. Definición de conceptos.


Objetivo. El Alumno conocerá las definiciones básicas de los conceptos que
intervienen en la estadística.
Actividad: Realizará la actividad del día solicitada.
 Definición de estadística: La estadística se trata de la teoría y aplicación de métodos para
coleccionar datos, organizarlos, analizarlos y hacer deducciones a partir de ellos. Los primeros
estudios estadísticos eran demográficos así que se ha conservado gran parte del vocabulario.
También se puede decir que la estadística es una agrupación de datos ordenados en forma sistemática en
cuadros y/o gráficos. Es el conjunto de métodos que permite recolectar, organizar, resumir y analizar datos
para sacar conclusiones y tomar decisiones.
La palabra estadística viene del nombre griego  (Statero), que significa balanza, del latín Satatus,
que significa situación o estado, y del alemán Staat, que significa estado.
 Definición de Probabilidad: La Probabilidad es la mayor o menor posibilidad de que ocurra
un determinado suceso. En otras palabras, su noción viene de la necesidad de medir o determinar
cuantitativamente la certeza o duda de que un suceso dado ocurra o no.
Ésta establece una relación entre el número de sucesos favorables y el número total de sucesos posibles.
Por ejemplo, lanzar un dado, y que salga el número uno (caso favorable) está en relación a seis casos
posibles (1, 2, 3, 4, 5 y 6); es decir, la probabilidad es 1/6.
La probabilidad está basada en el estudio de la combinatoria y es fundamento necesario de la estadística,
además de otras disciplinas como matemática, física u otra ciencia. En ellas se aplica una teoría de
probabilidades, la cual tiene como fin examinar las formas y medios para obtener esas medidas de certeza,
así como encontrar los métodos de combinarlos cuando intervienen varios sucesos en un experimento
aleatorio o prueba.
 Población: Es el conjunto sobre el que se realizará el estudio estadístico.
 Individuo o Unidad Estadística: Cada uno de los elementos que componen la población.
 Experimento, en estadística, es cualquier proceso que proporciona datos, numéricos o no
numéricos. Un conjunto cuyos elementos representan todos los posibles resultados de un
experimento se llama espacio muestral y se representa como S.
Un experimento que tiene las siguientes características es llamado experimento aleatorio o estadístico.
a. Todos los posibles resultados del experimento son conocidos antes de hacer una realización del
experimento.
b. El resultado exacto en cualquier ejecución del experimento no es predecible (aleatoriedad)
c. El experimento puede ser repetido bajo (más o menos) idénticas condiciones.
d. Existe un patrón predictible a lo largo de muchas ejecuciones (regularidad estadística)
Ejemplos: Experimentos aleatorios es lanzar una moneda y observar la cara.
 Frecuencia, en estadística, la frecuencia de un evento es el número de veces en que dicho
evento se repite durante un experimento o muestra estadística. Comúnmente, la distribución de la
frecuencia suele visualizarse con el uso de histogramas.
 Muestra: Conjunto representativo de la población pero más pequeño que esta.
 Muestreo: Es la reunión de los datos sobre una muestra que serán el objeto de nuestro estudio
estadístico.
 Valor: Son todos los resultados que podemos obtener. En el caso de una moneda serían cara y
cruz.
 Dato: Los distintos valores que obtenemos para cada individuo. Si lanzamos la moneda al aire tres
veces obtendríamos 3 datos; por ejemplo: cruz, cara, cruz.
 Rango: Es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una
población o muestra estadística.
El rango suele ser utilizado para obtener la dispersión total. Es decir, si tenemos una muestra con dos
observaciones: $10 y $100, el rango será de $90.
 Variable estadística o carácter: Se llama a cada una de las características que pueden
estudiarse de la población.

4
Estadística I, Guía semana I
Las variables estadísticas pueden ser de dos tipos:
I. Cualitativas: son aquellas en la que los resultados posibles no son valores numéricos.
Por ejemplo: color del pelo, tipo de ropa preferida, lugar de veraneo, etc.
II. Cuantitativas: aquellas cuyo resultado es un número. A su vez, las hay de dos tipos:
- Cuantitativas discretas: cuando se toman valores aislados. Por ejemplo: número de
amigos de tu pandilla, número de veces que vas al cine al mes, número de coches que
tiene tu familia.
- Cuantitativas continuas: cuando, entre dos valores cualesquiera, puede haber
valores intermedios. Es decir, se toman todos los valores de un determinado intervalo. Por
ejemplo: peso de las personas, nivel sobre el mar en que se encuentra tu ciudad, medida
del perímetro torácico.
 Media aritmética: La media aritmética es la suma de todos los datos dividida entre el número
total de datos. Se calculan dependiendo de cómo vengan ordenados los datos.
 Moda: La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que
tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la variable
que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún valor, no existe
moda.
 Mediana: La mediana es el valor que ocupa el lugar central entre todos los valores del conjunto
de datos, cuando estos están ordenados en forma creciente o decreciente. La mediana se
representa por Me.

5
Estadística I, Guía semana I

6
Estadística I, Guía semana I

Tema Día II. Recolección de datos.


Objetivo. El Alumno conocerá las diferentes técnicas para recolectar datos.
Actividad: Realizará la actividad del día solicitada.
Instrumentos de recolección de datos
Para el especialista, la información necesaria para toda investigación está constituida por datos. A fin de que
un análisis estadístico resulte útil en la toma de decisiones, los datos deben ser apropiados. Hay, por lo
menos, tres maneras de obtener datos:
i) utilizar los datos publicados por fuentes gubernamentales, industriales o particulares;
ii) a través de la experimentación;
iii) realizando encuestas.

Tipos de datos
En una investigación estadística, se manejan diversas características, a las que se dé nómina variable. Los
datos son los resultados que se observan para estas variables.
Básicamente existen dos tipos de variables, que producen dos tipos de datos: cualitativos y cuantitativos.
Las primeras variables producen respuestas categóricas, en tanto que las segundas producen respuestas
numéricas.
Por otra parte, los datos cuantitativos pueden ser discretos o continuos.
Los datos cuantitativos discretos son respuestas numéricas que surgen de un proceso de conteo, mientras
que los continuos son los que surgen de un proceso de medición.
Dentro de la estadística, la necesidad de recolectar datos reside en cuatro razones importantes:
 Proporcionar la introducción imprescindible para un estudio de investigación.
 Medir el desempeño de un proceso de producción en curso.
 Ayudar en la formulación de cursos alternativos de acción en un proceso de toma de decisiones.
 Satisfacer nuestra curiosidad.
Es entonces que podemos decir que los datos pueden concebirse como información numérica necesaria
para ayudarnos a tomar una decisión con más bases en una situación particular.
Para que un análisis estadístico sea útil en el proceso de toma de decisiones, los datos de entrada deben
ser apropiados. Por tanto, la recolección de datos es extremadamente importante. Si los datos están
estropeados por sesgos, ambigüedades u otro tipo de error, es improbable que incluso las metodologías
más finas y sofisticadas sean suficientes para compensar tales deficiencias.

Obtención de datos
Existen muchos métodos mediante los cuales podemos obtener los datos necesarios. Podemos:
 Buscar datos a publicados por fuentes gubernamentales industriales o individuales
 Diseñar un experimento para obtener los datos necesarios
 Concluir un estudio
 Hacer observaciones de comportamiento
 Utilización de fuentes de datos publicados

7
Estadística I, Guía semana I
Sin importar la fuente utilizada, se hace una distinción entre el recolector original de los datos, la
organización o individuos que compilan estos en tablas y diagramas. El recolector de datos es la fuente
primaria, mientras que el compilador de los datos es la fuente secundaria.
I. Cuestionario: Es el método que utiliza un instrumento o formulario impreso, destinado a
obtener repuestas sobre el problema en estudio y que el investido o consultado llena por sí mismo.
El cuestionario puede aplicarse a grupos o individuos estando presente el investigador o el responsable del
recoger la información, o puede enviarse por correo a los destinatarios seleccionados en la muestra.
Debido a su administración se puede presentar problema relacionados con la cantidad y calidad de datos
que pretende obtener para el estudio. Algunos problemas asociados con el envío de los cuestionarios
podrían ser: que no fuese devuelto; los consultados pueden evadir la respuesta a alguna pregunta o no
darle la importancia necesaria a las respuestas proporcionadas. Por ello y otros factores más, el instrumento
que se use para la recolección de datos debe ser objeto de una cuidadosa elaboración.
Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para proporcionar
información sobre un mayor número de personas en un periodo bastante breve y la facilidad de obtener,
cuantificar, analizar e interpretar los datos.
Dentro de las limitaciones de este método figuran las siguientes: es poso flexible, la información no puede
variar ni profundizarse, si el cuestionario es enviado por correo se corre el riesgo de que no llegue al
destinatario o no se obtenga respuesta de los encuestados; además, resulta difícil obtener una tasa alta de
compleción del cuestionario.
Debido a esa posible pérdida de información se recomienda cuando se use este método una muestra más
grande de sujetos de estudio.
II. Diseño de un experimento: Un segundo método para obtener los datos necesarios es la
experimentación. En un experimento se ejerce un control estricto sobre el tratamiento dado a los
participantes. Por ejemplo, en un estudio para probar la eficacia de una pasta de dientes, el
investigador determinaría qué participantes del estudio usarían la nueva marca y cuáles no, en lugar de
dejarle la elección a los sujetos.
III. Encuestas: Un tercer método para obtener datos es aplicar una encuesta. Simplemente se
formulan preguntas respecto a sus opiniones actitudes comportamiento y otras características.
Después, sus respuestas se editan, codifican y tabulan para su análisis.
IV. Realización de un estudio observacional: En un estudio observacional, el investigador
observa el comportamiento de interés directamente, por lo común en su entorno natural. Hay una
amplia variedad de formatos, los cuales pretenden recolectar información en un grupo establecido para
ayudar en el proceso de toma de decisiones.

Tipos de datos.
Existen básicamente dos tipos de variables que producen dos tipos de datos: categóricas y numéricas. Las
variables aleatorias categóricas producen respuestas categóricas, mientras que las variables aleatorias
numéricas producen respuestas numéricas. La variable aleatoria numérica puede considerarse como
discreta, mientras que la otra puede pensarse como continúa. Los datos discretos son respuestas numéricas
que surgen de un proceso de conteo, mientras que los datos continuos son respuestas numéricas que
surgen de un proceso de medición.
Niveles de medición y tipos de escala de medición.
De lo analizado anteriormente, observamos que nuestros datos resultantes también pueden describirse de
acuerdo con el nivel de medición obtenido. Los cuatro niveles de medición ampliamente reconocidos son,
del nivel de medición más débil al más fuerte, las escalas nominal, ordinal, de intervalo y de cociente.
Escala nominal y ordinal: Se dice que los datos obtenidos de una variable categórica han sido
medidos en una escala nominal o en una escala ordinal. Si los datos observados simplemente se
clasifican en las diversas categorías distintas en las que no se implica ningún orden, se obtiene un
nivel de medición nominal. Por otra parte, si los datos observados se clasifican en las distintas
categorías en las que se implica algún orden, se obtiene un nivel de medición ordinal.
Escalas de intervalo: Una escala de intervalo es una escala ordenada en la que la diferencia
entre las mediciones es una cantidad significativa.

Escalas de cociente: Si, además de que las diferencias son significativas e iguales en todos los
puntos de la escala, existe un punto cero verdadero que pueda ser tomado en cuenta con los
cocientes de mediciones, entonces la escala es una escala de cociente.

8
Estadística I, Guía semana I
Como resumen podemos decir que la necesidad de recolectar datos reside en cuatro razones (recordemos:
proporcionar, medir, ayudar y satisfacer) y que además los mismos se pueden obtener de diversas formas:
datos publicados, diseñar un experimento, realizar una encuesta o llevar a cabo un estudio observacional.
De allí podemos obtener dos tipos diferentes de datos, categóricos o numéricos, que se pueden medir a
través de una escala nominal y ordinal o una escala de intervalo y de cociente. En general, en el proceso de
recolección de datos para una investigación, estos métodos e instrumentos y fuentes suelen combinarse;
cada una con sus ventajas y desventajas, sus características propias y la información que se requiera, dan
flexibilidad para que el investigador determine su uso apropiado según el estudio a realizar.

Requisitos de un instrumento de medición.


Al elaborar los instrumentos de recolección de datos es necesario analizar en qué forma dicho instrumento
de medición cumple con la función para la cual ha sido diseñado. Este análisis debe realizarse antes de
iniciar la recolección de datos, lo que permitirá introducir las modificaciones necesarias antes de su
aplicación.
Las características de cada instrumento de medición pueden ser múltiples; sin embargo, hay dos que pos su
relevancia son fundamentales, ya que si los instrumentos no llenan estos requisitos, los datos recolectados
tendrán limitaciones importantes. Estas cualidades son: confiabilidad y validez.
El término confiabilidad se refiere a la capacidad del instrumento para arrojar datos o mediciones que
corresponden a la realidad que se pretende conocer, o sea, la exactitud de la medición, así como a la
consistencia o estabilidad de la medición en diferentes momentos.
Se dice que un instrumento es confiable si se obtienen medidas o datos que representen el valor real de la
variable que se está midiendo y si estos datos o medidas son iguales al ser aplicados a los mismos sujetos
u objetos en dos ocasiones diferentes, o al ser aplicados por diferentes personas. Por ejemplo, se dice que
una prueba es confiable si, al administrar a una persona en condiciones similares en dos ocasiones se
obtienen resultados semejantes, o si el mejor estudiante en la primera aplicación de la prueba también
obtiene la nota más alta en la segunda.
Al elaborar instrumentos es necesario tener en cuenta las recomendaciones para aumentar la confiabilidad;
algunas de éstas se mencionan a continuación:
 Aplicar las reglas generales de elaboración de instrumentos, de tal forma que se eliminen los
errores de medición (preguntas ambiguas).
 Aumentar el número de preguntas sobre determinado tema.
 Elaborar instrucciones claras que orienten el llenado o utilización de los instrumentos.
 Aplicar los instrumentos o realizar las mediciones en condiciones similares.
 La validez es otra característica importante que deben poseer los instrumentos de medición,
entendida como el grado en que un instrumento logra medir lo que se pretende medir.
O sea: cuando una prueba para evaluación del aprendizaje mide el grado en que han sido alcanzados los
objetivos educacionales establecidos previamente, esta prueba será válida. Esta característica se
considera fundamentalmente para un instrumento, pues es requisito para lograr la confiabilidad. La situación
opuesta no es necesariamente cierta, es decir, un instrumento puede ser confiable sin ser válido.
Pasos que deben seguirse en la elaboración de instrumentos.
Una vez que han sido elegido el tipo de instrumento que se utilizará en la recolección de datos, lo cual se
hace de acuerdo con una serie de consideraciones, puede pasarse a la elaboración del instrumento
propiamente dicha, lo que puede facilitarse siguiendo una series de pasos que se explican a continuación:
Paso 1. Decidir cuál será la unidad a la se aplicará el instrumento. Una ver determinado
el tipo de instrumento que será utilizado, es necesario decidir a quienes se aplicara para la obtención de
datos, ya que no siempre se aplica a la unidad de estudios. Por ejemplo, un instrumento puede estar
diseñado para recabar información sobre los hábitos nutricionales del niño; sin embargo, quien dará la
información será la madre.
Paso 2. Considerar las características importantes de la unidad de observación o
sujeto con relación al instrumento. Antes de iniciar la aplicación del instrumento es indispensable
precisar las características del grupo de individuos al cual será aplicado. Esto se hace con el fin de tomar en
consideración en el instrumento aspectos condicionantes de la fuente de información, tales como nivel
cultural, accesibilidad y otros.
Paso 3. Determinar la información que se recogerá. Para determinar la información que se
obtendrá es necesario establecer los aspectos de las variables que se desea incluir en el instrumento.
Paso 4. Determinar la estructura del instrumento:
- Áreas o secciones
- Formato general

9
Estadística I, Guía semana I
Es importante considerar el formato general del instrumento, aso como decidir las áreas o secciones que
deben tener, tales como instrucciones, datos generales y datos específicos, según las variables que se
están estudiando.
Paso 5. Diseñar el instrumento:
- Elaboración de preguntas o ítem
- Análisis de preguntas o ítem según alcance y estructura
En esta etapa se procede a la construcción del cuerpo del instrumento según el formato decidido, o sea, a la
elaboración de las preguntas o incisos, si es un instrumento de observación. A continuación debe analizarse
cada una de las partes en relación con los objetivos y las variables, considerando si cada pregunta abarca la
información que se espera obtener.
Paso 6. Probar el instrumento. Antes de aplicar el instrumento debe hacerse una prueba de campo
a fin de determinar su calidad y los ajustes que amerite. La calidad del instrumento determina en función de:
- Claridad de las preguntas o ítem y del lenguaje
- Cantidad de preguntas e ítem
- Formato y cuerpo
- Ordenamiento y secuencia de las preguntas
- Claridad de las instrucciones
La prueba de campo sirve, además, para determinar otros aspectos, como:
- Costo y duración de la aplicación del instrumento
- Necesidad de preparación del personal a cargo de la recolección de datos
La prueba de campo debe ser aplicada a un grupo de sujetos que tengan características similares a las de
la población que será estudiada, pero no es conveniente que sujetos que han participado en la prueba sean
incluidos en la etapa de recolección definitiva de información
Paso 7. Revisar y reproducir el instrumento: La revisión final se hace con posterioridad a la
prueba de campo; hecha esta, procede la impresión o reproducción del instrumento.

Las Entrevistas y los Cuestionarios.


Los conceptos que interesan al investigador deben traducirse en fenómenos observables y registrables. De
aquí que la definición de la variable de investigación y la selección o desarrollo de métodos adecuados para
recabar datos, constituye una de las tareas más excitantes del proceso de investigación, ya que si el
experimentador no cuenta con métodos de alta calidad para recolectar datos, deberá siempre cuestionar la
precisión y pertinencia de sus conclusiones. Así como sucede en el caso del diseño de la investigación y el
muestreo, el investigador debe con frecuencia elegir a partir de un conjunto de alternativas para decidir de
qué modo habrá de recabar la información.

Los métodos de recolección de datos difieren en varios aspectos importantes:


 Estructura. Los datos de una investigación suelen recabarse de acuerdo con un plan
estructurado que indica el tipo de información que debe reunirse y la forma exacta en la que habrá
de recolectarse. Sin embargo, a veces resulta adecuado establecer un mínimo de estructura y
ofrecer al sujeto la oportunidad de revelar información pertinente de manera natural, como sucede
en el caso de los estudios de campo.
 Posibilidad de cuantificar. Los datos que se sometan a análisis estadísticos deben recabarse
de tal forma que sea posible cuantificarlo. Por otra parte, valga considerar que los datos que
habrán de cuantificarse a menudo se recaben de manera narrativa. Los enfoques de recolección
estructurada de datos, por lo general, aportan los que pueden cuantificarse con mayor facilidad, si
bien, suele ser igualmente posible inútil cuantificar información no estructurada.
 Intervención del investigador. Los métodos de recolección de datos difieren conforme el
grado en que los sujetos se percaten de su propia categoría de sujetos ya que es posible que al
estar plenamente conscientes de la función que desempeñan en el estudio no exhiba
comportamiento y respuestas “normales”. No obstante, en la recolección discreta pueden surgir
problemas éticos.
 Objetividad. Algunos de los enfoques para la recolección precisan mayor número de juicios
subjetivos que otros. Pese a que el científico generalmente se esfuerza por obtener métodos que
sean lo más objetivos posible, en algunas investigaciones (particularmente las que se fundamentan
en observaciones fenomenológicas) el criterio subjetivo del investigador constituye un valioso
componente de la recolección de datos.

10
Estadística I, Guía semana I

11
Estadística I, Guía semana I

12
Estadística I, Guía semana I

13
Estadística I, Guía semana I

Tema Día III. Tablas de frecuencias.


Objetivo. El Alumno conocerá el procedimiento para elaborar tablas de
frecuencias.
Actividad: Realizará la actividad del día solicitada.
Las técnicas de conteo son estrategias matemáticas usadas en probabilidad y estadística
que permiten determinar el número total de resultados que pueden haber a partir de hacer
combinaciones dentro de un conjunto o conjuntos de objetos.

Una tabla de frecuencias muestra de forma ordenada un conjunto de datos estadísticos y


a cada uno de ellos le asigna una frecuencia que, en pocas palabras, son las veces que se
repite un número o dato. Puedes usar las tablas de frecuencias para ordenar variables
cuantitativas o cualitativas.
Frecuencia: En estadística, la frecuencia de un evento es el número de veces en que dicho evento se
repite durante un experimento o muestra estadística. Comúnmente, la distribución de la frecuencia suele
visualizarse con el uso de histogramas.
Tipos de frecuencias:
 Frecuencia absoluta (fi): La frecuencia absoluta es una medida estadística que nos da
información acerca de la cantidad de veces que se repite un suceso al realizar un número
determinado de experimentos aleatorios. La letra f se refiere a la palabra frecuencia y la letra i se
refiere a la realización i-ésima del experimento aleatorio.
 Frecuencia absoluta acumulada (Fi): es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado.
 Frecuencia relativa (ni): corresponde a las veces que se repite un número en un conjunto de
datos respecto al total, pero se expresa en porcentajes (%).
 Frecuencia relativa acumulada (N i): es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. es la suma de las frecuencias relativas.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N:

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.

14
Estadística I, Guía semana I

¿Cómo construir una tabla de frecuencias?


Paso 1: Reúne los datos.
Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
T= {32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29}.

Paso 2: Crea una nueva tabla. En la primera columna, ubica las notas de 1 a 10, de menor
a mayor. En la segunda columna, escribe la cantidad de veces que se repite cada nota y
llama a estos datos frecuencia absoluta.

Paso 3: Hasta aquí tienes una tabla de frecuencias sencilla, pero también puedes
agregarle una columna más para calcular la frecuencia absoluta acumulada. Sus valores
se obtienen sumando los datos en diagonal.
Paso 4: Sigue sumando los números en diagonal. Ahora es el turno de 1 + 2 = 3. Continúa
hasta llenar toda la columna.

15
Estadística I, Guía semana I

Paso 5: Una forma de verificar que la suma es correcta, es obteniendo como número final
la cantidad de datos que tienes. En este caso, sería igual a 31.

¿Cómo obtener la Frecuencia relativa y la frecuencia relativa absoluta?


La frecuencia relativa se expresa en porcentajes. Mira cómo puedes obtenerlos a partir de los
datos que ya tienes.
Paso 1: Añade una cuarta columna con el nombre frecuencia relativa. Toma cada dato de
la frecuencia absoluta y divídelo entre 31, que es la cantidad de datos totales que tienes.
Así:
Paso 2: Realiza las divisiones hasta obtener todos los datos. Al final, la suma de esos
valores debe darte 1. Nota: (Si al sumar el resultado que obtienes es 0.98 o un número
similar, no te preocupes, puedes aproximarlo a 1).

Paso 3:
Para la frecuencia relativa acumulada debes sumar los datos en diagonal,
como lo hicimos para la frecuencia absoluta acumulada.

Entonces, el primer número siempre va a ser igual al primer dato de la


frecuencia relativa, en este caso es cero. Luego, para obtener el segundo
dato, necesitas sumar el cero con el 0,1, que es el segundo número de la
frecuencia relativa y justamente, el que está ubicado de forma diagonal.
Así:

16
Estadística I, Guía semana I

Paso 4:
Suma todos los datos en diagonal hasta llenar toda la columna. El último
número que obtengas debe ser 1.

Paso 5:
¡Ahora sí vamos a descubrir los porcentajes de la frecuencia relativa! Toma
cada valor de la columna frecuencia relativa y multiplícalo por 100. Al final,
la suma de esa columna debe dar 100 %.

Paso 6:
Para terminar, calcula el porcentaje de la frecuencia relativa acumulada en
porcentajes. Sus valores se obtienen sumando los datos en diagonal.

Por ejemplo: el primer número siempre va a ser igual al primer dato de la


frecuencia relativa en %, es decir, a cero por ciento. Luego, para obtener el
segundo dato, necesitas sumar el cero con el 10%, que es el segundo
número de la frecuencia relativa y el que está ubicado de forma diagonal.

El último número que obtengas debe ser 100%.

Así de fácil puedes crear tu propia tabla de frecuencias. Solo recuerda:

Reunir tus datos y organizarlos.


Calcular la cantidad de veces que se repite un dato para obtener la
frecuencia absoluta.
Sumar los valores diagonalmente para obtener las frecuencias acumuladas.
La frecuencia relativa se expresa en porcentajes.

Medidas de tendencia central: Una medida de tendencia central es un valor único


que tiene como objetivo describir un conjunto de datos, determinando su ubicación
central. De esta manera, las medidas de tendencia central a veces se denominan
medidas de tendencia central que también se clasifican como un resumen estadístico.

17
Estadística I, Guía semana I

La media (a menudo conocida como promedio) es probablemente la medida de tendencia central


con la que estás familiarizado, pero existen otras, como la mediana y la moda.
Media: Se la conoce también como media aritmética y generalmente denominada
media, es una medida de tendencia central que se obtiene al sumar cada dato y
dividirlo por el número de datos. Por otro lado, si la media se obtiene en una población,
entonces la media se debe denotar con la letra miu (µ) y si se calcula dentro de una
muestra, entonces se debe denotar con una x con una línea en la parte superior.
Cabe recalcar que este tipo de medida, se puede calcular tanto en variables continuas y
discretas.
Ejemplos (Media). Cálculo de la Media para datos no agrupados.

a) En una evaluación de inglés las notas de 10 estudiantes (xi) fueron las siguientes:
90, 70, 60, 20, 40, 50,70, 50, 40, 75
Se pide calcular la media para dichos datos.
Solución:
En esta ocasión se presenta una muestra de datos no agrupados, en donde N = 10. Por
tanto, la media se expresaría como:

Cálculo de la media para datos agrupados.

18
Estadística I, Guía semana I

b) La siguiente tabla de frecuencias expresa el peso para 40 trabajadores, por tanto nos
piden calcular la media para dichos datos agrupados.

Solución:

En esta ocasión media se aplica para datos agrupados, por tanto tenemos que tener en
cuenta la marca de clase (Xi) y la frecuencia absoluta acumulada (Fi). Recuerda que la
sumatoria indica que se debe sumar dentro de los cinco intervalos el producto de la
frecuencia absoluta junto a la marca de clase, en este caso en la tabla se expresa como la
suma de todos estos productos es 2,868.

Mediana: La mediana es el valor intermedio encontrado entre conjuntos de datos,


cuando están ordenados. Es importante precisar que el 50% de los datos está por
encima de la media y el 50% restante está por debajo.
Se usa el símbolo Me para datos agrupados y no agrupados.
Fórmula de la mediana para datos no agrupados.
La fórmula que aplicaremos para el caso de la mediana en datos no agrupados, se divide
tanto para una cantidad impar de datos como para una cantidad par. De esta manera,
para el caso de una muestra con una cantidad impar de datos la fórmula de la Mediana
es:

Cuando se tiene muestra con una cantidad par de datos la fórmula de la Mediana es:

19
Estadística I, Guía semana I

Cálculo de la Mediana para datos impares no agrupados.


a) Se tiene una muestra de tamaño 7, en el que tenemos los siguientes valores y nos
piden hallar la mediana:
4, 7, 5, 6, 3, 2, 7
Solución: En primer lugar se debe ordenar los datos de manera creciente o decreciente.
2, 3, 4, 5, 6, 7, 7
Después, aplicar la fórmula de la mediana para datos impares no agrupados. Sabiendo
que n que es el número total de datos es 7.

Finalmente, se ha encontrado la mediana, que es el dato X4 o mejor dicho el dato que


ocupa la cuarta posición que sería 5: 2, 3, 4, 5, 6, 7, 7
Cálculo de la Mediana para datos pares no agrupados.
b) Se tiene una muestra de tamaño 8, en el que tenemos los siguientes valores y nos
piden hallar la mediana: 12, 15, 14, 16, 11, 10, 10, 13
Solución: En primer lugar, se deben ordenar los datos de manera creciente o
decreciente: 16, 15, 14, 13, 12, 11, 10, 10
Después se aplica la fórmula de la mediana para datos pares no agrupados, con n igual a
8 que es la cantidad total de datos. Como vemos usaremos los datos de la cuarta y quinta
posición, que son 12 y 13 respectivamente.

Cálculo de la Mediana para datos agrupados.


c) Se tiene la distribución de frecuencias de la cantidad de hogares que no tienen servicio
de luz, en 212 municipios. Para ello el investigador no solicita hallar la mediana de dichos
datos.

20
Estadística I, Guía semana I

Solución: Se inicia determinando en qué intervalo se encuentra la mediana, para ello


debe cumplir que el valor de n/2 sea menor igual que la frecuencia absoluta acumulada
(Fi):

En este caso el intervalo de la mediana se encuentra en el primer intervalo en donde la


frecuencia absoluta acumulada sea mayor o igual a 106, por tanto el intervalo a usar es el
que tiene la frecuencia absoluta acumulada como 150. El valor de 70 que es el anterior no
nos sirve, ya que es menor que 106.
De la misma forma, en este caso i=6, que es el número del intervalo a tener en cuenta.
Por tanto, cada una de las variables que necesitamos son:

Por último, se calcula la mediana reemplazando cada uno de los datos encontrado:

Moda: La moda es el valor que aparece con mayor frecuencia en nuestro conjunto
de datos. Es importante especificar que el conjunto de datos puede presentar una
moda, varias modas o no. En un gráfico absoluto, la moda es la barra más alta de
nuestro gráfico.

21
Estadística I, Guía semana I

El símbolo de la moda es Mo, tanto para datos agrupados y no agrupados.


Fórmula de la Moda para Datos no Agrupados.

Para calcular la moda (Mo) en datos no agrupados, solo hay que fijarse en los datos más
frecuentes y esta será la moda.
Puede darse el caso de que tengamos dos o más modas, esto sucedería si dos o más
datos se repitieron con mayor e igual frecuencia en nuestro muestra.
Fórmula de la moda para datos agrupados.

La fórmula que se usará para el cálculo de la moda, en el caso de que tengamos datos
agrupados será:

 Li es el límite inferior del intervalo con mayor frecuencia absoluta.


 fi-1 es la frecuencia absoluta anterior a la de mayor frecuencia.
 fi+1 es la frecuencia absoluta del siguiente intervalo al de mayor frecuencia absoluta.
 a es la amplitud del intervalo de mayor frecuencia absoluta.
Ejemplos (Moda).

Cálculo de la moda para datos no agrupados


a) Dada la muestra con los siguientes valores 20, 23, 24, 25, 25, 26 y 30, calcular la
moda.
Solución:
En este caso Mo = 25, ya que es el dato que más repite. Se dice que es un
caso unimodal.
b) Dada muestra con los siguientes valores 20, 20, 23, 24, 25, 25, 26 y 30, calcular la
moda.
Solución:
En esta ocasión Mo= 20 Mo= 25, ya que estos dos valores son los que más se repiten,
cada uno dos veces. Se dice entonces que es un caso bimodal.
c) Dada la muestra con los siguientes valores 20, 23, 20, 24, 25, 25, 26, 30 y 30, calcular
la moda.
Solución:
En este caso Mo= 20 M0= 25 y Mo=30, estos son los datos que más se repiten y con una
frecuencia de dos veces cada uno. Se dice entonces que es un caso multimodal.
Cálculo de la moda para datos agrupados
d) Dada la siguiente distribución de frecuencias, calcular lo moda para dicha muestra.

22
Estadística I, Guía semana I

Solución:
En este caso se presenta un ejercicio con datos agrupados en intervalos,
por ende debemos usar la formula para tal caso.

Por definición la moda para datos agrupados es:

Ahora hay que encontrar cada valor independiente de nuestra formula y a


calcular la Mo.

23
Estadística I, Guía semana I

Relación entre Media, Mediana y Moda con la


distribución de frecuencias
Dados los valores de la media, la media y la moda, podemos deducir el tipo de
distribución establecida en nuestra prueba. Los casos que podemos tener con relación a
estas tres medidas de tendencia central son:

 En el caso de que la media < mediana, contamos con una distribución asimétrica
sesgada a la izquierda.
 Si la media es igual a la mediana y existen dos modas, estamos hablando de una
distribución bimodal, caso que es poco frecuente.
 Si la media, la mediana y la moda son iguales, contamos con una distribución
simétrica.
 En el caso de que la media > mediana, contamos con una distribución asimétrica
sesgada a la derecha.

24
Estadística I, Guía semana I

25
Estadística I, Guía semana I

Definición de moda estadística:


 La moda es el valor que tiene mayor frecuencia absoluta.
 Se representa por Mo.
 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
máxima, entonces la distribución es bimodal (en caso de que sean 2 valores) o multimodal (en caso
de que existan más de 2), es decir, tiene varias modas.
 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
 Se puede hallar la moda para variables cualitativas y cuantitativas.
 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
 Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos
puntuaciones adyacentes.
 Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos
puntuaciones adyacentes.

Cálculo de la moda para datos agrupados; c uando todos los intervalos tienen
la misma amplitud.

: Es el límite inferior de la clase modal.


: Es la frecuencia absoluta de la clase modal.
: Es la frecuencia absoluta inmediatamente inferior a la clase modal.

26
Estadística I, Guía semana I

: Es la frecuencia absoluta inmediatamente posterior a la clase modal.


: Es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:

Ejemplo: Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:

En primer lugar buscamos el intervalo donde se encuentra la moda, que será el intervalo que tenga la mayor
frecuencia absoluta (fi). Aplicaremos la fórmula para el cálculo de la moda para datos agrupados,
extrayendo los siguientes datos:

 Media aritmética: es el valor obtenido al sumar todos los datos y dividir el resultado entre el
número total de datos. Denotamos la media con el símbolo X y la calculamos de la siguiente
manera:

En donde cada xi representa uno de nuestros datos y N es el número total de datos que
tenemos.
Ejemplo: Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kilos. Hallar el peso medio.
Primero, notemos que tenemos seis datos, por lo tanto N = 6. Procedamos a calcular la media:

27
Estadística I, Guía semana I

 Media aritmética para datos agrupados: Cuando los datos vienen agrupados en
una tabla de frecuencias, la expresión de la media es distinta. Supongamos que tenemos K clases
diferentes en nuestra tabla de frecuencias, en donde para cada clase Ci, tenemos su media xi y
su frecuencia fi correspondiente, entonces calculamos la media como:

Debemos observar que ahora N es la suma de las frecuencias de cada clase, esto es:

Además, cuando cada grupo o clase es un intervalo, la media de dicho intervalo es simplemente el punto

medio entre los límites, así, suponiendo que un grupo es el intervalo (a, b) entonces su media es  .

Como observación a considerar, notemos que al tener una tabla de frecuencias, al agrupar los datos,
sustituimos cada dato por la media del grupo o clase al que pertenece, y que la suma de todas las
frecuencias es igual a la cantidad de datos que tendríamos si no agrupáramos, por lo tanto, al calcular la
media en datos agrupados, lo que hacemos es simplemente reemplazar cada dato por la media del grupo o
clase al que pertenece. En caso de tener datos no agrupados, en general es mejor no agrupar ya que esto
implica pérdida de información.
Ejercicio de media aritmética para datos agrupados: En un test realizado a un grupo de 42
personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.

Podemos observar como cada xi es punto medio del correspondiente intervalo.


Para obtener la media, en primer lugar, vamos a calcular la sumatoria de xi * fi, crearemos una nueva
columna para los productos de la variable con su correspondiente frecuencia absoluta y lo sumaremos todo.
También tenemos que calcular N que es la sumatoria de las frecuencias absolutas.

28
Estadística I, Guía semana I

Entonces, utilizando nuestros datos, la media está dada por:

 Propiedades de la media aritmética


Primero, una definición que nos ayudará a entender mejor las definiciones.
Sea   un conjunto de datos y   la media de los datos, entonces, definimos la
desviación de un dato,  , respecto a la media como: .
1. La suma de las desviaciones de todos los datos de una distribución respecto a la media de la
misma igual a cero. Esto es:

La suma de las desviaciones de los números 8,3,5,12,10 de su media aritmética 7.6 es igual a 0:

2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número
cualquiera se hace mínima cuando dicho número coincide con la media aritmética. En otras palabras, lo
siguiente siempre se cumple:

3. Si a todos los valores de la variable se les suma un mismo número, la media aritmética de estos nuevos
datos es a la media de los anteriores más la misma cantidad que se le sumó a los datos. Esto es,
suponiendo que tenemos los datos   con media  , ahora, si le sumamos a todos
los datos una cantidad  ,  , la media de estos nuevos datos es:

4. Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda
multiplicada por dicho número. Esto es, suponiendo que tenemos los datos   con

29
Estadística I, Guía semana I

media  , ahora, si multiplicamos a todos los datos por una cantidad 


,  , la media de estos nuevos datos es:

Observaciones sobre la media aritmética:


1. La media se puede hallar sólo para variables cuantitativas.

2. La media es independiente de las amplitudes de los intervalos.


3. La media es muy sensible a las puntuaciones extremas, también conocidos como valores atípicos. Si
tenemos una distribución con los siguientes pesos:

65 kg, 69 kg, 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg


La media es igual a 74 kg, que es una medida de centralización poco representativa de la distribución,
sin embargo esto pasa porque tenemos un dato muy alejado a los demás 110 kg.

4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada

 ¿Qué es la mediana? La mediana es el valor que ocupa el lugar central de todos los datos
cuando éstos están ordenados de menor a mayor.
1. La mediana se representa por Me
2. La mediana se puede hallar solo para variables cuantitativas.
Ejemplo de cálculo simple de la mediana:

1. Ordenamos los datos de menor a mayor.


2. Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma:

    
3. Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones
centrales.

        
Fórmula y cálculo de la mediana para datos agrupados:
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de
la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre.

30
Estadística I, Guía semana I

Ejemplo de cálculo de la mediana para distribución estadística: Calcular la mediana de


una distribución. Estadística que viene dada por la siguiente tabla:

En primer lugar crearemos una nueva columna con los valores de la frecuencia acumulada:
En la primera casilla colocamos la primera frecuencia absoluta. En la segunda casilla sumamos el valor de
la frecuencia acumulada anterior más la frecuencia absoluta correspondiente y así sucesivamente hasta la
última, que tiene que es igual a N (100).

Buscamos el intervalo donde se encuentra la mediana, para ello dividimos la N por 2 porque la mediana es
el valor central:

Buscamos en la columna de las frecuencias acumuladas (Fi) el intervalo que contiene a 50

Clase de la mediana: [66,69)
Aplicaremos la fórmula para el cálculo de la mediana para datos agrupados, extrayendo los siguientes
datos:

31
Estadística I, Guía semana I

 Rango o recorrido: es la diferencia entre el mayor y el menor de los datos de una distribución
estadística.

32
Estadística I, Guía semana I

33
Estadística I, Guía semana I

34
Estadística I, Guía semana I

Tema Día IV: Representación gráfica de datos.


Objetivo. El Alumno conocerá las distintas formas de representar un gráfico.
Actividad: Realizará la actividad del día solicitada.
Las tablas estadísticas representan toda la información de modo esquemático y están preparadas para los
cálculos posteriores. Los gráficos estadísticos nos transmiten esa información de modo más expresivo, nos
van a permitir, con un sólo golpe de vista, entender de qué se nos habla, observar sus características más
importantes, incluso sacar alguna conclusión sobre el comportamiento de la muestra donde se está
realizando el estudio.
Los gráficos estadísticos son muy útiles para comparar distintas tablas de frecuencia. Los gráficos
estadísticos más usuales son:

I. Diagrama de barra. Se utiliza para la representación de variables cuantitativas discretas,


cada valor de la variable se representa por un punto sobre el eje OX y sobre él se dibuja una barra
de longitud igual o proporcional a su frecuencia absoluta. Si la frecuencia absoluta que se utiliza es
la acumulativa, el diagrama de barras que se obtiene es: diagrama de barras acumulativo.

II. Histograma: Se utiliza para la representación de variables cuantitativas continuas, cada


intervalo se representa sobre el eje OX, este será la base del rectángulo que se dibuja sobre él
con altura igual o proporcional a su frecuencia absoluta. Como los intervalos son consecutivos,
los rectángulos quedan adosados. Si se utilizarán rectángulos de amplitud diferente, el área del
rectángulo es la que tendría que ser proporcional a la frecuencia absoluta correspondiente a ese
intervalo. Histograma acumulativo, si se utiliza la frecuencia absoluta acumulativa.

35
Estadística I, Guía semana I

III. Polígono de frecuencias: Se utilizan para variables estadísticas cuantitativas, discretas


o continuas.
Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una poligonal, los extremos
superiores de las barras. Para una variable continua, el polígono de frecuencias se obtiene uniendo por una
poligonal los puntos medios de la base superior de los polígonos del histograma.
Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el impacto visual de
los mismos.

IV. Diagrama de sectores: Se utiliza para todo tipo de variable estadística, cuantitativa o
cualitativa. Consiste en dibujar sectores sobre un círculo, siendo la amplitud de los sectores proporcional a
su frecuencia absoluta, cada sector se rellena con un color diferente.
El cálculo de la amplitud en grados sexagesimales del sector correspondiente se realiza así: ángulo =
frecuencia relativa * 360
Ejemplo: Hemos preguntado a 20 personas por el número medio de días que practican deporte a la
semana y hemos obtenido las siguientes respuestas:

36
Estadística I, Guía semana I

Tema Día V: Ojivas. Procedimiento.


Objetivo. El Alumno conocerá la definición de ojivas y su procedimiento de
obtención.
Actividad: Realizará la actividad del día solicitada.
En estadística la ojiva es una gráfica asociada a la distribución de frecuencias, es decir, que en ella
se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en
lugar de solo exhibir los números asignados a cada intervalo.
La ojiva apropiada para información que presente frecuencias mayores que el dato que se está comparando
tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores,
tendrá una pendiente positiva. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se obtiene
de aplicar parcialmente la misma técnica a una distribución acumulativa y de igual manera que éstas,
existen las ojivas mayores que y las ojivas menores que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por esto la
aplicación de la técnica es parcial):
Un extremo de la ojiva no se “amarra” al eje horizontal, para la ojiva mayor que sucede con el extremo
izquierdo; para la ojiva menor que, con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para el caso
de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.
Ejemplo de ojivas:
Los siguientes datos son de 40 temperaturas:

Bibliografía: Spiegel Murray R., Estadística. Serie Schaum 4ta ed. 2009

37

También podría gustarte