Está en la página 1de 291

1/27

Sexto Nivel

1.1. Elementos básicos de the statistic

La statistic está ligada con the methods científicos en la toma, organization, recopilación, presentación y analysis de data, tanto para
the deduction de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

Población Muestra Parameter Estadístico Variables

Población

En general, en statistic se denomina población a un conjunto de elementos (que consiste en personas, objetos, etc.), que contienen
una o más características observables que se pueden medir.

A cada elemento de la población se denomina unidad elemental o unidad estadística. El resultado de medir una característica
observable en la unidad elemental se denomina dato estadístico.

2/27
Sexto Nivel

1.1. Elementos básicos de la estadística

La estadística está ligada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto para
la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

Población Muestra Parámetro Estadístico Variables


Muestra

Se denomina muestra a una parte de la población seleccionada de acuerdo con un plan, con el fin de obtener información referente a
la población de la que proviene. La muestra debe ser seleccionada de tal manera que sea representativa y, por lo tanto, el método de
selección de muestras debe garantizar la obtención de datos fidedignos.

2/27
Sexto Nivel

1.1. Elementos básicos de la estadística

La estadística está ligada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto para
la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

Población Muestra Parámetro Estadístico Variables

Parámetro

Es una medida descriptiva que resume una característica de la población; por ejemplo, la media, la mediana o la varianza.

2/27
Sexto Nivel

1.1. Elementos básicos de la estadística

La estadística está ligada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto para
la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

Población Muestra Parámetro Estadístico Variables

Estadístico

Llamado también estadígrafo, es una medida descriptiva que resume una característica de una muestra y es calculada a partir de
datos observados de una muestra aleatoria.

2/27
Sexto Nivel

1.1. Elementos básicos de la estadística

La estadística está ligada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto para
la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

Población Muestra Parámetro Estadístico Variables

Variables

Se llama variable estadística a una característica definida en la población por la investigación estadística y que puede tomar dos o más
valores.

Las variables pueden ser cualitativas y cuantitativas. La primera describe cualidades mientras que la segunda describe cantidades. A
su vez, la variable cuantitativa puede ser continua o discreta. Es continua cuando puede tener valores en un intervalo y es discreta
cuando puede tomar exclusivamente valores exactos (enteros).

Los datos que vienen definidos por una variable discreta o continual se llaman datos discretos o datos continuos, respectivamente. En
general, las medidas dan origen a datos continuos, mientras que las enumeraciones o conteos originan datos discretos.

2/27
Sexto Nivel

1.2. Niveles o escalas de medición de las variables

Se denomina escala de medición a un instrumento de medida, con el que se asigna valores a las
unidades estadísticas para una variable definida.

Las escalas de medición son de los siguientes tipos:

• Variables nominales. No tienen un orden o jerarquía determinados. Ejemplos: color, nacionalidad,


religión, estado civil.
• Variables ordinales. Sí tienen un orden o jerarquía establecidos. Ejemplos: clase social (alta, media,
baja), estado de conservación (excelente, muy bueno, bueno, regular, malo).
• Variables de nivel de intervalo. El cero es arbitrario y no representa la ausencia de la variable.
Ejemplo: temperatura: 0 grados centígrados (no representa la ausencia de variable, es decir, no
significa que no haya temperatura).
• Variables de nivel de razón o proporción. El “0” sí representa la ausencia de variable. Ejemplos:
dinero (0 dólares representa que no hay dinero), n.° de personas (0 personas representa la ausencia
de personas).

3/27
Sexto Nivel

1.3. Importancia del muestreo

En estadística, una muestra estadística (llamada también muestra aleatoria o simplemente muestra) es
un subconjunto de casos o individuos de una población estadística.

Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo
cual deben ser representativas de la misma. Para cumplir esta característica, la inclusión de sujetos en la
muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar
a la de un estudio exhaustivo con mayor rapidez y menor coste abajo.

Por otra parte, en ocasiones el muestreo puede ser más exacto que el estudio de toda la población,
porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En
cualquier caso, el conjunto de individuos de la muestra es el sujeto realmente estudiado; es decir, el
muestreo es importante porque:

• Por lo general no se pueden estudiar a las poblaciones en su totalidad, entonces estaremos


obligados a hacer el muestreo.
• Es más rápido y económico para conocer los parámetros (características) de interés de la población.
• Existe metodología clara y confiable para el muestreo (y tamaño de muestra).

4/27
Sexto Nivel

1.4. Fuentes de información

En el proceso de cualquier investigación, la recolección de datos constituye el paso fundamental para asegurarse la obtención de
resultados idóneos, ya sea dentro de una muestra o de una población.

La recolección de la información tiene que hacerse de acuerdo con una planificación y esquematización de la investigación, caso
contrario vamos a tener datos que no son relevantes, repetitivos y excesivos. Necesitamos organizar la información de tal manera
que pueda contribuir favorablemente al logro de los objetivos propuestos.

Con el panorama claro de las necesidades de información del proyecto, se deben realizar las siguientes actividades:

· Instrumentos de medición o técnicas de recolección de información


· La aplicación de los instrumentos de medición
· La sistematización, codificación y estructura de la información

A continuación, vamos a ver los diferentes instrumentos y técnicas que tenemos para recolectar información.

¿Qué entendemos por técnicas de recolección de datos?

Podemos decir que son las herramientas con las que se cuenta para la recolección de datos. Son los procedimientos especiales
utilizados para obtener y evaluar las evidencias necesarias, suficientes y competentes, que permiten formar un juicio profesional y
objetivo. En resumen, podemos decir que son cualquier recurso que recopile información referente a nuestro proyecto.

Tenemos diferentes clases de técnicas para recolectar información: verbales, oculares, documentales, físicas, escritas y de
auditoría.

a) Verbales. Consisten en obtener la información de manera oral mediante averiguaciones o indagaciones. Pueden ser:
entrevistas, encuestas y cuestionarios.

b) O l Obti l i f ió ifi d i l t f di t l l ó l bl d d
5/27
En el proceso de cualquier , la recolección de datos constituye
el paso fundamental para asegurarse la obtención de resultados idóneos,
sea dentro de una muestra o de una población.

La recolección de la información tiene que hacerse de acuerdo con una


planificación y esquematización de la investigación, caso contrario vamos a
tener datos que no son relevantes, repetitivos y excesivos. Necesitamos
organizar la información de tal manera que pueda contribuir favorablemente
al logro de los objetivos propuestos.

Con claro de las necesidades de información del proyecto, se


deben realizar las siguientes actividades:

· Instrumentos de medición o técnicas de recolección de información


· La aplicación de los instrumentos de medición
· La sistematización, codificación y estructura de la información

A , vamos a ver los diferentes instrumentos y técnicas que


tenemos para recolectar información.

¿Qué entendemos por técnicas de recolección de datos?

Podemos decir que son las herramientas con las que se cuenta para la
recolección de . Son los procedimientos especiales utilizados para
obtener y evaluar las evidencias necesarias, suficientes y competentes, que
permiten formar un juicio profesional y objetivo. En resumen, podemos decir
que son cualquier recurso que recopile información referente a nuestro
proyecto.

Tenemos diferentes clases de técnicas para recolectar información: verbales,


oculares, documentales, físicas, escritas y de auditoría.

a) Verbales. Consisten en obtener la información de manera oral mediante


averiguaciones o indagaciones. Pueden ser: entrevistas, encuestas y
cuestionarios.

b) Oculares. Obtienen la información verificando visualmente en forma


directa y paralela cómo los responsables de cada proceso desarrollan o
documentan los procesos o variables evaluadas. Pueden ser:
observación, o confrontación, revisión selectiva y rastreo.

c) Documentales. Obtienen información escrita para soportar afirmaciones,


análisis o estudios previos. Pueden ser: comprobación y revisión
analítica.

d) Físicas. Reconocimiento real sobre hechos o situaciones dadas en


tiempo y espacio determinados y se emplea como técnica de la
inspección.

e) Escritas. Reflejan toda la información que se considera importante para


sustentar los hallazgos del trabajo realizado.

f) De auditoría. Conducen a obtener información sobre el desarrollo de


destrezas y habilidades dentro de un proceso específico.
Ahora veamos algunos de los instrumentos que nos ayudan a obtener la
información:

· La observación
· La encuesta
· La entrevista

La observación
Es el registro visual de una situación real, estableciendo los acontecimientos
de acuerdo con algún esquema ya planificado.

La encuesta
Es una búsqueda sistemática de información en la que el investigador
pregunta a los investigados sobre los datos que desea obtener y
posteriormente reúne estos datos.

La entrevista
Es the communication interpersonal establecida entre el investigador y el
sujeto de studio, a fin de obtener respuestas verbales a las interrogantes
planteadas sobre el problema propuesto.

Dada la utilidad, complejidad y clasificación que tiene la encuesta, nos vamos


a centrar en el estudio de la misma, además hay que mencionar que es una
de las más utilizadas para la recolección de información.

La encuesta

Vamos a ver algunas de las características de una encuesta.

· Es una observación no directa de los hechos, sino por medio de lo que


manifiestan los interesados.
· Es un método preparado para la investigación.
· Permite una aplicación masiva que mediante un sistema de muestreo
pueda extenderse universalmente.

Se puede clasificar en:

a) Exploratoria

Se usa cuando la información previa del fenómeno a estudiar es escasa o


poco fiable o es la primera toma de contacto con un fenómeno no muy
conocido.

Utilidad: - Desarrolla hipótesis de trabajo


- Verificación factible de la investigación
Estrategia: - Consulta a expertos o grupos de discusión
- Revisión y análisis de datos disponibles en otras
fuentes

b) Descriptiva
Definir la realidad, examinar un fenómeno para caracterizarlo y/o para
diferenciarlo de otros. Es el paso previo en cualquier investigación
mediante la encuesta (provoca los porqué de la investigación explicativa)

Etapas
- Definición teórica del fenómeno a estudiar y selección/definición de las
variables
- Definir la población
- Seleccionar muestras representativas

c) Explicativa

- Determinar las relaciones causa y efecto entre los fenómenos.


- Es imprescindible el control de las posibles explicaciones alternativas.
- Considerar todas las variables del fenómeno.

Tipos de variables

- Variables independientes: causa de la explicación


- Variables dependientes: efecto producido por las anteriores
- Variables extrañas: ajenas al objeto de investigación pero pueden
afectar las variables explicativas
- Variables controladas: bajo el control del investigador
- Variables no controladas: aleatorias / perturbadoras

d) Predictiva

- Predice el funcionamiento de un fenómeno.


- Es necesario conocer la explicación de los fenómenos antes de tratar
de establecer una predicción de estos.
Sexto Nivel

1.5. Diseño de la encuesta

El diseño del cuestionario constituye el elemento principal del diseño de la encuesta; por lo tanto, su estructura es muy importante.
Dado esto, tenemos que formular preguntas directas y concretas, que abarquen la necesidad de información que el proyecto
requiere, de tal manera que en el momento de procesar toda esta información, esta no sea insuficiente ni inconsistente.

Las preguntas a formular se pueden clasificar entre otras de la siguiente manera:


a) Pregunta cerrada. Se proporciona una serie de opciones donde se escoge una como respuesta, tiene la ventaja de ser fácil de
procesar.
b) Pregunta abierta. No se proporciona opciones, se puede responder con libertad, tiene la ventaja de una mayor riqueza de
respuestas pero es difícil de procesar.
c) Pregunta de profundización. Se utiliza para obtener una respuesta más amplia y completa a una pregunta abierta.
d) Pregunta parcialmente estructurada. Puede tener dos o más opciones o ser de tipo sí/no.
e) Pregunta de control. Son preguntas que nos indican si el encuestado no está mintiendo.

La estadística está ligada con los métodos científicos en la toma, organización, recopilación, presentación y análisis de datos, tanto
para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

Características del cuestionario

• Interesante.
• Sencillo de entender.
• Preciso y claro en las preguntas.
• Ordenado.
• Debe tener un vocabulario adecuado.
• Debe tener espacio suficiente para respuestas.

Una vez que ya tengamos listos los apartados anteriores, procedemos a realizar una prueba piloto o experimental, con el fin de
identificar puntos críticos en los que exista controversia en las respuestas debido a una mala formulación de alguna pregunta (estas
se reformulan o en ciertos casos se eliminan).
6/27
Sexto Nivel

Bibliografía

Levin, Rubin y otros (2004). Estadística para la administración y economía. Estados Unidos: Pearson.

8/27
Sexto Nivel

Autoevaluación

1. Se entiende por población:

Un conjunto de elementos que contienen una o más características observables


Porción representativa de un conjunto grande de colecciones
Elementos que describen un comportamiento general
Una característica susceptible de ser medida

Pregunta 1 de 18

9/27
Sexto Nivel

Autoevaluación

2. Un parámetro es:

Elemento que describe una muestra


Medida descriptiva que resuma una característica de la población
Característica de la población que se analiza
Diferencia entre un dato conocido y un dato desconocido

Pregunta 2 de 18

10/27
Sexto Nivel

Autoevaluación

3. Una variable es:

La tendencia a favorecer la elección de determinados elementos de la muestra


Característica definida en la población por la tarea o investigación estadística.
Elemento que describe una muestra y sirve para estimar el parámetro correspondiente de la población.
Medida descriptiva de la población completa de observaciones que tienen interés para el investigador

Pregunta 3 de 18

11/27
Sexto Nivel

Autoevaluación

4. Las variables pueden ser:

Cuantitativas y cualitativas
Continua y no continua
Discreta y no discreta
Analítica y descriptiva

Pregunta 4 de 18

12/27
Sexto Nivel

Autoevaluación

5. Las variables cuantitativas se clasifican en:

Primer y segundo orden


De caracterización y de apoyo
Continuas y discretas
Invasivas y evasivas

Pregunta 5 de 18

13/27
Sexto Nivel

Autoevaluación

6. Una medición es ORDINAL cuando:

Indica una escala de ordenación


Son mediciones de una escala numérica
Son mediciones numéricas en las cuales el cero es un valor fijo y la diferencia de valores es importante
Son nombres donde los valores se pueden ordenar ya sea de forma ascendente o descendente.

Pregunta 6 de 18

14/27
Sexto Nivel

Autoevaluación

7. Son mediciones de INTERVALOS cuando:

Es una escala en la cual se tiene un cero relativo, es decir que no significa ausencia total de la propiedad que se observa

Se trata de mediciones numéricas en las cuales el valor del cero es arbitrario pero la diferencia de valores es importante

Nos permiten jerarquizar los datos en categorías, ordenadas en virtud de un determinado criterio
Se trata de medidas arbitrarias para definir un proceso

Pregunta 7 de 18

15/27
Sexto Nivel

Autoevaluación

8. La escala de medición de una variable es:

Característica de cada variable


Elementos que describen las variables de una muestra
Instrumento de medida, con el que se asigna valores a las unidades estadísticas
Tendencia a favorecer la elección de determinados elementos de la muestra

Pregunta 8 de 18

16/27
Sexto Nivel

Autoevaluación

9. Una muestra es:

Un conjunto de elementos que contienen una o más características observables


Porción representativa de un conjunto grande de colecciones
Elementos que describen un comportamiento general
Medida descriptiva que resume una característica de la población

Pregunta 9 de 18

17/27
Sexto Nivel

Autoevaluación

10. El muestreo es importante porque:

Es más rápido e igual funciona para la población elegida sin importar las características del mismo
La metodología se la aplica según el tipo de muestra elegido
Por lo general no se pueden estudiar a las poblaciones en su totalidad, entonces estaremos obligados a hacer el
muestreo.
Es económico, pero depende del tamaño de la muestra y de la metodología elegida

Pregunta 10 de 18

18/27
Sexto Nivel

Autoevaluación
11. Las técnicas de recolección de datos son las_____________ con las que se cuenta para _____________, son los procedimientos
especiales utilizados para obtener y evaluar las evidencias necesarias

Características/el procesamiento de datos


Mediciones/realizar encuestas
Herramientas/recolección de datos
Herramientas/el procesamiento de datos

Pregunta 11 de 18

19/27
Sexto Nivel

Autoevaluación

12. Una característica de un cuestionario es:

Tener un método preparado para la investigación


Ser complejo y muy técnico
Ordenado
Tener libertad de lenguaje al expresar preguntas

Pregunta 12 de 18

20/27
Sexto Nivel

Autoevaluación

13. Son técnicas de recolección de datos:

Visuales, diarias, mensuales


Verbales, oculares, documentales
Verbales, científicas, modernas
Físicas, Escritas, novelísticas

Pregunta 13 de 18

21/27
Sexto Nivel

Autoevaluación

14. Una técnica de recolección es la ocular, la misma que consiste en:

Obtener la información de manera oral mediante averiguaciones o indagaciones


Obtener la información de manera escrita mediante cuestionarios escritos que tienen que ser analizados
Obtener la información verificando visualmente en forma directa
Observaciones analíticas y diferentes

Pregunta 14 de 18

22/27
Sexto Nivel

Autoevaluación

15. Cual no es un tipo de encuesta:

Inferencial
Exploratoria
Explicativa
Predictiva

Pregunta 15 de 18

23/27
Sexto Nivel

Autoevaluación

16. Cual es una característica de un cuestionario

Preciso y claro en las preguntas


Tener claro objetivo
Formular preguntas directas
No sea insuficiente

Pregunta 16 de 18

24/27
Sexto Nivel

Autoevaluación

17. Los tipos de pregunta que pueden realizarse en un cuestionario son: _______, de profundización, _________ o de control

Cerrada/parcialmente estructurada
Abierta/parcialmente estructurada
Abierta/sin estructura
Cerrada/sin estructura

Pregunta 17 de 18

25/27
Sexto Nivel

Autoevaluación
18. Un cuestionario debe ser: interesante, sencillo de entender, ____________, ordenado, ___________ y debe terne espacio suficiente
para las respuestas

Ordenado/enfocado en un solo tema


Debe tener preguntas de profundización/Sencillo de entender
Consta de preguntas abiertas/tener un vocabulario adecuado
Preciso y claro en las preguntas/ tener un vocabulario adecuado

Pregunta 18 de 18

26/27
1/21
Sexto Nivel

2.1. Distribuciones de frecuencia

Toda actividad que hagamos con un propósito investigativo, en el cual el resultado sean varias mediciones, tiene más que simples
números o valores en una hoja. Este conjunto de datos puede ser organizado y tabulado, y de esta manera realizar, entre otros
procesos, gráficos que nos ayuden a captar tendencias y a establecer modelos de probabilidades. Lo que nos dice esto es que la
organización de los datos es muy importante para los procesos y análisis estadísticos.

Métodos de organización de datos

Existen muchas herramientas para describir y resumir un gran conjunto de datos, una de las más simples pero no menos importante
es la ordenada, es decir, ordenar los datos de forma ascendente o descendente. Para ciertos propósitos este orden de los datos no
es suficiente, y es cuando necesitamos otras herramientas o métodos para organizarlos, de aquí tenemos lo siguiente:

a) Distribuciones de frecuencias

Una distribución de frecuencias se puede tomar como una tabla donde los datos están categorizados por filas, y su ocurrencia o
frecuencia en columnas, la finalidad que tiene esta distribución es hacer más fácil la obtención de información de los datos.

El número de veces que aparece un valor o la frecuencia con que aparece un valor se llama frecuencia absoluta (fi), y la suma de
estas frecuencias absolutas nos tiene que dar como resultado el número de datos.

Al ordenar nuestros datos tomando en cuenta estas consideraciones, podemos decir que hemos realizado una distribución de
frecuencias o tabla de frecuencias.

En la Tabla 1 se muestra un ejemplo de distribución de frecuencias del peso de 100 estudiantes de una universidad de Perú.

Tabla 1
Peso de estudiantes

2/21
Toda actividad que hagamos con un propósito investigativo, en el cual el
resultado sean varias mediciones, tiene más que simples números o valores
en una hoja. Este conjunto de datos puede ser organizado y tabulado, y de
esta manera realizar, entre otros procesos, gráficos que nos ayuden a captar
tendencias y a establecer modelos de probabilidades. Lo que nos dice esto
es que la organización de los datos es muy importante para los procesos y
análisis estadísticos.

Métodos de organización de datos

Existen muchas herramientas para describir y resumir un gran conjunto de


datos, una de las más simples pero no menos importante es la ordenada, es
decir, ordenar los datos de forma ascendente o descendente. Para ciertos
propósitos este orden de los datos no es suficiente, y es cuando necesitamos
otras herramientas o métodos para organizarlos, de aquí tenemos lo
siguiente:

a) Distribuciones de frecuencias

Una distribución de frecuencias se puede tomar como una tabla donde los
datos están categorizados por filas, y su ocurrencia o frecuencia en
columnas, la finalidad que tiene esta distribución es hacer más fácil la
obtención de información de los datos.

El número de veces que aparece un valor o la frecuencia con que aparece un


valor se llama frecuencia absoluta (fi), y la suma de estas frecuencias
absolutas nos tiene que dar como resultado el número de datos.

Al ordenar nuestros datos tomando en cuenta estas consideraciones,


podemos decir que hemos realizado una distribución de frecuencias o
tabla de frecuencias.

En la Tabla 1 se muestra un ejemplo de distribución de frecuencias del peso


de 100 estudiantes de una universidad de Perú.

Tabla 1
Peso de estudiantes

Peso (lb) Número de estudiantes


(frecuencia absoluta)
140-149 8
150-159 15
160-169 46
170-179 22
180-189 9
100
De acuerdo con esta tabla, se pueden visualizar varias características que no
podríamos ver si los datos no estuvieran organizados y tabulados. La primera
clase comprende los pesos de los estudiantes, que están entre 140 y 149
libras. En esta clase, hay ocho estudiantes, es decir, la frecuencia de esta
clase es 8.

Un dato importante que hay que mencionar es que cada clase tiene un límite
inferior y un límite superior (por ejemplo la tercera clase 160-169 tiene
como límite superior a 169 y como límite inferior a 160). Podemos ver que
estos valores son exactos y más adelante notaremos su importancia, además
es esencial que los valores no se solapen de una clase a otra, esto puede
causar mucha confusión.

Existen también los denominados límites reales o verdaderos de clase que


se obtienen sumando al límite superior de una clase 0,5 y restando al límite
inferior del misma clase 0,5. Cuando los límites de la clase se expresan con
un decimal, la regla nos indica que se debe sumar 0,05 al límite superior y
restar el mismo valor al límite inferior. Por ejemplo, los límites reales de la
cuarta clase de la tabla 1 serían: 170-0,5 = 169,5 y 179+0,5 = 179,5.

El número de clases (o número de intervalos) de una tabla de frecuencias


de manera general debe tener entre 5 y 20 clases. Si tuviera pocas clases no
se tendría ningún detalle sobre los datos, de la misma manera si hubiera
muchas clases se crearía confusión.

El intervalo de clase son las divisiones o ancho de los valores que se


encuentran dentro de una clase. Para determinar este valor se resta el límite
superior menos el límite inferior. Lo mejor es hacer iguales los intervalos de
clase de una distribución de frecuencias, de esta manera podemos facilitar la
interpretación estadística.

El intervalo de clase se determina con la siguiente expresión:

Otro elemento necesario para una tabla de distribución de frecuencias es


establecer un punto medio o marca de clase, que es el punto medio del
intervalo de clase. Este se determina sumando el límite inferior con el límite
superior y se divide para dos. Por ejemplo, para la quinta clase de la tabla 1,
la marca de clase o punto medio sería:

b) Distribuciones de frecuencias acumuladas

Se conoce como frecuencia acumulada (Fi), la suma de las frecuencias


menores que el límite real superior de la clase de un intervalo de clase.
También podemos decir que es la suma de todas las fi hasta el intervalo
requerido. Por ejemplo, la frecuencia acumulada hasta el intervalo de clase
170-179 de la tabla 1 es: 8+15+46+22 = 91.

Una tabla que represente estas frecuencias acumuladas se llama distribución


de frecuencias acumuladas, tabla de frecuencias acumuladas o brevemente
distribución acumulada.

Es importante mencionar que el proceso de acumulación puede basarse en


“o más” o “menor que”, todo dependerá de lo requerido.

c) Distribuciones de frecuencias relativas

La frecuencia relativa (fr) se determina dividiendo cada frecuencia absoluta


para el número de datos. Por ejemplo, en la tabla 1, la frecuencia absoluta de
la tercera clase es 46. Este valor se lo divide para el número de datos, que
en este caso es 100, dándonos como resultado 0.46, que es la frecuencia
relativa.

Es importante mencionar que la suma de estas frecuencias siempre dará 1, o


también expresado en porcentaje la suma será del 100 %.

Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las


correspondientes frecuencias relativas, la tabla resultante se llama
distribución de frecuencias relativas, distribución porcentual o tabla de
frecuencias relativas.

d) Distribuciones de frecuencias relativas acumuladas

Una distribución de frecuencias relativas acumuladas (Hi) es la división de


cada una de las frecuencias acumuladas para el total de datos. Por ejemplo,
en la tabla 1 la frecuencia acumulada de la cuarta clase es 91, esto dividido
para el número de datos que es 100 nos da 0.0091, dato que nos indica
frecuencia relativa acumulada.

El proceso de acumulación, igual que en las distribuciones de frecuencia,


también se basa en un principio “o más” o “menor que”.

Ejemplo 1

La siguiente tabla representa la distribución de frecuencias para los gastos


semanales de 80 trabajadoras de una compañía de fabricación de
pantalones en la ciudad de Ambato.

Gastos Número de trabajadoras


(frecuencia)
100-199 5
200-299 7
300-399 28
400-499 17
500-599 18
600-699 5

Elaborar una tabla de frecuencias acumuladas, frecuencias relativas, y


relativas acumuladas. Adicionalmente incluir el valor de la marca de clase.

Desarrollo
Utilizando los conceptos revisados, calculamos lo solicitado (se puede hacer
manualmente o utilizando una hoja de cálculo, en la cual, hay que tener
tomar en cuenta la codificación de las fórmulas en cada celda):

Gastos Marca Frecuencia Frecuencia Frecuencia Frecuencia


de absoluta acumulada relativa relativa
clase acumulada
100-199 149,5 5 5 0,0625 0,0625

200-299 249,5 7 12 0,0875 0,1500

300-399 349,5 28 40 0,3500 0,5000

400-499 449,5 17 57 0,2125 0,7125

500-599 549,5 18 75 0,2250 0,9375

600-699 649,5 5 80 0,0625 1,0000

Total 80

Ejemplo 2
La siguiente tabla representa la distribución de frecuencias para los valores
pagados por horas extras de 70 trabajadores del área de Limpieza de la
Universidad Internacional.
Salario Número de trabajadores
(frecuencia)
50-59,99 8
60-69,99 10
70-79,99 16
80-89,99 15
90-99,99 10
100-119,99 8
120-179,99 3
Elaborar una tabla de frecuencias acumuladas con criterio “menor que” y “o
más”.

Desarrollo
Utilizando los contenidos estudiados, se sabe que se debe tomar en cuenta
el límite inferior de cada intervalo de clase.

1. Criterio “menor que”

Salarios Frecuencia % Frecuencia


acumulada acumulada
Menos que 50 0 0,0
Menos que 60 8 11,43
Menos que 70 18 25,71
Menos que 80 34 48,57
Menos que 90 49 70,00
Menos que 100 59 84,29
Menos que 120 67 95,71
Menos que 179,99 70 100,00

2. Criterio “o más”
Salarios Frecuencia % Frecuencia
acumulada acumulada
50 o más 70 100,00
60 o más 62 88,57
70 o más 52 74.29
80 o más 36 51,43
90 o más 21 30,00
100 o más 11 15,71
120 o más 3 4,29
179,99 o más 0 0.0

e) Tablas de contingencias

La tabla de contingencia es una tabla que nos da el número de las


observaciones en diferentes variables; es decir, tenemos varias variables con
varias categorías a la vez. Con esto podemos determinar si dos
características están relacionadas y de qué manera lo están.
La tabla 2 muestra una tabla de contingencia en donde se evalúan dos
variables: sexo y voto de 92 electores seleccionados de manera aleatoria:

Tabla 2
Sexo y voto de 92 electores

Candidato 1 Candidato 2 General


Hombres 25 20 45
Mujeres 31 16 47
General 56 36 92

Nota: La columna y fila General representan los totales por columna y por fila,
respectivamente.

f) Gráficos estadísticos

Las visualizaciones gráficas son una manera muy práctica de describir un


conjunto de datos, mediante la cual se puede adquirir enseguida una
comprensión suficiente de los mismos. Entre estos podemos mencionar:
gráfico circular, gráfico de barras, histograma, polígono de frecuencia y
ojivas. Según se trate de variables cualitativas o cuantitativas se utiliza
gráficos específicos como los detallados a continuación:
Sexto Nivel

2.2. Gráficos para variables cualitativas

Una variable cualitativa, como se había indicado, se caracteriza por contener observaciones no numéricas sin embargo podrían ▲
ser representadas numéricamente por las frecuencias absolutas y relativas (Congacha, 2016). Gracias a este proceso, loa
gráficos utilizados con estas variables son: diagramas de barra y el gráfico circular (o de pastel).

Gráfico circular
Presenta los datos en forma círculo o tarta y de ahí que se lo llama también gráfico de pastel. El círculo que lo describe se
encuentra dividido en segmentos en donde cada área de cada uno de los segmentos es proporcional al número de casos en esa
categoría. De manera general, se usan porcentajes para cada categoría. Una muestra de cómo se ve el gráfico de pastel se
presenta en la figura 1.

Figura 1. Gráfico de pastel


3/21
Sexto Nivel

2.2. Gráficos para variables cualitativas

Gráfico de barras ▲

Otra manera de representar los datos es mediante el llamando gráfico de barras, que consiste en exhibir los datos mediante un
número de rectángulos, del mismo ancho, en donde cada uno de ellos representa una categoría particular. La longitud (y por lo
tanto el área) de cada rectángulo es proporcional al número de casos en la categoría que representa. Se usa de manera general
para datos cualitativos. Una muestra de cómo se ve el gráfico de barras se presenta en la figura 2.

Figura 2. Gráfico de barras

3/21
Sexto Nivel

2.3. Gráficos para variables cuantitativas

Como se conoce si los resultados de una investigación nos ha conducido a obtener valores numéricos, estamos tratando con las
variables cuantitativas. Para poder representarlos utilizamos histogramas, polígonos de frecuencia, ojivas, diagramas de caja,
diagramas de tallo y hojas y diagramas de puntos. Sin embargo, las variables cuantitativas también pueden utilizar el diagrama
circular y el diagrama de barras para ser representados (Congacha, 2016).

Histograma
Es un método útil y muy corriente de visualizar datos. Para el efecto hay que las clases (o intervalos) de una distribución de
frecuencias en el eje horizontal y las frecuencias absolutas en el eje vertical. Representa los datos de manera similar que el
diagrama de barras, es decir, que el área de cada barra rectangular es proporcional a la frecuencia de la clase.

Una muestra de cómo se ve el histograma se presenta en los figuras 3 y 4.

4/21
Como se conoce si los resultados de una investigación nos ha conducido a
obtener valores numéricos, estamos tratando con las variables cuantitativas.
Para poder representarlos utilizamos histogramas, polígonos de frecuencia,
ojivas, diagramas de caja, diagramas de tallo y hojas y diagramas de puntos.
Sin embargo, las variables cuantitativas también pueden utilizar el diagrama
circular y el diagrama de barras para ser representados (Congacha, 2016).

Histograma
Es un método útil y muy corriente de visualizar datos. Para el efecto hay que
las clases (o intervalos) de una distribución de frecuencias en el eje horizontal
y las frecuencias absolutas en el eje vertical. Representa los datos de manera
similar que el diagrama de barras, es decir, que el área de cada barra
rectangular es proporcional a la frecuencia de la clase.

Una muestra de cómo se ve el histograma se presenta en los figuras 3 y 4.

Figura 3. Histograma

Figura 4. Histograma
Polígono de frecuencias

Es un gráfico de línea trazado sobre las marcas de clase. Puede obtenerse


uniendo los puntos medios de los techos de los rectángulos en el histograma.

Una muestra de cómo se ve el polígono de frecuencias se presenta en las


figuras 5 y 6.

Figura 5. Polígono de frecuencias

Figura 6. Polígono de frecuencias


Ojivas

Es un gráfico de línea que representa frecuencias acumuladas. En el eje


horizontal se muestra el límite superior de cada clase.

Una muestra de cómo se ve las ojivas se presenta en las figuras 7 y 8.


Figura 7. Ojiva

Figura 8. Ojiva
Diagramas de caja
Los diagramas de caja se construyen tomando en consideración las
puntuaciones que dividen al grupo de datos en 4 partes iguales (es decir,
cuartiles, que es una medida de posición que se revisará en el tema siguiente).
Como los diagramas de caja toman en cuenta estos valores, permiten
visualizar el espacio que ocupa cada 25% de los datos considerados en
función de “puntuaciones directas” (Morales, 2008).
Este tipo de diagramas son utilizados para hacer comparaciones
principalmente cuando:
- Se tiene dos o más grupos medidos en la misma variable (el caso
más común) y
- Se tiene un mismo grupo medido en varias variables (la
condicionante en este caso es que cada variable está medida en un
mismo número de ítems)
Los diagramas de caja están formados por:
a) Un rectángulo (que es la caja) cuyos extremos son el cuartil 1 y el cuartil
3. Dentro del rectángulo se dibuja una línea que indica donde se
encuentra el segundo cuartil o mediana.
b) Dos brazos: el primero que comienza en el primer cuartil y termina en el
valor mínimo de los datos que se estudian y el segundo que comienza
en el tercer cuartil y termina en el valor máximo de los datos
considerados.
c) Los datos llamado atípicos (que son los valores extremos). Los datos
atípicos son aquellos datos que no cumplen con ciertas características
de heterogeneidad en el conjunto de datos estudiados.
En la figura 9 podrá visualizar un diagrama de caja y sus elementos:

Figura 9. Diagrama de Caja (Q1=primer cuartil, Q2=segundo cuartil, Q3=tercer cuartil)

Diagramas de tallo y hojas


El diagrama de tallo y hojas es una forma sencilla de mostrar el conjunto de
datos que se está estudiando. Este gráfico uso los valores numéricos reales
de cada uno de los datos.

El diagrama de tallo y hojas (cuya traducción al inglés “Stem and Leaf


Diagram” es comúnmente utilizada en una serie de bibliografía y paquetes
informáticos) es una organización de datos en forma de categorías que toma
como base su posición. Cada dato o número estudiado se dividirá en dos
partes tomando en cuenta su posición.

La figura 10 nos presenta como presentar un grupo de datos utilizando este


tipo de diagrama.

Figura 10. Diagrama de tallo y hojas

Como se puede observar, para cada fila el número que se encuentra en el tallo
constituye el primer dígito(s) de los valores numéricos de los datos que se
estudia. En la hoja se coloca el dígito de 0 a 9 restantes. La dispersión
mostrará que tanto varía el conjunto de datos.

Diagramas de puntos
Los diagramas de puntos (o gráfico de puntos) se utilizan cuando los datos
que se tiene no se pueden separar fácilmente en categorías o clases. Para
construir estos diagramas colocamos la información sobre una línea horizontal
(a modo de recta numérica) como se puede apreciar en las figuras 11 y 12.

Figura 11. Diagrama de Puntos (pocos datos)

Figura 12. Diagrama de Puntos (muchos datos)

Como se observa este diagrama es útil cuando se tiene un número de datos


pequeño ya que cuando el número de datos es grande la gráfica resultante no
es nada informativa y puede causar confusión.
Sexto Nivel

Recursos complementarios

Video sobre tablas de distribución de frecuencias

Distribución de frecuencias

https://www.youtube.com/watch?v=Ecd3BIcJ1yA

5/21
Sexto Nivel

Bibliografía

Congacha, J. (2016). Estadística aplicada a la Educación (con actividades de aprendizaje). Ecuador.


Escuela Politécnica Superior de Chimborazo.

Gorgas, J., Cardiel, N. (2011). Estadística básica para estudiantes de ciencias. España: Universidad
Complutense de Madrid.

Morales, P. (2008). Estadística Aplicada a las Ciencias Sociales. España. Universidad Pontificia Comillas
de Madrid

Webster, A. (2012). Estadística aplicada para la administración y economía. Estados Unidos: Irwin.

Spiegel, M., Stevens, L (2009). Estadística (Serie Schaum). México: McGraw-Hill/interamericana


Editores.

6/21
Sexto Nivel

Autoevaluación

1. Que es la distribución de frecuencias:

Una herramienta con la cual podemos resumir mediante una tabla numerosos datos de tal manera que se ponga de
manifiesto la localización y la dispersión de las observaciones.
Una herramienta con la cual podemos resumir mediante un gráfico numerosos datos de tal manera que se ponga de
manifiesto la localización y la dispersión de las observaciones.
Una carta de control con la cual podemos resumir mediante proporciones numerosos datos de tal manera que se ponga
de manifiesto la localización y la dispersión de las observaciones.
Una evaluación con la cual podemos resumir mediante gráficos numerosos datos de tal manera que se ponga de
manifiesto la localización y la dispersión de las observaciones

Pregunta 1 de 14

7/21
Sexto Nivel

Autoevaluación

2. Que es la frecuencia absoluta:

Elemento que describe una muestra


El número de veces que aparece un determinado valor en un estudio estadístico
El menor número de veces que aparece un determinado valor en un estudio estadístico
El mayor número de veces que aparece un determinado valor en un estudio estadístico

Pregunta 2 de 14

8/21
Sexto Nivel

Autoevaluación

3. Como se obtiene la frecuencia relativa:

Multiplicando la frecuencia absoluta para el número total de observaciones


Dividiendo la frecuencia absoluta para el número total de observaciones
Sumando la frecuencia absoluta y el número total de observaciones
Restando la frecuencia absoluta del número total de observaciones

Pregunta 3 de 14

9/21
Sexto Nivel

Autoevaluación

4. Un intervalo de clase es:

El recorrido de los valores que se encuentran dentro de una clase


El valor más bajo del conjunto de datos
El valor más alto del conjunto de datos
El valor que se obtiene de sumar el valor más bajo y el valor más alto del conjunto de datos

Pregunta 4 de 14

10/21
Sexto Nivel

Autoevaluación

5. La marca de clase es:

Un valor promedio de todos los datos dado


El valor que identifica a los datos intermedios del conjunto dado
Es un valor que se obtiene sumando los límites superior e inferior dividiéndolo por dos
Es un valor que se obtiene restando los límites superior e inferior dividiéndolo por dos

Pregunta 5 de 14

11/21
Sexto Nivel

Autoevaluación

6. Las distribuciones de frecuencias acumuladas “menor que” u “o más” se utiliza cuando:

No se tiene más valores conocidos


Se quiere conocer la versión más sencilla de los datos conocidos
Se quiere conocer la procedencia de los datos conocidos
Se quiere determinar el número de observaciones que son mayores o menores que determinada cantidad

Pregunta 6 de 14

12/21
Sexto Nivel

Autoevaluación
7. Se presenta a continuación los pesos (en libras) de 40 estudiantes de la UDL Si se construye una tabla de distribución de frecuencias
entonces que enunciado es verdadero:

El rango de estos datos es 57 libras y el tamaño de cada uno si se utilizan 5 intervalos es 11 aproximadamente

El rango de estos datos es 56 libras y el tamaño de cada uno si se utilizan 20 intervalos será de 3 aproximadamente

El número de intervalos más conveniente para los datos es de 7


El número de intervalos más conveniente para los datos es de 10
Pregunta 7 de 14

13/21
Sexto Nivel

Autoevaluación

8. De manera general los histogramas sirven para representar:

Variable aleatoria discreta


Variable cualitativa
Variable aleatoria continua
Variable de índice par

Pregunta 8 de 14

14/21
Sexto Nivel

Autoevaluación

9. Que se representa con las ojivas:

Frecuencias acumuladas
Datos de una distribución
Frecuencias relativas
Ninguna

Pregunta 9 de 14

15/21
Sexto Nivel

Autoevaluación

10. Para graficar un diagrama de pastel se usa las:

Frecuencias absolutas
Frecuencias absolutas acumuladas
Frecuencias relativas porcentuales
Frecuencias relativas acumuladas porcentuales

Pregunta 10 de 14

16/21
Sexto Nivel

Autoevaluación

11. Los polígonos de frecuencias se graficar uniendo los:

Puntos extremos superiores de los intervalos


Puntos extremos inferiores de los intervalos
Puntos medios de los intervalos
Puntos que corresponden a la mediana de los intervalos

Pregunta 11 de 14

17/21
Sexto Nivel

Autoevaluación

12. El diagrama de tallo y hoja divide a cada uno de los datos proporcionados en:

Dos partes
Tres partes
Cuatro partes
Cinco partes

Pregunta 12 de 14

18/21
Sexto Nivel

Autoevaluación

13. Para un diagrama de caja se toma en consideración los valores que dividen al grupo de datos en:

Diez partes
Cinco partes
Cuatro partes
Cien partes

Pregunta 13 de 14

19/21
Sexto Nivel

Autoevaluación

14. ¿Cuál de las siguientes afirmaciones es FALSA?

El diagrama de caja visualiza el espacio que ocupa cada 25% del grupo en función de puntuaciones directas
El diagrama de caja visualiza el espacio que ocupa cada 33.33% del grupo en función de puntuaciones directas
El diagrama de caja sirve para hacer comparaciones entre dos o más grupos medidos en una misma variable
El diagrama de caja sirve para hacer comparaciones en un mismo grupo de datos medidos en varias variables

Pregunta 14 de 14

20/21
1/24
Sexto Nivel

Introducción

El uso de tablas y gráficos nos proporcionan información útil sobre el conjunto de datos que se está
investigando, sin embargo, no son el mejor referente para sacar conclusiones basados en el mismo
conjunto (Congacha, 2016).
Es importante saber que los datos recolectados para un estudio estadístico no son generalmente
constantes. Es necesario ver una medida que nos indique la variabilidad de estos datos y nos dé una
referencia sobre alrededor de qué valor fluctúan. Por otro lado, también es necesario conocer la simetría
y la forma en la que los datos tienden a agruparse.

Las medidas que permite esto son las llamadas medidas descriptivas y usualmente se encuadran en los
siguientes cuatro tipos:

• Medidas de tendencia central


• Medidas de dispersión
• Medidas de posición
• Medidas de forma

2/24
Sexto Nivel

3.1. Medidas de tendencia central

Los estadísticos de ubicación o de tendencia central (también llamados promedios) proporcionan una estimación de la puntuación
típica, común o normal encontrada en una distribución de puntuaciones en bruto.

Es muy importante que, a más de saber calcular las medidas de tendencia central, se pueda dar una interpretación correcta de la
información que estas proporcionan.

Una primera medida es la media poblacional que es la suma de todos los valores observados en la población dividido por el
número de datos en la población. La media muestral es la suma de todos los valores de la muestra dividido por el número de datos
en la muestra.

Si analizamos las propiedades de la media aritmética, entre las que destaca que es única y que su cálculo incluye todos los datos
de la muestra, es por esto que es la medida de tendencia central más utilizada; sin embargo, el valor de la media aritmética se ve
afectado por la presencia de uno o más valores sumamente grandes o pequeños (valores extremos). En tales casos, la medida de
tendencia central más representativa es la mediana. La media ponderada es un caso especial de la media aritmética.

Otra medida de tendencia central que es utilizada es la media geométrica que resulta útil para determinar el promedio de
porcentajes, razones, índices o tasas de crecimiento. La media geométrica es la raíz enésima del producto de n datos.

La mediana es el punto medio de los valores una vez que se han ordenado de menor a mayor. Si el número de datos es par, la
mediana es la media aritmética de los dos valores centrales. Si el número de datos es impar, la mediana es el único dato central.
Las principales propiedades de la mediana son que no es influida por la presencia de valores extremos y que es calculable en el

3/24
Los estadísticos de ubicación o de tendencia central (también llamados
promedios) proporcionan una estimación de la puntuación típica, común o
normal encontrada en una distribución de puntuaciones en bruto.

Es muy importante que, a más de saber calcular las medidas de tendencia


central, se pueda dar una interpretación correcta de la información que estas
proporcionan.

Una primera medida es la media poblacional que es la suma de todos los


valores observados en la población dividido por el número de datos en la
población. La media muestral es la suma de todos los valores de la muestra
dividido por el número de datos en la muestra.

Si analizamos las propiedades de la media aritmética, entre las que destaca


que es única y que su cálculo incluye todos los datos de la muestra, es por
esto que es la medida de tendencia central más utilizada; sin embargo, el
valor de la media aritmética se ve afectado por la presencia de uno o más
valores sumamente grandes o pequeños (valores extremos). En tales casos,
la medida de tendencia central más representativa es la mediana. La media
ponderada es un caso especial de la media aritmética.

Otra medida de tendencia central que es utilizada es la media geométrica


que resulta útil para determinar el promedio de porcentajes, razones, índices
o tasas de crecimiento. La media geométrica es la raíz enésima del
producto de n datos.

La mediana es el punto medio de los valores una vez que se han ordenado
de menor a mayor. Si el número de datos es par, la mediana es la media
aritmética de los dos valores centrales. Si el número de datos es impar, la
mediana es el único dato central. Las principales propiedades de la mediana
son que no es influida por la presencia de valores extremos y que es
calculable en el caso de datos de nivel ordinal o más altos.

La moda es el dato que aparece con mayor frecuencia. En una distribución


puede haber una o más modas o no haber ninguna. La moda puede
determinarse para todos los niveles de datos y tiene la ventaja de que no
influyen en ella los valores extremos; sin embargo, se usa menos que la
media o la mediana, ya que en muchos casos no hay moda o hay más de
una.
Si Media = Mediana = Moda, la distribución es simétrica. Si Media >
Mediana > Moda, la distribución no es simétrica y tiene sesgo positivo. Si
Moda > Mediana >Media, la distribución no es simétrica y tiene sesgo
negativo.

Ejemplo

Con los siguientes datos: 8, 2, 3, 5, 4, 2, 6, 3, 1, 3, 13, 4, calcular la media


aritmética, la media geométrica, la mediana y la moda. Indicar, además, si
hay un valor extremo y cuál es el tipo de sesgo de la distribución.

1) Media aritmética: =

2) Media geométrica

3) Mediana. Para determinar la mediana, ordenar los datos:


1,2,2,3,3,3,4,4,5,6,8,13.

Como n = 12 es par, la mediana es la media de las dos puntuaciones


centrales, es decir Mediana = (3+4) /2 = 3.5

4) Moda = 3 (el valor con la frecuencia mayor)

5) Valor extremo: 13 (claramente separado de los demás valores)

6) Tipo de sesgo: Media > Mediana > Moda sesgo positivo o a la derecha

Para datos agrupados en una distribución de frecuencias, en el cálculo de la


media aritmética intervienen el producto de la frecuencia y el punto medio de
cada intervalo de clase.

Las ecuaciones que se utilizarán para este tipo de datos serán:

Media aritmética

Donde: X = punto medio o marca de clase


f = frecuencia
Mediana

Donde:
= límite inferior de la clase de la mediana
= frecuencia acumulada de la clase anterior a la clase de la
mediana.
= frecuencia de la clase que contiene a la mediana
Moda
Se la puede aproximar por el punto medio de la clase modal.

Un valor más preciso se obtiene aplicando la siguiente fórmula:

Donde:
= límite inferior de la clase modal
= (frecuencia de la clase modal) – (frecuencia de la clase que
le antecede)
= (frecuencia de la clase modal) – (frecuencia de la clase que
le sigue)
= es el ancho del intervalo de clase.
Sexto Nivel

3.2. Medidas de dispersión

Una medida de ubicación, como la media o la mediana, solo describe el centro de los datos, pero no dice nada sobre la dispersión
de los datos. Por eso son necesarias las llamadas medidas de dispersión.

Una medida de dispersión pequeña indica que los datos se acumulan con proximidad alrededor de la media aritmética, mientras que
una medida de dispersión grande indica que hay uno o varios datos alejados de la media aritmética.

El rango es la medida de dispersión más simple. Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos.
Es muy fácil de calcular y entender, sin embargo, es una medida de dispersión que da una información limitada ya que solo toma en
cuenta dos valores (el máximo y el mínimo) de la distribución.

La varianza es la media aritmética de las desviaciones de la media elevadas al cuadrado. La desviación estándar es la raíz
cuadrada de la varianza. Podemos hablar de una varianza poblacional y de una varianza muestral.

La diferencia principal es que, en la varianza poblacional, el numerador se divide por N (tamaño de poblacional) y en la varianza
muestral por n-1 (donde n es el tamaño muestral) ya que se debe compensar el hecho de que la distribución muestral tiene menor
dispersión que la distribución poblacional.

Ejemplo

Calcular la desviación estándar de los siguientes datos considerando que son datos: a) de una población y b) de una muestra.

4/24
Una medida de ubicación, como la media o la mediana, solo describe el
centro de los datos, pero no dice nada sobre la dispersión de los datos. Por
eso son necesarias las llamadas medidas de dispersión.

Una medida de dispersión pequeña indica que los datos se acumulan con
proximidad alrededor de la media aritmética, mientras que una medida de
dispersión grande indica que hay uno o varios datos alejados de la media
aritmética.

El rango es la medida de dispersión más simple. Es la diferencia entre el


valor máximo y el valor mínimo de un conjunto de datos. Es muy fácil de
calcular y entender, sin embargo, es una medida de dispersión que da una
información limitada ya que solo toma en cuenta dos valores (el máximo y el
mínimo) de la distribución.

La varianza es la media aritmética de las desviaciones de la media elevadas


al cuadrado. La desviación estándar es la raíz cuadrada de la varianza.
Podemos hablar de una varianza poblacional y de una varianza muestral.

La diferencia principal es que, en la varianza poblacional, el numerador se


divide por N (tamaño de poblacional) y en la varianza muestral por n-1
(donde n es el tamaño muestral) ya que se debe compensar el hecho de que
la distribución muestral tiene menor dispersión que la distribución
poblacional.

Ejemplo

Calcular la desviación estándar de los siguientes datos considerando que son


datos: a) de una población y b) de una muestra.

4 5 8 7 9 6
a) µ = 39/6 = 6.5
X X-µ (X-µ)2
4 -2.5 6.25
5 -1.5 2.25
8 1.5 2.25
7 0.5 0.25
9 2.5 6.25
6 0.5 0.25
_____
S (X-µ)2=17.5 à σ2 = S (X-µ)2/N = 17.5/6 = 2.917 à σ = 1.708

b) Para la desviación estándar muestral, el cálculo de la sumatoria es el


mismo solo que en lugar de µ se usa .

= = 3.5 --à = 1.871

La desviación estándar es una medida de dispersión más adecuada que el


rango ya que en su cálculo entran todos los datos. Esta medida se utiliza
normalmente para comparar la dispersión de dos o más conjuntos de datos.

Para datos agrupados en una distribución de frecuencias, la desviación


estándar toma en cuenta también la frecuencia de cada clase, como se
muestra en las ecuaciones a continuación:

Amplitud de variación o rango

AV = límite superior de la clase más alta – límite inferior de la clase más


baja

Desviación estándar

Donde:

= punto medio o marca de clase


= frecuencia
= media aritmética

Dispersión relativa

Coeficiente de variación

De la población:

De la muestra:
Coeficiente de asimetría o sesgo, denominado coeficiente de Pearson

Es importante mencionar que las medidas de dispersión relativa son aquellas


que nos permiten hacer comparaciones entre varios grupos de datos y de ahí
proviene su utilidad y aplicación.

Rango Intercuartílico

Una medida de dispersión que se utiliza cuando se quiere eliminar los


valores extremadamente alejados del grupo de datos que se está estudiando
y/o la medida de tendencia central que se está estudiando es la mediana, es
el llamado rango intercuartílico.

El rango intercuartílico consiste en la diferencia entre el cuartil 3 y el cuartil 1:

El valor del rango intercuartílico es mayor mientras más grande sea la


dispersión que presente el grupo de datos en estudio.
Sexto Nivel

3.3. Medidas de posición

Como bien se ha descrito en las medidas de tendencia central, la mediana nos permite dividir al grupo de datos ordenados en dos
partes iguales. Sin embargo, en ocasiones es necesario dividir al grupo de datos estudiado en más partes iguales, en este caso, se
estudian las llamadas medidas de posición.

Las medidas de posición más comunes son los cuartiles, deciles y percentiles (o centiles), aunque existe bibliografía que también
considera el uso de quintiles.
Los cuartiles dividen al grupo de datos ordenado en cuatro partes iguales y se denotan con la letra Q. Existe tres cuartiles: Q1, Q2
y Q3 indicando que el cuartil 2 o Q2 es el valor de la mediana. La figura 1 indica la representación de los cuartiles:

Figura 1. Representación de Cuartiles

Los deciles en cambio dividen al grupo de datos ordenado en diez partes iguales y se denotan con la letra D. Existe nueve deciles:
D1, D2 …. D9 indicando que el decil 5 o D5 es el valor de la mediana. En la figura 2 se puede apreciar la representación de los
deciles:

5/24
Como bien se ha descrito en las medidas de tendencia central, la mediana
nos permite dividir al grupo de datos ordenados en dos partes iguales. Sin
embargo, en ocasiones es necesario dividir al grupo de datos estudiado en
más partes iguales, en este caso, se estudian las llamadas medidas de
posición.

Las medidas de posición más comunes son los cuartiles, deciles y


percentiles (o centiles), aunque existe bibliografía que también considera el
uso de quintiles.
Los cuartiles dividen al grupo de datos ordenado en cuatro partes iguales y
se denotan con la letra Q. Existe tres cuartiles: Q1, Q2 y Q3 indicando que el
cuartil 2 o Q2 es el valor de la mediana. La figura 1 indica la representación
de los cuartiles:

Figura 1. Representación de Cuartiles

Los deciles en cambio dividen al grupo de datos ordenado en diez partes


iguales y se denotan con la letra D. Existe nueve deciles: D1, D2 …. D9
indicando que el decil 5 o D5 es el valor de la mediana. En la figura 2 se
puede apreciar la representación de los deciles:

Figura 2. Representación de Deciles

Los percentiles dividen al grupo de datos ordenado en cien partes iguales y


se denotan con la letra P. Existe noventa y nueve percentiles: P1, P2 … P99
indicando que el percentil 50 o P50 corresponde al valor de la mediana. En la
figura 3 se puede verificar la representación de los percentiles:

Figura 3. Representación de Percentiles

Cálculo de la posición de las medidas de posición

Para calcular la posición de un cuartil, decil o percentil se usa la fórmula:

Para la posición del primer cuartil Q1 use C = 25, para el tercer cuartil Q3 use
C= 75. (Q1 = C25; Q3 = C75), en algunos textos en vez de C se usa P, así
P25

Para calcular la posición de un decil, por ejemplo, D3 use C = 30; para el


decil 7 D7 use. C = 70

Para calcular la posición de un percentil, por ejemplo; P30 use C = 300; para
el percentil 70 P70 use C = 700

Si Lc es entero el centil es el dato de la posición Lc

Si Lc no es entero, por ejemplo, si L25 = 7.62, el centil o percentil 25 se


encontrará a 0.62 de la distancia entre el séptimo y el octavo dato. Su valor
se calcula del siguiente modo:

C25 = Q1 = Dato7 + 0.62 (Dato8 – Dato7)

En el cálculo de los cuartiles, recuerde por ejemplo que el primer cuartil Q1


es aquel valor que es mayor o igual que el 25 % de los datos y menor o igual
que el 75 % de ellos.

Recuerde NO confundir posición del cuartil, decil o percentil con el valor del
cuartil, decil o percentil, son dos procesos diferentes que se complementan.
Ejemplo

Calcular el primer y tercer cuartiles de los siguientes datos:

8.4 8.8 9.2 10 11.3 12.5 12.9 13.6 14 15

Solución

En este caso: n = 10, para Q1 C = 25 y para Q3 C = 75

Es la posición de Q1, mientras que su valor es:

Q1 = Dato 2 + 0.75 (Dato 3 – Dato 2)

De igual manera:

Es la posición de Q3, mientras que su valor


es:
Q3 = Dato 8 + 0.25 (Dato 9 – Dato 8)

La mediana es se calcula del mismo modo que los otros cuartiles.

Se debe mencionar que el uso de percentiles se da de mejor manera para


grupos de datos grande ya que su uso en grupos pequeños no es de utilidad.

Medidas de posición para datos agrupados en intervalos o clases


Para calcular cuartiles, deciles y percentiles de datos agrupados en intervalos
o clases, se debe encontrar en primera instancia la posición de las medidas
deseadas utilizando:

si es cuartil el término buscado


si es decil el término buscado

si es percentil el término buscado

donde k es el número del término buscado y n el número de datos que se


tiene.

Como segundo paso se debe encontrar el intervalo donde se encontraría


esta posición, para ello hacemos uso de la frecuencia absoluta acumulada
(F) Una vez identificado el intervalo procedemos como último paso a
encontrar el valor del término buscado. Para esto se usa la fórmula:

si es cuartil el término buscado

si es decil el término buscado

si es percentil el término buscado

Donde:
Li = límite inferior de la clase o intervalo donde se debería encontrar el cuartil,
decil o percentil buscado
Fi-1 = frecuencia absoluta acumulada del intervalo anterior al intervalo donde
se debería encontrar el cuartil, decil o percentil buscado
fi = frecuencia absoluta del intervalo donde se debería encontrar el cual, decil
o percentil buscado
c = ancho del intervalo
Sexto Nivel

3.4. Medidas de forma

Medidas de sesgo y curtosis

Aparte de las medidas de tendencia central y de dispersión, otra característica de un conjunto de datos es la forma. Hay cuatro
formas: simétrica, con sesgo positivo, con sesgo negativo y bimodal. En un conjunto simétrico media, mediana y moda son iguales y
los valores de los datos se dispersan uniformemente en torno a estos valores. Un conjunto de valores se encuentra sesgado a la
derecha o positivamente sesgado si existe un solo pico y los valores se extienden mucho más allá a la derecha del pico que a la
izquierda de este.

En una distribución sesgada a la izquierda o negativamente sesgada existe un solo pico pero las observaciones se extienden más a
la izquierda, en dirección negativa (figura 4).

6/24
Medidas de sesgo y curtosis

Aparte de las medidas de tendencia central y de dispersión, otra característica


de un conjunto de datos es la forma. Hay cuatro formas: simétrica, con sesgo
positivo, con sesgo negativo y bimodal. En un conjunto simétrico media,
mediana y moda son iguales y los valores de los datos se dispersan
uniformemente en torno a estos valores. Un conjunto de valores se encuentra
sesgado a la derecha o positivamente sesgado si existe un solo pico y los
valores se extienden mucho más allá a la derecha del pico que a la izquierda
de este.

En una distribución sesgada a la izquierda o negativamente sesgada existe un


solo pico pero las observaciones se extienden más a la izquierda, en dirección
negativa (figura 4).

Figura 4. Sesgos de una distribución

La medida más sencilla para calcular el sesgo es el coeficiente de sesgo de


Pearson, que se puede calcular con dos fórmulas distintas. La primera basada
en la media, mediana y distribución estándar de una distribución, la da se
puede obtener mediante programas estadísticos.

La curtosis mide cuán puntiaguda es una distribución, en general en


referencia a la distribución normal. Si tiene un pico alto, se dice leptocúrtica
mientras que si es aplastada se dice platicúrtica. La distribución normal, que
no es ni muy puntiaguda ni muy aplastada, se llama mesocúrtica. El
coeficiente de curtosis se calcula con la fórmula siguiente:

Si el coeficiente es mayor a 3, la forma es leptocúrtica. Si es igual a 3, la


forma es mesocúrtica y si es menor a 3, la forma es platicúrtica (figura 5).

Figura 5. Coeficientes de curtosis


Ejemplo

Considerando los siguientes datos, calcular el coeficiente de curtosis e indicar


el tipo de curtosis:

2 3 4 4 5 6

x (x- )
2 -2 4 16

3 -1 1 1

4 0 0 0

4 0 0 0

5 1 1 1

6 2 4 16

10 34
La curva es platicúrtica.

Otra manera de visualizar la simetría es utilizando el llamado diagrama de


caja (mencionado en el Tema 2).

El diagrama de caja permite visualizar la simetría o la asimetría de una


distribución de datos.

Para construir un diagrama de caja se requieren cinco valores: La media, la


mediana, el dato menor o mínimo, el dato mayor o máximo y el primero y
tercer cuartiles.

Rango intercuartílico

Es la diferencia entre el tercer y el primer cuartil:

Ejemplo

Suponga que en el servicio de entrega a domicilio de cierta pizza, el tiempo


mínimo de entrega es de 15 minutos, que el tiempo máximo es de 40 minutos,
que la mediana es 25 minutos y que los cuartiles son:
minutos.

a) Calcular el rango intercuartílico.

b) Trazar el diagrama de caja y sobre la base de este, indique si la distribución


de los datos es o no simétrica.
Solución

a) Rango intercuartílico = 32.5 – 20 = 12.5

b) El diagrama de caja es el que se muestra a continuación:


El diagrama muestra
que:

1. El bigote izquierdo es
más corto que el derecho.

2. Que Q1 está más cerca de la mediana que Q3.

Comentario

Se observa que la cola o el bigote de la derecha es más largo que el de la


izquierda, y también la distancia entre la mediana y es mayor que la
distancia entre y la mediana, lo que indica que la distribución de los datos
es asimétrica, con sesgo positivo.

Las líneas que van desde el mínimo a Q1 y desde Q3 al máximo se


denominan bigotes.
Sexto Nivel

3.5. Pasos para la elaboración de un informe básico utilizando elementos de la estadística descriptiva

Antes de describir los pasos que se deben seguir para la elaboración de un informe básico, se debe comenzar comprendiendo que
es un informe y cuál es su utilidad.

Definición

Un informe es un instrumento que nos permite “describir” las cualidades de un hecho y de todos los eventos que le rodean. Al
hablar de informes estadísticos podría entonces decirse que es el instrumento que nos permitirá “describir” las cualidades y
características del experimento que se está investigando.

El informe puede ser dado de manera oral o escrita y responde siempre a un objetivo muy concreto y tiene un carácter informativo.

Utilidad

Partiendo de su definición, podemos indicar que la utilidad que presenta un informe es proporcionar información relevante que nos
permita conocer las características y circunstancias sobre las cuales se desarrolla determinado suceso o experimento que se está
investigando.

Estructura

Un informe estadístico debe contener algunos puntos básicos, según se describe en la figura 6 (OBSICA, 2014):

7/24
Antes de describir los pasos que se deben seguir para la elaboración de un informe
básico, se debe comenzar comprendiendo que es un informe y cuál es su utilidad.

Definición

Un informe es un instrumento que nos permite “describir” las cualidades de un


hecho y de todos los eventos que le rodean. Al hablar de informes estadísticos
podría entonces decirse que es el instrumento que nos permitirá “describir” las
cualidades y características del experimento que se está investigando.

El informe puede ser dado de manera oral o escrita y responde siempre a un


objetivo muy concreto y tiene un carácter informativo.

Utilidad

Partiendo de su definición, podemos indicar que la utilidad que presenta un informe


es proporcionar información relevante que nos permita conocer las características y
circunstancias sobre las cuales se desarrolla determinado suceso o experimento
que se está investigando.

Estructura

Un informe estadístico debe contener algunos puntos básicos, según se describe en


la figura 6 (OBSICA, 2014):
Figura 6. Estructura básica de un informe estadístico

Para elaborar un informe estadístico se debe tomar en cuenta tres pasos


fundamentales:

1) Planear: Es la fase en la cual se van a establecer los lineamientos que nos


permitan definir la ruta a seguir al momento de escribir nuestro documento.
La planeación toma en consideración tres aspectos:
-Estructura y forma
-Contenido
-Tiempo

La figura 7 ilustra las preguntas que contestan cada uno de estos aspectos
para lograr completar esta fase con éxito (OBSICA, 2014):
Figura 7. Aspectos a tomar en cuenta en la planificación

2) Redactar: Este paso se refiere a desarrollar todas las ideas que se han considerado
en la etapa 1 (planear) tomando en consideración toda la información recolectada.

Algunos de los elementos que se deben tomar en cuenta al momento de la


redacción se muestran en la figura 8 (OBSICA, 2014):

Figura 8. Aspectos a tomar en cuenta en la redacción

Al momento de finalizar la redacción del documento, como consejo se


sugiere tomar un tiempo de descanso y nuevamente leer el mismo. Esto
permitirá tener una mirada muy fresca y permitirá tener una mejor
perspectiva de lo que se está escribiendo. Con esto se puede corregir
errores que en lecturas anteriores no se hubieran identificado.

3) Revisar: Este paso consiste en mejorar el contenido del informe, eliminando


información innecesaria e incrementando aquella que se considere dará
mayor realce al nuestro documento.

La revisión en sí, es contrastar el producto final obtenido y el planificado en la


primera etapa. Debe tomarse en consideración que el contenido, la forma y
la estructura deben estar acorde a los objetivos planteados inicialmente.

Elementos de la estadística descriptiva a considerar en los informes


estadísticos

En esta primera etapa del estudio estadístico, se elaborará un informe básico


tomando en consideración la primera rama de la Estadística, que en ese caso, es la
Estadística Descriptiva.
El informe básico que se presenta tomará en consideración los siguientes
elementos:

1. Características de los datos


En este punto se debe tomar en consideración:

Enfoque que se dio para la recolección de datos (cualitativo, cuantitativo o


mixto).
Diseño utilizado en el estudio (experimental o no experimental)
Universo de estudio (población o muestra que será investigada)
Instrumento de recolección de datos
2. Formas de presentación de los datos
En este ítem se debe tomar en consideración:

Si se presentan datos brutos


Si se presentan datos ordenados en intervalos o clases (de ser numéricos)

3. Uso de recursos esquemáticos


Hablar de recursos esquemáticos se refiere a qué tipo de gráficos estadísticos
se utilizar al momento de elaborar el informe. Esta información se obtiene de
analizar las características de los datos.

4. Cálculo de medidas descriptivas


Se presentará los valores correspondientes a:

Medidas de tendencia central: media, mediana y moda


Medidas de dispersión: varianza y desviación estándar (de ser el caso si se
debe hacer comparaciones entre distintos grupos, se debe incluir los
coeficientes de variación)
Medidas de posición: cuartiles (para poder calcular el rango intercuartílico)
Medidas de forma: sesgo y curtosis

5. Conclusiones y Recomendaciones
Sexto Nivel

Recursos complementarios

Video sobre la determinación de las medidas descriptivas

MEDIA, MODA Y MEDIANA Super facil | Medidas de tendenci…


tendenci…

https://www.youtube.com/watch?v=0DA7Wtz1ddg

8/24
Sexto Nivel

Bibliografía

Gorgas, J., Cardiel, N. (2011). Estadística básica para estudiantes de ciencias. España: Universidad
Complutense de Madrid.

Webster, A. (2012). Estadística aplicada para la administración y economía. Estados Unidos: Irwin.

Galindo, E. (1999). Estadística para la administración y la ingeniería. Ecuador: Gráfica Mediavilla Hnos.

Spiegel, M., Stevens, L (2009). Estadística (Serie Schaum). México: McGraw-Hill/interamericana


Editores.

OBSICA (2014). Cuaderno Metodológico sobre Informes Descriptivos. El Salvador. Observatorio e Índice
de Seguridad Democrática del Sistema de la Integración Centroamericana

9/24
Sexto Nivel

Autoevaluación
1. Denny está preocupado, y con razón, por su nota en Estadístic En los cinco exámenes de este semestre ha conseguido las
siguientes notas: 63, 59, 71, 41, 32. Su profesor le ha advertido que cualquier nota por debajo de 60 es insuficiente. La nota promedio
de Denny es:

55
63
53.2
62.5

Pregunta 1 de 14

10/24
Sexto Nivel

Autoevaluación

2. Dadas las observaciones 4, 9, 8, -1, -0.5, 12, 5 y 9 ; la media aritmética es:

4.8925
6.8965
5.6875
-4.8965

Pregunta 2 de 14

11/24
Sexto Nivel

Autoevaluación

3. Dadas las observaciones 4, 9, 8, -1, -0.5, 12, 5 y 9 ; la mediana es:

6
6.5
-0.5
9

Pregunta 3 de 14

12/24
Sexto Nivel

Autoevaluación

4. Dadas las observaciones 4, 9, 8, -1, -0.5, 12, 5 y 9 ; podemos decir que presenta una moda:

bimodal
trimodal
unimodal
no tiene moda

Pregunta 4 de 14

13/24
Sexto Nivel

Autoevaluación
5. En un número reciente de la revista FORBEX se publicó que 30 de las 500 mayores empresas de los Estados Unidos declaraban
ingresos en millones de dólares, según la siguiente tabla:

53.33 millones de dólares

63.33 millones de dólares

43.33 millones de dólares

55.33 millones de dólares


Pregunta 5 de 14

14/24
Sexto Nivel

Autoevaluación

6. Dados los siguientes datos: 73, 82, 64, 61, 63, 68, 52, 73 ; el rango de los mismos es:

30
40
35
45

Pregunta 6 de 14

15/24
Sexto Nivel

Autoevaluación
7. Arturo Suárez vende cinco pólizas de seguros diferentes que saca del maletero de su Plymouth de 2010. Sus primas mensuales son
110, 145, 125, 95 y 150 us La varianza de estos datos será:

420
430
435
425

Pregunta 7 de 14

16/24
Sexto Nivel

Autoevaluación
8. Arturo Suárez vende cinco pólizas de seguros diferentes que saca del maletero de su Plymouth de 2010. Sus primas mensuales son
110, 145, 125, 95 y 150 us La desviación estándar de estos datos serán:

20.54
30.54
30.74
20.74

Pregunta 8 de 14

17/24
Sexto Nivel

Autoevaluación
9. El director de vuelo de PP necesita información sobre la dispersión del número de pasajeros. Las decisiones en relación con los
horarios y el tamaño más eficiente de los aviones dependen de la fluctuación de la carga de pasajeros. Cuál es el valor de la desviación
estándar de los datos indicados:

10.80
11.80
12.80
9.80
Pregunta 9 de 14

18/24
Sexto Nivel

Autoevaluación

10. El sesgo es un valor que :

Mide el grado de asimetría de la distribución con respecto a la media.


Mide el grado de desviación respecto a la mediana
Mide el grado de concordancia con los valores de la media
Mide la diferencia entre la media y la moda

Pregunta 10 de 14

19/24
Sexto Nivel

Autoevaluación

11. La curtosis cuando tiene un pico alto se llama:

Leptocúrtica
Mesocúrtica
Platicúrtica
Ninguna

Pregunta 11 de 14

20/24
Sexto Nivel

Autoevaluación

12. Una medida de dispersión que se usa cuando la mediana es la descriptiva de tendencia central representativa es:

Rango
Rango Intercuartílico
Desviación media
Desviación estándar

Pregunta 12 de 14

21/24
Sexto Nivel

Autoevaluación

13. El uso de los percentiles se recomienda cuando:

Se tiene un grupo de datos grande


Se tiene un grupo de datos pequeño
Se tiene un grupo de datos de variable cualitativa
Se tiene un grupo de datos extraños

Pregunta 13 de 14

22/24
Sexto Nivel

Autoevaluación

14. Los deciles dividen al grupo de datos en estudio en:

Cuatro partes iguales


Cinco partes iguales
Diez partes iguales
Cien partes iguales

Pregunta 14 de 14

23/24
1/23
Sexto Nivel

4.2. Reglas de probabilidad (adición/condicional/conjunta/marginal/Bayes)

Cuando es posible escribir un evento que sea de interés en función de la unión, la intersección o el complemento hay reglas
especiales de probabilidad que pueden ayudar a simplificar los cálculos inherentes que se deban realizar:

· Regla especial de adición

Se aplica cuando los eventos son mutuamente excluyentes o disjuntos. (Recuerde que los eventos A y B son mutuamente
excluyentes cuando el evento A ocurre el evento B no puede ocurrir o viceversa)

Para un par de eventos A, B: P(A o B) = P(A) + P(B)

Para tres eventos A, B, C: P(A o B o C) = P(A) + P(B) + P(C)

En el ejemplo de las 3 bolas rojas, 2 blancas y 5 azules, calcular la probabilidad de que al sacar una bola de la urna esta sea:

a) Roja o blanca: P(roja o blanca) = P(roja) +P(blanca) = 3/10 + 2/10 = ½


b) Blanca o azul: P(blanca o azul) =P(blanca) + P(azul) = 2/10 + 5/10 = 7/10

· Regla general de la adición


Se aplica para calcular la probabilidad de ocurrencia de uno u otro evento que no sean mutuamente excluyentes. (la fórmula es
válida también para eventos mutuamente excluyentes dado que P(A y B) = 0 )

3/23
Cuando es posible escribir un evento que sea de interés en función de la
unión, la intersección o el complemento hay reglas especiales de
probabilidad que pueden ayudar a simplificar los cálculos inherentes que se
deban realizar:

· Regla especial de adición

Se aplica cuando los eventos son mutuamente excluyentes o disjuntos.


(Recuerde que los eventos A y B son mutuamente excluyentes cuando el
evento A ocurre el evento B no puede ocurrir o viceversa)

Para un par de eventos A, B: P(A o B) = P(A) + P(B)

Para tres eventos A, B, C: P(A o B o C) = P(A) + P(B) + P(C)

En el ejemplo de las 3 bolas rojas, 2 blancas y 5 azules, calcular la


probabilidad de que al sacar una bola de la urna esta sea:

a) Roja o blanca: P(roja o blanca) = P(roja) +P(blanca) = 3/10 + 2/10 =


½
b) Blanca o azul: P(blanca o azul) =P(blanca) + P(azul) = 2/10 + 5/10 =
7/10

· Regla general de la adición


Se aplica para calcular la probabilidad de ocurrencia de uno u otro evento
que no sean mutuamente excluyentes. (la fórmula es válida también para
eventos mutuamente excluyentes dado que P(A y B) = 0 )

Para los eventos A, B: P(A o B) = P(A) + P(B) – P(A y B)

Ejemplo
Un estudiante está tomando Álgebra y Castellano. Si la probabilidad de que
apruebe Álgebra es 0.75, la de que apruebe Castellano es 0.90 y la
probabilidad de que apruebe Álgebra y Castellano es 0.70. Se pregunta,
¿cuál es la probabilidad de que apruebe Álgebra o Castellano?

P(A o C) = P(A) + P(C) – P(A y C)

= 0.75 + 0.90 - 0.70 = 0.95

Para resolver estos problemas debe realizar un diagrama de Venn como el


de la figura.
· Regla especial de la
multiplicación

Se aplica para calcular la probabilidad conjunta de ocurrencia de eventos


independientes (recuerde que el evento A es independiente del evento B
cuando la ocurrencia del evento B no está influenciada por la ocurrencia del
evento A o viceversa)

Para dos eventos A y B: P(A y B) = P(A) P(B)


Para tres eventos A, B y C: P(A y B y C) = P(A) P(B) P(C)

Ejemplo
Se lanza un dado por dos ocasiones, ¿cuál es la probabilidad de que en los
dos lanzamientos caiga en 3?

P(3, 3) = P(3) P(3) = (1/6) (1/6) = 1/36


Obsérvese que el resultado del segundo lanzamiento es independiente del
primero.

· Probabilidad condicional

Es la probabilidad de que ocurra un evento B, dado que ya ocurrió un evento


A o también la probabilidad de que ocurra un evento A dado que ya ocurrió el
evento B. Esto se escribe:

Si se cumple que los eventos o sucesos A y B son


estadísticamente independientes.

· Regla general de la multiplicación

Se aplica para calcular la probabilidad conjunta de eventos dependientes,


es decir, cuando la ocurrencia de uno de ellos está condicionada a la
ocurrencia del otro.

P(A y B) = P(A) P(B/A) o también P(A y B) = P(B) P(A/B)

Estas fórmulas y las de la probabilidad condicional están relacionadas, ya


que las unas se obtienen de las otras mediante despejes.

Tomemos el ejemplo de las 3 bolas rojas, 2 blancas y 5 azules y supongamos


que se desea calcular la probabilidad de que al sacar una bola y luego otra,
la primera sea roja y la segunda blanca:

P(R y B) =

Obsérvese que la probabilidad de que la primera vez salga roja es 3 /10, pero
al haber sacado una roja ahora nos quedan en total 9 bolas, de las cuales 2
son blancas.

Calculemos ahora la probabilidad de sacar una bola roja y una azul.

Como no se indica el orden tendremos que:

P(R y A) = P(R, A) + P(A, R) =

· Teorema de Bayes

En la siguiente gráfica sea S el


espacio muestral y sean los
eventos
mutuamente excluyentes y
colectivamente exhaustivos, de
modo que:

Y sea el evento B tal que:

Entonces la probabilidad de que ocurra B viene dada por:


; luego:

Esta es la probabilidad total de que ocurra B.


De la probabilidad condicional sabemos que:

De aquí se tiene que:

Es decir:

Si ahora suponemos que P(A1) es una probabilidad a priori, P(B/A1) es la


probabilidad condicional de que ocurra B dado que ocurrió A1; y pensemos
que se quiere calcular la probabilidad a posteriori de que ocurra A1 dado que
ocurrió B, simplemente despejemos P(A1/B), según la fórmula anterior.

Donde P(B) es la probabilidad total de B, sustituyendo P(B) en el


denominador se obtiene la fórmula del Teorema de Bayes.

· Probabilidad Marginal
La probabilidad marginal es aquella que permite calcular probabilidades
totales. Se da esta probabilidad cuando es de interés conocer la distribución
de un evento sin tener en cuenta el otro evento (a esto se lo llama
“marginar”). La distribución de la variable por separado se llama “distribución
marginal”:
Sexto Nivel

4.3. Representación de las probabilidades en diagramas de árbol y tablas de contingencia

Tabla de contingencia o matriz de probabilidad

Los problemas de probabilidades se resuelven fácilmente usando una tabla de contingencia o matriz de probabilidad, en ella se
pueden leer las probabilidades a priori y las probabilidades conjuntas o de intersección. Además permite calcular fácilmente las
probabilidades de la unión de eventos y las condicionales, tal como se ilustra a continuación.

Ejemplo
El personal que labora en una empresa está formado por hombres y mujeres que trabajan en las siguientes secciones: Gerencia,
Profesional y Técnica, cuyos datos se resumen en la siguiente tabla:

Sección Género
Hombre Mujer
Gerencia 8 3
Profesional 24 16
Técnica 50 35

Complete esta tabla de contingencia y luego, suponiendo que se elige al azar un empleado, calcule las siguientes probabilidades:

a) La probabilidad de que sea mujer.


b) La probabilidad de que sea hombre y trabaje en la sección técnica
4/23
Tabla de contingencia o matriz de probabilidad

Los problemas de probabilidades se resuelven fácilmente usando una tabla


de contingencia o matriz de probabilidad, en ella se pueden leer las
probabilidades a priori y las probabilidades conjuntas o de intersección.
Además permite calcular fácilmente las probabilidades de la unión de
eventos y las condicionales, tal como se ilustra a continuación.

Ejemplo
El personal que labora en una empresa está formado por hombres y mujeres
que trabajan en las siguientes secciones: Gerencia, Profesional y Técnica,
cuyos datos se resumen en la siguiente tabla:

Sección Género
Hombre Mujer
Gerencia 8 3
Profesional 24 16
Técnica 50 35

Complete esta tabla de contingencia y luego, suponiendo que se elige al azar


un empleado, calcule las siguientes probabilidades:

a) La probabilidad de que sea mujer.


b) La probabilidad de que sea hombre y trabaje en la sección técnica.
c) La probabilidad de que trabaje en Gerencia o en la sección
profesional.
d) La probabilidad de que trabaje en gerencia, dado que sea mujer.
e) La probabilidad de que sea hombre dado que trabaje en la Sección
técnica.

Solución

A la tabla de los datos le añadimos una fila y una columna para los totales
parciales de las filas y de las columnas. En la celda del extremo inferior
derecho se coloca el total horizontal y vertical.

Sección Género Total


Hombre Mujer
Gerencia 8 3 11
Profesional 24 16 40

Técnica 50 35 85
Total 82 54 136

a) P(Mujer) = 54/136
b) P(Hombre y Técnica) = 50/136
c) P (Gerencia o Profesional) = P(Gerencia) + P(Profesional) = 11/136 +
40/136 = 51/136
d) P(Gerencia/ Mujer) = 3/54 En la columna de MUJER vemos que 3 de
las 54 trabajan en gerencia. También se puede aplicar la fórmula de la
probabilidad condicional.

e) P(Hombre/ Técnica) = 50/85 En la fila TECNICA se ve que 50 de los


85 técnicos son hombres.

Aplicando la fórmula:

Diagrama de árbol

Un diagrama de árbol es una herramienta que se utiliza para determinar


todos los posibles resultados de un experimento aleatorio (su uso es más
característico en el Teorema de Bayes).

El diagrama de árbol es una representación gráfica de los posibles resultados


del experimento, el cual consta de una serie de pasos, donde cada uno de
estos tiene un número finito de maneras de ser llevado a cabo.

Para la construcción de un diagrama de árbol se partirá poniendo una rama


para cada una de las posibilidades, acompañada de su probabilidad. Cada
una de estas ramas se conoce como rama de primera generación.
En el final de cada rama de primera generación se constituye, a su vez, un
nudo del cual parten nuevas ramas conocidas como ramas de segunda
generación, según las posibilidades del siguiente paso, salvo si el nudo
representa un posible final del experimento (nudo final).

Hay que tener en cuenta que la construcción de un árbol no depende de


tener el mismo número de ramas de segunda generación que salen de cada
rama de primera generación y que la suma de probabilidades de las ramas
de cada nudo es de DVD x h.

Existe un principio sencillo de los diagramas de árbol que hace que estos
sean mucho más útiles para los cálculos rápidos de probabilidad:
multiplicamos las probabilidades si se trata de ramas adyacentes
(contiguas).

Ejemplos

Una universidad está formada por tres facultades:

· La 1.ª con el 50 % de estudiantes.


· La 2.ª con el 25 % de estudiantes.
· La 3.ª con el 25 % de estudiantes.

Las mujeres están repartidas uniformemente, siendo un 60 % del total en


cada facultad.

¿Probabilidad de encontrar una alumna de la primera facultad?


¿Probabilidad de encontrar un alumno varón?

Pero también podría ser lo contrario.


Sexto Nivel

4.4. Técnicas de conteo

Las técnicas de conteo son aquellas que son usadas para enumerar eventos difíciles de cuantificar. Son utilizadas de manera
común en probabilidades.
Las técnicas de conteo se utilizan para poder calcular de una manera más ágil los elementos necesarios para el cálculo de
probabilidades utilizando el enfoque clásico.

1. Fórmula de la multiplicación. Si hay m formas de realizar una cosa y n formas de hacer otra, habrá mxn formas de realizar
ambas en conjunto. Esta regla se extiende a 3, 4 o más acciones.

Ejemplo

Un joven tiene 3 pares de zapatos, 4 pantalones y 5 camisas. ¿De cuántas maneras puede vestirse?

N = 3x4x5 = 60 (puede vestirse de 60 formas)

Ejemplo

¿De cuántas maneras puede usted colocar 4 libros en un estante?

El libro que va a colocar en primer lugar puede elegir de 4 maneras, le quedan 3 libros, entonces el que va a colocar en la segunda
posición puede elegirse de 3 maneras; le quedan 2 para la tercera posición; y una vez colocado el tercero le queda 1 para la cuarta

5/23
Las técnicas de conteo son aquellas que son usadas para enumerar eventos
difíciles de cuantificar. Son utilizadas de manera común en probabilidades.
Las técnicas de conteo se utilizan para poder calcular de una manera más
ágil los elementos necesarios para el cálculo de probabilidades utilizando el
enfoque clásico.

1. Fórmula de la multiplicación. Si hay m formas de realizar una cosa y n


formas de hacer otra, habrá mxn formas de realizar ambas en conjunto. Esta
regla se extiende a 3, 4 o más acciones.

Ejemplo

Un joven tiene 3 pares de zapatos, 4 pantalones y 5 camisas. ¿De cuántas


maneras puede vestirse?

N = 3x4x5 = 60 (puede vestirse de 60 formas)

Ejemplo

¿De cuántas maneras puede usted colocar 4 libros en un estante?

El libro que va a colocar en primer lugar puede elegir de 4 maneras, le


quedan 3 libros, entonces el que va a colocar en la segunda posición puede
elegirse de 3 maneras; le quedan 2 para la tercera posición; y una vez
colocado el tercero le queda 1 para la cuarta posición; es decir: n.° de formas
= 4x3x2x1 = 24 = 4!

2. Permutaciones. Nos da el número de arreglos de r


objetos tomados de un grupo de n objetos. Un arreglo se diferenciará de otro
por el orden de sus elementos, por ejemplo ab y ba son diferentes.

Ejemplo

Cuántos números de 2 cifras se pueden escribir usando los dígitos 1, 2 y 3


bajo la condición de que no haya dígitos repetidos.
Los números de dos cifras construidos con los dígitos 1, 2 y 3 son
efectivamente 6, tal como usted puede ver:

12 13 21 23 31 32

3. Combinaciones.

Las combinaciones son arreglos de r objetos tomados de un grupo de n


objetos, donde no importa el orden de ellos.

Ejemplo

Con los dígitos 1, 2 y 3, cuántas sumas diferentes se puede tener, tomando


dos a dos, bajo la condición de que no haya dígitos repetidos.

Observe que en este caso no importa el orden porque por ejemplo las sumas
1+2 y 2+1 son las mismas, entonces el número de sumas distintas son:

Ejemplo
¿Cuántas combinaciones de dos letras se pueden formar con las letras A, B,
C y D?

Estas combinaciones son: AB AC AD BC BD y CD.

Obsérvese que como combinación AB y BA es la misma, pero no como


permutación.

Ahora un ejemplo de cálculo de probabilidades utilizando técnicas de conteo


para encontrar los elementos que se requieren para el enfoque clásico:

En 1988 había 56 demócratas en el Senado de EUA, 21 de los cuáles eran


partidarios de la iniciativa de defensa estratégica del presidente. 29 de los 39
republicanos apoyan esta defensa. Los cinco senadores restantes que
apoyan la iniciativa no eran republicanos ni demócratas. Había que elegir al
azar dos senadores que formaran un consejo asesor en asuntos de defensa
nacional. La probabilidad de elegir cinco senadores partidarios de la
iniciativa es:

La probabilidad de elegir 5 senadores partidarios de la iniciativa es 0.038 o el


3.8%
Sexto Nivel

Autoevaluación

1. La probabilidad de extracción de una extracción de una baraja de 52 cartas de un rey, as, jota de tréboles o reina de diamantes es:

5/26
6/26
1/13
4/26

Pregunta 1 de 15

8/23
Sexto Nivel

Autoevaluación

2. La probabilidad de que aparezca al menos una cara en tres lanzamientos de una moneda:

1/8
7/8
1/4
3/8

Pregunta 2 de 15

9/23
Sexto Nivel

Autoevaluación
3. Se extrae una bola al azar de una caja que contiene 10 rojas, 30 blancas, 20 azules y 15 naranjas. La probabilidad de que sea no
roja o azul es:

1/3
3/5
2/5
2/3

Pregunta 3 de 15

10/23
Sexto Nivel

Autoevaluación
4. Una caja contiene 9 papeletas numeradas del 1 al 9 inclusive. Si se extraen tres papeletas sucesivamente, la probabilidad de que
sean alternativamente impar, par, impar o par, impar, par:

5/18
4/17
1/3
2/5

Pregunta 4 de 15

11/23
Sexto Nivel

Autoevaluación

5. La probabilidad de conseguir un total de 7 puntos una vez en dos lanzamientos de dos dados es:

11/36
9/4
5/18
5/12

Pregunta 5 de 15

12/23
Sexto Nivel

Autoevaluación

6. La probabilidad de conseguir un total de 7 puntos al menos una vez en dos lanzamientos de dos dados es:

5/18
5/36
1/36
11/36

Pregunta 6 de 15

13/23
Sexto Nivel

Autoevaluación

7. Se extraen sucesivamente dos cartas de una baraja de 52. La probabilidad de que la primera carta sea un as pero la segunda no es:

47/52
16/221
15/34
13/17

Pregunta 7 de 15

14/23
Sexto Nivel

Autoevaluación

8. Se extraen 3 cartas de una baraja de 52. La probabilidad de que dos sean jotas y una rey es:

22/245
6/5525
169/425
73/5525

Pregunta 8 de 15

15/23
Sexto Nivel

Autoevaluación

9. La probabilidad de la aparición de un número impar en una tirada de un dado es:

2/9
1/3
1/2
3/8

Pregunta 9 de 15

16/23
Sexto Nivel

Autoevaluación
10. En una encuesta realizada por la American encontró que 60% de sus socios hicieron alguna reservación en una línea aérea el año
pasado. Se toman dos integrantes al azar. ¿Cuál es la probabilidad de que ambos hayan hecho una reservación en alguna línea área?

0.36
0.66
0.96
0.16

Pregunta 10 de 15

17/23
Sexto Nivel

Autoevaluación

11. Hallar la probabilidad de que en tres lanzamientos aparezcan dos caras y un sello:

3/8
1/8
1/2
2/8

Pregunta 11 de 15

18/23
Sexto Nivel

Autoevaluación

12. Hallar la probabilidad de que en una familia con cuatro hijos tenga al menos un niño:

1/16
15/16
1/8
5/8

Pregunta 12 de 15

19/23
Sexto Nivel

Autoevaluación

13. ¿Cuántos resultados distintos puede aparecer al lanzar un dado 4 veces?

1296
1196
956
1000

Pregunta 13 de 15

20/23
Sexto Nivel

Autoevaluación
14. Tres matrimonios se reúnen para celebrar el aniversario de cado uno de ellos. Desean que les hagan un fotografía de forma que
todos los hombres juntos y también todas las mujeres. ¿de cuántas formas pueden colocarse?

47
67
72
52

Pregunta 14 de 15

21/23
Sexto Nivel

Autoevaluación
15. Se quiere preparar una salsa con tres ingredientes. Si disponemos de 7 ingredientes en la alacena, cuántas salsas será posible
elaborar?

15
20
35
40

Pregunta 15 de 15

22/23
1/28
Sexto Nivel

Introducción

El objetivo fundamental de la Estadística es inferir las propiedades de una población de la observación de


una muestra o subconjunto de ésta. La construcción y estudio de los modelos estadísticos, con variables
discretas o continuas, están entonces íntimamente ligados al cálculo de probabilidades y por
consiguiente con las distribuciones de probabilidad que se generan.

Para comenzar es necesario tener en cuenta cuál es la definición de variable aleatoria.

2/28
Sexto Nivel

5.1. Introducción a las variables aleatorias: Definición y tipos. Funciones de probabilidad y distribución para
variables aleatorias discretas
Una variable, como se sabe, es un símbolo que actúa en las funciones, las fórmulas, los algoritmos y las proposiciones de las ▲
matemáticas y la estadística, que según sus características se clasifican de distinto modo.
Se denomina entonces variable aleatoria (o estocástica) a la función que adjudica eventos posibles a números reales, es decir
cifras, y cuyos valores se miden en experimentos de tipo aleatorio. Los valores posibles representan los resultados de
experimentos que todavía no se llevaron a cabo o cantidades inciertas.
Es importante mencionar que estos experimentos aleatorios deben ser desarrollados bajo las mismas condiciones y que pueden
ofrecer resultados diferentes. La variable aleatoria, permite ofrecer una descripción de la probabilidad de que se adopten ciertos
valores, de ahí la relevancia de su estudio.

Las variables aleatorias pueden clasificarse en discretas y continuas. Son discretas cuando sólo puede tomar un número
determinado de valores (valores enteros) y son continuas cuando puede tomar distintos valores en un intervalo dado.

Funciones y Distribuciones de probabilidad

Al estudiar variables aleatorias, se debe tomar en consideración que la Teoría de Probabilidades y Estadística define para estas
las llamadas funciones de densidad de la distribución de probabilidad y la función acumulativa de probabilidad.

La función de densidad probabilidad para variables discretas asigna a cada resultado o suceso posible definido sobre la variable la
probabilidad que dicho suceso ocurra; mientras que para variables continuas asigna a cada intervalo de resultados posibles un
valor de probabilidad de que ese evento suceda.

3/28
Sexto Nivel

5.1. Introducción a las variables aleatorias: Definición y tipos. Funciones de probabilidad y distribución para
variables aleatorias discretas
La función acumulativa es la suma para las variables discretas y la integración para las variables continuas de las probabilidades ▲
que le corresponden a todos los posibles resultados considerados para la variable aleatoria (tomando en consideración desde el
valor más pequeño al más grande)

En estadística descriptiva se observó a las distribuciones de frecuencias como una forma útil de resumir variaciones en los datos
observados. Las distribuciones de probabilidad están relacionadas con las distribuciones de frecuencias. De hecho, podemos
pensar que una distribución de probabilidad es una distribución de frecuencias teórica.

Una distribución de frecuencias teórica es una distribución de probabilidades que describe la forma en que se espera varíen los
resultados. Como estas distribuciones representan las expectativas de que algo suceda, resultan modelos útiles para hacer
inferencias y tomar decisiones en condiciones de incertidumbre.

Las funciones de densidad de distribución y acumulativa, en su carácter de valiosos modelos teóricos para describir el
comportamiento de los valores de determinadas variables aleatorias, se distinguen por poseer parámetros para la población.

3/28
Sexto Nivel

5.1. Introducción a las variables aleatorias: Definición y tipos. Funciones de probabilidad y distribución para
variables aleatorias discretas
Función de densidad de distribución de probabilidad y distribución de probabilidades para variables discretas ▲

La definición para la función de distribución de una variable aleatoria discreta es (Galindo, 1999):

“Sea X una variable aleatoria discreta. A la función real F tal que:

se le denomina función de distribución de la variable aleatoria X”

La representación gráfica de una distribución de probabilidad de una variable aleatoria discreta es análoga al diagrama de barras
de frecuencias relativas de una variable estadística discreta.

3/28
Sexto Nivel

5.2. Distribuciones de probabilidad discreta: Binomial y Poission

La distribución de probabilidad binomial es una distribución de probabilidad discreta, en la cual solo hay dos resultados posibles
en cada ensayo: éxito o fracaso y los ensayos son independientes entre sí. La variable aleatoria cuenta el número de éxitos (x) en n
ensayos. La probabilidad de éxito en un ensayo se representa por Π y permanece contante en todos los ensayos.

Ejemplo: Se estima que 20% de las personas de un país están afectadas por una enfermedad. Se selecciona al azar a 9 personas.
Determinar la probabilidad de que 6 de ellas estén afectadas por la enfermedad.

En este ejemplo: p = 0.2, n = 9 y x =6

P(2) = 9C6(0.2)6(0.8)9-6 = 0.0028

Otra distribución de variable discreta que se va a examinar es la distribución hipergeométrica En la distribución binomial, la
probabilidad de éxito permanece constante en cada ensayo mientras que en la distribución hipergeométrica esto no ocurre ya que
el muestreo se realiza sin reemplazo. Si se selecciona una muestra de una población finita sin reemplazo y si el tamaño de muestra
n es mayor al 5% del tamaño de la población N, se aplica la distribución hipergeométrica. S es el número de éxitos en la población y
x el número de éxitos en las muestra.

4/28
Sexto Nivel

5.2. Distribuciones de probabilidad discreta: Binomial y Poission

La distribución de probabilidad binomial es una distribución de probabilidad discreta, en la cual solo hay dos resultados posibles
en cada ensayo: éxito o fracaso y los ensayos son independientes entre sí. La variable aleatoria cuenta el número de éxitos (x) en n
ensayos. La probabilidad de éxito en un ensayo se representa por Π y permanece contante en todos los ensayos.

Ejemplo: Se estima que 20% de las personas de un país están afectadas por una enfermedad. Se selecciona al azar a 9 personas.
Determinar la probabilidad de que 6 de ellas estén afectadas por la enfermedad.

En este ejemplo: p = 0.2, n = 9 y x =6

P(2) = 9C6(0.2)6(0.8)9-6 = 0.0028

Otra distribución de variable discreta que se va a examinar es la distribución hipergeométrica En la distribución binomial, la
probabilidad de éxito permanece constante en cada ensayo mientras que en la distribución hipergeométrica esto no ocurre ya que
el muestreo se realiza sin reemplazo. Si se selecciona una muestra de una población finita sin reemplazo y si el tamaño de muestra
n es mayor al 5% del tamaño de la población N, se aplica la distribución hipergeométrica. S es el número de éxitos en la población y
x el número de éxitos en las muestra.

4/28
La distribución de probabilidad binomial es una distribución de
probabilidad discreta, en la cual solo hay dos resultados posibles en cada
ensayo: éxito o fracaso y los ensayos son independientes entre sí. La
variable aleatoria cuenta el número de éxitos (x) en n ensayos. La
probabilidad de éxito en un ensayo se representa por Π y permanece
contante en todos los ensayos.

Ejemplo: Se estima que 20% de las personas de un país están afectadas


por una enfermedad. Se selecciona al azar a 9 personas. Determinar la
probabilidad de que 6 de ellas estén afectadas por la enfermedad.

En este ejemplo: p = 0.2, n = 9 y x =6

P(2) = 9C6(0.2)6(0.8)9-6 = 0.0028

Otra distribución de variable discreta que se va a examinar es la distribución


hipergeométrica En la distribución binomial, la probabilidad de éxito
permanece constante en cada ensayo mientras que en la distribución
hipergeométrica esto no ocurre ya que el muestreo se realiza sin reemplazo.
Si se selecciona una muestra de una población finita sin reemplazo y si el
tamaño de muestra n es mayor al 5% del tamaño de la población N, se aplica
la distribución hipergeométrica. S es el número de éxitos en la población y x
el número de éxitos en las muestra.

Ejemplo: Una empresa tiene 50 empleados en la sección de ensamblado. 40


de ellos pertenecen al sindicato. Se eligen al azar 5 empleados para formar
un comité. ¿Cuál es la probabilidad de que 4 de ellos formen parte del
sindicato?

En este ejemplo: N = 50 S= 40 n = 5 X = 4

P(4) = (4C40)(50-40C5-4)/50C5 = 0.431

Distribución de probabilidad de Poisson.


Características:

1. La variable aleatoria es el número de veces que ocurre un evento en un


intervalo dado.

2. La probabilidad de que ocurra un evento es proporcional al tamaño del


intervalo.

3. Los intervalos no se superponen y son independientes.

Fórmula:

Donde:

Nota: en los ejercicios de probabilidad acumulada, se suman las


probabilidades de cada uno de los eventos involucrados.
Sexto Nivel

5.3. Funciones de probabilidad y función de distribución para variables aleatorias continua

La definición para la función de distribución de una variable aleatoria continua es (Galindo, 1999):

“Sea X una variable aleatoria continua. A la función real F tal que:

se le denomina función de distribución de la variable aleatoria X”

La definición de la función de densidad de distribución de probabilidad para una variable aleatoria continua es (Galindo, 1999):
“A una función real f no negativa que cumple que:

se le denomina función de densidad.

En particular si la función f está definida sobre el intervalo [a,b],


entonces

5/28
Sexto Nivel

5.4. Distribuciones de probabilidad continua: Normal y t-Student

Las distribuciones de probabilidad continua resultan de medir una variable continua. En este tipo de distribuciones generalmente se
desea conocer el porcentaje de observaciones que se encuentran dentro de cierto margen. Es importante señalar que una variable
aleatoria continua tiene un número infinitos de valores dentro de cierto intervalo en particular.

La distribución de probabilidad uniforme es la más simple de una variable aleatoria. Tiene forma rectangular y queda definida por
el valor máximo b y el valor mínimo a. La altura de la distribución es constante e igual a 1/(b-a).

Ejemplo:

Una distribución uniforme se define en el intervalo de 6 a 10. Hallar la media y calcular la probabilidad de un valor mayor a 7.

En este ejemplo, a = 6 y b= 10, entonces µ = (a+b)/2 = 8

P (X>7) = (10-7)/(10-6) = 3/4 = 0.55 (basta con dividir las longitudes de los segmentos ya que la altura es la misma para ambas
áreas)

La distribución normal se la identifica como la piedra angular de la estadística moderna. Esto se debe en parte al papel que
desempeña en el desarrollo de la teoría estadística y en parte al hecho de que las distribuciones de datos observados

6/28
Las distribuciones de probabilidad continua resultan de medir una variable co
distribuciones generalmente se desea conocer el porcentaje de observacion
dentro de cierto margen. Es importante señalar que una variable aleatoria con
infinitos de valores dentro de cierto intervalo en particular.

La distribución de probabilidad uniforme es la más simple de una variable


rectangular y queda definida por el valor máximo b y el valor mínimo a. La altu
constante e igual a 1/(b-a).

Ejemplo:

Una distribución uniforme se define en el intervalo de 6 a 10. Hallar la media y


de un valor mayor a 7.

En este ejemplo, a = 6 y b= 10, entonces µ = (a+b)/2 = 8

P (X>7) = (10-7)/(10-6) = 3/4 = 0.55 (basta con dividir las longitudes de los
altura es la misma para ambas áreas)

La distribución normal se la identifica como la piedra angular de la estadís


debe en parte al papel que desempeña en el desarrollo de la teoría estadística
que las distribuciones de datos observados frecuentemente tienen el mismo
distribuciones normales. Las aplicaciones de la distribución normal son muy nu
disciplinas académicas, en la industria y en las empresas. Observe que e
realizar un gráfico de la curva normal y ubicar la media y el o los valores d
calcular el valor normal estándar Z. Con el valor de Z, se busca el valor del área
áreas bajo la curva normal que se encuentra al final del texto. Por sime
correspondiente para un valor negativo de Z es el mismo que para su corresp
de Z. Es indispensable que sepa usar correctamente dicha tabla. El ran
porcentaje de datos que se encuentra por debajo de un valor determinado
de un valor dado en la curva normal).

Ejemplo: Una distribución normal tiene media 10 y desviación estándar 2. De


de datos que se encuentra:

a) entre 10 y 12 z= (12-10)/2 = 1 à P = 0.3413


c) por debajo de 12 z= (12-10)/2 = 1 à P = 0.3413 + 0.5 = 0.8413

En este ejemplo, el rango percentilar es 84.13

d) entre 7 y 11 (un valor menor y otro mayor a la media, se suman las áreas)

z1 = (7-10)/2 = -1.5 à 0.4332

z2 = (11-10)/2 = 0.5 à 0.1915 P = 0.4332 + 0.1915 = 0.6247

e) entre 11.5 y 13.5 (dos valores mayores (o menores) a la media, se restan la

z1 = (11.5-10)/2 = 0.75 à 0.2734

z2 = (13.5-10)/2 = 1.75 à 0.4599 P = 0.4599 – 0.2734 = 0.1865 (el resultad


ser positivo)

· Cuando se debe calcular porcentajes, multiplicar la proporción por 100:

· Cuando se debe calcular cantidades, realizar p x n, donde n = tamaño d

Distribución t Student

La Distribución t Student o distribución t, es una distribución teórica que se ut


primera instancia una población que se considere distribuida normalmente y qu
de la muestra es pequeño y se desconoce la desviación estándar.

La Distribución t Studente utiliza una tabla estadística característica que toma


grados de libertad y el nivel de confianza que se le da al proceso. Su fórmula d

Este tema se profundizará cuando se revise el capítulo correspondiente a In


(Intervalo de Confianza para la media población – muestras pequeñas)

RESUMEN:

Distribuciones de probabilidad discreta


Variable aleatoria: discreta y continua

Media, varianza y desviación estándar de una distribución de probabilidad

Media o valor esperado:


Puede usar la fórmula alterna.

Desviación estándar:

Distribución de probabilidad binomial :

Características

1. Solo tiene dos resultados posibles en cada ensayo de un experimento: Éxito

2. La variable aleatoria es el resultado del conteo del número de éxitos en n ens

3. La probabilidad de éxito en cada ensayo es siempre igual en cada ensayo.

4. Los ensayos son independientes.

Fórmula:

Tablas de probabilidad binomial

Se las usa para calcular las probabilidades binomiales para n desde 1 a 15

Media de una distribución binomial:

Varianza de una distribución binomial:

Desviación estándar:

Probabilidad acumulada.

Se calcula sumando las probabilidades de cada uno de los eventos involucrado

Distribución hipergeométrica

Esta distribución se refiere a los experimentos estadísticos que consisten en


reemplazo, de un conjunto finito el cual contiene algunos elementos consi
restantes son considerados “fracasos”.
Tomar una muestra sin reemplazo significa que los elementos son tom
devolverlos. Podemos concluir entonces que los ensayos ya no pued
independientes porque la probabilidad de “éxito“al tomar cada nuevo eleme
resultado de los ensayos anteriores debido a que la cantidad de elementos
cambiando.

Sean:

Ejemplo.

Una caja contiene 9 pelotas de tenis de las cuales 4 están en buen e


muestra se obtengan:

a) Ninguna pelota en buen estado.

b) Al menos una pelota en buen estado.

c) No más de dos pelotas en buen estado.

Este es un experimento de muestreo sin reemplazo, por lo tanto es un experi


con:

N=9 ; K=4 ; n=3 ; x : Cantidad de pelotas en buen estado en la muestra. ( Varia

a)

b) P(X>=1) = 1 - P(X<1)=1-P(0)=1- 0.119 = 0.881.

c) P(X<=2) = P(X=0)+P(x=1)+P(X=2).

Familia de distribuciones de probabilidad normal.

Tenga presente que la distribución de probabilidad normal estándar N(0,1), es


0 y σ=1

Una distribución normal cualquiera N(μ, σ) se convierte en una distribución n


mediante el cálculo del valor normal z el cual expresa el número de desvia
distribución normal dada.
Valor normal estándar:

Cálculo de aéreas bajo la curva normal

Una vez calculado el valor z para un X, μ y σ dados,

Se usa la tabla que aparece en el reverso de la portada del texto.

Para encontrar el área bajo la curva normal estándar, comprendida entre la


Tenga presente que a z le corresponde la primera columna y la primera fila; mie
la curva o probabilidad se lee en la intersección de la fila con la columna. Por
nos situamos en la fila 1.8 y en la columna 0.04, allí leemos 0.467, este es e
curva o la probabilidad.

Problema inverso

El otro uso de la tabla de distribución normal estándar, es aquel en el que


(área bajo la curva normal estándar) hay que buscar el valor z correspondient
puede a su vez calcular el X de la distribución normal dada. Para ello recuer
será negativo si se halla a la izquierda de la media y positivo en caso contrario.

Ejemplo

Un estudio del INEC determinó que la media del gasto mensual en alimen
integrada por cuatro personas es de $480 y que este rubro sigue una distrib
desviación estándar de $100.

Si se elige al azar una familia:

a) ¿Cuál es la probabilidad de que esta gaste entre $ 480 y $ 580?

b) ¿Cuál es la probabilidad de que gaste entre $300 y $480?

c) ¿Cuál es la probabilidad de que gaste entre $300 y $580?

d) ¿Cuál es la probabilidad de que gaste un mínimo de $650?

e) ¿Cuál es el gasto mínimo del 12% de las familias que mas gastan?

Solución
En este caso: μ = 480, σ = 100

a) X = 580, luego:

Para z = 1 la probabilidad es 0.3413; Por tanto: P (480 < X ≤ 580) = 0.341

b) X = 300, luego: Para usar la tabla tomamos z = 1


o de la probabilidad es 0.4641

Por tanto: P (300 < X ≤ 480) = 0.4641

Observe que el área se halla a la izquierda

de la media.

c) Para responder c) observe que la probabilidad de que esta familia gaste en


suma de las probabilidades calculadas en a) y b), es decir:

P(300 < X ≤ 580) = P(300 < x ≤ 480) + P(480 < x ≤ 580)

= 0.3413 + 0.4641 = 0.8054

d) X = 650, luego: Para z = 1.70 la probabilidad es 0.4

Esta es el área entre la media y x = 650, pero se pide la probabilidad de


de $650, significa que puede tener un gasto de $650 o más.

Por tanto la probabilidad se obtendrá restando

0.4554 de 0.5. es decir:

P (650 < X) = 0.5 – P (480 < X≤ 650)=0.0446 = 0.5 – 0.4554


e) El 12% de los que más gastan corresponde al área sombreada, entonces e
la x es: 0.5 – 0.12 = 0.38. En la tabla buscamos el valor del área más cercan
hay dos valores equidistantes de 0.38, que son: 0.3790 y 0.3810, el primero
debajo y el segundo a 0.0010 por arriba; cuando esto sucede, se escoge el m
se escogerá aquel que sea más cercano.

En este caso escogemos A(z) = 0.3810, cuyo valor de z es: z = +1.18 por en
de la media. Si se encontrara a la izquierda, se tomará z con signo negativo.

A continuación, de la fórmula de z se despeja x y se calcula su valor:

Entonces este 12% de familias gastará como mínimo $598

Es decir: X ≥ 598

Aproximación de la distribución normal a la binomial

Una aplicación importante de la distribución normal es: La distribución


aproximación de la distribución binomial, Se aplica cuando n sea grande
grande cuando n>25y además se cumpla con la condición de que:

Como la distribución normal es continua y la binomial discreta, se debe aplicar


corrección por continuidad.

Regla práctica: Una idea sencilla que permite una correcta aplicación
continuidad, es la de pensar que la gráfica de la distribución normal está forma
rectángulos, cada uno de los cuales se forma al fundir varillas (Las varillas est
otras) las cuales al fundirse formarían una sola lámina continua, de manera qu
6 al fundirse formará el rectángulo que va desde 5.5 hasta 6.5.

Entonces es fácil comprender que para x ≥ 6, se incluye el resultado de la fu


por lo que irá desde 5.5; para X > 6, no se incluye el resultado de la fundición
que irá desde 6.5; Para x < 15, el resultado de la fundición de la varilla 15 no se
tomará hasta 14.5; etc

Lo dicho es equivalente a las siguientes

Reglas para aplicar el factor de corrección por continuidad


X> +0.5

X≥ -0.5

X< -0.5

X≤ +0.5

≤ x ≤ -0.5 Y +0.5

< x < +0.5 Y -0.5

X= -0.5 Y +0.5

Ejemplo. Suponga una distribución binomial con n = 40, p = 0.55. Calcular:

a) La media y la desviación estándar de la variable aleatoria.

b) La probabilidad de que x ≥ 25

c) La probabilidad de que X < 15

d) La probabilidad de que 15 ≤ x ≤ 25

Solución

a) μ = np = 40x0.55 = 22; σ=

b) Para calcular P(x ≥ 25) , hay que tomar X = 24.5

cuya probabilidad

es 0.2881, entonces: P(x ≥ 25) = 0.5 - 0.2881 = 0.2119

c) Para calcular P(X < 15), hay que tomar x = 14.5

, A(z = 2.39) = 0.4916


d) Para encontrar P(15 ≤ x ≤ 25) binomial , al aplicar

las correcciones de continuidad se debe calcular

P(14.5 ≤ x ≤ 25.5) = P(14.5 ≤ x ≤ 22) + P(22< x ≤ 25.5)

= 0.4916 + 0.3665 = 0.8581

Link para descarga de tablas estadísticas:


http://verso.mat.uam.es/~pabl.fernandez/tablas_ProbI_2007-2008.pdf
Variables aleatorias discretas y continuas | Estadistica UNED
Sexto Nivel

Bibliografía

Webster, A. (2012). Estadística Aplicada para la Administración y Economía. Estados Unidos: Irwin.

Galindo, E. (1999). Estadística para la Administración y la Ingeniería. Ecuador: Gráfica Mediavilla


Hnos.

Spiegel, M., Stevens, L (2009). Estadística (Serie Schaum). México: McGraw-Hill/interamericana


Editores.

Gorgas J., Cardiel N., Zamorano J., (2011). Estadística Básica para Estudiantes de Ciencias. España:
Facultad de Ciencias Físicas/Universidad Complutense de Madrid

8/28
1/22
Sexto Nivel

Introducción
En estadística, un muestreo es la técnica para la selección de una muestra a partir de una población. En el
muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se pueden extraer
dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la
población se denomina espacio muestral.

El muestreo es una herramienta de la investigación científica. Su función básica es determinar qué parte
de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias
sobre dicha población.

El muestreo es más que el procedimiento empleado para obtener una o más muestras de una población;
el muestreo es una técnica que sirve para obtener una o más muestras de población.

Este se realiza una vez que se ha establecido un marco muestral representativo de la población. Se
procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no
necesariamente serían iguales, y lo más probable es que variarán de una muestra a otra.

Muestreo estadístico

Es aquel que se basa en el principio de equiprobabilidad, es decir, aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.

2/22
Sexto Nivel

6.1. Técnicas de muestreo probabilístico

Las técnicas de muestreo nos permiten obtener una muestra representativa de la población general, “un plano a escala en el que estén
representadas en miniatura todas las características de la población general”. A través de las técnicas de muestreo, intentamos
garantizar la validez interna del estudio, pudiendo distinguir los siguientes tipos de muestreo:

1. Muestreo probabilístico 2. Muestreo no probabilístico 3. Asignación a los grupos de estudio

1. Muestreo probabilístico

a) El muestreo aleatorio es aquel en el que todos los elementos de la población tienen la misma probabilidad de ser elegidos
como elementos de la muestra. Su principal inconveniente es que muchas veces es imposible obtener una lista de todos y
cada uno de los individuos de la población. Otro inconveniente es que en muestras pequeñas no garantiza la
representatividad, ya que en ocasiones el propio azar puede conducir a muestras altamente sesgadas.

b) El muestreo aleatorio sistemático es una técnica que simplifica el proceso de elección de los elementos de la muestra. En
primer lugar, se calcula la constante de la muestra (K), dividiendo el total de la población candidata (N) por el tamaño de la
muestra(n). Después, aleatoriamente, se obtiene el primer elemento. Los sucesivos elementos se obtienen del listado
ordenado mediante la suma de la constante (K), sucesivamente hasta completar la muestra. Este procedimiento requiere que
el orden con que está construida la lista no tenga ninguna influencia previsible sobre el resultado del estudio.

c) El muestreo aleatorio estratificado se trata de una modificación del muestreo aleatorio simple, que trata de garantizar que
la muestra es representatividad de la población estudiada, mediante el control de la igualdad de la distribución en la población
y en la muestra, de determinadas variables, estratos, que se consideran importantes para el estudio.

d) El muestreo por conglomerados es un método que consiste en lo siguiente: antes de seleccionar la muestra, la población
di id id d d i t (UPE) d l l 3/22 t t l t i C d d l UPE ti
Sexto Nivel

6.1. Técnicas de muestreo probabilístico

Las técnicas de muestreo nos permiten obtener una muestra representativa de la población general, “un plano a escala en el que estén
representadas en miniatura todas las características de la población general”. A través de las técnicas de muestreo, intentamos
garantizar la validez interna del estudio, pudiendo distinguir los siguientes tipos de muestreo:

1. Muestreo probabilístico 2. Muestreo no probabilístico 3. Asignación a los grupos de estudio


c) El muestreo aleatorio estratificado se trata de una modificación del muestreo aleatorio simple, que trata de garantizar que
la muestra es representatividad de la población estudiada, mediante el control de la igualdad de la distribución en la población
y en la muestra, de determinadas variables, estratos, que se consideran importantes para el estudio.

d) El muestreo por conglomerados es un método que consiste en lo siguiente: antes de seleccionar la muestra, la población
se divide en unidades de primera etapa (UPE), de las cuales se toma una muestra aleatoria. Cada una de las UPE contiene
un conjunto de unidades de análisis, que también son seleccionadas aleatoriamente. En cualquier caso, las unidades de
muestreo de primera etapa deben cubrir por entero a la población sin intersecarse; o sea, todo miembro de la población o
unidad de análisis pertenecerá a una y solo una UPE. Si se admiten en la muestra a todas las unidades de análisis que
integran las UPE elegidas, se ha optado por un muestreo por conglomerados monoetápico. Si luego de seleccionadas
aquellas unidades de primera etapa que crean unidades de segunda etapa y dentro de cada una de ellas se eligen algunas
unidades de análisis, entonces se está ante un muestreo por conglomerados bietápico.

Ejemplo

Unidades de primera etapa: provincias; unidades de segunda etapa: hospitales: unidades de tercera etapa: servicios de
cardiología; unidad de análisis; individuos.

3/22
Sexto Nivel

6.1. Técnicas de muestreo probabilístico

Las técnicas de muestreo nos permiten obtener una muestra representativa de la población general, “un plano a escala en el que estén
representadas en miniatura todas las características de la población general”. A través de las técnicas de muestreo, intentamos
garantizar la validez interna del estudio, pudiendo distinguir los siguientes tipos de muestreo:

1. Muestreo probabilístico 2. Muestreo no probabilístico 3. Asignación a los grupos de estudio

2. Muestreo no probabilístico

Las unidades se escogen utilizando métodos en los que no se utiliza el azar.

La técnica más utilizada es el muestreo consecutivo, que consiste en seleccionar a los individuos que cumplen los criterios de
selección, a medida que acuden a la consulta en un periodo determinado. Es el método más utilizado en ensayos clínicos,
principalmente cuando se trata de patología aguda.

3/22
3. Asignación a los grupos de estudio

La asignación de los individuos a los diferentes grupos de estudio debe


asegurar la comparabilidad de estos grupos, es decir, que no existan
diferencias entre las variables generales.

3.1. Estudios observacionales

a) Estudios de casos y controles

La asignación a cada grupo se realiza en función de la existencia o


no de la enfermedad.

b) Estudios de cohortes

La asignación se realiza en función de la presencia o ausencia de


exposición.

Estos tipos de asignación dan lugar a limitaciones en la


comparabilidad de los grupos, ya que si bien podemos intentar
controlar los factores conocidos que puedan influir en el factor de
estudio, no podemos hacer lo mismo con los desconocidos.

3.2. Estudios experimentales

En este tipo de estudio partimos de una muestra definida por los criterios de
selección. El investigador realiza la asignación a cada grupo, siendo
la asignación aleatoria o randomización la más utilizada. En esta la
asignación de los individuos a cada grupo se realiza al azar. Las ventajas de
este tipo de estudio son:

ü Mayor probabilidad de una distribución equilibrada de las variables


pronósticas (conocidas y no conocidas).

ü Permite el uso de técnicas de enmascaramiento.

3.3. Técnicas de enmascaramiento

Son aquellas que dan lugar a que los sujetos o el investigador desconozcan
a qué grupo pertenecen.

ü Simple ciego: cuando el sujeto o el investigador desconocen a qué grupo


pertenecen.
ü Doble ciego: cuando tanto el sujeto como el investigador desconocen a
priori el grupo al que pertenece cada sujeto.
Sexto Nivel

6.2. Distribuciones muestrales y teorema del límite central

6.2.1. Distribuciones muestrales

6.2.2. Teorema del límite central

4/22
Sexto Nivel

6.2.1. Distribuciones muestrales

Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible) en repetidas
muestras. Este patrón es llamado la distribución muestral de la estadística. Si conocemos la distribución muestral podemos hacer
inferencia. Las distribuciones muestrales adoptan diferentes formas según las estadísticas investigadas y las características de la
población estudiada.

Es posible, entonces, también definir que una distribución muestral es una distribución de probabilidad de una estadística muestral
calculada a partir de todas las muestras posibles de tamaño "n" elegidas al azar de una población determinada. Generalmente, nos
interesa conocer una o más de las siguientes características de la distribución muestral:

ü Su forma funcional (cómo aparece en su representación gráfica)


ü Su media
ü Su desviación estándar (error estándar)

La media de las medias muestrales

La distribución muestral de las medias muestrales es un simple listado de todas las medias muestrales posibles. Tienen una media
aritmética que se llama “media de las muestras muestrales” o “media general” y se calcula de la manera habitual: se suman las
medias muestrales y el resultado se divide por el número de observaciones. Se utiliza el símbolo , de tal manera:

5/22
Una estadística muestral proveniente de una muestra aleatoria simple tiene
un patrón de comportamiento (predecible) en repetidas muestras. Este patrón
es llamado la distribución muestral de la estadística. Si conocemos la
distribución muestral podemos hacer inferencia. Las distribuciones
muestrales adoptan diferentes formas según las estadísticas investigadas y
las características de la población estudiada.

Es posible, entonces, también definir que una distribución muestral es una


distribución de probabilidad de una estadística muestral calculada a partir de
todas las muestras posibles de tamaño "n" elegidas al azar de una población
determinada. Generalmente, nos interesa conocer una o más de las
siguientes características de la distribución muestral:

ü Su forma funcional (cómo aparece en su representación gráfica)


ü Su media
ü Su desviación estándar (error estándar)

La media de las medias muestrales

La distribución muestral de las medias muestrales es un simple listado de


todas las medias muestrales posibles. Tienen una media aritmética que se
llama “media de las muestras muestrales” o “media general” y se calcula de
la manera habitual: se suman las medias muestrales y el resultado se divide
por el número de observaciones. Se utiliza el símbolo , de tal manera:

Donde K es el número de muestras (observaciones)

Ejemplo

Considerando los números 2, 2, 3, 4 y 5 como una población, determinar la


distribución de medias muestrales de tamaño 3.

Muestra Media muestral Distribución muestral


2, 2, 3 7/3 = 2.333 Media muestral frecuencia
probabilidad
2, 2, 4 8/3 = 2.667 2.333 1
1/10
2, 2, 5 9/3 = 3 2.667 1
1/10
2, 3, 4 9/3 = 3 3
3 3/10
2, 3, 5 10/3= 3.333 3.333 2
2/10
2, 4, 5 3.667 3.667 2
2/10
2, 3, 4 3 4 1
1/10
2, 3, 5 3.333
2, 4, 5 3.667
3, 4, 5 4

Como se puede observar, el valor de la media es igual al valor de la media de


las medias muestrales.

Error típico y normalidad

La distribución muestral de las medias muestrales también tiene una varianza


y mide la dispersión de las medias muestrales en torno a la media general
calculándose como cualquier otra. Si se halla la raíz cuadrada de la varianza
de la distribución de medias muestrales tendríamos el llamado error típico de

la distribución muestral:

Podemos decir, entonces, que este error típico es una medida de la


dispersión de las medias muestrales en torno a µ y, por tanto, mide la
tendencia a incurrir en un error de muestreo en el intento de estimar el
parámetro.

Si los datos de una población siguen una distribución normal, la distribución


muestral de las medias también será normal. Esto quiere decir, que si de una
población que sigue una distribución normal se toman todas las muestras
posibles de un tamaño específico y después de calculan las medias de todas,
las medias muestrales también deberán seguir una tendencia normal.
Sexto Nivel

6.2.2. Teorema del Límite Central

Un concepto muy importante es el del teorema central del límite o teorema del límite central que establece que “si todas las
muestras de un tamaño en particular se seleccionan de cualquier población, la distribución muestral de la media se aproxima a una
distribución normal. Esta aproximación mejora con muestras más grandes”.

Esta aproximación se calcula a partir de:

Donde:

= media
= desviación estándar
n = tamaño de la muestra

Existen casos en los cuales se tiene como dato adicional la población de la cual proviene la muestra considerada, en estos se utiliza
la ecuación:

6/22
Un concepto muy importante es el del teorema central del límite o teorema
del límite central que establece que “si todas las muestras de un tamaño en
particular se seleccionan de cualquier población, la distribución muestral de
la media se aproxima a una distribución normal. Esta aproximación mejora
con muestras más grandes”.

Esta aproximación se calcula a partir de:

Donde:

= media
= desviación estándar
n = tamaño de la muestra

Existen casos en los cuales se tiene como dato adicional la población de la


cual proviene la muestra considerada, en estos se utiliza la ecuación:

Donde:

N = población
= media
= desviación estándar
n = tamaño de la muestra

Ejemplo

Una población normal tiene una media de 60 y una desviación estándar de


12. Usted selecciona una muestra aleatoria de 9. Calcule la probabilidad de
que la media muestral sea mayor que 63.
Buscando en la tabla de la distribución normal (revise recurso
complementario), A = 0,2266, entonces P = 0,2266.

Se sabe que un estimador puntual es un estadístico muestral que se usa


para estimar un parámetro poblacional. Como no se puede esperar que un
estimador puntual suministre el valor exacto del parámetro poblacional, se
debe utilizar lo que se llama estimación por intervalos ya que los intervalos
estadísticos expresan la incertidumbre debida a la variabilidad de los datos
muestrales. Es así que, por ejemplo, basados en una muestra de hogares en
los que se está viendo televisión, se puede construir un intervalo que
contenga, con un grado específico de confiabilidad, la media o la desviación
estándar de la cantidad de hogares que ven programas infantiles en la
televisión.

Intervalos de confianza

Un intervalo de confianza se define como un “rango de valores calculado a


partir de los datos muestrales, el cual probablemente incluye el valor
verdadero de un parámetro desconocido”. (Galindo, 1999)

Un intervalo de confianza tiene un límite inferior de confianza (LCL) y un


límite superior de confianza (UCL). A cada intervalo se le asocia una
probabilidad (1-α) de que contenga el valor verdadero del valor del parámetro
considerado. A tal probabilidad se la llama nivel de confianza (o coeficiente
de confianza). Es así entonces que:

Al intervalo que cumpla con estas condiciones se lo nombra como intervalo


de confianza al 100 (1-α) % (α se conoce como nivel de significancia).

Para tener resultados fiables, el nivel de confianza debe ser alto (muy
cercano a 1) por lo que normalmente toma valores de 0,90; 0,95; 0,99 (90 %,
95 %, 99 % expresados como porcentajes).

Es importante mencionar que mientras más confiabilidad se requiera en los


resultados, el nivel de confianza deberá ser mayor y, por lo tanto, la anchura
del intervalo; sin embargo, hay una contrapartida ya que si bien se está
seguro de que el intervalo contiene el valor verdadero del parámetro, el
intervalo de confianza es más ancho y menos preciso. Obviamente, una
mayor confiabilidad se obtendrá también con un tamaño de muestra mayor,
cuyo análisis se realizará en el transcurso de la unidad.
Interpretación de los intervalos de confianza

Un intervalo de confianza puede ser interpretado de dos maneras distintas:

a) Confía, al nivel de confianza estipulado, que el parámetro se encuentra en


el intervalo determinado.

b) Si se construyen todos los intervalos de confianza posibles, el porcentaje


de ellos que incluirá el parámetro desconocido coincide con el nivel de
confianza considerado.

Ejemplo

La directora de un centro de cuidado infantil de la ciudad de Quito ha


determinado que los gastos medios en medicina preventiva para los niños de
su centro está en un intervalo de 35 a 38 dólares calculado a un nivel de
confianza del 95 %.

Esto puede ser interpretado, entonces, de la siguiente manera:

a) En sentido a priori (antes de calcular el intervalo) se puede decir que


existe un 95 % de probabilidad de construir un intervalo que comprenda la
media poblacional. Sin embargo, una vez que se ha calculado el intervalo,
la probabilidad de que en el intervalo entre 35 y 38 se encuentre la media
poblacional es 1 o 0 y no del 95 %, ya que el valor de 95 % se asigna al
grado de confianza de que se encuentre en el intervalo, no a la
probabilidad de que esté en él.

b) La segunda interpretación parte de la consideración de que a partir de


cualquier población se pueden tomar infinitas muestras diferentes de
tamaño n. Cada muestra dará lugar a un intervalo ligeramente distinto
porque cada una de ellas tiene una media algo diferente afirmándose que
en el 95 % de estos intervalos se incluirá la media poblacional
desconocida.
Sexto Nivel

6.3. Intervalo de confianza para la media

Estimación de la media poblacional: intervalo de confianza para la media poblacional

Una de las más comunes aplicaciones de los intervalos de confianza es la de estimar la media poblacional. Se toman dos
consideraciones:

a) Para muestras grandes (tamaño de muestra mayor o igual a 30)

Un intervalo de confianza para la media poblacional µ, a un determinado nivel de confianza, viene dado por la ecuación:

Donde:

n es el tamaño de la muestra.
σ es la desviación estándar de la población.

es el valor z que corresponde al área de α/2 en el extremo superior de la distribución normal estándar.

Es importante mencionar que si se desconoce el valor de σ puede reemplazarse por su estimador muestral, sin pérdida de
exactitud.

7/22
Estimación de la media poblacional: intervalo de confianza para la
media poblacional

Una de las más comunes aplicaciones de los intervalos de confianza es la de


estimar la media poblacional. Se toman dos consideraciones:

a) Para muestras grandes (tamaño de muestra mayor o igual a 30)

Un intervalo de confianza para la media poblacional µ, a un determinado nivel


de confianza, viene dado por la ecuación:

Donde:

n es el tamaño de la muestra.
σ es la desviación estándar de la población.

es el valor z que corresponde al área de α/2 en el extremo superior de la


distribución normal estándar.

Es importante mencionar que si se desconoce el valor de σ puede


reemplazarse por su estimador muestral, sin pérdida de exactitud.

Los valores más comunes utilizados como niveles de confianza con sus
respectivos valores de z son:

Nivel de confianza α α/2 Zα/2


90 % 0,10 0,05 1,645
95 % 0,05 0,025 1,960
98 % 0,02 0,01 2,326
99 % 0,01 0,005 2,576

Ejemplo

El director creativo de una fábrica de juguetes didácticos le ha pedido que


estime el tiempo medio necesario para producir una unidad concreta del
proceso de fabricación. Una muestra de 600 unidades da una media de 7,2
días. Se sabe que la desviación estándar es de 1,90 días. A un nivel de
confianza del 90 %, calcular el intervalo de confianza para el tiempo medio
de ejecución del proceso de fabricación.
Datos

días
n = 600
σ =1,90 días

Nivel de confianza = 90 % (0,90), es decir que, α = 1- 0,90 = 0,10; por lo


tanto, α/2 = 0,05

(valor z que corresponde al área de α/2) = 1,645

Entonces, el intervalo de confianza para el tiempo medio de ejecución


solicitado será:

Interpretación

Estoy 90 % seguro de que el tiempo medio de ejecución del proceso de


fabricación está entre 7,072 días y 7,328 días.

b) Para muestras pequeñas (tamaño de muestra menor a 30)

Antes de hablar del intervalo de confianza para muestras pequeñas será


necesario revisar el tema sobre distribución T de Student.

Distribución T de Student:

Cuando hay que tomar una muestra pequeña, la distribución normal no


siempre es la adecuada. En concreto, cuando la muestra es pequeña y la
desviación estándar es desconocida, no se deberá aplicar la distribución z
recurriéndose a una distribución alternativa llamada T de Student.
Los valores de probabilidad vienen tabulados en la tabla que se muestra en
el enlace: https://www.uam.es/personal_pdi/ciencias/gallardo/Tablas-normal-
chi-t-F.pdf. Estos valores dependen de los grados de libertad (g.l) porque la
ley de probabilidad t varía cuando n varía. Cuando n aumenta, la distribución
t tiende hacia la normal estándar.

La lectura de la tabla se hace de la siguiente manera:

a) Escoger el número r de grados de libertad de acuerdo con el tamaño de la


muestra.

b) Considerar la probabilidad α, según el nivel de confianza.

c) Leer los valores obtenidos de t en la tabla (recuerde que se lee: el valor t


a r grados de libertad y nivel de significancia α).

Ejemplo

Encontrar el valor de la ley t para una muestra de 7 personas y un nivel de


confianza de 95 %.

Con estos datos se sabe que:

Grados de libertad = r = tamaño de la muestra = 7


Nivel de confianza = 95 % (0,95), es decir que α = 1-0,95 = 0,05

Con estos dos datos entrando a la tabla se obtiene que el valor t buscado es
de = 1,895.

Intervalo de confianza

Para construir un intervalo de confianza para la media en muestras


pequeñas, debemos basar nuestra ecuación en la distribución t, por lo tanto,
quedará establecida de la siguiente manera:

Donde:

n es el tamaño de la muestra.
s es la desviación estándar muestral.
es el valor de la distribución t de Student a (n-1) grados de libertad,
para el cual el área en el extremo superior es igual a α/2.

Ejemplo

En una muestra de 16 estudiantes de una carrera, se encontró una estatura


media de 164,5 cm con una desviación estándar de 8,3 cm. Calcular e
interpretar un intervalo de confianza de 95 % para la media poblacional.

Datos

cm
n = 16, es decir n-1 = 16 -1 = 15
s = 8,3 cm

Nivel de confianza = 95 % (0,95), es decir que α = 1- 0,95 = 0,05; por lo


tanto, α/2 = 0,025.

(el valor t a 15 grados de libertad y un nivel de significancia 0,025) =


2,131

Entonces el intervalo de confianza para la media poblacional será:

Interpretación

Estoy 95 % seguro de que la estatura media de los estudiantes de una


carrera está entre 160,078 cm y 168,922 cm.
Sexto Nivel

6.4. Intervalo de confianza sobre la proporción

Estimación de la media poblacional: intervalo de confianza para proporciones poblacionales

Muchas veces, las decisiones dependen de parámetros con dos categorías en donde puedan caer las respuestas. Es así que,
cuando esto sucede, el parámetro que se utiliza es la proporción poblacional.

Para construir el correspondiente intervalo de confianza se utiliza la siguiente ecuación:

Donde:

n es el tamaño de la muestra.
zα/2 es el valor z que corresponde al área α/2 en el extremo superior de la distribución normal estándar.

Ejemplo

En un estudio realizado a los egresados de la carrera de Licenciatura en Administración Educativa, los investigadores encontraron
que, de una muestra de 210 egresados, 77 habían repetido la materia de Dirección Estratégica. Calcule un intervalo de confianza al
90 % para la proporción poblacional de los que han repetido la materia de Dirección Estratégica.

8/22
Estimación de la media poblacional: intervalo de confianza para
proporciones poblacionales

Muchas veces, las decisiones dependen de parámetros con dos categorías


en donde puedan caer las respuestas. Es así que, cuando esto sucede, el
parámetro que se utiliza es la proporción poblacional.

Para construir el correspondiente intervalo de confianza se utiliza la siguiente


ecuación:

Donde:

n es el tamaño de la muestra.
zα/2 es el valor z que corresponde al área α/2 en el extremo superior de la
distribución normal estándar.

Ejemplo

En un estudio realizado a los egresados de la carrera de Licenciatura en


Administración Educativa, los investigadores encontraron que, de una
muestra de 210 egresados, 77 habían repetido la materia de Dirección
Estratégica. Calcule un intervalo de confianza al 90 % para la proporción
poblacional de los que han repetido la materia de Dirección Estratégica.

Datos

El valor proporcional para quienes han repetido la materia indicada es =

n = 210 egresados

Nivel de confianza = 90 % (0,90), es decir que α = 1- 0,90 = 0,10. Por lo


tanto α/2 = 0,05.

(valor z que corresponde al área de α/2) = 1,645.

Entonces, el intervalo de confianza para la proporción poblacional será:


(

Interpretación

Estoy 90 % seguro de que la proporción poblacional para los egresados que


repitieron la materia de Dirección Estratégica está entre 0,312 y 0,422.
Sexto Nivel

Recursos complementarios

Video de explicación de muestreo

Tipos de muestreo

https://www.youtube.com/watch?v=dubWAjxtmLY

9/22
Sexto Nivel

Bibliografía

Galindo, E. (1999). Estadística para la administración y la ingeniería. Ecuador: Gráfica Mediavilla Hnos.

Levin, R. I. & Rubin, D. S. (2004). Estadística para administración y economía. Estados Unidos: Pearson
Educación de México, .S.A. de C. V.
https://profefily.com/wp-content/uploads/2017/12/Estad%C3%ADstica-para-administraci%C3%B3n-y-
economia-Richard-I.-Levin.pdf

Webster, A. L (2000). Estadística aplicada a los negocios y la economía (tercera edición). Santa Fe de
Bogotá: Irwin McGraw-Hill. https://www.casadellibro.com/libro-estadistica-aplicada-para-administracion-y-
economia/9788480862691/539147

10/22
1/25
Sexto Nivel

Introducción

Antes de comenzar con el estudio de las pruebas de hipótesis, es importante tratar el tema del tamaño
de muestra como complemento a lo visto en el tema 6 y que será de gran utilidad para el desarrollo de
estos contenidos.

Tamaño de muestra

El tamaño de la muestra es importante en la determinación de la probabilidad del error y la precisión de


la estimación. Tomando en consideración el nivel de confianza, existen dos factores que inciden en el
tamaño muestral:

ü La variabilidad de la población (σ2), que es un factor no controlable por el investigador.

ü El grado de error que se puede aceptar, que es un factor que depende de lo crítico que sea el trabajo
sobre el cual se está analizando el parámetro. Es importante mencionar que cualquier intervalo
dado tiene una amplitud igual al doble del error tolerable.

a) Tamaño de muestra para la media poblacional

Debemos partir de que la variable tipifica z es igual a:

2/25
Antes de comenzar con el estudio de las pruebas de hipótesis, es importante
tratar el tema del tamaño de muestra como complemento a lo visto en el
tema 6 y que será de gran utilidad para el desarrollo de estos contenidos.

Tamaño de muestra

El tamaño de la muestra es importante en la determinación de la probabilidad


del error y la precisión de la estimación. Tomando en consideración el nivel
de confianza, existen dos factores que inciden en el tamaño muestral:

ü La variabilidad de la población (σ2), que es un factor no controlable por el


investigador.

ü El grado de error que se puede aceptar, que es un factor que depende de


lo crítico que sea el trabajo sobre el cual se está analizando el parámetro.
Es importante mencionar que cualquier intervalo dado tiene una amplitud
igual al doble del error tolerable.

a) Tamaño de muestra para la media poblacional

Debemos partir de que la variable tipifica z es igual a:

Despejando n se tiene:

En ciertas bibliografías encontrará la siguiente relación, que es equivalente a


la anterior:

Donde, es el error permitido o tolerable ( E ).

b) Tamaño de muestra para la proporción


Para este caso, debemos partir de que los intervalos de confianza tienen la
forma:

Donde el error es por lo que el tamaño de la muestra se calculará


con la siguiente ecuación:

Si no se conociera de antemano la estimación de p, se suele tomar p = 0,5,


porque este valor hace que tengamos un tamaño de muestras máximo.

Ejemplos

a) Se desea conocer la distancia promedio que corren semanalmente los


miembros del Club de carreras de fondo “Correr es vivir”. Por estudios
anteriores, se conoce que la desviación estándar de estas distancias es 4
km. ¿A cuántos atletas habrá que muestrear si la estimación debe quedar
a menos de 0,2 km con un nivel de confianza del 95 %?

Datos

σ = 4 km
E = 0,2 km porque el intervalo es de la forma

Para un intervalo de confianza del 95 % se tiene que el valor de z = 1,96

Entonces:
Es decir, que se necesita un tamaño de muestra mínimo de 1537 atletas. Si
la muestra fuera demasiado alta, es necesario aumentar el error permitido.

b) Víctor Pérez, un afamado doctor de la región, se presenta como candidato


a la Alcaldía de la urbe. Quiere estimar con un error de un punto
porcentual la proporción de electores que le votará. También quiere
confiar al 98 % en los datos que halle. ¿Qué tamaño de muestra deberá
tener el sondeo?

Datos

Para este caso haremos uso de la proporción en donde se puede asumir que
p = 0,5.

E = 0,01
Nivel de confianza = 98 % (0,98), es decir, que α = 1- 0,98 = 0,02; por lo
tanto, α/2 = 0,01.

(valor z que corresponde al área de α/2) = 2,326

Entonces:

Es decir, que necesitará una muestra de 13 526 para el sondeo del caso.
Sexto Nivel

7.1.Introducción a la prueba de hipótesis

7.1.1. Fundamento de las pruebas de hipótesis

3/25
Sexto Nivel

7.1.1. Fundamento de las pruebas de hipótesis

En el análisis estadístico, se hace una aseveración de la población. Para verificar si la afirmación es razonable se usan datos. En la
mayor parte de los casos, la población es tan grande que por diversas razones, es necesario tomar una muestra de la población. Por
tanto, a partir de la muestra, se puede probar la afirmación para determinar si la evidencia empírica de la muestra fundamenta o no la
afirmación relativa a la población. Así, hipótesis es un enunciado de una población elaborado con el propósito de poner a
prueba; y el procedimiento, basado en la evidencia de la muestra y la teoría de la probabilidad, que se utiliza para determinar
si la hipótesis es una afirmación razonable, se denomina prueba de hipótesis.

Figura 1
Proceso de los cinco pasos

A continuación se analiza cada paso.

Paso 1: Plantear hipótesis

Existen dos clases de hipótesis:

⇨ La hipótesis nula (denotada por Ho) es una declaración acerca del valor del parámetro de la población y debe contener la condición
de igualdad escrita con los símbolos , ≥ o ≤. En el caso de la media, la hipótesis nula se expresa en una de las tres formas:

H0 : u algún valor H0 : u ≥ algún valor H0 : u ≤ algún valor

⇨ La hipótesis alternativa (denotada por H1) es la declaración que debe ser verdad si la hipótesis nula es falsa. En el caso de la media,
la hipótesis nula se enuncia en una de las tres formas siguientes:

H1 : u ≠ algún valor H1 : u > algún valor H1 : u < algún valor


4/25
En el análisis estadístico, se hace una aseveración de la población. Para
verificar si la afirmación es razonable se usan datos. En la mayor parte de los
casos, la población es tan grande que por diversas razones, es necesario
tomar una muestra de la población. Por tanto, a partir de la muestra, se
puede probar la afirmación para determinar si la evidencia empírica de la
muestra fundamenta o no la afirmación relativa a la población. Así, hipótesis
es un enunciado de una población elaborado con el propósito de poner
a prueba; y el procedimiento, basado en la evidencia de la muestra y la
teoría de la probabilidad, que se utiliza para determinar si la hipótesis
es una afirmación razonable, se denomina prueba de hipótesis.

Existen tres métodos para probar hipótesis, que aparentemente son distintos,
pero que son equivalentes en el sentido de que siempre llevan a las mismas
conclusiones. El primer procedimiento es el método tradicional o de cinco
pasos, que será el que se usa en este curso. El segundo es el procedimiento
basado en los valores de P y el tercer procedimiento está basado en
intervalos de confianza.

Procedimiento de cinco pasos

Este proceso sistematiza una prueba, una hipótesis. Al llegar al quinto paso
aporta una clase de evidencia “más allá de la duda razonable”, en forma
similar a un proceso judicial. La figura 1 resume los pasos del método
tradicional.
Sexto Nivel

7.2. Prueba de hipótesis para la media

7.2.1. Prueba de hipótesis sobre la media de muestras grandes

7.2.2. Prueba de hipótesis sobre la media de muestras pequeñas

5/25
Sexto Nivel

7.2.1. Prueba de hipótesis sobre la media de muestras grandes

Los siguientes son los supuestos para probar una hipótesis respecto a la media de una sola población.

Ø La muestra es grande (n>30), así que el teorema de límite central aplica y se usa la distribución normal.

Ø Al aplicar el teorema del límite central, se puede usar la desviación estándar de la muestra s como un estimador de la desviación
estándar poblacional s siempre que se desconozca s y el tamaño de la muestra sea grande (n>30).

Ø Un valor p es la probabilidad de que la estadística de prueba sea más extrema que la que se obtiene cuando la hipótesis nula es
verdadera.

Probar una hipótesis sobre la media de la población

Ø Si se conoce la desviación estándar de la población, , la estadística de prueba sigue la distribución normal estándar, z, y se
determina por:

Ø Si no se conoce, pero el tamaño de la muestra es mayor a 30, la desviación estándar de la muestra, s, remplaza a .

6/25
Los siguientes son los supuestos para probar una hipótesis respecto a la
media de una sola población.

Ø La muestra es grande (n>30), así que el teorema de límite central aplica y


se usa la distribución normal.

Ø Al aplicar el teorema del límite central, se puede usar la desviación


estándar de la muestra s como un estimador de la desviación estándar
poblacional s siempre que se desconozca s y el tamaño de la muestra
sea grande (n>30).

Ø Un valor p es la probabilidad de que la estadística de prueba sea más


extrema que la que se obtiene cuando la hipótesis nula es verdadera.

Probar una hipótesis sobre la media de la población

Ø Si se conoce la desviación estándar de la población, , la estadística de


prueba sigue la distribución normal estándar, z, y se determina por:

Ø Si no se conoce, pero el tamaño de la muestra es mayor a 30, la


desviación estándar de la muestra, s, remplaza a .

Ejemplo

Como gerente de compras para una gran empresa de seguros, usted debe
decidir si actualizar o no los computadores de la oficina. Le han dicho que el
costo promedio de los computadores es de US$ 2100. Una muestra de 64
minoristas revela un precio promedio de US$ 2251, con una desviación
estándar de US$ 812. ¿A un nivel de significancia del 5 % parece que su
información es correcta?

Datos: ; ; ;

1) Planteamiento de la hipótesis

El costo promedio de los computadores es igual a US$ 2100.


El costo promedio de los computadores es diferente de US$
2100.

2) Nivel de significancia

Es una prueba de dos colas. Se ubica el área de 0.475 bajo la curva en la


tabla de la distribución de la normal y se obtiene z crítico = ±1.96.

3) Estadística de prueba Distribución “Z” porque n>30

4) Reglas de decisión

Si -1.96 < Zcal < 1.96, no se rechaza la hipótesis nula.

5) Conclusión

A un nivel de significancia de 0,05, el costo promedio de los computadores es


igual a US$ 2100.

Ejemplo

La comisión promedio que cobran las compañías de corretaje de servicio


completo en una venta de valores comunes es $144, con una desviación
estándar de $52. Diana Cabrera tomó una muestra aleatoria de 121
transacciones de sus clientes y determinó que habían pagado una comisión
promedio de $151. A un nivel de significancia de 0.10, ¿puede concluir Diana
que las comisiones de sus clientes son mayores que el promedio de la
industria?

Datos: ; , ; ,

1) Planteamiento de la hipótesis

Las comisiones de los clientes no son mayores que el


promedio de la industria.

Las comisiones de los clientes son mayores que el promedio


de la industria.

2) Nivel de significancia

Es una prueba de cola derecha. Se ubica el área de 0.40 bajo la curva en la


tabla de la distribución de la normal y se obtiene z crítico = 1.29.

3) Estadística de prueba Distribución “Z” porque n>30

4) Reglas de decisión

Si Zcal < 1.29, no se rechaza la hipótesis nula

5) Conclusión

A un nivel de significancia de 0,10, Diana puede concluir que las comisiones


de sus clientes son mayores que el promedio de la industria.
Sexto Nivel

7.2.2. Prueba de hipótesis sobre la media de muestras pequeñas

La distribución t se utiliza como el estadístico de la prueba cuando:

Ø La población muestreada se aproxima a la distribución normal.

Ø No se conoce la desviación estándar de la población.

Ø La muestra contiene menos de 30 observaciones.

Las características de la distribución t son:

Ø Es una distribución continua.

Ø Tiene forma de campana de Gauss y es simétrica.

Ø Es más aplanada o ancha, que la distribución normal estándar.

Ø Existe una familia de distribuciones t, dependiendo del número de grados de libertad.

En una prueba de una muestra, se compara una sola media de muestra con una media de población.

La fórmula para el estadístico de prueba t es:

7/25
La distribución t se utiliza como el estadístico de la prueba cuando:

Ø La población muestreada se aproxima a la distribución normal.

Ø No se conoce la desviación estándar de la población.

Ø La muestra contiene menos de 30 observaciones.

Las características de la distribución t son:

Ø Es una distribución continua.

Ø Tiene forma de campana de Gauss y es simétrica.

Ø Es más aplanada o ancha, que la distribución normal estándar.

Ø Existe una familia de distribuciones t, dependiendo del número de grados


de libertad.

En una prueba de una muestra, se compara una sola media de muestra con
una media de población.

La fórmula para el estadístico de prueba t es:

Donde es la media de la muestra, es la media de la población, s es la


desviación estándar de la muestra y n es el número de observaciones en la
muestra.

Los grados de libertad son .

Ejemplo

A continuación se presenta una lista de tasas de rendimiento por un año


(reportadas en porcentaje) para una muestra de 12 mutualistas clasificadas
como fondos de mercado de dinero gravable. Utilizando el nivel de
significancia de 0.05, ¿se puede concluir que la tasa de rendimiento es
mayor que 4.50 %?

4.63 4.15 4.76 4.70 4.65 4.52


4.70 5.06 4.42 4.51 4.24 4.52
Datos

n=12, ,

Se determina la media y la desviación estándar de la muestra

Planteamiento de la hipótesis

1) Nivel de significancia

Como n< 30 se debe aplicar la fórmula para la distribución normal y utilizar el


estadístico “t”. Es una prueba de derecha. Con los grados de libertad gl=n-
1=11 y el nivel de significancia del 5 %, se puede encontrar el t crítico, en la
tabla de la distribución t y se obtiene que t crítico = +1.796.

2) Estadística de prueba Distribución “t” porque n<30


3) Reglas de decisión

Si Zcal < 1.796, no se rechaza la hipótesis nula.

4) Conclusión

A un nivel de significancia de 0,05, la tasa media de rendimiento es menor al


4.5 %.

En la figura 3 se resumen las decisiones que deben tomarse al escoger entre


la distribución normal y la de t Student.
Sexto Nivel

7.3. Prueba de hipótesis para la proporción

En los numerales anteriores se presentaron los métodos para las pruebas de hipótesis, pero solo para la media de la población. En
esta sección se verá cómo se puede probar la aseveración realizada sobre la proporción, un porcentaje o una probabilidad de la
población. La prueba de una hipótesis sobre una proporción cumple con los siguientes supuestos:

Ø Tanto como son por lo menos de 5.

Ø La estadística de prueba es

Donde p es la proporción de la muestra, es la proporción de la población y n es el número de observaciones en la muestra.

Figura 3
Cómo escoger entre distribución normal y t Student

8/25
En los numerales anteriores se presentaron los métodos para las pruebas de
hipótesis, pero solo para la media de la población. En esta sección se verá
cómo se puede probar la aseveración realizada sobre la proporción, un
porcentaje o una probabilidad de la población. La prueba de una hipótesis
sobre una proporción cumple con los siguientes supuestos:

Ø Tanto como son por lo menos de 5.

Ø La estadística de prueba es

Donde p es la proporción de la muestra, es la proporción de la población y


n es el número de observaciones en la muestra.

Figura 3
Cómo escoger entre distribución normal y t Student
Ejemplo

Una empresa informa que 52 % de los automovilistas que usan las autopistas
en el Ecuador son varones. Una muestra de 300 autos, que ayer viajaron
hacia el este por la autopista de Los Chillos, reveló que 170 fueron
conducidos por hombres. Al nivel de significancia de 0.01, ¿se puede concluir
que una mayor proporción de varones conducían por la autopista de Los
Chillos, que lo que indican las estadísticas nacionales?

Datos

n = 300 automovilistas; x = número de hombres 170;


Se obtiene la proporción de hombres que conducían por Los Chillos, p = x/n
p = 56.67 %
1) Planteamiento de la hipótesis

2) Nivel de significancia

Es una prueba de cola derecha. Se ubica el área de 0.49 bajo la curva en la


tabla de la distribución de la normal y se obtiene z crítico = 2.33.

3) Estadística de prueba Distribución “Z” para las proporciones

4) Reglas de decisión

Si Zcal < 2.33, no se rechaza la hipótesis nula.

5) Conclusión

A un nivel de significancia de 0.01, se puede concluir que la proporción de


varones que conducen en la autopista a Los Chillos es menor que 52 %.

Prueba de hipótesis para la diferencia de dos medias

Muchas decisiones exigen el determinar si las medias poblacionales son


diferentes. En este caso, las pruebas de hipótesis se definen de la siguiente
manera para una prueba bilateral:
O mediante las expresiones equivalentes:

El proceso de contrastar la hipótesis de la diferencia entre dos medias


poblacionales implica que se debe elegir dos muestras, una para cada
población. La pregunta que se plantea es: “¿Hay diferencia significativa por el
hecho de que las muestras procedan de poblaciones no semejantes?”.
Entonces el proceso de análisis se realiza utilizando la llamada diferencia
crítica.

Esta diferencia crítica, cuando las varianzas muestrales son conocidas, se


calcula utilizando:

Donde se conoce como error típico de la diferencia entre medias


muestrales y se calcula como:

y son las varianzas de las dos muestras.

y son los dos tamaños muestrales.

Para el caso de pruebas de hipótesis unilaterales, con diferencia de cero, las


mismas quedan planteadas de la siguiente manera:

a) Para prueba de cola derecha:

b) Para prueba de cola izquierda:


Las diferencias críticas para estos casos quedan definidas de la siguiente
manera:

a) Para prueba de cola derecha:

b) Para prueba de cola izquierda:

En caso de que se desconozcan las varianzas poblacionales:

a) Para prueba de cola derecha:

b) Para prueba de cola izquierda:

Cuando la diferencia hipotética no es cero, el cual es un caso muy frecuente,


sino que es mayor que una cantidad específica, la prueba de hipótesis
quedará expresada de la siguiente manera:

a) Para prueba de cola derecha:

b) Para prueba de cola izquierda:

Donde a es el valor o cantidad especificada.

Las diferencias críticas para estos casos quedan definidas de la siguiente


manera:
a) Para prueba de cola derecha:

b) Para prueba de cola izquierda:

Se debe recordar que cuando se manejan muestras pequeñas, el valor de z


deberá ser reemplazado por el valor t que corresponde a la distribución T de
Student y las diferencias críticas se calcularán utilizando la ecuación

es la estimación de la varianza común a dos poblaciones y se calcula


como:
Sexto Nivel

7.4. Pruebas para datos pareados

Para comenzar este estudio, es necesario conocer qué son datos o muestras pareadas. Se puede indicar que las muestras
pareadas tienen como característica que cada observación de un primer grupo le corresponde o se encuentra relacionada con una
observación correspondiente a un segundo grupo, lo cual constituye un diseño más complejo que el visto con muestras
independientes como son las que se ha tratado hasta este momento.

Las muestras pareadas se obtienen cuando se han realizado comparaciones sobre una misma unidad global o unidad
experimental. Se presentan dos casos:

- Se determina una misma variable sobre la misma unidad experimental pero utilizando dos métodos diferentes.

- Se estudia a un mismo individuo o muestra antes y después de un determinado tratamiento.

En este tipo de datos se suele cometer, en algunas áreas, un error estadístico común: la utilización de pruebas para datos
independientes en muestras dependientes. Para poder analizar este tipo de muestras, hay que calcular la diferencia entre los datos
de la una muestra y la otra:

Donde X representa a la información proporcionada por la primera muestra y Y representa a la información proporcionada por la
segunda muestra. Entonces:

9/25
Para comenzar este estudio, es necesario conocer qué son datos o muestras
pareadas. Se puede indicar que las muestras pareadas tienen como
característica que cada observación de un primer grupo le corresponde o se
encuentra relacionada con una observación correspondiente a un segundo
grupo, lo cual constituye un diseño más complejo que el visto con muestras
independientes como son las que se ha tratado hasta este momento.

Las muestras pareadas se obtienen cuando se han realizado comparaciones


sobre una misma unidad global o unidad experimental. Se presentan dos
casos:

- Se determina una misma variable sobre la misma unidad experimental


pero utilizando dos métodos diferentes.

- Se estudia a un mismo individuo o muestra antes y después de un


determinado tratamiento.

En este tipo de datos se suele cometer, en algunas áreas, un error


estadístico común: la utilización de pruebas para datos independientes en
muestras dependientes. Para poder analizar este tipo de muestras, hay que
calcular la diferencia entre los datos de la una muestra y la otra:

Donde X representa a la información proporcionada por la primera muestra y


Y representa a la información proporcionada por la segunda muestra.
Entonces:

La prueba de hipótesis quedaría planteada de la siguiente manera:

en caso de ser de cola derecha.

en caso de ser de cola izquierda.

El estadístico observado o calculado que se necesita para poder hacer el


análisis es:
Los valores de y se obtienen de la siguiente manera:

Ejemplo

El profesor de Cultura Física de Octavo de Educación Básica de la Sección


BI de un colegio ha realizado mediciones de la frecuencia cardíaca a 9
estudiantes antes (x) y después (y) de que ellos se hubieran sometido a un
programa de entrenamiento para participar en la competencia de 110 m
planos de un evento intercolegial. Los resultados que obtuvo fueron los
siguientes:

Xi 81 85 82 82 90 83 73 93 92

Yi 76 71 87 79 90 89 76 75 89

Para un nivel de significancia del 0.05, es posible establecer si el programa


de entrenamiento varió de forma significativa la frecuencia cardíaca,
suponiendo una distribución normal de las diferencias.

Lo primero que debe realizarse es calcular el promedio y la desviación


estándar de las diferencias.

di 76- 71- 87- 79- 90- 89- 76- 75- 89-


81 85 82 82 90 83 73 93 92

di -5 -14 5 -3 0 6 3 -18 -3

Entonces:

1. Planteamiento de la hipótesis
Es una prueba bilateral ya que en el enunciado del ejercicio no nos indica
que sea mayor o menor, únicamente nos dice que “varió significativamente”.

2. Nivel de significancia

Como n< 30 se debe aplicar la fórmula para la distribución normal y utilizar el


estadístico “t”. Es una prueba bilateral. Con los grados de libertad gl=n-1=8 y
el nivel de significancia del 5 %, se puede encontrar el t crítico, en la tabla de
la distribución t y se obtiene que t crítico = +2.306.

3. Estadístico de prueba

Para este caso se utiliza:

4. Regla de decisión

Como es una prueba bilateral, la región de rechazo está en:

En este caso 1,117 < 2,306; por lo tanto, no se rechaza Ho (o no hay


suficiente evidencia estadística para rechazar Ho).

5. Conclusión

A un nivel de significancia de α=0.05, no hay que considerar que hubo una


variación apreciable en la frecuencia cardíaca de los estudiantes.
Sexto Nivel

7.5. Prueba chi cuadrado de independencia

Las pruebas que se han revisado hasta aquí dependen de postulados sobre la población y sus parámetros y de ahí que se
denominan pruebas paramétricas. Sin embargo, en la práctica existen muchas situaciones en las cuales formular una hipótesis de
carácter segura sobre el valor de un parámetro o la forma de una distribución poblacional es imposible. En estos casos, se deben
usar las llamadas pruebas no paramétricas.

Existen algunas pruebas no paramétricas que se pueden utilizar para una necesidad determinada, entre ellas están:

- Ji Cuadrado (también identificada como chi cuadrada) para contratar la bondad de ajuste, tablas de contingencia y pruebas de
independencia

- Prueba de rachas

- Prueba U de Mann-Whitney que compara distribuciones poblacionales

- Prueba de los signos para comparar pares coincidentes

- Prueba de Krustal-Wallis de medias poblaciones

En este tema se revisará la prueba Ji cuadrado (ϰ2) de independencia, es decir, se analizará cuando la prueba Ji cuadrado permita
comparar dos atributos para determinar si hay alguna relación entre ellos. Esta comparación se realiza analizando la diferencia
entre frecuencias reales y frecuencias observadas.
La prueba ji cuadrado toma la forma siguiente:

10/25
Las pruebas que se han revisado hasta aquí dependen de postulados sobre la población y sus
parámetros y de ahí que se denominan pruebas paramétricas. Sin embargo, en la práctica existen
muchas situaciones en las cuales formular una hipótesis de carácter segura sobre el valor de un
parámetro o la forma de una distribución poblacional es imposible. En estos casos, se deben usar las
llamadas pruebas no paramétricas.

Existen algunas pruebas no paramétricas que se pueden utilizar para una necesidad determinada,
entre ellas están:

- Ji Cuadrado (también identificada como chi cuadrada) para contratar la bondad de ajuste, tablas de
contingencia y pruebas de independencia

- Prueba de rachas

- Prueba U de Mann-Whitney que compara distribuciones poblacionales

- Prueba de los signos para comparar pares coincidentes

- Prueba de Krustal-Wallis de medias poblaciones

En este tema se revisará la prueba Ji cuadrado (ϰ2) de independencia, es decir, se analizará cuando
la prueba Ji cuadrado permita comparar dos atributos para determinar si hay alguna relación entre
ellos. Esta comparación se realiza analizando la diferencia entre frecuencias reales y frecuencias
observadas.
La prueba ji cuadrado toma la forma siguiente:

es la frecuencia de los sucesos observados en los datos muestrales.

es la frecuencia de los sucesos esperados si la hipótesis nula es correcta.

K es el número de categoría o clases.

La prueba lleva consigo K – m – 1 grados de libertad donde m es el número de parámetros a estimar.


Si observa el numerador de la fórmula de Ji cuadrado se aprecia que mientras más grande es la
diferencia entre lo observado y lo esperado, la hipótesis nula debe ser rechazada.

El valor de debe ser comparado con el valor de que se lo encuentra utilizando la tabla de
distribución . Esta tabla la puede visualizar y descargar del enlace:
http://labrad.fisica.edu.uy/docs/tabla_chi_cuadrado.pdf o
https://eva.fing.edu.uy/pluginfile.php/347391/mod_resource/content/1/TablaChi2.jpg

La tabla en mención es una tabla de doble entrada (figura 4).

Figura 4
Tabla Ji cuadrada
Para hacer la lectura de crítica se debe conocer el nivel de significancia y los (r-1) (c-1) grados de
libertad de lo que se está estudiando. (En este tipo de ejercicios, la información que nos proporciona
viene generalmente en tablas de contingencia y en este caso r es el número de filas y c es el número
de columnas).

Si el valor de calculada se encuentra en la zona oscura (es decir que es mayor a crítica) no se
puede aceptar la hipótesis nula ya que ha caído en la zona de rechazo.

Ejemplo

Wlma Armendariz es directora de investigación de productos Dow Chemical. Su proyecto actual exige
analizar la eficacia de un nuevo detergente para ropa infantil que Dow planea comercializar. A la
señora Armendariz le interesa en particular si la inclusión de amonio en la fórmula química del
detergente produce resultados más satisfactorios en cuanto a desinfección. Su prueba más reciente
fue elegir a 100 clientes potenciales y pedir a 75 de ellos a que prueben la fórmula con amonio. A los
otros 25 clientes les entregó el producto sin amonio. A los 100 se les solicitó que definieran el producto
con las calificaciones “mejor que la media”, “como la media” o “peor que la media”. Los resultados que
se obtuvieron fueron:

A un nivel de significancia del 10 %, ¿qué puede deducir Wilma?


1. Planteamiento de la hipótesis

2. Nivel de significancia

Al ser una prueba ji cuadrada, usamos la tabla ji cuadrada para encontrar el valor de crítica.

Los grados de libertad se calculan como (r-1) (c-1). En este caso, r es igual a 3 filas (hay tres Atributo
A) y c es igual a dos columnas (hay dos Atributo B). Por lo tanto, (3-1) x (2-1) = 2 x 1 = 2 grados de
libertad.

El nivel de significancia es del 10 %, se puede encontrar el valor buscado, crítica= = 4,605


(4.61 aproximado).

3. Estadístico de prueba

Para este caso se utiliza:

Se puede observar que necesitamos encontrar los valores esperados. Se deben calcular seis valores
esperados (hay tres filas y dos columnas, 3 X 2 = 6).

El cálculo del valor esperado se hace de la siguiente manera:

De la información en la tabla se sabe que:

- El 31 % (31/100 x 100) de los encuestados dijo que era mejor que la media.

- El 48 % (48/100 x 100) de los encuestados dijo que era igual que la media.

- El 21 % (21/100 x 100) de los encuestados dijo que era menor que la media.

Entonces el 31 % de los que usaron fórmula con amonio y el 31 % de los que usaron fórmula sin
amonio deberán dar esa calificación si no existiese diferencia de eficacia, por lo tanto:

sería el valor esperado de quienes probaron la fórmula con amonio y dijeron que
“era mejor que la media”.

sería el valor esperado de quienes probaron la fórmula sin amonio y dijeron que
“era mejor que la media”.

Este análisis se hace de igual manera para la calificación de “igual que la media” y “menor que la
media”.

Una tabla que resume esta información sería:


Hallada esta información, calculamos el valor de ji cuadrado:

4. Regla de decisión

Se tiene que 3,76 < 4,61; por lo tanto, no se rechaza Ho (o no hay suficiente evidencia estadística para
rechazar Ho).

5. Conclusión

A un nivel de significancia de α=0.10, no se rechaza la Ho, es decir, que la calificación y el uso de


amonio son independientes.
Sexto Nivel

Recursos complementarios

Video explicativo de las pruebas de hipótesis

Prueba de Hipótesis para la media

https://www.youtube.com/watch?v=AJcy4eZMwWM

11/25
Sexto Nivel

Bibliografía

Galindo, E. (1999). Estadística para la administración y la ingeniería. Ecuador: Gráfica Mediavilla Hnos.

Levin, R. I. & Rubin, D. S. (2004). Estadística para administración y economía. Estados Unidos: Pearson
Educación de México, .S.A. de C. V. https://profefily.com/wp-
content/uploads/2017/12/Estad%C3%ADstica-para-administraci%C3%B3n-y-economia-Richard-I.-
Levin.pdf

Webster, A. L (2000). Estadística aplicada a los negocios y la economía (tercera edición). Santa fe de
Bogotá: Irwin McGraw-Hill. https://www.casadellibro.com/libro-estadistica-aplicada-para-administracion-y-
economia/9788480862691/539147

12/25
1/16
Sexto Nivel

Introducción

Para comenzar el estudio de ANOVA se debe poner a consideración una pequeña introducción sobre este. ▲

El análisis de la varianza (conocido como ANOVA) constituye una metodología que permite comparar dos o más medias. Esto se
vuelve indispensable porque al querer comparar más de dos medias es una falacia tratar de utilizar repetidamente el contraste
(prueba de hipótesis) basado en z o en t Student.

Este error se da por dos motivos principalmente:

a) Al realizar simultánea e independientemente varios contrastes de hipótesis, se tiene una probabilidad muy alta de encontrar
alguno significativo al azar.
b) En cada comparación, la hipótesis nula es que las dos muestras provienen de una misma población, lo que conlleva a que,
una vez que se hayan realizado todas las comparaciones posibles, la estimación de la varianza necesaria para el contraste es
distinta, pues se ha realizado sobre la base de muestras distintas.

El proceso que puede resolver estos dos inconvenientes es el ANOVA, que está muy ligado al diseño de experimentos y, de cierta
manera, es la base del análisis multivariante.

2/16
Sexto Nivel

Introducción

Bases del ANOVA ▲

Para conocer cuál es la base de ANOVA, es necesario comenzar conociendo que la hipótesis nula de la que parten todos los tipos
de ANOVA (de un factor o de dos factores) es que la media de la variable que se está analizando es la misma en los diferentes
grupos, contrario a la hipótesis alternativa de que al menos dos difieren de forma significativa. Es importante recalcar que ANOVA
permite comparar múltiples medias, pero lo hace mediante el estudio de sus varianzas.

ANOVA tiene como base el que se calcula la media de cada uno de los grupos y a continuación se compara la varianza de estas
medias (esta varianza es explicada por la varianza grupo que se llama intervarianza y que se identifica con las siglas MSE) frente
a la varianza promedio dentro de los grupos (que es una varianza no explicada por la variable que se llama intravarianza y que se
identifica con las siglas MSA).

Bajo la hipótesis nula de que las observaciones de los distintos grupos proceden todas de la misma población –tienen la misma
media y varianza- , la varianza ponderada entre grupos será la misma que la varianza promedio dentro de los grupos. Si las
medias de los grupos están más alejadas las unas de las otras, la varianza entre medias se incrementará y dejará de ser igual a
la varianza promedio dentro de los grupos. (Amat, 2016)

2/16
Sexto Nivel

Introducción

El estadístico que se estudia en el ANOVA es el llamado Fcalculado (o simplemente F), que es el cociente entre la varianza de las ▲
medias de los grupos y el promedio de la varianza dentro de los grupos. El estadístico en mención sigue una distribución que se
llama “F de Fisher-Snedecor”. El Fcalculado se compara con el Fcrítico y se puede realizar el análisis necesario. Las tablas F
(donde encuentra el valor de Fcrítico) se las puede observar e imprimir para su uso en los siguientes enlaces:

http://www.uaaan.mx/~jmelbos/tablas/distf.pdf
http://dcb.fi-c.unam.mx/profesores/irene/Notas/tablas/Fisher.pdf

Si se cumple la hipótesis nula indicada, el estadístico F adquiere el valor de 1 ya que MSE y MSA son iguales. Cuanto más
difieran las medias de los grupos mayor será la varianza entre medias en comparación con el promedio de la varianza dentro de
los grupos y, por lo tanto, el valor de F será superior a 1.

MSE es un cociente en donde al numerador se lo llama suma de cuadrados del error y se representa por SSE y al denominador,
grados de libertad, por ser los términos independientes de la suma de cuadrados.
MSA también es un cociente, en donde al numerador se lo llama suma de cuadrados de los tratamientos y se representa por SSA
y al denominador (k-1) grados de libertad.

Existen algunos tipos de ANOVA en función de que si se trata de datos independientes, si son pareados, si comparan la variable
cuantitativa dependiente contra los niveles de una única variable explicatoria o factor o frente a dos factores.

Se revisará en este tema aquella ANOVA que compara la variable cuantitativa dependiente contra los niveles de una única
variable explicatoria llamada ANOVA de un factor.

2/16
Sexto Nivel

8.1. Análisis de varianza de un factor (ANOVA de un factor)

El ANOVA de un vía o de un factor es el tipo de análisis que se debe emplear cuando los datos que estamos considerando no están
pareados y se desea verificar si existen diferencias significativas entre las medias de una variable aleatoria continua en los
diferentes niveles de otra variable cualitativa o factor.

Las hipótesis contrastadas en el ANOVA de un factor son:

Ho: No hay diferencias entre las medias de los distintos grupos (

H1: Al menos un par de medias son significativamente distintas la una de la otra.

Como se indicó previamente, la diferencia de medias se analiza en función de la intervarianza y la intravarianza. Para este proceso,
ANOVA parte de la siguiente descomposición de la varianza:

Variabilidad total = variabilidad debida a los diferentes niveles del factor + variabilidad residual

Que es equivalente a:

Variabilidad explicada por el factor + variabilidad no explicada por el factor

Lo que es equivalente a:

(varianza entre niveles) + (varianza dentro de los niveles)


3/16
El ANOVA de un vía o de un factor es el tipo de análisis que se debe emplear cuando los datos que estamos
considerando no están pareados y se desea verificar si existen diferencias significativas entre las medias de
una variable aleatoria continua en los diferentes niveles de otra variable cualitativa o factor.

Las hipótesis contrastadas en el ANOVA de un factor son:

Ho: No hay diferencias entre las medias de los distintos grupos (

H1: Al menos un par de medias son significativamente distintas la una de la otra.

Como se indicó previamente, la diferencia de medias se analiza en función de la intervarianza y la


intravarianza. Para este proceso, ANOVA parte de la siguiente descomposición de la varianza:

Variabilidad total = variabilidad debida a los diferentes niveles del factor + variabilidad residual

Que es equivalente a:

Variabilidad explicada por el factor + variabilidad no explicada por el factor

Lo que es equivalente a:

(varianza entre niveles) + (varianza dentro de los niveles)

Para poder realizar el cálculo de las diferentes varianzas se debe obtener las sumas de cuadrados que se
describieron anteriormente. La figura 1 muestra la tabla de datos que se requiere para hacer el
correspondiente análisis ANOVA.

Figura 1
Información necesaria para realizar la prueba ANOVA

Nota. *SSW equivale a SSE, MSW equivale a MSE y c equivale al valor k

1) Suma de cuadrados total (SST)

Mide la variabilidad total de los datos, se define como la suma de los cuadrados de las diferencias de cada
observación respecto a la media general de todas las observaciones. Los grados de libertad para esta suma
son igual al número total de observaciones menos 1 (n-1).

La ecuación que nos sirve para este cálculo es:

2) Suma de cuadrados del factor (SSA)

Se obtiene como la suma de los cuadrados de las desviaciones de la media de cada “proveedor” respecto a
la media general, ponderando cada diferencia al cuadrado por el número de observaciones de cada grado
de libertad. Los grados de libertad correspondientes son iguales al número de niveles del factor menos uno
(k-1).
3) Suma de cuadrados residual/error (SSE)

Se calcula como la suma de los cuadrados de las desviaciones de cada observación respecto a la media del
nivel al que pertenecen. Los grados de libertad asignados para esta suma equivalen a la diferencia entre los
grados de libertad totales y los grados de libertad del factor, es decir, n-k.

El valor F que aparece en la última columna es el que permite determinar la validez de la hipótesis nula. Si F
es mayor a la Fcrítica se puede decir que no hay suficiente evidencia para aceptar la hipótesis nula (es decir
se rechaza Ho).

El valor de Fcrítico se encuentra utilizando la tabla de distribución F (que es una tabla de doble entrada). Se
necesitan tres elementos:

· Un nivel de significancia (de manera general a=0.01, 0.05 y 0.10)

· Los grados de libertad del numerador

· Los grados de libertad del denominador

Ejemplo

El director de una institución educativa está interesado en estudiar el efecto sobre el rendimiento académico
de un grupo de estudiantes que han tomado tres tipos diferentes de apoyo académico. Se les aplicó una
prueba (sobre 200 puntos) y los resultados fueron los siguientes:

Contrastar con un nivel de significación del 5 % si el tipo de apoyo tiene algún efecto sobre el rendimiento
académico.

Para resolver el ejercicio, debemos suponer, en primera instancia, que los datos provienen de poblaciones
normales e independientes y con la misma varianza.

1. Planteamiento de la hipótesis

Se quiere comprobar que el rendimiento medio de los estudiantes será el mismo en los tres tipos de apoyo:

2. Nivel de significancia

Al ser una prueba ANOVA, usamos la tabla F para encontrar el valor de Fcrítica.

El nivel de significancia es del 5 % (α = 0.05). Los grados de libertad tanto para numerador como para el
denominador son:

a) Para el numerador

Debemos buscar los grados de libertad entre grupos = k-1. Tenemos 3 opciones de ayuda, entonces, 3 – 1
= 2.

b) Para el denominador

Debemos buscar los grados de libertad dentro de los grupos = n-k.


Tenemos 12 datos y 3 opciones de ayuda, entonces, 12 – 3 = 9
Buscamos en la tabla F para nivel de significancia 0.05 el valor de Fcrítica = (tabla 1).

Tabla 1
Valores críticos de la distribución F (0,05)

3. Estadístico de prueba

Para este caso se utiliza:

Por lo tanto, se debe calcular los valores MSA y MSE para encontrar el cociente solicitado.

Se comienza con el cálculo de las medias y de las varianzas en las muestras:

En el siguiente cuadro se muestran los valores obtenidos para tipo 1, tipo 2 y tipo 3.
Con estos valores se procede a calcular la media de las medias y la varianza respecto a la media de las
medias.

a) Cálculo de SSE

El valor de SSE se calcula como:

b) Cálculo de SST

El valor de SST se calcula como:

c) Cálculo de SSA

El valor de SSA se calcula como:

SST = SSE + SSA


SSA = SST – SSE
SSA = 702,9156 - 207,752 = 495,1636

d) Cálculo de MSA y MSE

El valor de MSA se calcula como:

El valor de MSE se calcula como:

e) Cálculo del estadístico F


El valor de F se calcula como:

4. Regla de decisión

Se tiene que 10,725 > 4.256, por lo tanto, se rechaza Ho (o no hay suficiente evidencia estadística para
aceptar Ho).

5. Conclusión

A un nivel de significancia de α=0.05, se rechaza la Ho, es decir, que hay diferencias significativas entre los
diferentes tipo de apoyo.
Sexto Nivel

Recursos complementarios

Videos sobre la explicación de ANOVA

ANOVA. Introducción | | UPV

https://www.youtube.com/watch?v=DUT9jhPDih0

4/16
Sexto Nivel

Bibliografía

Amat, J. (2016). ANOVA análisis de varianza para comparar múltiples medias.


https://www.cienciadedatos.net/documentos/19_anova

Galindo, E. (1999). Estadística para la administración y la ingeniería. Ecuador: Gráfica Mediavilla Hnos.

Levin, R. I. & Rubin, D. S. (2004). Estadística para administración y economía. Estados Unidos: Pearson
Educación de México, .S.A. de C. V. https://profefily.com/wp-
content/uploads/2017/12/Estad%C3%ADstica-para-administraci%C3%B3n-y-economia-Richard-I.-
Levin.pdf

Webster, A. L (2000). Estadística aplicada a los negocios y la economía (tercera edición). Santa fe de
Bogotá: Irwin McGraw-Hill. https://www.casadellibro.com/libro-estadistica-aplicada-para-administracion-y-
economia/9788480862691/539147

5/16
1/20
Sexto Nivel

9.1. Regresión simple y correlación

¿Qué es el análisis de correlación? Se trata de un grupo de técnicas para medir la asociación entre dos variables. Por lo general, ▲
el primer paso es trazar los datos en un diagrama de dispersión que consiste en un gráfico en el cual se representan la variable
independiente (o predictora) en el eje X y la variable dependiente (o predecida) correspondiente en el eje y. Es importante elegir
una escala adecuada en cada eje para realizar dicho diagrama y además iniciar las escalas en valores cercanos a los valores
mínimos para evitar que una parte importante del diagrama queda vacío.

El diagrama de dispersión (o diagrama de puntos) nos da una idea inicial de cómo es la relación entre las variables que están
participando en nuestro análisis. La figura 1 evidencia cómo es un diagrama de dispersión.

Figura 1
Diagrama de dispersión

2/20
Sexto Nivel

9.1. Regresión simple y correlación

Como puede observarse, un diagrama de dispersión es un diagrama en el plano X-Y en donde se grafican los puntos que ▲
corresponden a una pareja ordenada (x,y).

En un diagrama de dispersión se pueden encontrar algunos tipos de relaciones entre las variables involucradas, estos pueden
observarse en la figura 2.

Figura 2
Relaciones posibles entre X e Y en un diagrama de dispersión

2/20
Sexto Nivel

9.1. Regresión simple y correlación

El uso del diagrama de dispersión nos da información sobre el tipo de ecuación de regresión (o modelo de regresión) que ▲
represente de mejor manera el comportamiento de los datos que se encuentran analizando.

Correlación

Una definición que entra en este estudio es el coeficiente de correlación. Esta medida describe la fuerza de la relación entre dos
conjuntos de variables en escala de intervalo o de razón. Esta medida se representa por la letra r y también se conoce como r de
Pearson, el apellido de su creador. El valor de r puede variar entre -1 (correlación negativa perfecta) y 1 (correlación positiva
perfecta). Un valor de 0 indica que no hay ninguna relación entra las variables.

El coeficiente de correlación se calcula mediante la fórmula siguiente:

Donde:

2/20
Sexto Nivel

9.1. Regresión simple y correlación

Ejemplo ▲
Dados los siguientes valores de X e Y, determinar el coeficiente de correlación r.

X ̅=2.5 Y ̅=3
Sx = 1.291 Sy = 1.826
n-1 = 3

Entonces r = 7/((3)(1.291)(1.826)) --> r = 0.989

Para determinar la importancia del coeficiente de correlación, se utiliza una prueba de hipótesis, que se realiza para verificar si
efectivamente existe una correlación entre la población de la cual se seleccionó la muestra o si es, según sea el caso, mayor a 0,
menor a 0 o diferente de cero. Para ello, se calcula el estadístico de prueba t correspondiente. Este valor depende del coeficiente
de correlación r y del tamaño de muestra n. Tome en cuenta que, en este caso, se deben considerar n-2 grados de libertad
cuando busque el valor crítico de t en la tabla t de Student.

2/20
Sexto Nivel

9.2. Regresión lineal simple

En la figura 2 se ha observado las posibles relaciones que pueden plantearse entre las variables que se encuentran en estudio. Al
ser observadores podemos analizar que se ha trazado una línea de color negro que ajusta visualmente la dirección de los puntos.
Esta línea se la llama línea de regresión.

La línea de regresión más sencilla es aquella que representa al modelo de regresión lineal, en la cual se está aseverando una
relación lineal (positiva o negativa) entre X e Y.

El modelo de regresión lineal presenta dos casos:

· El modelo de regresión lineal simple

· El modelo de regresión lineal múltiple

El modelo de regresión lineal simple es el modelo de regresión más sencillo y es el que todos los investigadores quisieran que sus
datos sigan, sin embargo, no siempre es posible.

El modelo de regresión simple responde a un modelo matemático de la ecuación de la recta en donde a es el valor del
corte en el eje Y y b es la pendiente de la recta.

Para encontrar esta ecuación de regresión lineal simple se debe realizar un análisis importante, el llamado análisis de regresión,
que consiste, mediante el método de los mínimos cuadrados, en obtener la ecuación de la recta de regresión.

L ió d l t d ió
3/20
Sexto Nivel

9.2. Regresión lineal simple

La ecuación de la recta de regresión es:

b = r Sy /Sx

Ejemplo

En el ejemplo anterior, se obtuvo r= 0.989, Sx = 1.291, Sy = 1.826,

Entonces: b = 0.989(1.826)/1.291 = 1.399

a = 3 – 1.399(2.5) = -0.498

Adicionalmente, se debe conocer sobre el coeficiente de determinación que es igual al coeficiente de correlación elevado al
cuadrado y representa la proporción de la variación total de la variable dependiente Y que se explica o contabiliza por la variación
de la variable dependiente X.

Modelos de regresión lineal múltiple


3/20
Sexto Nivel

9.2. Regresión lineal simple

Modelos de regresión lineal múltiple

Muchas relaciones entre variables no se acoplan adecuadamente con el modelo de regresión lineal simple porque la variable
independiente no solo depende de un factor independiente sino de algunos. En estos casos, es conveniente hacer uso del modelo
de regresión lineal múltiple.

El modelo de regresión lineal múltiple trata de ajustar modelos lineales o que son linealizables entre una variable dependiente y
algunas independientes, y usualmente se usa mucho en investigación. Este modelo está representado de la siguiente manera:

Donde y es la variable independiente o endógena y x son las variables exógenas o independientes, u los residuos (error de
observación debido a variables no controladas), es el término independiente (es decir, el valor esperado de y cuando son
ceros) y los valores de , los coeficientes estimados del efecto marginal entre cada x e y.

El modelo de regresión lineal múltiple más simple es el que tiene dos variables independientes. Así:

Al igual que en el modelo de regresión lineal simple, el modelo de regresión lineal múltiple puede resolverse usando el método de
los mínimos cuadrados. En la actualidad, el uso del software ha facilitado estos cálculos.

3/20
Sexto Nivel

9.3. Otros modelos de regresión simple


Como se ha revisado en el presente tema, la regresión es una técnica estadística que va a permitir cuantificar la relación entre dos o
más variables y también poder predecir los valores de una variable dependiente a partir de los valores de la variable independiente.

Hasta el momento se ha revisado el modelo de regresión lineal simple y múltiple; sin embargo, existen dos modelos principales más de
regresión simple: el de la logística y el de riesgos proporcionales o de Cox.

Modelo de regresión logística Modelo de regresión de Cox o de riesgos proporcionales

Modelo de regresión logística

El modelo de regresión logística es utilizado para predecir el resultado de una variable categórica (recuerde que una variable
categórica es aquella que puede adquirir un número limitado de categorías-cualidades) en función de las variables independientes o
predictoras.

La regresión logística es muy utilizada a nivel de ciencias médicas y ciencias sociales ya que es muy útil para modelar la probabilidad
de un evento ocurrido en función de otros factores.

Al ser la variable dependiente cualitativa (y binaria) se la codifica con cero o con uno y la función de y ya no sería la media, sino el
logaritmo neperiano de la medida de la odd ratio (OR) del valor uno de la variable.

Odd ratio es una medida de la asociación entre dos variables, que indica la fuerza de la relación entre estas variables. El odd ratio se
utiliza cuando al menos estamos relacionando dos variables.

La recta de regresión quedaría expresada de la siguiente manera: ln(OR)=a+bx

Esta función del ln (OR) se expresa en muchas ocasiones como ln(p/(1-p)), ya que la odds ratio es la probabilidad de que un suceso
ocurra (p) dividida para la probabilidad de que no ocurra (1-p). A esta función se la denomina logit, por lo que podemos ver también
representada la regresión logística de la siguiente forma: logit (y)=a+bx
4/20
Sexto Nivel

Recursos complementarios

Videos explicativos sobre regresión, regresión simple y correlación

Estadística. Regresión y Correlación Lineal. Alejandro Duarte

https://www.youtube.com/watch?v=V3OcXK0zjZ4

5/20
Sexto Nivel

Bibliografía

Galindo, E. (1999). Estadística para la administración y la ingeniería. Ecuador: Gráfica Mediavilla Hnos.

Levin, R. I. & Rubin, D. S. (2004). Estadística para administración y economía. Estados Unidos: Pearson
Educación de México, .S.A. de C. V. https://profefily.com/wp-
content/uploads/2017/12/Estad%C3%ADstica-para-administraci%C3%B3n-y-economia-Richard-I.-
Levin.pdf

Webster, A. L (2000). Estadística aplicada a los negocios y la economía (tercera edición). Santa fe de
Bogotá: Irwin McGraw-Hill. https://www.casadellibro.com/libro-estadistica-aplicada-para-administracion-y-
economia/9788480862691/539147

6/20
1/15
Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 1. Título de la investigación Metodología


investigación
Se considera al título de la investigación como el producto final del proceso de delimitación del
tema de investigación. Es indispensable que este sintetice la idea principal de la investigación de
Resumen una manera sencilla y con el estilo adecuado. Resultados

Debe tomarse en cuenta que hay que evitar las palabras que no sirven para propósitos útiles y
que pueden confundir a las personas. Se recomienda no usar abreviaturas y que este como Discusión de
Introducción
máximo contenga doce palabras. resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Cuando se habla de redacción científica estamos identificando al arte y a la
ciencia para comunicar válidamente conocimientos. Este es un aspecto
inherente al lenguaje que todos los universitarios deben dominar y luego
demostrarlo en sus informes académicos como la tesis de grado, informes,
artículos científicos y otros documentos formales que, una vez elaborados,
estén listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo


tanto, es necesario disponer de lineamientos generales para una estructura
normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura


que lleven.

Según el contenido pueden ser: técnicos, científicos o de divulgación

Según la estructura pueden ser: persuasivos, expositivos y analíticos.

Los informes técnicos son aquellos que provienen de investigaciones sobre


fenómenos sociales, psicológicos o económicos. Para la Carrera de
Educación Básica, estos serán los que más se realicen.

Los informes científicos son aquellos que provienen de investigaciones de las


ciencias exactas que son consideradas las ciencias “duras”.

Los informes de divulgación son aquellos que adaptan los resultados de


investigaciones en los ámbitos anteriormente mencionados para el
conocimiento de cualquier individuo, de tal manera que tengan acceso a esta
información y a las conclusiones sin ser expertos en los temas.

Los informes persuasivos son aquellos que “intentan” convencer a las


personas que los lean o reciban los resultados o conclusiones que se
exponen.

Los informes expositivos son aquellos que utilizan la narrativa para exponer
los resultados y las conclusiones de los hechos que se han investigado.

Los informes analíticos son aquellos que determinan y van a desarrollar las
causas de un hecho o fenómeno que se ha estudiado.

También es importante mencionar que existen dos formas para presentar los
resultados: el contexto académico y el contexto no académico.
Cuando se habla de contexto académico, los resultados se preparan para ser
presentados a un grupo de individuos formado por profesores,
investigadores, alumnos o funcionarios de instituciones de educación
superior o de centros de investigación. (Es un contexto propio para
encuentros científicos o publicaciones del mismo tipo).

En un contexto no académico, los resultados se preparan para ser


presentados a un público general, menos interesado en los detalles de la
investigación, con fines prácticos y en muchas de las ocasiones con carácter
comercial.

Con lo indicado, podemos afirmar, entonces, que el informe de un trabajo de


Investigación es un documento que presenta los resultados derivados de una
investigación, siguiendo el método científico y utilizando adecuadamente las
herramientas que se han aprendido en el transcurso de sus estudios de
pregrado (y en posgrado dependiendo en el nivel de estudios en el que se lo
esté realizando) tomando en consideración el público al que irá dirigido.
Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 2. Resumen Metodología


investigación
Es una redacción breve y global de los contenidos que se desarrollan en la investigación
permitiendo que las personas que presenten interés en el tema hagan una revisión rápida del
Resumen mismo. Resultados

El resumen debe incluir palabras claves, debe ser preciso y únicamente informativo.
Adicionalmente, debe presentar coherencia en sus ideas, legible y conciso y tener una extensión Discusión de
Introducción
de 150 a 250 palabras. (Salazar de Ariza; Barrantes E. & Orellana de Mazariegos, 2015) resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 3. Introducción Metodología


investigación
La redacción de la introducción es proporcionar un contexto de los antecedentes para el trabajo
realizado señalando los fines específicos del estudio sin ahondar en datos o conclusiones de la
Resumen investigación o del trabajo realizado. Resultados
La introducción debe explicar claramente la importancia del estudio del problema que se lleva a
cabo, así como la descripción de trabajos previos, la exposición de supuestos y el diseño de la
investigación. (Salazar de Ariza; Barrantes E. & Orellana de Mazariegos, 2015) Discusión de
Introducción
resultados
Una ayuda para la redacción de la introducción es contestar estas preguntas: (Carretero Ortega,
2005)
Antecedentes Conclusiones
• ¿De qué se trata la investigación propuesta?
• ¿Cuál es su objetivo?
Justificación • ¿De qué trata la investigación propuesta? Referencias
• ¿En qué contexto general se ubica?
• ¿Por qué reviste interés?
• ¿Qué resultados son los más significativos?
Objetivos 2/15 Anexos y apéndices
Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 4. Antecedentes Metodología


investigación
En este elemento se va a presentar la información del estado actual de la investigación en el área
de estudio del trabajo realizado.
Resumen Resultados
En antecedentes va la información sintetizada identificando claramente las relaciones, las
contradicciones y las inconsistencias que se pudiera encontrar en la literatura.
Introducción Discusión de
Esta sección le permitirá al lector entender fácilmente el contenido del informe y del trabajo de resultados
investigación. Puede incluirse figuras y tablas esenciales que permitan organizar y permitir la
comprensión del texto, sin exagerar en su uso. Si es necesario, puede colocar muchas tablas y
Antecedentes gráficos sobre el mismo tema pero en la sección Anexos. Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 5. Justificación Metodología


investigación
En este espacio debe explicar las razones por las cuales realizó la investigación resaltando la
importancia y la aplicabilidad de los resultados obtenidos a partir de aquella.
Resumen Resultados

Introducción Discusión de
resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 6. Objetivos Metodología


investigación
Los objetivos se consideran los resultados que el investigador espera obtener al realizar la
investigación, que permitirán dar respuesta al problema plateado.
Resumen Resultados
En la investigación debe plantear un objetivo general y varios objetivos específicos.

Introducción Discusión de
resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 7. Metodología Metodología


investigación
Aquí se detalla cómo se ha desarrollado el estudio que se está presentando. Debe incluirse una
descripción completa de los métodos empleados de tal manera que los lectores podrán evaluar si
Resumen esta es apropiada y si los resultados obtenidos son confiables y válidos. Resultados

En esta sección deberá incluir (Vicerrectorado de Investigación, 2022):


Introducción Discusión de
• Características de los participantes resultados
• Procedimientos de muestreo
• Tamaño, potencia y precisión de la muestra
Antecedentes • Diseño de la investigación Conclusiones
• Descripción de las manipulaciones experimentales o intervenciones realizadas
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 8. Resultados Metodología


investigación
En esta sección debe resumir y presentar los datos recopilados y el análisis de estos que son de
importancia y relevancia lo que permitirá realizar una discusión posterior.
Resumen Resultados
Debe considerar que tiene que hacer una presentación completa, precisa y sin ningún sesgo de
los resultados utilizando tablas, cuadros o gráficos. (Salazar de Ariza; Barrantes E. & Orellana de
Mazariegos, 2015) Discusión de
Introducción
resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 9. Discusión de resultados Metodología


investigación
En esta parte del informe analiza e interpreta los resultados obtenidos, especialmente con
respecto al supuesto original planteado.
Resumen Resultados
Es importante mencionar que en esta sección debe examinar, interpretar y calificar los resultados,
lo que permite realizar inferencias que, a su vez, llevarán a la obtención de conclusiones.
Introducción Discusión de
resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 10. Conclusiones Metodología


investigación
La sección presentará conclusiones, propuestas e implicaciones que salieron o se obtuvieron
como resultado del trabajo que está presentando tomando como base los objetivos que planteó al
Resumen inicio. Resultados

Introducción Discusión de
resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 11. Referencias Metodología


investigación
Se trata de la bibliografía que se ha utilizado para la investigación. Son los datos de las citas
incluidas en el texto, organizados en orden alfabético a partir del apellido del autor o autores.
Resumen Tome en cuenta las normas que se han solicitado utilizar (comúnmente se pide ocupar Normas Resultados
APA, la edición vigente).

Introducción Discusión de
resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

10.1. Elaboración del informe de investigación o trabajo práctico

Cuando se habla de redacción científica estamos identificando al arte y a la ciencia para comunicar válidamente conocimientos.
Este es un aspecto inherente al lenguaje que todos los universitarios deben dominar y luego demostrarlo en sus informes
académicos como la tesis de grado, informes, artículos científicos y otros documentos formales que, una vez elaborados, estén
listos para ser sometidos al análisis y a una lectura pública.

Los informes pueden producirse en diferentes niveles universitarios; por lo tanto, es necesario disponer de lineamientos generales
para una estructura normalizada de los mismos.

Los informes pueden ser de varios tipos según el contenido y la estructura que lleven.

Según el contenido pueden ser: técnicos científicos o de divulgación


Estructura de un informe de investigación
La estructura recomendada de un informe de investigación (incluso para artículos de revisión, artículos teóricos, artículos
metodológicos o monografías) debe contener:

Título de la 12. Anexos y apéndices Metodología


investigación
Constituye todo el material complementario y adicional que ha utilizado y que le sirvió para el
desarrollo de la investigación. Este material, si hubiera sido colocado en las secciones anteriores,
Resumen podría distraer o ser inadecuado. Resultados

Introducción Discusión de
resultados

Antecedentes Conclusiones
Justificación Referencias

Objetivos 2/15 Anexos y apéndices


Sexto Nivel

Recursos complementarios

Videos explicativos sobre la elaboración de informes de investigación o trabajo


práctico

Elaboración del informe final de investigacion

https://www.youtube.com/watch?v=1VGQP6fnt5o

3/15

También podría gustarte