Estadística en La Investigación Educativa: July 2019

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/334469565
Estadística en la Investigación Educativa
Book · July 2019
CITATION READS
1 2,218
1 author:
Díaz Tito
University of Information Sciences
36 PUBLICATIONS 18 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
La creatividad en el Proceso de Enseñanza Aprendizaje View project
Integration of information technologies into teaching and learning in higher education View project
All content following this page was uploaded by Díaz Tito on 15 July 2019.
The user has requested enhancement of the downloaded file.

En homenaje a Julio Antonio Mella
(Foto del autor)
CURSO CORTO
RELME 33
UNIVERSIDAD DE LAS
CIENCIAS INFORMÁTICAS
CUBA 2019
Dr.C., Ing. Tito Díaz Bravo

ESTADÍSTICA EN LA
INVESTIGACIÓN
EDUCATIVA
Curso Estadística en la Investigación Educativa - RELME 33 - La Habana, 2019
Índice
Contenido Página
Prólogo 3
1. Investigación educativa. Introducción a la Metodología de la 4
Investigación. Variables en la investigación, tipos y escala de
medición
1.1 Investigación Educativa 4
1.2 Introducción a la Metodología de la Investigación Educativa 7
1.2.1 Algunas clasificaciones de las investigaciones científicas 7
1.2.2 Pasos en la investigación educativa 11
1.3 Variables en la investigación, tipos y escala de medición 14
1.3.1 Variables en la investigación 14
1.3.2 Escalas de medición 17
1.3.3 Operacionalización de las variables de significado complejo o 20
constructos
2. Nociones de Probabilidades y Estadística. Estadística y Método 22
Estadístico. Estadística Descriptiva y Estadística Inferencial. Muestreo
2.1 Nociones de Probabilidades 22
2.1.1 Probabilidades y variables discretas. Distribución Uniforme. 26
Distribución Binomial
2.1.1.1 Definiciones de Probabilidad 30
2.1.1.2 Distribución Binomial 31
2.1.2 Probabilidades y variables continuas. Distribuciones Normal, t de 33
Student y Ji (Chi) Cuadrado
2.1.2.1 Distribuciones Normal y t de Student 34
2.1.2.2 Distribuciones Ji (Chi) Cuadrado 40
2.2 Estadística, Método Estadístico y Tipos de Muestreo 41
2.2.1 Estadística y Método Estadístico 41
2.2.1.1 Método Estadístico 43

2.2.2 Muestra. Tipos de muestreo 47
2.2.3 Factores que deben tenerse en cuenta para obtener una buena 49
muestra
2.2.4 Procedimientos de muestreo probabilístico. Muestreos Aleatorios 50
Simple, Estratificado y por Conglomerados
1
2.2.5 Muestreos en procesos continuos 54

2.2.6 Parámetros (estadísticos, estadígrafos) poblacionales y muestrales 55
2.2.7 Distribución muestral de la media aritmética, cuando la variable 62
original es normal
2.3 Estimación puntual y por intervalos 64
2.3.1 Estimación por intervalo de confianza de la media poblacional (µ) 64
con 𝜎 conocida y desconocida
2.3.2 Estimación por intervalo de confianza de una proporción poblacional 66
(P)
2.3.3 Precisión y tamaño de muestra 67
3. Elementos de Estadística Inferencial (Paramétrica y no Paramétrica) 71
3.1 Estadística Inferencial paramétrica 72
3.1.1 Errores de Tipos I y II. Nivel de significación 75
3.1.2 Pruebas de bondad de ajuste 77
3.1.3 Pruebas de Hipótesis acerca de la media poblacional 𝝁, con  77
conocida y desconocida
3.1.4 Prueba de Hipótesis acerca de una Proporción Poblacional 81
3.1.5 Estadística Inferencial no paramétrica 82
Referencias
Anexo 1. Hoja de datos, calificaciones de estudiantes de 3 grupos, en 86
escala de 0 a 20
Anexo 2. Funciones estadísticas del EXCEL 87
2
Prólogo
El presente documento recoge en síntesis información imprescindible para apoyar

el curso Estadística en la Investigación Educativa, a ser impartido como parte de
las actividades de RELME 33. Es de esperar que el número de horas que le
programen seguramente sea muy reducido y en consecuencia se ajustan los
objetivos a alcanzar, a esta condición determinante. En adición, está presente la
circunstancia de deber dedicársele alguna fracción del tiempo a contenidos
propios de Metodología de la Investigación Educativa, dada la muy estrecha
relación existente entre las dos áreas de conocimientos explícitas en el nombre del
curso que nos ocupa. El curso se impartirá propiciando un protagonismo dinámico
de los participantes en los contenidos a tratar, a partir de la experiencia de la que
sean portadores, obtenida en su labor profesional.
Será especialmente útil la literatura científica pertinente y actualizada, accedida

por internet. Se utilizaran recursos de las Tecnologías de la Información y las
Comunicaciones, lo que resulta deseable en las acciones de formación a llevar a
cabo; y con un enfoque de semipresencialidad, flexible en su naturaleza, para
satisfacer necesidades de los participantes.
Índice
3
1. Investigación educativa. Introducción a la Metodología de la Investigación

Educativa. Variables en la investigación, tipos y escala de medición
1.1 Investigación Educativa
La denominación de Investigación Educativa, un poco rara y que aparentemente

niega que otras llevadas a cabo en entornos diferentes no lo sean (más bien
debería llamársele Investigación en Educación), es extendida en la parte de la
comunidad científica que se ocupa de mejorar la educación y en particular lo
concerniente a los procesos de enseñanza y aprendizaje. Una versión del
concepto, la presenta Rosas Becerril (2018):
"Hablar de investigación educativa es hablar de un proceso de

construcción, explicación y comprensión del fenómeno educativo, en el que
se presenta la producción de conocimientos vinculados a la vida social y la
intervención de diversos campos de conocimiento como la sociología, la
psicología, la antropología y la economía (Calvo, et al. 2008; Herrera,
1999). Lo anterior nos lleva a pensar en una interacción de carácter
disciplinario, a partir de un marco metodológico, en donde no baste con
ordenar ideas y conocimientos, sino también generar resultados diversos
que planteen nuevas ideas, conceptos y teorías en donde se vean
involucrados comportamientos, valores y actitudes, que pueden llevar a
plantear a la investigación educativa como una disciplina dentro del ámbito
educativo, cuya naturaleza involucre expresiones y problemas de carácter
epistemológico y metodológico; su objetivo será la búsqueda de
conocimiento que nos permitirá llegar a nuevas concepciones y significados
en la resolución de problemas educativos."
En lo adelante se adopta el concepto expuesto anteriormente, en el que se

expresa que la investigación educativa es el proceso de construcción, explicación
y comprensión del fenómeno educativo, del cual se genera la producción de
conocimientos que permite llegar a nuevas concepciones y significados en la
resolución de problemas educativos que transcurren influenciados por diversos
factores, de los que puede añadirse que acrecientan su complejidad.
Las sociedades de los distintos países organizan sus distintos niveles de

subsistemas de educación con vistas a la formación de niños y jóvenes para
enfrentar la vida y satisfacer las demandas de fuerza de trabajo existente en los
distintos sectores que la conforman. Es en el entorno de los procesos de
enseñanza y aprendizaje, en el que interaccionan educandos y educadores,
4
siendo necesario atender la eficacia con el que transcurren estos procesos

complejos. Así, la investigación educativa es la actividad que desarrollan
profesionales de la educación para ir obteniendo nuevos conocimientos que den
solución a las problemáticas existentes, las cuales influyen con efectos negativos
en los resultados deseados. Existe abundante literatura sobre la investigación
educativa; en particular sobre este tipo de investigación, Rosas (2018) expresa:
"En conclusión, uno de los aspectos importantes en el que se desarrolló la

investigación educativa, se centra en la construcción del fenómeno
educativo vinculado a diversos campos de conocimiento, cuya historia
marca un análisis y búsqueda de saberes y conocimientos que permiten
llegar a concepciones y significados en la resolución de problemas a través
de diversas disciplinas. En consecuencia, se innovará la práctica educativa
mejorando los procesos de enseñanza y aprendizaje en donde se desarrolla
una metodología que involucra la formación de profesionales con perfiles
definidos formados en instituciones cuya actividad llevan al ejercicio de la
investigación y que han transitado por diversos momentos históricos que las
ha hecho ser reconocidas como las verdaderas fundadoras de la
investigación educativa."
En el ámbito mexicano, una obra de especial importancia es la de Buendía y

Álvarez (2019), en la que se refieren a la investigación educativa ante el cambio
de gobierno en su país, resaltando la situación que se presenta en:
I. Desigualdad, calidad y equidad en la educación

II. Gobernanza, políticas y gestión
III. El alcance de las estrategias de evaluación docente implementadas en
el sistema educativo para la justicia social: equidad e inclusión
IV. Evaluación de los aprendizajes y de los docentes en la educación básica
V. Los profesores del sistema educativo mexicano: formación, actualización
y prácticas académicas en educación básica y media superior
VI. La formación y actualización de profesores en México. Avances,
retrocesos y propuestas
VII. El Modelo Educativo 2017, el currículo y el aprendizaje: perspectivas
críticas
VIII. Inclusión, equidad y violencia escolar en la educación media y superior
IX. Educación de jóvenes y adultos: rezago educativo y alfabetizaciones
X. Educación y trabajo
XI. La evaluación del trabajo académico en la educación superior
XII. Financiamiento educativo. Retos y alcances para una educación
5
XIII. Sociedad, economía y políticas de ciencia y tecnología con calidad y con

justicia
Los trece temas integrados en la obra anterior, cubren un extenso e importante

conjunto de aspectos sobre los que se han venido llevando a cabo investigaciones
educativas en ese país y que les sirven de referentes además, para próximas
investigaciones a llevar a cabo en un futuro,
Se investiga para obtener nuevos conocimientos que permitan resolver

problemáticas que afectan la actividad en determinada instancia. Qué, para qué y
cómo investigar, son tres interrogantes iniciales trascendentes que deben ser
respondidas de modo convincente.
En aquellas actividades en que nos desempeñamos y para las cuales hemos

alcanzado una competencia apropiada, somos capaces de identificar los aspectos
buenos, regulares y malos que prevalecen, lo que nos permite iniciar el camino de
la selección de un tema de investigación, factible de llevar a cabo, con el propósito
de contribuir a la solución de algún problema existente que sea tanto de interés
personal como para la comunidad a la que se tributa - (Qué investigar).
Existe una necesidad imperiosa de mejorar la efectividad de los procesos de

enseñanza y aprendizaje, de lograr cada vez más un aprendizaje perdurable, una
enseñanza que responda a las necesidades de los entornos en los que se
desempeñarán los futuros egresados, que influya en sus habilidades de
autosuperación continua, y con una decisiva integración de las tecnologías de la
información y las comunicaciones, TIC - (Para qué investigar).
La Metodología de la Investigación Educativa en esencia no se diferencia de la
Metodología de la Investigación en general, sino que la primera se ocupa de tratar
de darles solución a un subconjunto de problemas que pudieran considerarse
también de los que corresponden a la segunda. Así los pasos básicos en una y
otra son de hecho los mismos que deben llevarse a cabo en cualquier trabajo de
investigación. No obstante, dado que existe disponible una valiosa y extensa
bibliografía específica de Metodología de la Investigación Educativa, será esta la
priorizada en las referencias a las que se haga alusión a lo largo del presente
documento, en particular las del ámbito latinoamericano - (Cómo investigar).
Índice
6
1.2 Introducción a la Metodología de la Investigación Educativa
1.2.1 Algunas clasificaciones de las investigaciones científicas
Existen clasificaciones generales para las investigaciones científicas, que

constituyen referentes valiosos para orientarse en las circunstancias en las que el
investigador debe llevar a cabo su labor en determinados momentos. Algunas de
dichas clasificaciones toman en cuenta distintos aspectos, como son:
El nivel de conocimiento precedente, de partida

Grado de profundidad del estudio a llevarse a cabo
Enfoque o paradigma en el que se sustenta: cuantitativo, cualitativo y mixto
Atención a la dinámica de las variables bajo estudio, debe hacerse en corto
tiempo – transversal, y puede realizarse sin que apremie tanto el tiempo,
longitudinal
Ausencia o presencia de experimentación
Ampliando ligeramente la información sobre las clasificaciones que toman en
cuenta los aspectos enumerados antes, se tiene:
I. De acuerdo al nivel de conocimiento de partida: Puras o Fundamentales,

Aplicadas, y De desarrollo. En las diferencias entre estas, el nivel de
conocimientos existentes del cual se parte es definitorio. En el caso de la Puras
o Fundamentales, es inexistente el conocimiento previo sobre lo que se estudia;
están dirigidas precisamente a identificar características, propiedades,
comportamientos, sobre lo nuevo que se decide estudiar. De antemano no está
siquiera prevista la aplicabilidad de los posibles hallazgos que deban tener
lugar. Se llevan a cabo en instituciones de muy alto prestigio, son propias de
países con alto nivel de desarrollo económico y científico. Las investigaciones
Puras o Fundamentales se distinguen además por ser las de mayores
requerimientos de personal de elevada calificación, equipamiento,
financiamiento y tiempo para realizarse. Tales requerimientos disminuyen de las
Puras o Fundamentales a las De Desarrollo. Las Aplicadas se apoyan en
conocimientos ya existentes (obtenidos en investigaciones Puras o
Fundamentales, a cuyos resultados se haya tenido acceso) para resolver
problemáticas latentes de interés, de aquí su denominación de Aplicadas;
resultan más numerosas que las mencionadas antes. Y las menos complejas
son las De Desarrollo, entre las que pueden citarse las de transferencia de
tecnología.
II. Grado de profundidad del estudio a llevarse a cabo, de las más elementales a
las de mayor alcance respecto a las posibles respuestas a dar (según la
profundidad o alcance previsto, la complejidad esperada): Observacionales,
7
Descriptivas, Explicativas (No experimentales y experimentales). En estas,

a partir de la segunda, incluyen en su realización a las que le anteceden.
III. Respecto al paradigma (enfoque) de investigación, se subdividen en

Cualitativas, Cuantitativas y Mixtas.
A continuación ejemplos de investigaciones de los tres tipos de paradigmas o

enfoques mencionados.
Ejemplo 1
En una investigación acerca de las preferencias de los estudiantes del nivel

preuniversitario respecto a estudiar una u otra carrera universitaria, se está en
el enfoque cualitativo.
Fin del ejemplo 1
Ejemplo 2
Cuantitativas podrían ser investigaciones en las que se centraran los objetivos

en el tiempo que les lleva a los estudiantes llegar a la escuela y retornar a sus
casas diariamente.
Fin del ejemplo 2
Ejemplo 3
Una investigación de rendimiento docente de los estudiantes que tome en

cuenta el tiempo diario (cuantitativa) de estudio y las modalidades (individual,
colectiva y combinada) de ese estudio, es de corte mixto.
Fin del ejemplo 3
Cabe puntualizar que las investigaciones educativas más frecuentes son las de
paradigma mixto.
IV. En dependencia con el tiempo a ejecutarse: Longitudinales y Transversales.

Esto tiene relación con la sensibilidad al cambio en el tiempo de la variable
bajo estudio.
Ejemplo 4
Si la variable bajo estudio cambia en el orden de los años, como ocurre con
las teorías del aprendizaje, la investigación puede llevarse a cabo digamos,
durante varios meses y hasta más de un año, y sería una investigación
8
longitudinal. Si se estuviera indagando entre los estudiantes, sobre la

disponibilidad de dispositivos móviles con determinadas prestaciones, debería
planificarse en cuestión de días o semanas, dado que dicha tecnología viene
cambiando en términos menores de un año; se trataría de una investigación
transversal.
Fin del ejemplo 4
V. Forma de proceder, posibilidad y necesidad o no de realización de

experimentos: No experimentales y Experimentales. Generalmente las no
experimentales resultan más sencillas que las experimentales. En las no
experimentales se trabaja con dos muestras, tales que la variable
independiente posee de forma espontánea un valor en una de las muestras y
otro valor en la otra muestra. En las experimentales existe al menos una
variable independiente sobre la que el investigador está en la posibilidad de
efectuar cambios según sus criterios, para apreciar qué efectos se producen
sobre la variable dependiente bajo estudio. En muchos casos de
investigaciones educativas, el aula o la institución de enseñanza, son los
laboratorios en los que se lleva a cabo la investigación.
Ejemplo 5
Un estudio no experimental sobre la influencia de la disponibilidad de

aplicaciones en dispositivos móviles, de contenidos de una asignatura
determinada versus la no disponibilidad de tales aplicaciones, en el
rendimiento docente de dicha asignatura, estaría planteando la necesidad de
identificar dos muestras en la población de interés: una de estudiantes con la
disponibilidad aludida, y la otra sin dicha disponibilidad. Es no experimental
porque el investigador no influye sobre la existencia de la disponibilidad de las
aplicaciones referidas; tal disponibilidad se presenta de modo natural.
Fin del ejemplo 5
Ejemplo 6
Suponga que se experimenta sobre el rendimiento docente en una asignatura,

planificando una hora de estudio de esa asignatura, fuera del horario de clases
y bajo la atención del profesor, dos veces a la semana, durante todo el periodo
de clases. Una parte de los alumnos se incorpora a la actividad y la otra no,
supuesto que ambas muestras sean similares respecto al rendimiento docente
anterior al inicio del experimento. (Esta situación es de reconocer que no
resulta sencilla de alcanzar, más aún cuando toda investigación debe
responder a la ética educativa, que estaría violentándose si se le limita el
derecho de incorporarse al que lo desee). Por lo descrito antes, esta es una
9
investigación experimental; lo de una hora de estudio como se expuso, fue

decisión del investigador y así, una muestra transcurrió el periodo bajo un
régimen, y la otra no. Al final habrá que analizar si existen o no diferencias
significativas en el rendimiento docente de la asignatura para la que se diseñó
el experimento.
Fin del ejemplo 6
Las anteriores clasificaciones trascienden lo formal para convertirse en

referencias importantes que le van permitiendo al investigador tener más
conocimientos generales sobre lo que pudiera interesarle (o verse obligado a)
hacer en un momento determinado y decidir incluso hasta dónde llegar de
acuerdo a sus posibilidades. Cualquiera que sea la clasificación apropiada,
estarán presentes las interrogantes planteadas antes (Qué, Para qué y Cómo
investigar), junto a otros elementos de importancia a tomar en consideración en
una investigación. Cabe señalar que cualquier investigación puede ser ubicada
en más de una de las clasificaciones anteriores; por ejemplo:
- Las Observacionales y las Descriptivas son ambas, asimismo, No
explicativas y De Desarrollo, y pudieran ser además Transversales o
Longitudinales. Y además estar atendiendo a alguno de los enfoques o
paradigmas Cualitativo, Cuantitativo o Mixto.
- Las Experimentales generalmente son Longitudinales y Mixtas. Y no son ni

Observacionales ni Descriptivas, con estas se está buscando influencias de
una o más variables (independientes) sobre al menos alguna otra
dependiente); son de naturaleza Explicativas. Por lo general corresponden
a las Aplicadas o De Desarrollo.
- Las Descriptivas son No experimentales, y pudieran ser Transversales o

Longitudinales. Además pudieran estarse llevando a cabo con cualquiera
de los tres paradigmas Cualitativo, Cuantitativo o Mixto.
En particular, refiriéndose a los enfoques cualitativo y cuantitativo de investigación,

Martínez (2008) expresa:
Tanto si se trabaja con un enfoque o con el otro, el investigador necesita ser

riguroso, pero también creativo; ser parte de la investigación y poder
reflexionar sobre ella. El maestro del siglo XXI, deberá ser una gran
persona con gran capacidad de autorreflexión y prospectiva sobre su propia
acción; esto implica formarse en una actitud investigativa, convirtiendo sus
asignaturas en fuentes de estudio. Construyendo, deconstruyendo y
reconstruyendo permanentemente su acción pedagógica cada día.”
10
Las cualidades y el proceder del investigador formador, y el carácter riguroso,

creativo, dialéctico y de desarrollo en espiral de la investigación educativa, quedan
brillantemente sintetizados en el párrafo anterior.
Qué resultados científicos se espera obtener como resultado de una investigación

educativa, es una cuestión que determina de antemano el tipo de investigación
que se llevará a cabo. Entre las varias clasificaciones existentes para estos
resultados, se encuentra la que atiende al aspecto de la realidad que se
transforma, en específico: la teoría o la práctica. Al respecto De Armas Ramírez y
Valle Lima (2011) plantean:
"Los resultados teóricos son aquellos que permiten enriquecer; modificar o

perfeccionar la teoría científica, aportando conocimientos sobre el objeto y
sobre los métodos de la investigación de la ciencia, que pueden ser
clasificados a su vez en sistemas de conocimientos y metodológicos ̎. Y
sobre los resultados prácticos consideran que ̎… se incluyen aquellos que
tienen un carácter instrumental para transformar el funcionamiento del
objeto en la realidad haciéndolo más eficiente, más productivo y más viable,
entre ellos señalamos: programas, estrategias, tecnologías, metodologías
de trabajo, medios de enseñanza, modelos materiales y otros."
Índice
1.2.2 Pasos en la investigación educativa
Existen una serie de pasos presentes en la mayor parte de las investigaciones,

que resultan comunes indistintamente de lo que se requiera investigar; no es
propósito del presente documento entrar en detalles de lo interno en dichos pasos.
Entre los numerosos libros que se han escrito de esta materia, caben citarse las
ediciones 5ta, y 6ta. de Metodología de la Investigación, de los autores Hernández
Sampieri, Fernández Collado y Baptista Lucio (2010) y (2014), obras estas
valiosas, detalladas y extensas, ricas en ejemplos incluidos de investigaciones
educativas, apropiadas para el autoestudio y de apoyo a cursos extensos de dicha
temática.
Sin embargo, para el propósito del presente documento se prefiere dirigir la

atención del lector al Manual para la elaboración de las investigaciones
educativas, de Martínez Barrientos (2008), porque en el mismo los interesados
podrán encontrar una información bastante resumida y enfocada plenamente al
tipo de investigación de la que estamos tratando. Asimismo dicha autora,
atendiendo a necesidades de la Carrera de Educación en la que es profesora, se
circunscribe a solo dos formas básicas diferentes, la investigación aplicada
cuantitativa o investigación cuasi-experimental, y la investigación aplicada
11
cualitativa o investigación acción. De su Manual, y suponiendo que de las

Recomendaciones pueda ser emprendida una nueva investigación, se ilustran en
la Figura 1 los pasos a realizar en una Investigación Educativa.
El documento resultante de la propuesta de investigación recoge la información de

los tres primeros pasos de la Figura 1; algunos autores le denominan Diseño
teórico y metodológico de la investigación. En "Método" debe incluirse hasta el
cronograma para ejecutar las acciones necesarias que permitan alcanzar el
objetivo propuesto, por lo que estarán presentes las tareas concernientes al propio
desarrollo de la investigación, la recopilación y análisis de resultados, y la escritura
del informe final. En numerosos casos esta propuesta debe presentarse a modo
de Protocolo o Proyecto de investigación, debiéndose cumplir con toda la
información requerida por los destinatarios encargados de evaluar y aprobar o no
la propuesta en cuestión.
12
Marco
contextual
Presentación de la
problemática
Conclusiones y (Planteamiento del
Problema -
Recomendaciones Justificación - Marco
teórico de referencia
- Objetivos )
Método (Características de la
investigación - Hipótesis -
Participantes - Ambiente -
Variables / Categorías de
Resultados investigación - Instrumentos y
Técnicas - Diseño de
investigación - Procedimiento)
Figura 1. Pasos en la Investigación Educativa (Síntesis realizada a partir del

Manual para la elaboración de investigaciones educativas, de Alejandra
Martínez Barrientos, 2008)
Índice
13
1.3 Variables en la investigación, tipos y escala de medición
1.3.1 Variables en la investigación
Al concepto de variable nos aproximamos desde edades tempranas en la vida,

primero desde la familia y después se incorporan las influencias de la sociedad y
la escuela; intuitivamente conocemos que los sabores difieren, lo que nos gusta o
no nos gusta; lo que nos resulta entretenido o aburrido, interesante o sin
importancia; número de hijos; carácter agradable o desagradable de las personas
con las que nos relacionamos; edad; estatura alcanzada en determinado momento
de la vida; temperatura corporal; año que se cursa en uno u otro nivel de
educación; calificación obtenida en alguna asignatura, entre otras. En la Tabla 1
se introduce una primera posible clasificación para las diez variables acabadas de
mencionar.
Tabla 1. Ejemplos de variables y una posible variante de clasificación atendiendo a

la naturaleza de estas.
Cualitativa Cuantitativa
Cualitativa/
Variable
cuantitativa Nominal Ordinal Continua Discreta
Entorno de
1 Cualitativa x
influencias
2 Sabor Cualitativa x
Grado de
3 Cualitativa x
entretenimiento
4 Nivel de interés Cualitativa x
5 Número de hijos Cuantitativa x
Afinidad al
6 Cualitativa x
carácter de otro
7 Estatura Cuantitativa x
Tiempo
transcurrido
8 Cuantitativa x
realizando una
evaluación
Año escolar que
9 Cuantitativa x
se está cursando
Calificación
10 obtenida en una Cuantitativa x
asignatura
Otros autores como Newbold, Carlson, & Thorne (2008), a las variables
cualitativas le denominan categóricas y lo asocian a que estas producen
respuestas que pertenecen a grupos o categorías, lo cual es equivalente a lo
expresado en el presente documento para tales variables. Especifican dichos
14
autores que una variable numérica continua puede tomar cualquier valor de un
intervalo dado de números reales y normalmente proviene de un proceso de
medición (no de recuento) y que en todos los casos, el valor podría desviarse
dentro de un cierto margen, dependiendo de la precisión del instrumento de
medición utilizado.
Lo mostrado en la Tabla 1 puede cambiar como se verá de inmediato. Un poco

más de información al respecto, sin pretensión de exhaustividad resulta necesaria.
En general, para clasificar a una variable como cualitativa debe partir tanto de su
naturaleza, como de la forma en que nos interese tratar a dicha variable. Si lo
esencial es un atributo de calidad, que no permite o amerita distinción de orden o
preferencia entre los distintos valores que constituyen los resultados posibles, se
considera cualitativa nominal (Entorno de influencias – Lugar: casa, escuela,
parque, calle, etc.); por supuesto, que pudiera en determinada investigación
considerarse como cualitativa ordinal, si en el estudio en cuestión fuese importante
considerar el nivel de preferencia por uno u otro entorno. El Sabor, atendiendo a
que guste o no guste, es cualitativa ordinal; ahora, si interesase solo especificar
cuan dulce es un alimento, pudiera llegar a ser tratada como cuantitativa continua
y se estaría midiendo en base a la concentración de azúcar existente en dicho
alimento. El Tiempo transcurrido en la realización de una evaluación final escrita
por parte de un estudiante, a partir del inicio de la actividad en cualquier
asignatura, es por su esencia cuantitativa continua; sin embargo, como
ordinariamente es suficiente medirlo en horas y minutos, el tratamiento puede ser
el de variable cuantitativa discreta; por otra parte, se estaría considerando como
cualitativa ordinal, si solo se registran para cada estudiante dos niveles: Si y No
(respecto a si el tiempo máximo programado para esta evaluación, le resultó
suficiente o no para responder las preguntas formuladas).
Es de esperar que según el tipo de investigación (Cualitativas, Cuantitativas y

Mixtas), serán las variables predominantes en esta. En el contexto de una
investigación, las denominaciones siguientes resultan de especial relevancia para
distinguir el tipo de variable:
Dependientes: Variables que indican si el tratamiento o manipulación de las

variables independientes tuvo algún efecto. Se les denomina también variables
resultantes, efectos o variables de criterio. Por ejemplo, calificación en una
asignatura. En las investigaciones con frecuencia interesa solo una variable
dependiente.
Independientes: Variables que se manipulan por interés del investigador para

estudiar el efecto que producen en las variables dependientes. Se les llama a
veces tratamientos, factores o variables predictivas. Por ejemplo, cantidad de
15
horas presenciales dedicadas a la impartición de una asignatura (al menos hay

que considerar dos niveles, digamos impartición con 70 horas y con 90 horas). La
consideración de solo una variable independiente simplifica marcadamente el
estudio que pueda estar llevándose a cabo, aunque lo puede limitar notablemente
en su alcance.
De control: Variables relacionadas con las variables dependientes y cuya

influencia debe eliminarse. Por ejemplo, la hora y la sesión del día en que se
imparte una asignatura pudiera influir en el aprendizaje de esta; existe consenso
en que la sesión de la mañana es más apropiada que la de la tarde y que los
primeros turnos dentro de la sesión son asimismo los más favorables para el
aprendizaje.
Extrañas: Variables relacionadas con las variables dependientes o

independientes pero que no forman parte del experimento. Se les denominan en
ocasiones como variables amenazadoras. Un ejemplo lo constituye la cantidad
de clases previstas pero no impartidas.
Moderadoras: Variables relacionadas con las variables independientes y

dependientes y que tienen impacto en las variables dependientes. Se les llama
también variables de interacción. Por ejemplo, nivel de confort del salón en el
que tienen lugar las clases.
Otras clasificaciones de las variables resultan también de importancia en el

contexto de una investigación, como lo son:
Variables Cualitativas y Cuantitativas
Esta clasificación fue mencionada antes; se amplían de inmediato aspectos de

interés de la misma. Las Cualitativas incorporan la información de alguna cualidad,
y las Cuantitativas de algún atributo cuantificable, como sugieren sus respectivas
denominaciones.
Las Cualitativas a su vez se dividen en Nominales y Ordinales. Las Nominales

pueden ser Dicotómicas (por ejemplo: sexo biológico de una persona) o
Politómicas (por ejemplo: Centro Docente en el que un alumno cursó sus
estudios de preuniversitario, bajo el supuesto de que existan más de dos centros
de ese nivel de estudio).
Por su parte, las Cuantitativas pueden ser Continuas (p.e. tiempo transcurrido
desde el inicio de una actividad evaluativa) o Discretas (p.e. Cantidad de clases
de una asignatura específica en una semana)
16
Variables Determinísticas y Aleatorias (también denominada esta última como

estocásticas o probabilísticas)
Esta subdivisión obedece al nivel de incertidumbre asociado a los posibles valores

que puede tomar la variable. Nivel de incertidumbre cero es el asociado a los
posibles valores de una variable determinística, como es el caso de la posición
del planeta Tierra con respecto al Sol en un momento determinado. Y como
variable aleatoria puede mencionarse al resultado posible (aprobado o
desaprobado) de un estudiante en una evaluación.
Índice
1.3.2 Escalas de medición
Es conocido que el nivel de medida de una variable en matemática y estadística,

denominado además como escala de medición, es una clasificación adoptada con
el propósito de identificar la naturaleza de la información contenida dentro de los
caracteres alfanuméricos que registran valores de los atributos de los objetos y
sujetos, y por tanto, corresponden a datos de una variable. Las escalas de
medición son propias para cada tipo de variable; las de mayor grado de
información de sus posibles valores, corresponde a las cuantitativas continuas; le
siguen las cuantitativas discretas, después las cualitativas ordinales; y ya para las
cualitativas nominales no existe escala, sus posibles valores tienen una
importancia similar, no son siquiera ordenables por tipo de ventaja alguna.
Las dos escalas propias de variables cuantitativas son: 1. Escala de intervalo (se
caracteriza por la invariabilidad de las longitudes de dos intervalos cualesquiera,
bajo un cambio de escala del tipo y= ax + b). Y, 2. Escala de razón (similar a la de
intervalo, pero respecto a la transformación y= ax. La mayor diferencia entre
ambas escalas consiste en que en la primera el cero es relativo, mientras que en
la segunda es absoluto. Ejemplos de ambos tipos de escalas se encuentran en las
utilizadas para medir la variable Temperatura; Las escalas Celsius y Fahrenheit
son de intervalo, y sus ceros se establecieron de forma relativa, a partir del punto
de congelación del agua para la Celsius, y de una disolución saturada de sal
común en agua en la Farenheit. Para convertir de Celsius a Farenheit se emplea
ºF = 9/5 ºC + 32. Mientras que la escala Kelvin es de razón, pues se estableció a
partir de la existencia de un cero absoluto calculado experimentalmente
(aproximadamente -273 ºC).
En el caso de las variables cualitativas, la definición de sus categorías debe

cumplir tres condiciones principales: 1. Categorías mutuamente excluyentes. 2.
17
Ser exhaustivas, o sea, cubrir todos los casos que pudieran existir. Y, 3. Las
categorías deben precisarse lo suficiente, como para ser medidas.
En cuestionarios de recogida de opiniones, la información a registrar sobre

determinado aspecto, puede tomar la forma de una variable cualitativa ordinal
politómica. En este caso se recomienda que se utilice un número impar de niveles
o categorías (con simetría adecuada); estaría entonces en decidirse por tres, cinco
o siete; tres implica perdida de información y siete apunta a exceso de desglose;
en consecuencia, se recomienda asumir cinco; por ejemplo, para Grado de
interés, se estaría preguntando del modo siguiente:
 Muy bajo o Inexistente

 Bajo
 Medio
 Alto
 Muy alto o Total
Una variante práctica de escala en este tipo de requerimiento de información, es la

de solicitar que, en escalas ascendentes de 0 a 5, o de 0 a 10, especificando que
0 es lo peor, y 5 o 10 lo mejor, según seleccione una u otra, indique el número que
se corresponda con su criterio al respecto.
Las operaciones aritméticas comunes (+, -, * y /) y la mayor parte de los cálculos

de estadísticos o estadígrafos (a presentar más adelante), se realizan solo con
variables cuantitativas. El tipo de prueba estadística permitida y gráficos a obtener,
dependerán de los tipos de variables con los que se esté trabajando.
De las escalas para calificación de evaluaciones docentes que se han utilizado en

la Educación Superior en Cuba, pueden citarse la de 0 a 100, con el aprobado en
70 durante un buen tiempo (en algunos lugares y momentos con 60), y ya
oficialmente descartada; y la actual, de 2- Desaprobado, 3- Aprobado, 4- Notable,
y 5- Excelente. Esta última es muy mala por su asimetría; posee solo una
categoría para los desaprobados y tres para los aprobados; buena parte de los
análisis docentes se apoyan en tratamientos estadísticos de media aritmética, lo
que reduce la calidad de la información utilizada y disminuye la credibilidad de las
conclusiones expuestas, causado parcialmente por el uso de una escala en
extremo inapropiada. Da pena observar el desconocimiento, desatención o
resignación, que numerosos directivos docentes muestran en sus análisis al
respecto. El autor del presente documento preferiría escalas de 0 a 10, o de 0 a
20, las que sin dejar de ser de carácter cualitativo, permitirían distinguir mejor los
niveles de aprendizaje mostrados por el estudiante.
18
Ejercicio 1
A partir de la información de la Figura 2:
a. Clasifique la variable en las diferentes variantes con las que podría asumirse.
Aprecie que falta la denominación del intervalo de la extrema izquierda y su
valor de área bajo la curva, y un valor dentro de uno de los paréntesis,
¡complételos!
b. Ubique en la vertical correspondiente del eje horizontal en blanco, los valores

de Z que corresponden a los coeficientes de inteligencia estandarizados,
CI−100
considerando 𝑍 =
15
Coeficiente de
Inteligencia
estandarizado
(Z)
Figura 2. Coeficiente de inteligencia (Tomada de: (Tomado de:
https://sites.google.com/site/estadisticadescriptivaenedu/4o-sem-estadistica-
aplicada-a-la-investigacion-educativa )
Nota: El autor del presente documento, al igual que muchos otros profesionales,
estima que asumir mecánicamente el alcance del significado del coeficiente
de inteligencia para encasillar a las personas, es cuestionable. Sin
embargo, considerándolo a modo de diagnóstico resulta una información de
valor.
Fin del Ejercicio 1 Índice
19
1.3.3 Operacionalización de las variables de significado complejo o

constructos
Existen variables con distintos niveles de complejidad; las sencillas no hay que
operacionalizarlas, sus valores se recopilan directamente como lo son las
calificaciones resultantes en una evaluación, las horas de inasistencia de un
estudiante a las clases de una asignatura, los años de experiencia en la docencia
de un profesor, etc. Es suficiente identificar el tipo de variable y la correspondiente
escala de medición a utilizar. Otra situación tiene lugar con las que no resultan
sencillas de medir; a estas se les denominan Constructos, término proveniente
de la sicología en la que son tratadas como entidades hipotéticas de difícil
definición dentro de alguna teoría científica. Un constructo es algo que nos
encontramos, pero cuya definición es difícil o controvertida, es un fenómeno
no tangible que mediante un proceso particular de operacionalización se convierte
en una variable que puede ser medida y estudiada.
Algunos de los constructos que aparecen con frecuencia en las investigaciones

educativas son la inteligencia, la motivación y la efectividad de una estrategia de
enseñanza, por ejemplo. En estos casos se pueden definir dimensiones en las
que se consideran a su vez, indicadores los cuales si pueden medirse y es a
través de la información recopilada de estos últimos, que se asignan determinados
niveles o valores al constructo o variable original de significado complejo de
la que se necesita obtener información en las condiciones de un estudio dado. No
es objetivo del presente documento un tratamiento en mayor grado de detalles de
tales variables; se le recomienda al interesado que mediante un estudio
documental identifique cuál es el consenso actualizado del tratamiento de
variables de tal naturaleza con la que necesite trabajar en un momento dado, no
obstante y a continuación se hace alusión a un interesante trabajo publicado
recientemente.
Un buen ejemplo de operacionalización de variables es el publicado por Montes

Castillo, Valencia Castillo y Gracia Olivas (2017). Estos autores realizaron la
investigación Indicadores de uso y aceptación de redes sociales virtuales en
jóvenes de escuelas secundarias públicas en Sonora. Muestran resultados
preliminares de 100 jóvenes de 8 secundarias públicas, sobre el uso y aceptación
de redes sociales. Identifican 7 dimensiones con un total de 26 indicadores. Los
indicadores los trabajan como variables cualitativas ordinales, a responder cada
uno a partir de: Siempre/Casi siempre/A veces/Nunca. En la Tabla 2 se muestran
las dimensiones e indicadores, considerados por los autores mencionados antes.
20
Los autores desglosan sus conclusiones por las dimensiones asumidas. De las
dos primeras expresan: "En cuanto a expectativa de rendimiento, los jóvenes
encuestados consideraron que no existe mucha relación entre el uso de redes
sociales y una posible utilidad y eficiencia en su vida, o en su rendimiento
académico. Y en consideración a expectativa de esfuerzo los jóvenes percibieron
las redes sociales muy fáciles de usar, y que poseen gran habilidad en su
manejo".
Tabla 2. Dimensiones e indicadores de uso y aceptación de redes sociales

virtuales en jóvenes de escuelas secundarias públicas en Sonora
Dimensiones Indicadores
1. El uso de redes sociales aumenta mis posibilidades de
lograr cosas que son importantes para mí
2. El uso de redes sociales me ayuda a lograr cosas más
Expectativa de rápidamente
rendimiento 3. El uso de redes sociales me ayuda a lograr cosas más
rápidamente
4. El uso de redes sociales aumenta mi rendimiento escolar
5. El uso de redes sociales aumenta mi productividad
6. Aprender a usar las nuevas redes sociales es fácil para mí
7. Mi interacción con las redes sociales es clara y
Expectativa de
comprensible
esfuerzo
8. Encuentro las redes sociales fáciles de usar
9. Es fácil para mí ser hábil en el uso de redes sociales
10. Las personas que son importantes para mí piensan que
debo usar
redes sociales
Influencia
11. Las personas que influyen en mi comportamiento piensan
social
que debo usar redes sociales
12. Personas cuyas opiniones valoro, prefieren que utilice
redes sociales
13. Tengo los recursos necesarios para usar redes sociales
14. Tengo el conocimiento necesario para utilizar redes
sociales
Condiciones
15. Las redes sociales son compatibles con otra tecnología
facilitadoras
que utilizo
16. Puedo obtener ayuda de otros cuando tengo algún
problema con redes sociales
17. Usar redes sociales es divertido
Motivación
18. El uso de redes sociales es agradable
Hedónica
19. El uso de redes sociales me entretiene mucho
20. El uso de redes sociales se ha convertido en un hábito para
Hábito mí
21. Soy adicto al uso de redes sociales
21
22. Debo usar redes sociales

23. El uso de redes sociales se ha convertido en algo natural
para mí
24. Tengo la intención de seguir usando redes sociales en el
Intención futuro
conductual 25. Siempre intentaré usar redes sociales en mi vida diaria
26. Planeo seguir usando frecuentemente redes sociales
Ejercicio 2
Suponga una investigación educativa, de interés y factible de realizar en su ámbito

de labor (descríbala brevemente). Identifique las variables involucradas en el
estudio y clasifíquelas según corresponda; entre en detalles sobre los posibles
valores que puedan tomar las variables en cuestión. Intercambie su propuesta con
algún otro colega.
Fin del ejercicio 2
Índice
2. Nociones de Probabilidades y Estadística. Estadística y Método

Estadístico. Estadística Descriptiva y Estadística Inferencial. Muestreo
2.1 Nociones de Probabilidades
De modo muy elemental se presenta en este epígrafe información sobre las

importantes ramas del conocimiento matemático Probabilidades y Estadística.
Necesariamente el interesado en profundizar deberá hacerlo en otras fuentes
documentales; aquí el alcance está en el entorno de lo mínimo necesario para
alcanzar un fundamento básico y a la vez robusto de los conceptos y técnicas de
cálculo, necesarios para una aplicación preliminar y productiva de la Estadística en
la Investigación Educativa, así como para el intercambio con especialistas
versados en la materia a los que se debe acudir cuando se estime necesario.
La teoría de las probabilidades tiene sus inicios al principio del siglo XVII y su
surgimiento está relacionado a los diferentes juegos al azar de la época, es de
señalar que durante mucho tiempo estos juegos fue la única motivación para el
desarrollo de los conceptos y métodos de la teoría de las probabilidades
destacándose algunos matemáticos de la época tales como: Fermat, Pascal,
Bernoulli, etc. Hoy en día su aplicación abarca diversas disciplinas tales como la
física, la biología, la psicología, la teoría de la información, la informática, etc.
22
La teoría de las probabilidades estudia las leyes que rigen ciertos tipos de
fenómenos naturales o como resultado de experimentos realizados por el hombre,
llamados fenómenos, sucesos, eventos o experimentos aleatorios. En estos no se
pueden predecir los resultados posibles; es decir, aunque tengan lugar en
igualdad de condiciones, en cada ocasión que ocurran los resultados pueden ser
diferentes.
De la vida diaria, se tienen nociones cercanas a los conceptos teóricos sobre

variables aleatorias, tanto para variables discretas como para continuas, y de
hecho se tienen en consideración en alguna que otra decisión frecuente a tomar
en la vida. A continuación algunos ejemplos:
Ejemplo 7
Se espera que un estudiante bien preparado para una evaluación en determinada

asignatura, tenga alta probabilidad de obtener resultados satisfactorios en esta. En
este caso al evento se le puede denominar Realizar una evaluación y los
resultados posibles considerarlos como dos: Satisfactorio y No satisfactorio. La
variable es cualitativa, dicotómica y de escala ordinal.
Fin del Ejemplo 7
Ejemplo 8
Un profesor que muestre empatía por sus estudiantes y que tenga buenos
métodos de enseñanza, tiene mayores probabilidades de que sus estudiantes
alcancen buenos resultados, que otro profesor que no se distinga por estos dos
aspectos. Como variable se tendría la unión de Cualidades y Desempeño,
cualitativa dicotómica ordinal, y los resultados posibles
Fin del Ejemplo 8
Ejemplo 9
Como Director de una Escuela que tiene que decidir sobre un nuevo miembro del
claustro entre varios Docentes que aspiran a la plaza, Usted estaría considerando
con menos probabilidades a aquellos candidatos que poseen en su historial
cualidades de ausentistas injustificados. En este ejemplo se puede definir como
variable aleatoria a la Decisión (Cualitativa dicotómica y ordinal) y los resultados
posibles son los Si o No para cada candidato.
Fin del Ejemplo 9
23
Ejemplo 10
La intuición estaría fijando como variable aleatoria discreta El número de días

que en una semana (de 5 días con clases), un estudiante estaría asistiendo a la
escuela. Los resultados posibles serían 𝑋 = {𝑥1 , 𝑥2 , 𝑥3 , 𝑥4, 𝑥5 𝑦 𝑥6 } = {5, 4, 3, 2, 1, 0},
lo que significa:
5- Asiste todos los días 1- Asiste solo un día
4- Asiste 4 días 0- No asiste ningún día
3- Asiste 3 días
2- Asiste 2 días
Fin del Ejemplo 10
Ejemplo 11
Para el mismo entorno del ejemplo anterior, una variable aleatoria continua sería
El Tiempo que dicho estudiante permanece en la escuela determinado día. Dado
que el tiempo es por su esencia una variable continua, los valores posibles (en
horas) estarían definidos cuando más, por los infinitos valores
correspondientes al intervalo X ∈ [0, 24]. En este caso, para proseguir con los
cálculos deseados de probabilidad se podría utilizar, por ejemplo, la Distribución
Normal de probabilidades, que se presenta más adelante.
Fin del Ejemplo 11
Ejercicio 3
Relativo a los ejemplos 5 y 6 anteriores del entorno estudiante-escuela, defina dos

nuevas variables aleatorias, una discreta y otra continua. Fundamente su elección.
Fin del ejercicio 3
La teoría de la probabilidad es la parte de las matemáticas que se encarga del

estudio de los fenómenos o experimentos aleatorios. Por experimento, fenómeno,
proceso, cuestión o asunto, de naturaleza aleatoria, se entenderá todo aquel que
cuando se le repite bajo las mismas condiciones iniciales, los resultados que se
24
obtienen de las variables aleatorias bajo estudio, no siempre son los mismos. Los
5 ejemplos anteriores cumplen con lo de naturaleza aleatoria (El número de días
que en una semana - de 5 días con clases - un estudiante estaría asistiendo a la
escuela. Y El Tiempo que dicho estudiante permanece en la escuela determinado
día).
Al trabajar con variables aleatorias discretas, resultan importantes los conceptos

de Espacio muestral y Espacio de probabilidades. Al conjunto de resultados
posibles de una variable aleatoria X, 𝑋 = {𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑘 }, se le denomina
Espacio muestral. El Espacio de probabilidades correspondiente, es el
conjunto de valores de probabilidades que está asociado a cada uno de los
resultados posibles. Si se designa por 𝑝(𝑋 = 𝑥𝑖 ) = 𝑝(𝑥𝑖 ) a la probabilidad asociada
al resultado 𝑥𝑖 , el Espacio de probabilidad (EP) puede representarse por:
𝐸𝑃(𝑋) = {𝑝(𝑥1 ), 𝑝(𝑥2 ), 𝑝(𝑥3 ), … , 𝑝(𝑥𝑘 )}
En la teoría de probabilidades y estadística, existen para una variable aleatoria,

la función de densidad de la distribución de probabilidad, y la función
acumulativa de probabilidad. La primera es una tal que asigna, para variables
discretas, a cada resultado posible o suceso independiente definido sobre la
variable, la probabilidad de que dicho suceso ocurra; mientras que, para
variables continuas, a cada intervalo de resultados independientes posibles que
pueda tomar la variable, le asigna también un valor de probabilidad de que dicho
suceso pueda tener lugar. La segunda, como su nombre indica, es la suma para
variables discretas, e integración para variables continuas, de las probabilidades
que corresponden a las ocurrencias posibles de resultados de la variable aleatoria,
desde su valor menor posible hasta un valor mayor fijado de esta.
Las funciones de densidad de distribución y acumulativa, en su carácter de

valiosos modelos teóricos para describir el comportamiento de los valores de
determinadas variables aleatorias, se distinguen por poseer parámetros para la
población. Como se constatará más adelante, sucede que raras veces se conocen
los parámetros de la población respecto a la variable, y en la investigación será
imprescindible (en pruebas paramétricas de inferencia estadística) hacer
estimaciones de estos, a partir del conjunto de datos que se recopilen de la
variable que se está estudiando.
Un muy preciado beneficio es que, una vez que se pruebe estadísticamente que
una variable aleatoria particular sigue el comportamiento de determinado modelo
teórico de probabilidades, todas las propiedades de dicho modelo teórico que se
definen detalladamente en la literatura, pasan a ser de inmediato comportamientos
25
que poseen los valores de la variable aleatoria en cuestión, un jalón importante en

el avance del conocimiento dentro de la investigación.
Índice
2.1.1 Probabilidades y variables discretas. Distribución Uniforme.

Distribución Binomial
El comportamiento de los valores de variables aleatorias discretas, puede ser

descrito por distintos modelos teóricos de probabilidad que se recogen en la
literatura. En este documento se presta atención solo a los de Distribución
Uniforme y Distribución Binomial, por ser dos de los más utilizados.
A continuación se presentan de modo simplificado y con carácter intuitivo, algunos

conceptos necesarios para comprender, por ejemplo, qué significa que todos los
alumnos de un grupo de estudiantes puedan tener igual posibilidad (igual
probabilidad) de integrar una muestra a seleccionar de dicho grupo. Si el grupo
tuviese 20 estudiantes (N= 20), se estará hablando de que cualquiera de ellos
1
tiene una probabilidad 𝑝 = 𝑁 = 1/20 = 0,05 de ser seleccionado; el espacio
muestral o población de todos los resultados posibles está compuesto por 20
sujetos. Aquí prevalece, se cumple satisfactoriamente, el comportamiento
correspondiente a la Distribución Uniforme de probabilidades, modelo teórico
más simple de los que caracterizan tales distribuciones de probabilidades de algún
fenómeno o proceso (La Distribución Uniforme tiene su equivalente para variables
aleatorias continuas).
Veinte muestras de tamaño 𝑛 = 1, pueden como máximo ser extraídas del grupo
de 20 estudiantes, las que en su conjunto constituyen la población (N= 20), como
se dijo antes. No es obvio decir cuántas muestras de tamaño 2, 3, 4, 5 o más (𝑛 ≤
𝑁) pueden sacarse del grupo anterior. La respuesta se obtiene de:
𝑁 𝑁!
El coeficiente binomial 𝐶(𝑛, 𝑁) = ( ) = 𝑛!(𝑁−𝑛)!permite obtener el número
𝑛
de subconjuntos de n elementos escogidos de un conjunto con N
elementos.
Considerando 𝑛 = 10, resultarían:
20 20! 10!∗11∗12∗13∗14∗15∗16∗17∗18∗19∗20 6,70443𝐸+11

𝐶(10,20) = ( ) = 10!(20−10)! = = = 184756
10 10!∗10! 10!
¡Cifra muy grande!
26
Ejercicio 4
Cambiemos a N=5, {A,B,C,D,E}, y n=2. Complete en el cuadro siguiente, las respuestas a las
interrogantes y el cálculo de las fórmulas de abajo:
A,B A, C A, D A, E
B, C B, D B, E
 Total de muestras posibles (de tamaño n=2)=

 Probabilidad de que una cualquiera de las muestras de tamaño n=2 sea la
seleccionada (considerando Distribución uniforme de probabilidades )=
5 5! 3!∗4∗5
 𝐶(2,5) = ( ) = 2!(5−2)! = 2!∗3! =
2
Fin del ejercicio 4
Ejemplo 12
Los cálculos de los resultados del Coeficiente Binomial usualmente se obtienen
directamente por funciones suministradas en calculadoras y software. En el caso
del EXCEL está disponible la función COMBINAT(N, x), donde:
N – número de repeticiones
x – cantidad de éxitos en n repeticiones
A continuación se muestran los resultados de los cálculos en EXCEL
considerando N= 5 para valores de x desde 0 hasta 5:
x 0 1 2 3 4 5
COMBINAT(5,x) 1 5 10 10 5 1
Fin del Ejemplo 12
¿Por qué el EXCEL?

¡Porque es bueno y está en todas partes!
(Ver en el Anexo 2 las valiosas funciones estadísticas del EXCEL)
27
Ejercicio 5
Suponga que Usted labora en una institución de educación en la que las

calificaciones de las actividades evaluativas responden a:
2 - Suspenso, (𝑥1 ); 3 - Aprovechado, (𝑥2 ); 4.- Notable, (𝑥3 ) y 5 - Excelente, (𝑥4 )
 Considerando Distribución uniforme de probabilidades para el espacio muestral

que conforman los cuatro resultados posibles anteriores (N= 4), cuál sería la
probabilidad que le corresponde a la ocurrencia de cualquiera de estos
 Obtenga la probabilidad P(Notable o Excelente)
Fin del ejercicio 5
Usted debe haber notado que para eventos independientes (𝑥𝑖 ) simples, como lo
son las calificaciones a obtener en una evaluación, se cumple:
 𝟎 < 𝑃(𝒙𝒊 ) < 1

 ∑𝑵
𝒊=𝟏 𝑷(𝒙𝒊 ) = 𝟏
Se conoce como evento seguro aquel para el cual 𝑷 = 𝟏.
Ejemplo 13
El tiempo transcurre independiente de la voluntad humana.
Fin del ejemplo 13
Ejemplo 14
El estudiante que hizo la evaluación obtendrá alguno de los cuatro resultados

definidos para otorgar la calificación (Con escala de 2, 3, 4 y 5).
Fin del ejemplo 14
28
Se le llama evento imposible al que le corresponde 𝑷 = 𝟎.
Ejemplo 15
Manteniéndose la fuerza gravitatoria, una pelota de beisbol lanzado al aire termina

subiendo.
Fin del ejemplo 15
Ejemplo 16
El estudiante que no se presentó a determinada evaluación escrita, sin tener

comunicación de ningún tipo con alguna otra persona o recurso virtual de apoyo,
una vez que esta concluyó, y en lugar en el que se realizó, entregó al igual que los
demás alumnos, su documento de constancia de haberla hecho).
Fin del ejemplo 16
La probabilidad mayor que cero es la característica de un evento, que hace que

existan razones para creer que éste ocurrirá. Considerando que p es la
probabilidad de que ocurra un evento, y q la probabilidad de que no ocurra,
entonces tiene que cumplirse que p + q = 1 (opcionalmente puede escribirse como
q = 1 – p).
Eventos compuestos son los que incluyen más de un evento simple, como el del
ejercicio 4, P(Notable o Excelente)= P(Notable) + P(Excelente)= 0,25 + 0,25= 0,5.
Ejercicio 6
En una asignatura determinada se conoce que el comportamiento habitual de la

distribución de calificaciones no es la de la Distribución Uniforme, sino la
correspondiente a:
P(2 -Suspenso)= 0,4
P(3 - Aprovechado)= 0,3
P(4 - Notable)= 0,2
P(5 - Excelente)= 0,1
a. Obtenga la probabilidad P(No Suspenso)
b. Pronúnciese sobre el acercamiento a la realidad, del modelo empírico de

probabilidades correspondiente a los cuatro niveles de ocurrencia dado en este
ejercicio para una asignatura determinada (del comportamiento habitual de la
29
distribución de calificaciones), con respecto al modelo teórico de la Distribución

Uniforme para este tipo de sucesos.
Fin del Ejercicio 6

Índice
2.1.1.1 Definiciones de Probabilidad
Existen varias definiciones de probabilidad que el lector puede buscar. La

definición clásica plantea que la probabilidad es la característica de un evento,
que hace que existan razones para creer que este ocurrirá. La probabilidad p de
que suceda un evento 𝒙𝒊 de un total de N casos posibles igualmente probables es
igual a la razón entre el número de ocurrencias h de dicho evento (casos
favorables) y el número total de casos posibles N:
𝒉
𝑷 = 𝑷𝒓𝒐𝒃{𝒙𝒊 } =
𝑵
Ejemplo 17
Utilizando la fórmula de la definición anterior, y para una semana escolar con
actividades de lunes a viernes, los siguientes cálculos resultan válidos para
cualquier semana escolar:
 Probabilidad que un día de clases seleccionado aleatoriamente en esa
semana, sea lunes,
𝑃(𝑙𝑢𝑛𝑒𝑠) = 1/5
 Probabilidad de que un día de clases seleccionado aleatoriamente, no sea
ni lunes ni viernes,
𝑃(𝑛𝑜 𝑙𝑢𝑛𝑒𝑠 𝑛𝑖 𝑣𝑖𝑒𝑟𝑛𝑒𝑠) = 3/5
Fin del Ejemplo 17
Definición de Probabilidad a partir de la frecuencia (Definición empírica)

Supóngase que cierto experimento aleatorio se lleva a cabo n veces con el
propósito de obtener la probabilidad de que ocurra un resultado o evento
determinado A. Designando por 𝑛(𝐴) el número de ocurrencias de dicho evento
A, en las 𝑛 realizaciones del experimento, se define la probabilidad de A, a partir
de la frecuencia, según:
𝑛(𝐴)
𝑃(𝐴) = lim
𝑛→∞ 𝑛
30
El hecho de que el número de repeticiones exija 𝑛 → ∞, conlleva a que no sea

posible realizarlo en la práctica, no obstante ofrece cierta información de interés.
Índice
2.1.1.2 Distribución Binomial
Suponga que Usted desearía conocer la probabilidad de que en 20 sesiones de

trabajo con la computadora conectado a internet durante un mes, logra evadir un
número de veces específico (0, 1, 2,…, 20) al riesgo de infectarse con un virus
informático, ¿cómo lo hace? ¡Con la Distribución Binomial, otro modelo teórico
para distribuciones de probabilidades de variables discretas!
La Distribución Binomial es una distribución de probabilidad discreta que le

permite contar el número de éxitos en una secuencia de n ensayos (o
repeticiones) de Bernoulli independientes entre sí, con una probabilidad fija p de
ocurrencia del éxito en cualquiera de los ensayos. Un experimento de Bernoulli se
caracteriza porque sólo son posibles en cada repetición o ensayo, dos resultados.
A cualquiera de estos se le puede denominar éxito, con una probabilidad de
ocurrencia p; y al otro, fracaso, con una probabilidad q = 1 –p (note que equivale
a plantear que p + q = 1).
En la Distribución Binomial el experimento se repite n veces de forma

independiente, y se trata de calcular la probabilidad de un determinado número de
éxitos (desde 0 hasta n) en esas repeticiones. De existir más de dos resultados
posibles en una realización del experimento, estos pueden asumirse en dos
grupos, los que se asumen que corresponden al éxito (no necesariamente lo que
se está acostumbrado a valorar de bueno), y los demás se agrupan en los que
corresponden al fracaso. Otro ejemplo de este tipo de comportamiento es el que
se asocia con la asistencia de todos los maestros a la escuela un día de clases de
la semana: p - éxito (asisten todos) y q- fracaso (no asisten todos), ¿Qué valores
asumiría Usted de p y q para su escuela? ¿Qué probabilidad existe de que tengan
lugar 0, 1, 2, 3, 4 o 5 éxitos en la semana? En breve le resultará sencillo
determinarlo.
Debe tenerse muy presente la elección de éxito o fracaso para realizar los
cálculos necesarios y hacer la posterior conclusión respecto al enunciado original
que corresponda al problema que se esté solucionando; una u otra selección sería
para tomar el camino más sencillo en los cálculos necesarios, si fuese este un
requisito.
Puede representarse que una variable aleatoria X sigue el comportamiento o

modelo teórico de una Distribución Binomial de parámetros n y p, a partir de:
𝑋~ 𝐵(𝑛, 𝑝)
31
Para variables discretas se definen: a) Función de distribución de probabilidad, fp

(valores puntuales), y b) Función acumulativa de distribución de probabilidad, fdp
(valores acumulados de probabilidad según aumentan los valores de la variable
aleatoria). Para la Distribución Binomial, estas son:
𝑛
𝑓𝑝𝐵 = ( ) 𝑝𝑘 𝑞 𝑛−𝑘 y𝑓𝑑𝑝 = ∑𝑘𝑖=0 𝑓𝑝𝐵 𝑖
𝑘
Ejercicio 7
Retomando la información del modelo empírico de distribución de probabilidades

del ejercicio 6, (PSuspenso=0,4; PAprovechado= 0,3 PNotable= 0,2 y PExcelente=0,1),
obtenga:
a. El valor q de la Distribución Binomial, si dicha probabilidad significa PSuspenso

b. El valor p de la Distribución Binomial, si dicha probabilidad significa PAprobado
c. Los valores de 𝑓𝑝𝐵 , probabilidad de que un estudiante apruebe en k= 0, 1,
2, 3, 4 y 5 oportunidades, al presentarse a un total de 5 evaluaciones.
Solución:
a. PSuspenso= 0,4 (Por dato)
b. PAprobado= PAprovechado (0,3) + PNotable (0,2) + PExcelente (0,1)= 0,6
Aprecie que se cumple la condición establecida antes de p + q= 1
c. Tomando "éxito" que un estudiante apruebe, p= 0,6 y q= 1 − 0,6 = 0,4
Función de
distribución
Función de distribución de probabilidad, acumulativa de
k 𝑛 probabilidad,
𝑓𝑝𝐵 = ( ) 𝑝𝑘 𝑞 𝑛−𝑘 𝑘
𝑘
∑ 𝑓𝑝𝐵 𝑖
𝑖=0
5 5!
0 ( ) 0,60 ∗ 0,45−0 = ∗ 0,60 ∗ 0,45−0 = 0.01024 0.01024
0 0!(5−0)!
5 5!
1 ( ) 0,61 ∗ 0,45−1 = ∗ 0,61 ∗ 0,45−1 = 0.0768 0.08704
1 1!(5−1)!
5 5!
2 ( ) 0,62 ∗ 0,45−2 = ∗ 0,62 ∗ 0,43 = 0.2304 0.31744
2 2!(5−2)!
5 5!
3 ( ) 0,63 ∗ 0,45−3 = ∗ 0,63 ∗ 0,42 = 0.3456 0.66304
3 3!(5−3)!
5 5!
4 ( ) 0,64 ∗ 0,45−4 = ∗ 0,64 ∗ 0,41 = 0.2592 0.92224
4 4!(5−4)!
5 5!
5 ( ) 0,65 ∗ 0,45−5 = ∗ 0,65 ∗ 0,40 = 0.07776 1.00000
5 5!(5−5)!
Fin del Ejercicio 7 Índice
32
2.1.2 Probabilidades y variables continuas. Distribuciones Normal, t de

Student y Ji (Chi) Cuadrado
Las variables continuas son aquellas que pueden tomar todos los infinitos valores
existentes entre dos de estos.
Ejemplo 17
Considérese el tiempo que le toma a un estudiante responder parte de una

pregunta en el examen final de una asignatura; digamos que ese evento fue
diseñado para responderse con una media de 10 minutos, con un intervalo
probable de 4 a 16 minutos (equivalente a 10 ± 6 min) de valores posibles. Para
este ejemplo, está además presente la condición de aleatoriedad, por el hecho de
no existir un modelo determinístico a partir del cual pueda calcularse con precisión
el tiempo aludido, que le pueda llevar a un estudiante cualquiera.
Fin del Ejemplo 17
En la práctica, numerosas variables continuas se trabajan con un nivel de

discretización razonable, que no influye en perdida de información trascendente a
los fines del evento en cuestión, lo que por lo general lo define el propio
investigador a partir de su propio conocimiento.
Ejemplo 18
En la expresión anterior con valores esperados de 10 ± 6 min, (intervalo cerrado
de 4 a 16), se tienen implícitos media poblacional 𝜇 = 10 min. y semiamplitud 3
veces la desviación estándar poblacional, 3𝜎 = 6 min., o sea, 𝜎 = 2 min. Se trata
de un evento en el que se considera que la precisión es suficiente registrando las
mediciones de tiempo aproximándolas a minutos.
Fin del Ejemplo 18
Ejemplo 19
Si en lugar del ejemplo anterior, se estuviese midiendo el tiempo en que se

demora un estudiante en recorrer 50 metros en una prueba de velocidad de los
más ágiles de un grupo, posiblemente se estaría hablando en términos de hasta
décimas de segundo. Pudiera tenerse como caracterización de los resultados
esperados 50.0± 12.0 seg., significando media poblacional 𝜇 = 50.0 seg. y
semiamplitud 3 veces la desviación estándar poblacional, 3𝜎 = 12 seg.; o sea, 𝜎 =
4 seg. En este caso la sensibilidad de la magnitud de la respuesta pudiera estar
33
conllevando a trabajar con décimas de segundos, en lugar de valores enteros

aproximados de segundos o minutos, y que se desecharía asimismo la variante de
medir hasta las centésimas de segundo.
Fin del Ejemplo 19
Existen diversas distribuciones de probabilidades de variables continuas, a

continuación se presenta alguna información solo de tres de estas.
Índice
2.1.2.1 Distribuciones Normal y t de Student
Dos de las Distribuciones de probabilidades para variables continuas más

utilizadas son las Distribución Normal y la t de Student. Los valores de una
variable continua aleatoria que siguen el modelo teórico de la Distribución Normal,
se distinguen por estar agrupados mayormente alrededor de la media poblacional,
con simetría por ambos lados, mostrando una forma acampanada (Ver Figura 3) y
con porcentajes fijos de probabilidad en los intervalos qe pudieran definirse,
siendo de importancia frecuente los comprendidos en 𝑋𝜖[𝜇 ± 𝑛𝜎] para 𝑛 = 1,
2 𝑦 3, a los que corresponden probabilidades aproximadas de:
𝑝(𝑋𝜖[𝜇 ± 𝜎]) = 68,2% 𝑝(𝑋𝜖[𝜇 ± 2𝜎]) = 95,4% 𝑝(𝑋𝜖[𝜇 ± 3𝜎]) = 99,7%
Figura 3. Representación del comportamiento de los valores de una variable con

distribución Normal (μ, N), a partir de su función de distribución de
probabilidad
Tenga en consideración que, por el significado de Probabilidad, tiene que

cumplirse que 𝑃(𝑋𝜖[𝜇 ± ∞]) = 100% = 1. Debe estarse atento a la representación
equivalente de valores de probabilidad tanto en porcentaje como en fracciones.
Los software utilizan principalmente la de fracciones y a las personas en general le
es más reveladora en porcentaje. Asimismo hay que estar alerta en el uso de P
para indicar probabilidad; notará que se utiliza con cierta frecuencia que un mismo
problema para denotar distintas probabilidades, además de emplear otros
símbolos con el mismo propósito.
34
La Distribución Normal es una de las más utilizadas en la Estadística Inferencial,

incluso para desechar su posibilidad de uso cuando no representa
apropiadamente el comportamiento de los valores de la variable que se esté
estudiando, y decidirse en tal caso por transformaciones de los datos primarios,
por aplicar la Distribución t de Student, o por el uso de pruebas no paramétricas.
Funciones de densidad y acumulativa de probabilidades de la Distribución

Normal.
La función de densidad de la distribución de probabilidad de una variable aleatoria

X que sigue una distribución normal X es:
1 𝑥−𝜇 2
1 − ( )
𝑓(𝑥) = 𝜎√2𝜋 𝑒 2 𝜎 para −∞ < 𝑥 < ∞
donde μ y σ son los parámetros poblacionales media y desviación estándar

respectivamente, 𝑒 = 2,71828…y 𝜋 = 3,14159...Se representa abreviadamente
como N(μ, σ).
Propiedades de la función de densidad de probabilidades del Distribución

Normal
 El área total comprendida entre la función de densidad y el eje de las abscisas

es igual a uno
 Es asintótica a ese eje, esto quiere decir que teóricamente x toma valores entre
- y+
 Es simétrica respecto a la media donde alcanza su máximo valor
 La distancia entre el eje vertical que pasa por la media y el punto donde cambia
de concavidad (punto de inflexión ) la curva, es igual a al valor de .
La función acumulativa de la Distribución Normal, se plantea para 𝑓(𝑥) =

1 𝑥−𝜇 2
1 − ( )
𝑒 2 𝜎 como a:
𝜎√2𝜋
𝑡
𝐹(𝑡) = ∫ 𝑓(𝑥)𝑑𝑥
−∞
35
La propiedad de que la suma de las probabilidades correspondientes a todos los

resultados posibles de un evento, vista antes para variables discretas,
necesariamente tiene que cumplirse también para variables continuas, y significa
que:
∞
∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
Por importantes razones prácticas resulta necesario trabajar con la variable

𝑥−𝜇
aleatoria estandarizada 𝑍 = 𝜎 . Ver Figura 4.
Figura 4. Funciones de densidad y acumulativa probabilísticas, de la

Distribución Normal estandarizada (con 𝜇 = 0 𝑦 𝜎 = 1) (gráficos obtenidos con
EXCEL utilizando ∆𝑍 = 1).
𝑥−𝜇
La estandarización de los valores de la variable aleatoria X a partir de 𝑍 = tiene
𝜎
la notable connotación de transformar la variable original, cualquiera que esta sea,
a una adimensional, de parámetros media y desviación estándar 𝜇 = 0 𝑦 𝜎 = 1
como se dijo antes.
𝐶
En la Tabla 3 se muestran varios cálculos de 𝑍, 𝑓(𝑍) 𝑦 ∫0 𝑓(𝑍)𝑑𝑍 para un
ejemplo de la variable original Calificación [𝜇𝐶 = 7, 𝜎𝐶 = 1], suponiendo que se
utiliza una escala de valor máximo 10.
36
Tabla 3. Resultados de la función de densidad probabilística estandarizada𝑓(𝑍), y

de su función acumulativa de la Distribución Normal Estandarizada
Acumulativa, correspondientes a N(7, 1) para 4 ≤ 𝐶𝑎𝑙𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛 ≤ 10,
obtenidos con el EXCEL
Distribución Normal
𝐶𝑎𝑙𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛 − 7 1 1
− (𝑍)2 Estandarizada
Calificación 𝑍= 𝑓(𝑍) = 𝑒 2
1 √2𝜋 Acumulativa
(DISTR.NORM.ESTAND(Z))
4 -3 0.004 0.001
4.5 -2.5 0.018 0.006
5 -2 0.054 0.023
5.5 -1.5 0.130 0.067
6 -1 0.242 0.159
6.5 -0.5 0.352 0.309
7 0 0.399 0.500
7.5 0.5 0.352 0.691
8 1 0.242 0.841
8.5 1.5 0.130 0.933
9 2 0.054 0.977
9.5 2.5 0.018 0.994
10 3 0.004 1.000-
Más adelante se utilizarán dos probabilidades denominadas Nivel de significación

(∝) y Nivel de confianza (𝑝), las que se relacionan de acuerdo a:
∝+𝑝=1
En la Tabla 4 se muestran algunos valores de uso frecuente de Z, que delimitan
𝑥−𝜇
los intervalos −𝑍𝑐 ≤ 𝑍 = 𝜎 ≤ 𝑍𝑐 (alrededor del valor medio 𝜇𝑍 = 0),
correspondientes a valores de probabilidad de 95, 97.5 y 99 % respetivamente.
Tabla 4. Valores de 𝑍𝑐 que delimitan intervalos de la variable normal estándar Z,

𝑥−𝜇
−𝑍𝑐 ≤ 𝑍 = 𝜎 ≤ 𝑍𝑐 , para distintos niveles de significación de uso
frecuente (Probabilidad∝).
∝ (𝑝 = 1−∝) 𝒁𝒄
0.05 (𝑝 = 0.95) 1.645
0.025(𝑝 = 0.975) 1.960
0.01(𝑝 = 0.99) 2.495
37
Ejercicio 8
Este ejercicio se relaciona con el 1. Complete la Tabla de los intervalos de más
abajo, apoyándose en la información dada a continuación y recordando que
∞
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑡𝑖𝑣𝑎, ∫ 𝑓(𝑥)𝑑𝑥 = 1
−∞
DISTR.NORM.ESTAND()
Coef. de intelig. Z (Prob acumulativa)
55 -3 0.0013
70 -2 0.0228
85 -1 0.1587
100 0 0.5000
115 1 0.8413
130 2 0.9772
145 3 0.9987
Probabilidad acumulativa Probabilidad

Coeficiente de inteligencia hasta el contorno correspondiente al intervalo (%
derecho del intervalo con solo una cifra decimal)
I muy baja <55 0.0013 0.0013 (0.1)

Insuficiencia mental, [55;
0.0013 y 0.0228 0.0228 - 0.0013= 0.0215 (2.1)
70)
Inteligencia (I) débil, [70;
0.0228 y 0.1587 0.1587 - 0.0228= 0.1359 (13.6)
85)
0.5000 – 0.1587= 0.3413
I media baja, [85; 100) 0.1587 y 0.5000
(34.1)
I media alta, [100; 115) 0.5000 y
Gran I, [115; 130) 0.9772 - 0.8413= ( )
I superior, [130; 145)
I Superdotados, ≥145 0.9987 y 1.0000 1.0000 -0.9987= 0.0013 ( )
Fin del Ejercicio 8
38
En el EXCEL están disponibles las funciones siguientes, de variantes de utilización

de la Distribución Normal, las cuales requieren una breve familiarización para
utilizarlas con seguridad:
1. DISTR.NORM - Devuelve la distribución normal acumulativa

2. DISTR.NORM.INV - Devuelve la función inversa de la distribución normal
acumulativa
3. DISTR.NORM.ESTAND - Devuelve la distribución normal estándar
acumulativa
4. DISTR.NORM.ESTAND.INV - Devuelve la función inversa de la distribución
normal estándar acumulativa
Índice
Distribución t de Student
Tiene su origen en el problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño, aunque puede utilizase
también para muestras grandes (𝑛 ≥ 30), caso en cuyo comportamiento tiende
cada vez más al de la Distribución Normal.
Dada Z una variable aleatoria normal estándar y V una variable aleatoria chi
cuadrada con ν grados de libertad y considerando Z y V independientes, la
𝑍
distribución de la variable aleatoria T, definida a partir de 𝑇 = 𝑉
, posee el modelo
√
ν
teórico representado por la función de densidad
ν+1 −(ν+1)
𝛤[ ] 𝑡2 2
2
ℎ(𝑡) = ν (1 + ) , −∞ <𝑡 < ∞
𝛤( )√𝜋ν ν
2
conocida como la Distribución t de Student, con ν grados de libertad. Constate

que esta distribución posee solo el parámetro ν. (Ver figura 5)
Más adelante se estarán calculando los grados de libertad a partir del tamaño de
muestra, según:
ν=n−1
39
Distribución
Normal
Figura 5. Distribución t de Student para varios grados de libertad
Índice
2.1.2.2 Distribución Ji (Chi) Cuadrado
La Distribución de Pearson, también llamada Ji cuadrada(o) o Chi cuadrado(a)

(𝜒²), es una distribución de probabilidad continua con un parámetro 𝛎 que
representa los grados de libertad de la variable aleatoria
𝑋 = 𝑍12 + 𝑍22 + ⋯ + 𝑍ν2 ,
donde 𝑍𝑖2 son variables aleatorias normales estandarizadas (𝜇 = 0 𝑦 𝜎 2 = 1) e

independientes. La cualidad de que la variable aleatoria 𝝌² tenga este tipo de
distribución se representa habitualmente como: 𝑋~ 𝝌².
La distribución Ji cuadrada (𝜒 2 ) tiene la función de densidad:
1 𝜈 𝜈
𝜈 𝑥 2−1 𝑒 −2 , 𝑥>0
𝑓(𝑥, 𝝂) = { 22 𝛤(𝜈)
2
0, 𝑥≤0
Como se dijo antes, el único parámetro de esta distribución de probabilidades es 𝜈

(grados de libertad); se calcula a partir de:
𝜈 = n − 1, donde n es el tamaño de la muestra.
40
Esta distribución posee media y varianza poblacionales definidas como:

𝜇 = 𝜈 y 𝜎2 = 2 𝜈
En la Figura 6, se ilustran varios miembros de esta familia de curvas para distintos

grados de libertad.
Figura 6. Distribución 𝝌² para varios valores de 𝛎
Índice
2.2 Estadística, Método Estadístico y Tipos de Muestreo
2.2.1 Estadística y Método Estadístico
La Estadística es más que una simple compilación y presentación de datos en

tablas y gráficos, aunque usualmente es este el concepto intuitivo que la mayor
parte de los individuos poseen sobre la esencia de esta disciplina, a lo que
ciertamente se reduce en numerosas aplicaciones sencillas. La Estadística deriva
su nombre del hecho de haber sido aplicada primeramente a la recolección de
datos, que permitieron la administración de los estados con propósitos militares e
impositivos, o sea, los gobernantes necesitaban conocer cierta información
referente al número y riquezas de sus súbditos. A los datos sobre determinado
asunto hoy día se les suele denominar estadísticas; estas pueden referirse a la
41
educación, la salud, al deporte, al comercio, etc. Siempre que el término se utilice

en plural, es sinónimo de datos.
Estadística es la ciencia encargada de suministrar las diferentes técnicas y

procedimientos, que permiten, desde organizar la recolección de datos, hasta su
procesamiento, análisis e interpretación. Se utiliza cuando los datos primarios
resultan numerosos y requieren procedimientos de cálculo de parámetros
(estadígrafos o estadísticos) que resuman en pocos resultados, las principales
cualidades del comportamiento de los valores de las variables que se estén
estudiando, en términos de estimadores de tendencia central, dispersión y
posición relativa de cada conjunto de datos de las distintas variables que se estén
utilizando en el estudio.
De particular beneficio resulta la Estadística, cuando los datos recopilados poseen

además incertidumbre en sus magnitudes, propias de los errores ordinarios de
medición. Cabe enfatizar que son similarmente perniciosas las situaciones
consistentes en utilizar la Estadística innecesariamente, cuando resultan evidentes
las cualidades del comportamiento observado, como cuando se soslaya su
aplicación en condiciones de discernimiento objetable. Ante la duda de una
frontera difusa, debe aplicarla. Tenga presente además, que la aplicación de la
Estadística Inferencial para situaciones que lo ameriten, le permitirá profundizar el
alcance de su análisis, con respecto a llegar solo a la Estadística Descriptiva,
como podrá valorar más adelante.
Según los objetivos de su aplicación, se divide en Descriptiva e Inferencial:
• Constituida por el conjunto de métodos

estadísticos dedicados al procesamiento
inicial de los datos primarios, o sea, el
Estadística resumen y presentación de la información
Descriptiva recogida sobre un determinado aspecto o
problema, en términos de estimadores o
parámetros de tendencia central, dispersión
y posición relativa.
• Rama de esta ciencia dedicada al análisis

de la información, que permite las pruebas
de hipótesis, para servir como elemento de
Estadística apoyo en la interpretación de los resultados
y posterior toma de decisiones sobre la base
Inferencial de los mismos. La aplicación de la
Estadística Inferencial tiene implícita en su
primera etapa, el empleo de la Estadística
Descriptiva.
:
42
2.2.1.1 Método Estadístico
El Método Estadístico es una forma particular del Método Científico de

investigación, de ahí que sus etapas tengan puntos comunes entre sí.
Etapas del Método Estadístico

Las acciones a realizar se agrupan en cuatro etapas, las que se ilustran en la
Figura 7; son muy similares a las que deben acometerse en una Investigación
Educativa, tal y como se presentó con antelación; de hecho, muy similares a las
de cualquier otra investigación en la que se esté aplicando el Método Científico,
como es de esperar; no obstante, se precisan de inmediato algunos aspectos que
ameritan detallarse en este momento de la etapa de Planificación de la
investigación.
Elaboración o
procesamiento
Planificación de de los datos
la investigación recogidos
Recolección Análisis e
de la interpretación
información
Figura 7. Etapas del Método Estadístico
Antes de proceder a la recolección de la información, en la etapa de Planificación

de la Investigación, deben precisarse la Población y la Muestra con las que se
trabajará. Cabe dejar sentado que la mayor confiabilidad de los resultados a
alcanzar corresponde a aquellos estudios que se lleven a cabo con todos los
43
elementos de la población. El muestreo conlleva ineludiblemente algún grado de

pérdida de información, por muy riguroso que se realice. Se trabaja sobre la
muestra en numerosas oportunidades, dado que se presenta como la única opción
factible ante la magnitud de la población, ya sea por recursos financieros o de otra
índole. Es trascendente reconocer debidamente los conceptos de Población y
Muestra, y el carácter relativo que poseen. Así, se tiene que:
Usted puede tener en un

momento dado tres grupos de
clases con un total de 60
estudiantes, esa podría ser su
población. Y por ejemplo, para
participar en acciones
sistemáticas de beneficio al
medio ambiente, le invitan a
participar en cada ocasión a 12
estudiantes en los que estén
representados los tres grupos
en equidad numérica; 12 de 60
sería la muestra (20% de 60).
Ejemplo 20
En una investigación en la Universidad de las Ciencias Informáticas, en
dependencia del estudio que se vaya a realizar (digamos, resultados docentes en
Matemática I), pueden tener lugar entre otras algunas de las situaciones
siguientes:
44
Variante 1 Variante 2
POBLACIÓN
POBLACIÓN
Total de estudiantes de los grupos
Todos los estudiantes de atendidos por uno de los profesores
primer año (alrededor de conferencistas (usualmente entre dos y 6
mil alumnos) grupos de alrededor de 20 estudiantes
cada uno)
MUESTRA MUESTRA
Cualquier subconjunto de Determinada fracción del total de
estudiantes tomados de la estudiantes de ese profesor (garantizando
Población representatividad de cada grupo aludido)
Fin del Ejemplo 20
Por circunstancias como las de los ejemplos anteriores, los conceptos de

Población y Muestra son relativos. Se debe estar consciente que la
generalización de los resultados será válida solo para aquella población de la cual
la muestra con la que se haya trabajado resulte debidamente representativa.
Índice
En la recolección de la información, se distinguen a su vez tres etapas, cuya

identificación y desarrollo poseen marcada importancia en el éxito de la
investigación a ejecutar. Estas son:
Planificación Ejecución Verificación
Existen tres niveles en los que puede darse la recolección de la información,

atendiendo de modo decreciente a su magnitud, denominados: Censo, Encuesta
y Entrevista. El Censo incluye a todos los elementos de la población; es costoso,
trabajoso; su realización lleva un tiempo apreciable; proporciona una información
máxima de las variables en estudio; en el caso de los poblacionales que habitan
45
un país, se realiza comúnmente con frecuencia no menor de 4 años. La Encuesta

por su parte, se le aplica al sector de la población que se estime pertinente, es
menos costosa que el Censo y se puede hacer con mayor frecuencia que este,
aunque como es lógico, el valor de su información es más limitado. Mientras que
la Entrevista es de estos tres, el escalón menos abarcador de recolección de
información, supuesto que se le aplique a muchas menos personas que en la
encuesta. Cabe puntualizar que tanto en el Censo como en la Encuesta pueden
estarse haciendo entrevistas, como de hecho es práctica en algunos lugares,
aunque ajustadas en su extensión a la magnitud de tales investigaciones.
Algunas de las técnicas e instrumentos para la obtención y registro de los

datos, en la recolección de la información, son:
Registro Planilla de recolección de datos

Cuestionario Bases de Datos
Antes de confeccionar los instrumentos de recolección de información, se les debe
prestar atención a la operacionalización de las variables, garantizando que se
correspondan con el nivel de información necesario para cumplir los objetivos
propuestos en el estudio. Relacionados con los instrumentos para la recolección,
se debe considerar además, el equipo de medición, si se fuese a utilizar, y los
requisitos de objetividad-exactitud, confiabilidad y validez que deben cumplir de
ser necesarios tales equipos. En cuanto a las preguntas es importante ver que
existen los tipos de preguntas: cerrada, abierta y semi-abierta.
La Recolección de la información constituye para el investigador una etapa de

alta trascendencia. La calidad de la información determina decisivamente en la de
los resultados del estudio. Mientras que la elaboración y el resumen puede hacerlo
un técnico estadístico competente, la recolección tiene que estar en manos del
propio investigador, vigilarla constantemente, garantizando que se realice
conforme a los planes trazados previamente. Una mala recolección traerá
resultados catastróficos.
La información también se recolecta durante la Observación o el Análisis

documental, según el tipo de investigación.
Entre los principales aspectos que deben considerarse al recoger la

información están:
- Los errores que pueden cometerse en la recolección de datos y la manera

de controlarlos.
- Las ventajas y limitaciones de los diversos métodos empleados en la
recolección de la información.
46
- Las condiciones que deben reunir los individuos que se estudian y los
procedimientos más convenientes para su elección.
- El diseño de formularios exhaustivos que servirán para registrar la
información.
Ejemplo 21
Si en un estudio se toma como unidad de análisis a estudiantes que han

suspendido asignaturas en los años precedentes, se está considerando como
población al conjunto de estudiantes que han suspendido alguna asignatura
en los años precedentes; pero esto, aún cuando concuerda con lo definición
vista, resulta bastante impreciso para ser utilizado en una investigación. Es
evidente la necesidad de delimitar mejor la población, por lo que el investigador se
debe detener a pensar ¿Hacia qué población se desean generalizar los
resultados? Si el interés es generalizarlo hacia una asignatura X de la Disciplina
Matemática (le corresponden las asignaturas Matemática I, II, III y IV), entonces la
población definitivamente es: el conjunto de estudiantes que han suspendido
alguna asignatura X de la Disciplina Matemática en los años precedentes; y
si se va a trabajar solo con una muestra, obligadamente esta debe extraerse de
esa población.
Fin del Ejemplo 21

Algunos de los Errores más comunes que se presentan en la recolección de la
información, pueden ser:
 No definir conceptualmente las variables, no operacionalizar debidamente a las

que lo requieren
 Uso sin validación de instrumentos desarrollados en otro espacio y tiempo
 Cualidades del instrumento (redacción, claridad, etc.)
 No realizar pruebas pilotos que determinen confiabilidad y validez del
instrumento
 Falta de respeto al informante al poner por escrito en el cuestionario frases
como Responda con sinceridad
Índice
2.2.2 Muestra. Tipos de muestreo
Atendiendo al uso de las probabilidades en el momento de definir la muestra,

existen dos caminos para el muestreo, que identifican su tipo: No probabilístico
47
(Por criterios - a juicio - del investigador, o circunstancias que se presentan) y

Probabilístico (Aleatorio). Si en un grupo de sus estudiantes precisa declarar el
o los que más participan en las clases, esta sería una muestra no probabilística,
no son cualesquiera de los estudiantes los que integrarían el subgrupo en
cuestión. Asimismo sucedería si resultase necesario precisar los de menor
aprovechamiento docente; estaría definiendo una segunda muestra atendiendo a
este nuevo criterio. No resultan pocas las ocasiones en las que resulta
prácticamente obligado trabajar con muestreo no probabilístico, lo que sitúa al
investigador en condiciones de no poder generalizar los resultados a los que
arriba.
A diferencia del anterior, el Muestreo probabilístico o Diseños muestrales
probabilísticos, son aquellos en los que se usa la teoría de la probabilidad para
seleccionar las unidades muestrales, mediante un plan bien definido antes de
recopilar cualquier dato. Los elementos de una muestra o unidades muestrales,
deben ser escogidos adecuadamente para poder extender los resultados que se
observen a los elementos de toda la población. En ese caso la muestra será
llamada una muestra representativa, y como su nombre lo indica, representa a
toda la población. Debe estarse bien alerta porque aún cuando se utilice un
procedimiento probabilístico en la selección de la muestra, esta pudiera no resultar
lo representativa que es esperado.
Sobre muestreo el interesado que no satisfaga sus necesidades en el presente
documento, podrá consultar Técnicas de muestreo, Cochran (SA); y los capítulos
8 y 13, de Metodología de la Investigación, Hernández, Fernández y Baptista
(2014), entre otras obras que tratan ese contenido.
Ejercicio 9
Complete la información en el diagrama siguiente;
Tipos de muestreo
atendiendo o no al uso
de las probabilidades
Fin del Ejercicio 9 \Índice
48
2.2.3 Factores que deben tenerse en cuenta para obtener una buena
muestra:
I. El tamaño de la muestra
Se recurre a una muestra cuando no resulta posible por diferentes motivos

realizar el estudio en toda la población. Las limitantes para hacer el estudio
directamente sobre el total de la población pueden ser de índole económico, de
tiempo, conveniencia, factibilidad, etc. o limitantes que estén dadas en la
combinación de dos o más factores de los mencionados. Muestra es por lo
general pérdida de información, conlleva a menos exactitud de los resultados.
Siempre que el estudio pueda llevarse a cabo con todos los elementos que
integran la población, se estará haciendo un estudio más riguroso. No obstante,
en numerosos casos prácticos no queda otra alternativa que recurrir a la
selección de una muestra para hacer el estudio deseado.
La muestra debe tener en cuenta si los elementos de la población tienen poca

o mucha variabilidad en los valores de las variables más importantes del estudio
que deba hacerse; para obtener la información a priori sobre la variabilidad de
la variable de mayor interés en el estudio dentro de población, se puede
consultar con un investigador de experiencia en el campo de interés, realizar un
pilotaje (estudio preliminar con una muestra de menor tamaño) o buscar
información en la literatura sobre investigaciones similares en la que se reporte
este estimador.
De cómo obtener el tamaño de una muestra en determinadas circunstancias se

estará hablando más adelante en este documento cuando se presente el
estadígrafo Z de pruebas de hipótesis con la Distribución Normal.
II. Las condiciones de selección de la muestra
La muestra debe ser seleccionada tomando en consideración determinados
criterios (métodos o esquemas de muestreo) que respondan a las condiciones
específicas de cómo los valores de las principales variables de interés en el
estudio, están dados en el seno de la población, de manera que refleje los
aspectos esenciales de la misma de una manera adecuada.
Un elemento trascendente adicional, es el de las condiciones que debe poseer

una muestra representativa, buena, válida. La muestra representativa es aquella
que posee, a su menor escala, características similares en las variables que se
están estudiando, con respecto a las que poseen dichas variables en la población
de la que es extraída. Las condiciones de una muestra representativa, se
asocian con sus atributos de:
49
 Tamaño (cantidad de elementos de la población incluidos en la

muestra)
 Calidad (forma en que fueron seleccionados los elementos que la
integran)
Una muestra representativa será la que posee un tamaño y calidad apropiados

para hacer mínimos los errores del muestreo. Más adelante se tratará cómo
proceder para inducir el logro de estas condiciones en la selección de la muestra
en cuestión.
\Índice
2.2.4 Procedimientos de muestreo probabilístico. Muestreos Aleatorios

Simple, Estratificado y por Conglomerados
Para que las conclusiones deducidas a partir de los resultados obtenidos de una
muestra sean válidas, lo primero que debe tenerse en cuenta es el método o
procedimiento de elegir la muestra, de manera que la selección no esté permeada
por el criterio personal del investigador o preferencias profesionales de diversa
índole; además, el proceso de selección debe ser comparable con un experimento
aleatorio (Cada vez que se repite bajo las mismas condiciones, existen factores
del azar que causan variaciones en los resultados de los valores de las variables
observadas). Es en esas circunstancias que se elige obtener una muestra
aleatoria. Los tres tipos de muestreo probabilístico más utilizados son: muestreos
aleatorio simple, estratificado y por conglomerados.
I. Muestreo Aleatorio Simple (MAS)
Este muestreo constituye el enfoque más directo para obtener una muestra
probabilística. Es aplicable cuando la población tiene poca variabilidad en los
valores de las variables principales objeto de estudio, es decir, cuando hay un
comportamiento más o menos uniforme de las características principales que se
desean estudiar en toda la población.
El MAS consiste en:
1. Identificar la población en la que se realizará el estudio (tamaño N)

2. Calcular el tamaño de la muestra, n
3. Numerara cada elemento de la población
4. Determinar una cantidad de números aleatorios igual al tamaño de la muestra
50
5. Extraer la muestra que estará integrada por cada uno de los elementos de la
población que correspondan a los números aleatorios determinados con
antelación.
Ejemplo 21
Casos en los que el MAS estaría fundamentado, serían en investigaciones sobre:
a. Conocimientos de Español en alumnos de todos los grupos, de un mismo

maestro y grado, de una escuela primaria
b. Nivel de estudio alcanzado por los padres de los alumnos de distintos
grados de una escuela primaria
c. Disponibilidad de tablet y teléfonos celulares en alumnos de 6to grado
Fin del Ejemplo 21
Ejemplo 22
Dada la población que representan19 alumnos de un aula, seleccione una muestra

aleatoria de tamaño 5.
Solución:
1. Aquí ya es dato el tamaño de la población, N=19.
2. Asimismo, ya es un dato el tamaño de la muestra, n= 5
3. Se numera la población. En este caso es usual la existencia de un registro de
asistencia en el que, por orden alfabético del primer apellido, ya estén los
nombres de todos los alumnos.
4. Se seleccionan por algún procedimiento apropiado, tantos números aleatorios
como tamaño de muestra se requiera. Por ejemplo, con el EXCEL pondría en
una celda =ALEATORIO.ENTRE(1,19), y desplazando por 5 celdas se
obtuvieron los números 8, 9, 5, 19 y 1
5. Se procede al estudio en cuestión con los cinco alumnos cuyos nombres se
corresponden en el listado con los cinco números aleatorios determinados
antes
Fin del Ejemplo 22
Más adelante se estudiará la Distribución Normal y de sus propiedades se

presentará una fórmula para el cálculo del tamaño de muestra.
Índice
51
II. Muestreo Aleatorio Estratificado (MAE).
Estratificar significa dividir la población en subgrupos (estratos) en función de las

variables o características que interesan ser estudiadas; la estratificación permite
una mayor correspondencia entre la población y la muestra, respecto a las
variables o aspectos por los que se realizó la estratificación.
Es conveniente aplicar la estratificación cuando la variabilidad de los valores de

las variables de interés en el estudio resulta muy cambiante dentro de la
población, buscando que dentro de cada estrato la variabilidad disminuya, aunque
entre estratos si existan diferencias importantes. En otras palabras, los valores de
la variable de interés principal en el estudio se encuentran en el seno de la
población de modo tal, que por estratos posee cierta homogeneidad, mientras que
de un estrato a otro las diferencias son significativas. Tal sería el caso de
Conocimientos de Español en alumnos de 2do. a 6to.grado de una escuela
primaria
Ejemplo 23
A modo de ejemplo, para el cálculo de una muestra en MAE, considérese una

escuela de nivel primario con N=700 estudiantes, distribuidos supuestamente a
razón de 100 por cada nivel (desde preescolar hasta el 6to. grado). Suponga que
tiene que sacar una muestra aleatoria de 21 alumnos de cada nivel (ntotal= 21x7=
147) para posteriormente hacer un estudio socio económico de las familias en las
cuales conviven. De acuerdo a los datos y requerimientos, se cumple:
N𝑃𝑟𝑒𝑒𝑠𝑐𝑜𝑙𝑎𝑟 = N1𝑟𝑜. = N2𝑑𝑜. = N3𝑟𝑜. = N4𝑡𝑜. = N5𝑡𝑜. = N6𝑡𝑜. = 100
𝑖=6
𝑡𝑜.
N𝑡𝑜𝑡𝑎𝑙 = ∑𝑖=𝑃𝑟𝑒𝑒𝑠𝑐𝑜𝑙𝑎𝑟 N𝑖 =N𝑃𝑟𝑒𝑒𝑠𝑐𝑜𝑙𝑎𝑟 + N1𝑟𝑜. + N2𝑑𝑜. + N3𝑟𝑜. + N4𝑡𝑜. + N5𝑡𝑜. + N6𝑡𝑜. = 700
npreescolar= n1ro.= n2do. = n3ro. = n4to.= n5to. = n6to.=21 y
𝑖=6
𝑡𝑜.
𝑛𝑡𝑜𝑡𝑎𝑙 = ∑𝑖=𝑃𝑟𝑒𝑒𝑠𝑐𝑜𝑙𝑎𝑟 𝑛𝑖 = npreescolar + 𝑛1𝑟𝑜. + 𝑛2𝑑𝑜. + 𝑛3𝑟𝑜. +𝑛4𝑡𝑜. + 𝑛5𝑡𝑜. + 𝑛6𝑡𝑜. )=147.
52
Para definir los 21 alumnos de cada nivel se numera previamente a los 100 del
mismo; por alguna vía obtiene 21 números aleatorios en el intervalo [1, 100]
(puede hacerlo en EXCEL auxiliándose de la función
=ALEATORIO.ENTRE(inferior, superior) y pasan a integrar la muestra de dicho
nivel aquellos alumnos que se corresponden con los números aleatorios obtenidos
para el nivel en cuestión (Nota: Debe obtener para cada nivel 21 nuevos números
aleatorios, alguno pudiera coincidir)
Fin del Ejemplo 23
Las fórmulas de trabajo a utilizar cuando el tamaño de los estratos sea diferente y
también pueda serlo la cantidad de elementos a seleccionar de cada estrato, para
integrar la muestra total, son:
1. Identificar el tamaño de la población N, la cantidad de estratos K y el tamaño Nj
de cada uno (Note que para K estratos, 𝑁 = 𝑁1 + 𝑁2 + ⋯ + 𝑁𝐾 )
2. Calcular el tamaño de muestra total 𝑛
3. Hallar proporcionalmente el tamaño de la muestra 𝑛𝑗 de cada estrato, por
medio de asignación proporcional, es decir:
Nj
Peso relativo de cada estrato: p j 
N
Tamaño de muestra a obtener de cada estrato: 𝑛𝑗 = 𝑝𝑗 ∗ 𝑛, para 𝑗 = 1, 𝐾
Índice
III. Muestreo Aleatorio por Conglomerados
Usualmente se acude a este tipo de muestreo cuando se presume que puede

existir una asociación física, de ubicación geográfica, de la variable de interés del
estudio con el lugar del que proviene, o se encuentra, el sujeto que integra la
población. Supóngase que se desea indagar sobre el tiempo promedio que le
toma a los alumnos llegar a la escuela; habría que hacer una muestra
representativa de alumnos atendiendo a las zonas en las que residen. Se procede
de modo similar al MAE, lo que ahora la zona de residencia pasaría a tomar el
lugar del estrato.
Ejercicio 10
Enlace con segmentos de recta el tipo de muestreo que aplicaría en los ejemplos
de investigaciones relacionadas a continuación y complete las celdas en blanco de
la primera columna con dos nuevos ejemplos:
53
Tipos de
Ejemplos muestreo
aleatorio
Estado de tranquilidad social del lugar de
residencia del alumno
Horas dedicadas a ver televisión de los alumnos Simple
de los 3 grupos existentes de 5to. Grado en una
escuela
Años de experiencia docente de los profesores
de una escuela
Nivel de conocimientos de Historia de los Estratificado
alumnos en una escuela
Por
Conglomerados
Fin del Ejercicio 10

Índice
2.2.5 Muestreos en procesos continuos (sistemáticos, repetitivos)
Numerosos procesos en la naturaleza y en la sociedad transcurren de modo

continuo por su propia esencia, como es el movimiento de los planetas del sistema
solar (de carácter determinístico), siempre en cada instante en la misma posición
esperada y con igual velocidad de rotación alrededor del sol.
En la industria, los procesos de tecnologías más avanzadas, también suelen tener

tal cualidad, como son los que tienen lugar en las plantas petroquímicas y en las
modernas potabilizadoras de agua (de carácter aleatorio en las propiedades de los
productos, aunque con poca dispersión respecto a los índices de calidad a
cumplir), entre otras.
Para el comportamiento de la asistencia a una escuela, considerando de lunes a

viernes y en periodos de clases, diariamente se estaría en presencia de un
proceso continuo de carácter aleatorio.
El nivel de atención de los alumnos durante una clase, es también una variable
continua y de carácter aleatorio.
El muestreo sistemático solo se realiza en los procesos continuos de naturaleza
aleatoria.
54
Ejemplo 24
A modo de ejemplo, considere el presentado antes (una escuela de nivel primario

con N=700 estudiantes, distribuidos supuestamente a razón de 100 por cada nivel,
desde preescolar hasta el 6to. grado). Ahora se propone hacer un estudio durante
20 semanas con dos variables a medir en cada alumno: puntualidad (en tiempo, y
atrasado) y forma de uso del uniforme (incorrecto y correcto). Al respecto y fijando
el momento de registro de la información, cuatro de las formas de acometer el
estudio pueden ser:
a) Todas las 20 semanas y a la llegada de cada uno de los estudiantes
b) Seleccionar aleatoriamente 4 de las 20 semanas y a la llegada de cada uno

de los estudiantes
c) Seleccionar aleatoriamente 1 semana dentro de cada uno de los 4periodos
consecutivos de 5 semanas (semanas 1 a la 5, 6 a la 10, 11 a la 15y 16 a la
20) y a la llegada de cada uno de los estudiantes
d) Seleccionar aleatoriamente una semana dentro de las primeras 5 (suponga

que sale la semana 3), y después repetir el registro cada una de las
próximas 5 semanas (semanas 8, 13 y 18) y a la llegada de cada uno de los
estudiantes
El caso a) sería un estudio sin muestreo, se estaría realizando con toda la

población o universo, exhaustivo, requeriría más tiempo del personal para
realizarlo. Sus resultados serían los más exactos posibles. Los casos b), c) y d)
toman en cuenta muestreo con aleatoriedad, manteniendo fijo lo del registro de la
información solo en 4 semanas de las 20. Con mayor peso, los casos c) y d)
toman en consideración lo de continuo del proceso, por lo que los resultados a
alcanzar deberán ser los más confiables.
Fin del Ejemplo 24
Algo más de información sobre este tipo de muestreo puede encontrarlo en

Selección sistemática de elementos muestrales (Hernández Sampieri, Fernández
Collado y Baptista Lucio, 2014).
Índice
2.2.6 Parámetros (Estadísticos o estadígrafos) poblacionales y muestrales
Muy importante son los conceptos de parámetros (estadísticos o estadígrafos)

poblacionales y muestrales. Los estadísticos o estadígrafos, son valores
calculados a partir de un conjunto de datos primarios, de la (o las) variable de
interés que indican determinadas cualidades relevantes que caracterizan a ese
55
conjunto de datos recopilados. Pueden agruparse en tres tipos según lo que

representan:
De tendencia central (moda, mediana, y media aritmética o promedio)
De dispersión (varianza, desviación estándar, coeficiente de variación y

rango)
De posición relativa (centiles, deciles y cuartiles)
Más adelante se definen otros estadísticos para finalidades a explicar en su

momento.
Estadígrafo o estadístico, como lo llaman indistintamente algunos autores, son

números que se obtienen de fórmulas o funciones, que se calculan a partir de los
valores (datos primarios) de una muestra aleatoria.
Los estadígrafos son variables aleatorias, ya que al depender de los valores de

una muestra aleatoria, el carácter de ésta se trasmite al valor del estadígrafo. Por
lo tanto también los valores del estadígrafo, obtenidos para distintas muestras,
siguen un modelo teórico de probabilidad. Al conjunto de valores que toma el valor
del estadígrafo, correspondientes a diferentes muestras se le denomina la
distribución muestral de los valores del estadígrafo. De tal modo, la distribución de
las medias muestrales puede representarse por: 𝑋 = {𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑘 }.
Una propiedad de suma importancia, cuya demostración puede encontrarse en la

literatura especializada, es que la distribución de las medias muestrales sigue el
comportamiento de la Distribución Normal, independientemente de la distribución
teórica que pueda representar al comportamiento de los valores de la variable
original de que se trate.
Índice
Existen dos estadísticos especialmente útiles para procesar valores de variables

cualitativas: Razón y Proporción
RAZÓN (R): Sean los datos A y B que cumplen que A no está contenido en B (no
tienen elementos comunes). La razón es la relación A/B. Puede tomar valores
mayores de 1.
PROPORCIÓN (P).- Sean los datos A y A+B, para los cuales se establece la
relación: A/(A+B). Observe que A está presente también en el denominador. Se
cumple que 0 ≤ 𝑃 ≤ 1.
56
Tabla 4. Algunos parámetros indicadores de Tendencia central y de Dispersión
Parámetro Muestra
Población (tamaño N)
(Estadístico) (tamaño n)
Media (promedio
aritmético), ∑𝑁
𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑥𝑖
medida de 𝜇= 𝑥̅ =
𝑁 𝑛
tendencia central
Ordenado previamente en
orden ascendente (o
descendente) los valores, se
toma el que ocupa la posición
Idem al procedimiento de
Mediana intermedia si el total es impar,
la población
o la semisuma de los que
ocupan las posiciones
alrededor de la intermedia si el
total de valores es de orden par
Valor que más se repite
Idem a la población, en
Moda (pueden existir más de una
los valores de la muestra
Moda)
Varianza (medida ∑𝑁𝑖=1(𝑥𝑖 − 𝜇)
2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
de dispersión) 𝜎 2
= 𝑠2 =
𝑁 𝑛−1
Desviación
estándar o típica 𝜎 = √𝜎 2 𝑠 = √𝑠 2
Coeficiente de 𝜎 𝑠
𝐶𝑉 = ∗ 100 𝐶𝑉(%) = ∗ 100
variación, CV (%) 𝜇 𝑥̅
𝑅𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 Idem a la población, con
Rango
− 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 los valores de la muestra
Nota: Todos los parámetros muestrales (𝑥̅ , Mediana, Moda, 𝑠 2 y 𝑠), son
estimadores puntuales de los respectivos parámetros poblacionales 𝜇,
Mediana, Moda, 𝜎 2 y 𝜎.
Ejemplo 25
Suponga que la información del lugar de procedencia de los 17 estudiantes del

Grupo 16 de la FICI, atendiendo a provincias occidentales (OC), centrales (CE) y
orientales (OR) es:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
OR OR OC CE OC OC CE OR OC OC OR CE OC OR OC OC OC
Calcular Razón y Proporción de estudiantes de las provincias OC
57
Solución:
Por inspección se identifican 9 de las OC, 3 de las CE y 5 de las OR.
9 9
𝑅𝑂𝐶 = = 1.125~ 1.1 𝑦 𝑃𝑂𝐶 = = 0.529~ 0.5
8 17
Fin del Ejemplo 25
Se seguirá el convenio, cuando resulte necesario identificar la Razón y Proporción

muestrales, de escribirlas como 𝑅̂ y 𝑃̂, y las poblacionales solo con R y P
respectivamente. Se cumple que 𝑅̂ y 𝑃̂ son estimadores de los respectivos
parámetros poblacionales R y P.
Ejemplo 26
En el recién realizado examen final de Matemática I, los 17 estudiantes del grupo

16 de la Facultad Introductoria de Ciencias Informáticas de la Universidad de las
Ciencias Informáticas, obtuvieron las calificaciones (en escala de 2 a 5) siguientes:
4; 3; 4; 2; 5; 3; 3; 2; 2; 3; 3; 5; 2; 2, 3; 3 y 4
Calcule media aritmética (promedio), mediana, moda, varianza, desviación

estándar (o típica), coeficiente de variación (en porcentaje) y Rango.
Solución:
Media aritmética
4 + 3 + 4 + 2 + 5 + 3 + 3 + 2 + 2 + 3 + 3 + 5 + 2 + 2 + 3 + 3 + 4 53
𝑥̅ = = ~ 3.1−
17 17
Mediana
Requiere el ordenamiento previo de los valores en cuestión:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 5 5
El total de valores es impar, la posición intermedia corresponde al número

de orden 9 y la mediana es 3. Significa que la mitad de las calificaciones
58
resultan o están por debajo de 3. Asimismo, que la mitad de los valores son
o están por encima de 3. El valor de calificación 3 es una medida de
tendencia central del conjunto de datos primarios utilizados.
Moda
La Moda es 3; valor que se repite 7 veces. Más de lo que se repite el 2 (5

veces), el 4 (3 veces) o el 5 (dos veces)
Varianza
Para el cálculo de 𝑠 2 es recomendable tomar el mayor número de cifras

decimales significativas del cálculo precedente, por lo que ahora se
retomará 𝑥̅ = 3,11764706
(4 − 3,11764706)2 + (3 − 3,11764706)2 + … + (4 − 3,11764706)2

𝑠2 = = 0,985294118
17 − 1
Desviación estándar
𝑠 = √𝑠 2 = √0,985294118 = 0,992619825~ 0,99
Ciertamente, este valor no es sencillo de asociar con el nivel de dispersión que

poseen los datos primarios. Hay que tener muy presente el rango en los que
estos están comprendidos, para apreciar así cuánto es 0,99 respecto al mismo.
Coeficiente de variación (%)

0,992619825
𝐶𝑉(%) = 3,117647059 ∗ 100 = 31,8387491% ~ 32% ¡El mejor parámetro de los
de Dispersión! Es muy informativo lo que significa 32%, sin tener que estar
entrando en detalles sobre los valores de los datos primarios en cuestión.
Rango
𝑅𝑎𝑛𝑔𝑜 = 5 − 2 = 3
Fin del Ejemplo 26
59
Con el SPSS 20 para los datos anteriores, se obtuvo:
Estadísticos descriptivos
N Rango Mínimo Máximo Media Desv.

típ.
Calificación 17 3 2 5 3.12 .993
N válido (según
17
lista)
Índice
60
ATENCIÓN, ESTÉ ALERTA DE NO COMUNICAR

RESULTADOS
CON CIFRAS DECIMALES INNECESARIAS.
EVITE LAS MALAS PRÁCTICAS QUE TANTO

ABUNDAN.
¡QUE EL RIDÍCULO LO HAGAN OTROS!

Los software convenientemente trabajan con el mayor número de
cifras decimales que pueden, atendiendo a las características de las
computadoras o calculadoras para los que fueron desarrollados, con
la finalidad de que al ejecutar internamente los cálculos, los errores
no se propaguen indebidamente en los pasos intermedios y puedan
llegar a resultados absurdos. Ahora bien, el que tiene que pensar y
decidir, respecto al número de cifras decimales con las que se queda
finalmente, es el que muestra los resultados, sobre todo de modo
público. Para el ejemplo anterior, los datos primarios no tienen
cifras decimales y son solo del orden de las unidades; no se refiere a
cálculos con grandes cantidades de dinero. E s suficiente entonces
dar los resultados de la media con una sola cifra decimal y el de la
desviación estándar con dos (no se daría el resultado de la varianza
porque su información de la dispersión del conjunto de datos
primarios es de peor calidad que la que proporciona el resultado de
la desviación estándar). La desviación estándar posee las mismas
unidades en que están dados los datos primarios, es la que puede
llegar a comprenderse mejor su magnitud en cualquier caso
específico. Sin embargo, el estimador de dispersión de mayor calidad
es el coeficiente de variación, que calculado en porcentaje para este
ejemplo (con un resultado del orden de las tres decenas), debe
mostrarse con no más de una cifra decimal a lo sumo; finalmente, si
se reporta el coeficiente de variación, es redundante informar el
valor de la desviación estándar.
Índice
61
2.2.7 Distribución muestral de la media aritmética, cuando la variable original

es normal.
Cuando se estudió la Distribución Normal se mostró que esta queda plenamente

definida por dos parámetros: la media  y la desviación estándar . Ahora
tenemos dos variables aleatorias: 𝑋 𝑦 𝑋̅. Se describen a continuación algunas
particularidades de la distribución de 𝑋̅ cuando 𝑋 tiene Distribución Normal.
Considerense todas las muestras posibles de tamaño n que puede extraerse

aleatoriamente, con o sin reemplazamiento de una población dada. Para cada
muestra pueden calcularse estadígrafos tales como la media, la varianza y la
desviación estándar; se apreciará que para cada muestra estos estadígrafos
varian, lo que ermite obtener una distribución del estadígrafo al que se le
denominará Distribución muestral.
Ejemplo 27
Sea la población formada por los valores 1 ; 2 ; 3. La media poblacional es 𝜇 = 2
De inmediato se obtienen todas las muestras de tamaño 2 que se puede extraer

de la población dada y su media muestral ( Muestras posibles 32 = 9 ).
(1;1) x 1
(1;2) x  1,5
(1;3) x2
(2;1) x  1,5
(2;2) x2
(2;3) x  2,5
(3;1) x2
( 3; 2 ) x  2,5
(3;3) x3
Como se observa, para cada muestra se obtuvo su media muestral, pero si

caalcula la media de todas las medias muestrales, ocurrirá que esta coincide con
la media poblacional:
62
1  1,5  2  1,5  2  2,5 2  2,5 3

2
9
De la misma forma se puede verificar que la desviación estándar de todas las

desviaciones estándar muestrales dividida por la raíz del tamaño de muestra es la
desviación estándar de la población. ¡ Verifíquelo !
Fin del Ejemplo 27
Luego, para evitar confusiones, se le llamará 𝜇𝑋 y 𝜎𝑋 a los valores de la media y la

desviación estándar respectivamente de la distribución de la variable 𝑋, mientras
denotaremos por 𝜇𝑋̅ y 𝜎𝑋̅ a los valores parámetros de la distribución de 𝑋̅.
Cuando la distribución de la variable 𝑋 es normal con media 𝜇𝑋 y desviación

estándar 𝜎𝑋̅ , entonces la distribución o modelo teórico de la media muestral 𝑋̅ con
x
una media igual a 𝜇𝑋 , (𝜇𝑋 =𝜇𝑋̅ ), y una desviación estándar  x  donde n es el
n
tamaño de la muestra.
x
El valor  x  , que representa la desviación estándar del modelo de 𝑋̅, en otras
n
palabras, la desviación teórica que tienen los valores de 𝑋̅ con respecto a la
media  x , se conoce también con el nombre de error estándar de 𝑋̅, se le denota
𝑠
por EE 𝑋̅ y se estima puntualmente por medio de la expresión 𝐸𝐸𝑋̅ = .
√𝑛
Es importante señalar que aunque la variable 𝑋 no siga el comportamiento de la

Distribución Normal, si se tiene una cntidad numerosa de observaciones
independientes, entonces el modelo de 𝑋̅ puede ser aproximado por el modelo de
la Distribución Normal.
Como se puede apreciar, al estimar el valor de un parámetro  a partir de su

estimador puntual  , casi siempre existe una diferencia entre los valores real y
estimado que se define como error de muestreo y se calcula por  - .
Índice
63
2.3 Estimación puntual y por intervalos
Hay dos tipos de estimación, la estimación puntual, en la que la estimación es un

valor numérico calculado a partir de algún estadístico (media, varianza, …); y la
estimación por intervalos, en la que se selecciona un valor de probabilidad
determinado, el cual es directamente proporcional a la amplitud del intervalo de
estimación del parámetro en cuestión. En la estimación lo que se persigue es
obtener un valor aproximado (estimado) de un valor poblacional que se
desconoce, a partir de datos muestrales y fijar el grado de incertidumbre que
corresponde a obtener esa estimación por intervalo, en términos de probabilidad.
(El estimador es una función y la estimación, un valor).
Las fórmulas de trabajo de los estimadores puntuales son las ya presentadas

(Tabla 4, Algunos parámetros indicadores de Tendencia central y de Dispersión):
𝑥̅ → 𝜇; 𝑠 2 → 𝜎 2 ; 𝑠 → 𝜎; … ; 𝑅̂ → 𝑅 𝑦 𝑃̂ → 𝑃
Propiedades de los estimadores:
Existen propiedades que todo estimador debe cumplir, las cuales son:
 Insesgado: Cuando el valor que se espera del estimador, coincide con el valor
del parámetro.
 Eficiente: Dado dos estimadores insesgados de un mismo parámetro, se
considera el más eficiente al que tiene menor varianza.
 Consistente: Si a medida que aumenta el tamaño de la muestra, sucede quela
probabilidad de que la estimación sea el verdadero valor del parámetro tiende a
uno.
 Suficiente: Cuando emplea toda la información que existe en la muestra.
En la estimación puntual no se mide el grado de incertidumbre que se tiene al

hacer la inferencia al resto de la población, y se sabe que los estimados varían de
muestra a muestra, por lo que es importante que siempre vaya acompañado de
una medida de la precisión de la estimación. Para esto es necesario emplear otro
método de estimación conocido como estimación por intervalos de confianza.
Índice
2.3.1 Estimación por intervalo de confianza de la media poblacional (µ) con 

conocida y desconocida.
En este tipo de estimación se busca un intervalo en el que se pueda afirmar que la

media poblacional (o cualquier parámetro) se encuentra en el intervalo con una
confianza determinada expresada en términos de probabilidad. Por ejemplo, para
64
nivel de significación nivel de confianza, p= 1- (95%) es de

esperar que de cada 100 estimaciones de intervalos que se determinen a partir de
100 medias muestrales, el valor de la media poblacional, se encuentre en 95 de
los intervalos calculados.
1.  conocida o no, pero n>30, entonces el intervalo de confianza se halla por la

siguiente expresión:
 
x Z  xZ  (Utilizando la Distribución Normal)
1
2
n 1
2
n
2.  desconocida con n<30; en este caso es necesario estimar y el intervalo

se calcula por la siguiente expresión:
s s
x  t  
   x  t  
(Utilizando la Distribución t de Student)
1 
 2
; n  1

n 1 
 2
; n  1

n
Ejemplo 28
Se desea conocer la estimación por intervalo de confianza para la media

poblacional de calificación final (en escala de 0 a 10) en una asignatura con una
confiabilidad de 0,95. Se seleccionó una muestra aleatoria de 60 estudiantes para
los que resultó una media de 7.4 y la desviación estándar de 0.8.
Solución:
Como se desconoce la varianza poblacional pero n > 30, se utiliza la fórmula de

estimación por intervalo con la Distribución Normal, variable Z.
1    0,95    0,05 =1.96*0.8/RAIZ(60)= 0.2


1  0,975  Z   Z 0,975  1,96
2 1
2
=DISTR.NORM.ESTAND.INV(0.975)= 1.96
s s
x Z  xZ 
1
2
n 1
2
n
65
0,8 0,8
7,41,96   7,41,96
60 60
7,4 – 0,2  7,4 + 0,2
7,27,6
La media poblacional desconocida, de las calificaciones de la que se tomó la

muestra, se encuentra entre 7,2 y 7,6, calculado con 𝛼 = 0,05 (nivel de
significación 5%, equivalente a nivel de confianza 95%)
Fin del Ejemplo 28

Índice
2.3.2 Estimación por intervalo de confianza de una proporción poblacional

(P)
𝐴
Es conocido que se le llama proporción al cociente de 𝐴+𝐵 y en este caso también
se puede determinar un intervalo de confianza para la proporción poblacional, a
partir de las fórmulas:
ˆ .q
p ˆ ˆ .q
p ˆ
ˆ Z 1
p  P p
ˆ Z 1 Para 𝑛 ≥ 30
2 n 2 n
ˆ .q
p ˆ ˆ .q
p ˆ
ˆ t 1 ; n1 
p  P p
ˆ t 1 ; n1  Cualquier 𝑛

 2

 n 
 2

 n
Este tipo de estimación es especialmente útil para el procesamiento de variables

cualitativas, ya que tanto A como B pueden obtenerse por conteo. La proporción
tiene que cumplir: 0 ≤ 𝑃 ≤ 1. Multiplicar su resultado por 100 para llevarla a
porcentaje resulta frecuente.
Cuando no conozca p̂ y q̂ puede asumir el valor 0.5 para ambas y estaría

obteniendo el intervalo de mayor amplitud posible.
Ejemplo 29
En una escuela se desea estimar con una confianza del 95% el porcentaje de
estudiantes que participan en los Juegos Deportivos anuales. Para ello se escoge
al azar una muestra de 120 estudiantes de los que se llega a conocer que 31
66
participan. Estime la proporción poblacional de estudiantes que participan en esos

juegos.
Solución:
31
pˆ  0,26
120
qˆ 1 pˆ 10,26 0,74 =1.96*RAIZ(0.74*0.26/120) =0.08
1 0,95  0,05

1 0,975  Z   Z 0 , 975 1,96
2 1
2
p . q p . q
p  Z   P  p  Z 
1
2
n 1
2
n
0,26 – 0.08 < P < 0,26 + 0.08
0.18 < P < 0.34
La participación de estudiantes en los juegos, en términos de estimado por

intervalo de la proporción poblacional, llevada a porcentaje, está entre el 18 y el
34%.
Fin del Ejemplo 29
Nota: Existen fórmulas similares de estimación por intervalos para los demás
parámetros poblacionales, como la varianza. No se presentan por quedar
fuera del alcance elegido para el presente documento.
Índice
2.3.3 Precisión y tamaño de muestra
 s p . q
Las expresiones Z  ; t   y Z  reciben el nombre
1
2
n  1  ; n  1
 2 
n 1
2
n
de error máximo permisible (emp); también se conocen como precisión y se
denotan por "d". (Más adelante serán útiles también para el cálculo del tamaño de
una muestra). De tal modo, se tiene que
67
 s p . q
𝑑=Z  = t   = Z 
1
2
n  1  ; n  1
 2 
n 1
2
n
En general las fórmulas de intervalos de confianza para la media poblacional 𝜇 y la

proporción poblacional 𝑃, mostradas antes, se pueden expresar como:
𝜇 ∈ {x̅ ± d} 𝑦 𝑃 ∈ {p̂ ± d}
Debe tenerse en cuenta que la amplitud de los intervalos de estimación, son

directamente proporcionales a 𝑍1−∝ y t   en los casos de la estimación de
2  1 ; n1 
 2 
la media y proporción poblacionales (𝜇 y 𝑃) respectivamente, e inversamente

proporcional a √𝑛 .
Los cálculos del Ejemplo 29 se hicieron con 𝛼 = 0.05; en consecuencia, para un

menor valor de 𝛼 (mayor nivel de confianza, 𝑝 = 1−∝) aumentarán, los valores de
𝑍1−∝ y t   haciendo que sea mayor la amplitud del intervalo, mayor valor de
2  1 ; n1 
 2 
"d" o "emp", menos precisa la estimación.
Por otra parte, teniendo en cuenta que hay una relación de proporcionalidad
 s
inversa en los tres casos con el tamaño de muestra (𝑑 = Z  = t  
1
2
n  1  ; n  1
 2 
n
p . q
= Z  ), para un 𝛼 fijo, el recurso para disminuir el emp, o sea, de
1
2
n
aumentar la precisión de la estimación, está en trabajar con una muestra mayor,
de ser posible.
Se puede observar que todos los intervalos están en función del tamaño de la
muestra 𝑛. Y, que a medida que aumente el tamaño de la muestra 𝑛, la amplitud
del intervalo disminuye, es decir, la estimación se hace más precisa. Conocer que
Cuba se encuentra en el Golfo de México (una ubicación relativamente reducida,
es más preciso que solo tener una noción de que se encuentra en el hemisferio
occidental (región bastante más extensa).
Algo que inquieta mucho a los investigadores es cómo determinar el tamaño de

muestra, de modo que no sea tan pequeña que los resultados carezcan de validez
(el intervalo de estimación de los parámetros poblacionales podría ser tan amplio
que no brinde información interesante), pero tampoco tan grande que obtener la
68
información y procesarla represente gastos innecesarios de tiempo y recursos

humanos y financieros.
El tamaño de muestra depende de tres factores fundamentales:

a. Variabilidad, dispersión, de los valores de las variables de interés en el
universo o población. Mientras más dispersos sean estos valores, más
diferentes unos de los otros, mayor ha de ser el tamaño de la muestra.
b. Precisión que se necesita en los resultados, es decir, magnitud del error que se
puede tolerar.
Ejemplo 30
Si se está investigando la cantidad de horas de estudio semanales de

estudiantes universitarios, pudiera esperarse un intervalo de 15 a 30 horas, con
amplitud de 15 horas; aquí un error máximo permisible de 5 horas (33% de 15,
equivale a 𝑑 = 0.33) pudiera ser aceptado.
Fin del Ejemplo 30
Ejemplo 31
En otro contexto de un estudio similar al del Ejemplo 30, pero en niños de 1er.
Grado, el intervalo esperado de horas de estudio a la semana pudiera ser de 5
a 10 horas, de amplitud 5 horas; 1 hora como error máximo permisible ya es
alto, representa un 20%, o sea, 𝑑 = 0.20.
Fin del Ejemplo 31
c. Margen de certeza, confianza (por ejemplo, 95% → 𝑝 = 0.95; ∝= 0.05 o

99% → 𝑝 = 0.99; ∝= 0.01) con los que se desean obtener las estimaciones de
los parámetros poblacionales Media, Desviación estándar, Proporción, … ,
(𝜇, 𝜎, 𝑃, ) … , al generalizar los resultados; mientras mayor sea la certeza
deseada, mayor deberá ser el tamaño de la muestra.
Para fijar el tamaño de muestra se debe en primer lugar, decidir sobre la precisión
(d) que se desea y sobre el nivel de certeza o de confianza a elegir (𝑝 = 1−∝). A
partir de la precisión 𝑑 y el nivel de significación ∝, se está en condiciones de
calcular el tamaño de la muestra despejando 𝑛 de la ecuación de trabajo:
 2
𝑍1− 𝛼 ∗𝜎
2
𝑑= Z  → 2
1 n 𝑛=
2 𝑑2
69
f
Luego si se desea hallar el tamaño de la muestra se tiene que su primera
F
aproximación 𝑛0 = 𝑛 es:
l
 Z  . 
2
i
p  1  
n0   2
 para datos cuantitativos,
H  d 
 
0
f
F
lSi los datos son de variable cualitativa, la primera aproximación se calcula a través
ide la expresión:
p
V  
Z c2 p 1  p Z c2 1 p 
0 n0  o n 0  ,
d2 CV 2. p
p
i
Nota: Si no conoce los valores de éxito y fracaso (𝑝 𝑦 1 − 𝑝 = 𝑞) para el cálculo
c
de la expresión anterior, asuma 0.5 para ambos. Se demuestra que con
t
u
esos valores estaría calculando la muestra de mayor tamaño, la que le
r asegurará de hecho los resultados más seguros.
e
Y el dominado tamaño de muestra óptimo se obtiene en cálculos sucesivos
G
(retomando en cada caso 𝑛0 = 𝑛 ) de:
r
a n0
y n , donde N es el tamaño de la población.
n0
0 1
N
p
i¿Cántos cálculos sucesivos? Siga las magnitudes que le corresponderían al error
c 
máximo
t permisible 𝑑= Z  en la nueva circunstancia.
1
2
n
u
r
¡No pocos software estadísticos hacen los cálculos de tamaño de muestra por las
e
fórmulas anteriores!
B
i¿Y que sucede si no conoce el parámetro poblacional 𝜎? Utilice formulas similares
L
que emplean la desviación estándar 𝑠, obtenible de los propios datos recopilados
e
para la muestra de la variable bajo estudio.
v
e
l
0
f 70
F
i
l
Ejercicio 11
Suponga que Usted se propone hacer un estudio acerca de horas de estudio a la

semana (HES) entre 100 estudiantes del mismo grado de una escuela de nivel
medio superior. Asuma (o genere aleatoriamente) 20 valores de HES entre 1 y 15
(o algún otro intervalo que Usted considere razonable) y obtenga de los mismos
los valores de la varianza y el error típico (Con el SPSS entre por Analizar,
seleccione Estadísticos descriptivos …. Con el EXCEL calcule los valores de
tamaño inicial y óptimo de muestra para valores de niveles de significación de 0,1;
0,05 y 0,01. Obtenga el valor de t a partir de la función DISTR.T.INV. Haga un
gráfico de tamaño óptimo versus valores de nivel de significación. Interprete cómo
cambian dichos valores según aumenta el nivel de significación.
Índice
3. Elementos de Estadística Inferencial (Paramétrica y no Paramétrica)
En la Investigación Educativa se hace un uso intenso de la Estadística con

carácter profesional, lo que se refleja en las numerosas publicaciones científicas
especializadas, entre otras fuentes de divulgación del conocimiento, dirigidas a
hacer cada vez más efectivo los procesos de formación, en particular los de
enseñanza aprendizaje de niños, jóvenes y adultos, y cuando este no es el caso,
al menos a contrarrestar factores adversos que se fortalecen con la modernidad,
no pocos de los cuales se logran llegar a revertir a favor de los propósitos de la
escuela y la sociedad.
No se debe subestimar la investigación educativa que se realiza de modo

espontáneo y no formal en el día a día, en primer lugar en la necesaria
interrelación del maestro consigo mismo, así como con sus alumnos e
interrelación con los demás docentes y personal de la escuela en general. De
hecho, lo hacen no solo los docentes sino también los alumnos y sus familiares
más cercanos, los cuales en cualquier momento están en capacidad de dar a
conocer su diagnóstico acertado, que ya han venido conformando en sus mentes,
de sus maestros y del proceso de enseñanza y aprendizaje en el que están
inmersos en su sociedad.
Con los recursos de la Estadística Descriptiva, expuesta en las páginas anteriores

de este documento, se está en capacidad de planificar la investigación precisando
cuáles deben ser las variables a tomar en consideración en el estudio, que
71
permitan alcanzar los objetivos propuestos, y en fases tempranas de la misma, ir

analizando y regulando la efectividad del procedimiento de recogida de
información, la calidad de esta última y las características del objeto de
investigación que se deben ir revelando a partir de los estadísticos muestrales que
se calculan de tendencia central, dispersión y posición relativa. Y en paralelo, el
buen uso de tablas y gráficos va sentando los elementos para un buen informe de
investigación y ulterior publicación de sus resultados.
El campo de la Estadística Inferencial, que se desarrolla sucintamente a

continuación, amplía con creces los recursos al alcance del investigador en su
afán de transformar para mejorar los procesos en los que participa. El tratamiento
de la incertidumbre en los datos, es el principal elemento que incorporan los
métodos propios de la Estadística Inferencial en sus dos grandes componentes, la
Paramétrica apoyada en el comportamiento de los valores de las variables de
estudio, cumpliendo con las cualidades del modelo teórico de la Distribución
Normal, y la no Paramétrica, cuando tal condición no está presente.
Índice
3.1 Estadística Inferencial Paramétrica
Resultan de trascendente utilidad, las inferencias estadísticas que puedan hacerse

sobre los parámetros de la población de valores de determinada variable, que sea
portadora de algún aspecto relevante de la investigación educativa que se esté
llevando a cabo. Es en esta dirección en la que las hipótesis estadísticas tienen su
papel relevante.
Las Hipótesis Estadísticas se emplean para hacer inferencias sobre:
1. Tipo de distribución teórica o empírica que se corresponde con el

comportamiento de una variable. Ejemplo: La calificación en el examen final de
una asignatura posee el comportamiento de la Distribución Normal, N(μ, σ)
2. Valores de parámetros poblacionales (media μ y desviación estándar σ en el

caso de la Distribución Normal). Ejemplo: El porcentaje promedio de aprobados
en el examen final de una asignatura en el presente año, es significativamente
mayor al que se venía obteniendo años atrás
Las suposiciones que constituyen las hipótesis, podrán ser verdaderas o falsas, y
los procedimientos que se estudiarán permitirán delimitar dicho resultado, con un
nivel de significación α (valor de probabilidad α) asociado a la decisión, prefijado
de antemano. Esto se hace planteando dos hipótesis: Hipótesis nula (H0) e
Hipótesis alternativa (H1). Es común tomar como Hipótesis nula (H0) la
72
afirmación o igualdad. Las Pruebas de Hipótesis permitirán contrastar la veracidad

de afirmaciones tales como:
a) El Sistema de ejercicios complementarios introducidos en la enseñanza de

la Matemática en el último curso, tiene una aceptación favorable del orden
de 80% de los estudiantes:
i. H0: Nivel de aceptación, sist. de ejerc, compl.= 80

ii. H1: Nivel de aceptación, sist. de ejerc, compl.≠ 80
b) Los resultados docentes logrados con la nueva Estrategia de enseñanza y

aprendizaje (RDNE), resultaron superiores a los que se venían obteniendo
(RDA) con anterioridad:
i. H0: RDNE= RDA

ii. H1: RDNE> RDA
c) El aprovechamiento docente de los estudiantes (ADE) del maestro

Ruaniolder es peor que los de la profesora Saudemnia:
H0: ADEEst. de Ruanilder = ADEEst. de Saudemia

H1: ADEEst. de Ruanilder < ADEEst. de Saudemia
Volviendo a lo de las hipótesis, según el número de colas, existen dos tipos de

pruebas: de dos colas (bilaterales) o de una sola cola (unilaterales, ya sea a la
derecha o a la izquierda). Corresponden dos colas al análisis de igualdad vs
desigualdad; mientras que las de una sola cola abarcan dos casos, igualdad vs
mayor que (unilateral a la derecha) e de igualdad vs menor que, (unilateral a la
izquierda).
Ejercicio 12
Complete con cruces las celdas que caractericen los tipos de hipótesis de los tres
casos anteriores:
Casos Dos colas Unilateral a la Unilateral a la

(H1 de derecha izquierda
desigualdad) (H1de mayor que) (H1 de menor que)
a)
b)
c)
73
Para el ejemplo de Porcentaje promedio de aprobados en el examen final de una

asignatura en el presente año, considerando que el que se venía obteniendo en
años a tras era de 75 %, sería:
H0: μAprobados= 75% (De forma general: H0: μ= μ0)
El término "nula" significa que no existe diferencia estadística significativa (más

allá de la que correspondería a los errores aleatorios existentes) entre los
resultados obtenidos en las nuevas circunstancias o experimento y la hipótesis
planteada; y en consecuencia, las diferencias encontradas pueden ser explicadas
por las fluctuaciones del azar.
El ejemplo anterior toma en cuenta la inferencia a partir de datos de una media

muestral sobre la correspondiente media poblacional. Más adelante se plantearán
hipótesis nula con otros parámetros como son la varianza y la proporción.
La Hipótesis alternativa puede en general ser cualquiera que difiera de la nula,

coincide por lo general con la hipótesis de la investigación. Para el ejemplo
anterior, pudieran ser:
H1: μAprobados>75%; H1: μAprobados< 75% o H1: μAprobados75%).
La notación convencional de la hipótesis alternativa, se representa como:
H1: μ μ0 ó H1: μ < μ0 ó H1: μ > μ0
El valor μ0 se corresponde con el del parámetro poblacional esperado, histórico,

acostumbrado, establecido, etc., como se le suele denominar comúnmente.
En los ejemplos anteriores se utilizó el parámetro poblacional μ, lo cual resultará

equivalente en su formulación para cualquier otro parámetro poblacional con el
que se necesite trabajar.
Observen que se está haciendo inferencia a toda la población a partir de datos

muestrales, por lo que existe una probabilidad de cometer errores que se
clasifican en Tipos I y II, lo que se describe más adelante.
De lo anterior Usted debe estarse percatando de la diferencia entre la aritmética y

la estadística en este asunto de pruebas de hipótesis. Tal sería el caso para:
H0: μAprobados= 75%,
74
Suponga que en un estudio se calculan, a partir de diferentes muestras, medias

muestrales porcentuales con valores de 74,6; 76,2; 73,1 y 75,8. No quedan dudas
de las diferencias aritméticas de cada una con respecto al valor 75 de H0. Sin
embargo, desde el punto de vista estadístico pudieran o no, llevar al no rechazo
de la H0, según sean en cada caso el tamaño de la muestra y las varianzas
muestrales respectivas (recuérdese del error máximo permisible, d  t s ).
  
 1 ; n1 
 2  n
Con la información posterior este asunto quedará más esclarecido.
Índice
3.1.1 Errores de Tipos I y II. Nivel de significación
Se le denomina error de Tipo I, al hecho de rechazar la Hipótesis nula (H0) cuando

en realidad ésta es verdadera (existe una probabilidad α de que esto suceda).
Asimismo y muy relacionado con el anterior, se le llama error de Tipo II al caso de
no rechazar la Hipótesis nula (H0), cuando en realidad ésta es falsa (probabilidad
). Ambas serían decisiones erróneas y de las cuáles no existirían evidencias de
haber incurrido en las mismas.
Aumentando el tamaño de la muestra se puede reducir el riesgo de rechazar una

hipótesis que sea verdadera (o lo que guarda muy estrecha relación: el riesgo de
aceptar una hipótesis que sea falsa). Se sugiere a los interesados que profundicen
estos aspectos en la literatura especializada.
Las variantes existentes de probabilidad de tomar una decisión determinada,

frente a una realidad bajo estudio, y el posible error latente asociado a dicha
decisión, se recogen en la Tabla 5, la mitad de las veces puede existir error, ya
sea de tipo I o II.
La probabilidad de cometer error de tipo I es muy utilizada en la práctica y se

denomina nivel de significación. El nivel de significación (α), cuantifica el
riesgo de rechazar una hipótesis que sea verdadera, y puede llegar a suceder si al
procesar los valores de la muestra ocurre, por puras fluctuaciones del azar, que
las discrepancias observadas resultasen significativas.
75
Tabla 5. Posibles errores de Tipo I o II asociados la decisión

sobre la hipótesis nula
Realidad
Decisión Ho verdadera Ho falsa
No rechazar No hay error Error de tipo II

Ho (Probabilidad 1-) (Probabilidad )
(Aceptar)
No aceptar Error de tipo I No hay error

Ho (Probabilidad ) (Probabilidad 1-)
(Rechazar)
Ejemplo 32
Suponga que es verdadero que para cierta población de 200 estudiantes que
examinaron una asignatura, no se rechaza que H0: μAprobados= 75%. Pero ocurre
que en una muestra de 10 estudiantes, se encuentra que todos están aprobados
(100% de aprobados). Tuvo lugar un suceso poco frecuente en el que los
resultados observados difieren, por azar, marcadamente de los esperados.
Fin del Ejemplo 32
Los valores de α usuales son 0,05 y 0,01. Al complemento para llegar a 1 (área
total bajo la curva de la Distribución Normal) se le denomina nivel de confianza o
confiabilidad (1-). Expresados en porcentajes, los valores de p que
corresponden a los α anteriores, son 95 y 99% respectivamente. Los valores de α
se estarían fijando menores, según sea mayor el nivel de confianza que se tenga
sobre el cumplimiento de la hipótesis en cuestión, o viceversa, de acuerdo a la
experiencia del investigador.
Similar al razonamiento que se había hecho en intervalos de confianza, asumir un

nivel de significación de 0,05 (nivel de confianza de 0,95), es asumir que si se
repite el experimento 100 veces, en 5 de ellas (5% de las veces) se podría estar
tomando una decisión equivocada; es decir, el 95% de las veces se estaría
llegando a elegir la decisión correcta.
A la probabilidad de error de tipo II se le denomina . Se demuestra que  y 

están relacionadas se acuerdo a:  decrece   crece. Una variante en la
76
práctica es fijar  y buscar el menor , paso este que no es frecuente detenerse a

hacerlo.
Índice
3.1.2 Pruebas de bondad de ajuste
En cualquier Prueba de Hipótesis habrá que definir previamente a qué Distribución

Teórica de Probabilidades se ajustan los valores de la variable aleatoria que se
corresponde el comportamiento de los valores de la variable que se esté
estudiando. Si dicha información no está disponible, se debe proceder a indagarlo
mediante alguna variante de prueba de hipótesis no paramétrica, denominadas
pruebas de bondad de ajuste, como las que se basan el estadígrafo, Chi
Cuadrado definido por:
(𝒗𝒂𝒍𝒐𝒓 𝒐𝒃𝒔𝒆𝒓𝒗𝒂𝒅𝒐𝒊 −𝒗𝒂𝒍𝒐𝒓 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐𝒊 )𝟐

𝝌𝟐𝒅𝒂𝒕𝒐𝒔 = ∑𝒏𝒊=𝟏 ; 𝒄𝒐𝒏 𝒈𝒓𝒂𝒅𝒐𝒔 𝒅𝒆 𝒍𝒊𝒃𝒆𝒓𝒕𝒂𝒅, 𝝂 = 𝒏 − 𝟏
𝒗𝒂𝒍𝒐𝒓 𝒆𝒔𝒑𝒆𝒓𝒂𝒅𝒐𝒊
Suponiendo que se trate de corroborar si determinada variable tiene el

comportamiento de la Distribución Normal, y fijado el nivel de significación α con el
que se desea realizar la prueba, para cada valor observado de la muestra se
determina de la Distribución Normal, cuál sería el valor esperado correspondiente,
se obtiene 𝝌𝟐𝒅𝒂𝒕𝒐𝒔 y se verifica si se cumple 𝝌𝟐𝒅𝒂𝒕𝒐𝒔 ∈ ∈ (𝝌𝟐𝒊𝒛𝒒𝒖𝒊𝒆𝒓𝒅𝒐 , 𝝌𝟐𝒅𝒆𝒓𝒆𝒄𝒉𝒐 ). Los
valores de 𝝌𝟐𝒊𝒛𝒒𝒖𝒊𝒆𝒓𝒅𝒐 𝒚 𝝌𝟐𝒅𝒆𝒓𝒆𝒄𝒉𝒐 se obtienen de la distribución 𝝌𝟐 para el 
seleccionado.
Índice
3.1.3 Pruebas de Hipótesis acerca de la media poblacional 𝝁, con  conocida

y desconocida
Suposiciones básicas:
 La variable objeto de estudio es cuantitativa continua
 La población tiene Distribución Normal de probabilidad ó la muestra

aleatoria es “grande” (diversos autores consideran n  30)
 Los xi que integran la muestra son aleatorios e independientes
Los pasos en el cálculo manual para realizar esta prueba de hipótesis, son:
77
1. Elegir o calcular, según corresponda, los valores de α, μ0, n, y σ o s según la

situación particular. Determinar el valor de Zc o tc que delimitan el intervalo de
nivel de confianza 𝒑 = 𝟏 − 𝜶 según corresponda (utilizando la Distribución
Normal para σ conocida, o la Distribución t de Student para σ desconocida
2. Plantear H0 y H1
̅ , s y tdatos según  sea conocida o desconocida

̅ , y Zdatos o 𝑿
3. Calcular 𝑿
4. Decidir sobre rechazo o no de H0, (Ver Figura 8 para Z)
La esencia de los pasos anteriores Usted debe interiorizarla, aún cuando se apoye
en un software estadístico para los cálculos, en el sentido de poder interpretar
debidamente los resultados que obtendría con el software. En la Tabla 6 se
resumen los principales elementos de estas pruebas de hipótesis.
Tabla 6. Hipótesis en pruebas sobre media poblacional
Hipótesis Estadígrafo Región Crítica, no se rechaza H1
H0:  = 0
Distribución Normal
H1: 0 x  0
Z datos 
 Zdatos<Z½ o Zdatos> Z1-½
n
 conocida
H0:  = 0
Distribución t de Student
H1: 0 x  0
t datos  tdatos <t½ n-1 o tdatos> t1-½n-1
s
 desconocida n
78
Con  conocida no se rechaza H0 cuando se cumple que Zdatos queda

comprendida en el intervalo  Z c , Z c  Similar situación para  desconocida, si
tdatos pertenece al intervalo  tc , tc  ,
En todos los casos puede observarse que el estadígrafo cuantifica una

discrepancia o diferencia aritmética (en este caso entre x y μ0) a partir de la
información de los datos y el valor del parámetro poblacional sobre el que se está
haciendo la prueba; tal diferencia aritmética está determinada además por los
datos de σ ó s, y n , según la fórmula particular que se deba usar en esta
prueba. Tal discrepancia aritmética se emplea en la prueba de hipótesis para
concluir si su magnitud representa o no una diferencia significativa, lo que se
determina al comparar el valor del estadígrafo de los datos con el correspondiente
de la distribución teórica con la que se esté trabajando. Observe que si el valor
absoluto de Zdatos es grande (con signo positivo o negativo), está causado porque
que la diferencia entre X y μ0 es grande, por eso es que si Zdatos es mayor que
Zc (cola de la derecha), o menor que –Zc (cola de la izquierda), no se acepta la
hipótesis H0 : μ=μ0
Ejemplo 33
Con SPSS y entrando previamente el juego de datos del Anexo 1,

Calificaciones de tres grupos, en escala de 0 a 20; por la entrada
Analizar/Comparar medias/Prueba t para una media, de la Vista de Datos,
seleccionando Grupo 1, se llega al cuadro de diálogo:
79
En la ventanita Valor de prueba se debe introducir el valor deseado para 𝜇0 . En

este ejemplo se asumió el valor 16. Los resultados obtenidos están a continuación:
Prueba para una muestra

Valor de prueba = 16
t gl Sig. Diferencia 95% Intervalo de
(bilateral) de medias confianza para la
diferencia
Inferior Superior
Grupo
-.229 33 .820 -.059 -.58 .46
1
En la columna de Sig. (bilateral), aparece debajo el valor de probabilidad 0.820;

este es el resultado clave para seguir el análisis y el modo de hacerlo es el
siguiente:
Sig. (bilateral)> No se
𝛼 rechaza Ho
Valor de 𝛼 (0.05
u otro)
Sig. (bilateral) No se acepta
<𝛼 Ho
Dado que .820 > 0.05, no se rechaza H0; se concluye que las calificaciones del
Grupo 1 se corresponden con la media poblacional 𝜇 = 16
Fin del Ejemplo 33 Índice
80
3.1.4 Prueba de Hipótesis acerca de una Proporción Poblacional
Se trata ahora de inferir, conociendo la proporción en que un determinado

resultado se presenta en una muestra, cómo se está comportando con respecto al
parámetro poblacional correspondiente (𝒑 ̂ → 𝑷). Por ejemplo, Usted puede
interesarse en estudiar la proporción de estudiantes incorporados al trabajo
científico en su centro, determina una muestra, recoge la información prevista, y
desea inferir si la muestra en cuestión corresponde a una población con una
proporción deseada P0 de estudiantes incorporados a esa actividad formativa. Se
está en el caso de:
H0: P=P0 H1: PP0
Se parte de la suposición que las proporciones p calculadas en muestras de

tamaño n siguen la Distribución N(P, PQ / N ).
El procedimiento es muy similar a la prueba anterior, con el estadígrafo,
p  P0
Z datos  Recuerde que: p+q = P+Q = P0+Q0 = 1
P0 Q0
n
k
donde p  , es decir la estimación de la proporción a partir de la muestra, o
n
lo que es lo mismo, el número de individuos que presentan la característica
estudiada dividido el número total de casos en la muestra.
La región crítica o de rechazo de H0 es:
Zdatos > Z 1-/2 ó Zdatos < Z /2
Ejemplo 34
Se dispone de una muestra de 36 estudiantes, de un año de una Escuela; de la

muestra se obtiene que la proporción de estudiantes incorporados al trabajo
científico es de 0,25. Confirme con un nivel de significación de 0,05 sí puede
afirmarse que la proporción de estudiantes en esa actividad en ese año puede
considerarse de 0,30.
81
Solución:
Siguiendo de modo equivalente los pasos generales indicados para la prueba

anterior:
1. Identificar los valores de α, P0, n, p y q, y Zdatos.

α = 0,05, P0=0,30, p= 0,25, Q0=1 – P0= 0,70, n= 36 y Zc=1,96
2. H0: P= 0,30
H1: P 0,30
3. Calcular Zdatos
0,25  0,30  0,05  0,05 * 6

Z datos     0,65
0,30 * 0,70 0,21 0,46
36 36
4. El valor de Zdatos no corresponde a la región rechazo de H0 (menor de

𝒎𝒆𝒏𝒐𝒓 𝒅𝒆 − 𝟏. 𝟗𝟔; 𝒎𝒂𝒚𝒐𝒓 𝒅𝒆 𝟏. 𝟗𝟔), no existen existen razones para rechazar
esta hipótesis y por tanto se acepta que la muestra de estudiantes se
corresponde a la población del año, que posee una proporción de estudiantes
incorporados al trabajo científico de P= 0,30.
Fin del Ejemplo 34
Índice
3.1.5 Estadística Inferencial no paramétrica
Los métodos estadísticos no paramétricos tienen la gran ventaja de permitir obviar

el requisito de ajuste de las variables a la Distribución Normal, son muy simples de
usar y se pueden aplicar utilizando la mayoría de los buenos software estadísticos
presentes en el mercado, como el SPSS. Su presentación queda fuera del objetivo
del presente documento, solo adelantar la información de la Tabla 7 y alertar que
operan con la mediana en lugar de la media aritmética.
82
Tabla 7. Relación de algunas pruebas de estadística no paramétrica
Análisis Test Paramétrico Test no paramétrico
Si la distribución
supuesta es consistente
con los datos,
denominadas pruebas de
Una muestra No hay
bondad de ajuste: test de
la 𝜒 2 , de Kolmogorov-
Smirnov, de Shapiro-Wilk
y de Jarque-Bera
Una muestra Test t simple Test del signo de rangos

de Wilcoxon
Muestras pareadas Test t simple Test del signo de rangos
de Wilcoxon
Dos muestras Test t para muestras Test de suma de rangos
independientes independientes de Wilcoxon
Más de dos muestras
ANOVA de un factor Test de Kruskal-Wallis
independientes
Diseño en bloques
ANOVA con bloques Ji cuadrado de Friedman
aleatorios
Índice
83
Referencias
Buendía Espinosa, Angélica y Álvarez Mendiola, Germán. Coordinadores. (2019).

La investigación educativa ante el cambio de gobierno en México.
Reflexiones y propuestas para el futuro. -- 1ª ed. -- Ciudad de México:
Consejo Mexicano de Investigación Educativa, 2019, 461p. ISBN 978-607-
7923-27-5
Cochran, William G. Técnicas de muestreo. Compañía Editorial Continental.

México
Congacha Aushay, Jorge Washington (2016). Estadística aplicada a la
Educación. Escuela Superior Politécnica de Chimborazo. Ecuador
De Armas Ramírez, Nerelys y Valle Lima, Alberto (2011). Resultados científicos

en la Investigación Educativa. Editorial Pueblo y Educación. Cuba
Hernández Sampieri, Roberto; Fernández Collado, Carlos, y Baptista Lucio, María

Del Pilar (2010). Metodología de la Investigación. 5ta. ed. McGRAW-HILL /
INTERAMERICANA EDITORES, S.A. DE C.V.
Hernández Sampieri, Roberto; Fernández Collado, Carlos, y Baptista Lucio, María

Del Pilar (2014). Metodología de la Investigación.de los autores, 6ta. ed.
McGRAW-HILL / INTERAMERICANA EDITORES, S.A. DE C.V
Martínez Barrientos, Alejandra. (2008). Manual para la elaboración de

Investigaciones Educativas. Universidad Católica Boliviana San Pablo”. La
Paz. Bolivia. 108 pág. Recuperado de:
http://www.cimm.ucr.ac.cr/wordpress/wp-
content/uploads/2010/12/Mart%C3%ADnez-A.-Manual-2008.pdf
McMillan, James H. y Schumacher, Sally. (2005). Investigación Educativa. Una

introducción conceptual. 5ta. Edición. Virginia Commonwealth University
PEARSON EDUCACIÓN, S. A., Madrid
Montes Castillo, Mariel M.; Valencia Castillo, Flavio; y Gracia Olivas, Paola
Guadalupe (2017). Indicadores de uso y aceptación de redes sociales
virtuales en jóvenes de escuelas secundarias públicas en Sonora.
Publicado en: REDES ACADÉMICAS, DOCENCIA E INVESTIGACIÓN
EDUCATIVA. Recuperado de: http://www.reed-edu.org/wp-
content/uploads/2017/11/REDES-ACAD%C3%89MICAS-DOCENCIA-E-
INVESTIGACI%C3%93N-EDUCATIVA.pdf
84
Newbold, Paul; Carlson, William L. y Thorne, Betty M. (2008). Estadística para

Administración y Economía. 6ta. ed. Pearson Educación
Nolberto Sifuentes, Violeta Alicia y Ponce Aruneri, María Estela (2006).

Estadística Inferencial Aplicada. Universidad Nacional Mayor de San
Marcos. Perú
Rincón, Luis (2006). Una introducción a la PROBABILIDAD Y ESTADÍSTICA.

Facultad de Ciencias UNAM. México. Tomado de:
http://www.matematicas.unam.mx/lars
Rosas Becerril, Patricia (2018). La Investigación Educativa: concepto y

antecedentes. p. 57-61
Índice
85
Anexo 1. Hoja de datos, calificaciones de estudiantes de 3 grupos, en escala de 0

a 20
Grupos
Estudiantes
1 2 3
1 16 13 19
2 15 14 18
3 19 13 16
4 17 17 19
5 14 14 17
6 18 8 18
7 18 12 17
8 14 14 17
9 15 13 15
10 14 13 17
11 14 14 17
12 15 12 18
13 15 14 16
14 17 15 15
15 17 11 18
16 17 13 17
17 14 14 18
18 15 15 18
19 17 14 16
20 16 15 17
21 14 15 19
22 17 15 17
23 17 11 16
24 16 15 17
25 17 12 17
26 17 14 18
27 13 15 17
28 17 12 16
29 16 14 18
30 16 15 18
31 16 14 15
32 18 9 16
33 14 . 17
34 17 . 16
35 . . 16
36 . . 17
37 . . 17
86
Anexo 2. Funciones estadísticas del EXCEL
Función Descripción
DESVPROM Devuelve el promedio de las desviaciones

absolutas de la media de los puntos de datos
PROMEDIO Devuelve el promedio de sus argumentos
PROMEDIOA Devuelve el promedio de sus argumentos,

incluidos números, texto y valores lógicos
PROMEDIO.SI Devuelve el promedio (media aritmética) de

todas las celdas de un rango que cumplen unos
criterios determinados
PROMEDIO.SI.CONJUNTO Devuelve el promedio (media aritmética) de

todas las celdas que cumplen múltiples
criterios.
DISTR.BETA Devuelve la función de distribución beta

acumulativa
DISTR.BETA.INV Devuelve la función inversa de la función de

distribución acumulativa de una distribución
beta especificada
DISTR.BINOM Devuelve la probabilidad de una variable

aleatoria discreta siguiendo una distribución
binomial
DISTR.CHI Devuelve la probabilidad de una variable

aleatoria continua siguiendo una distribución chi
cuadrado de una sola cola
PRUEBA.CHI.INV Devuelve la función inversa de la probabilidad

de una variable aleatoria continua siguiendo
una distribución chi cuadrado de una sola cola
PRUEBA.CHI Devuelve la prueba de independencia
INTERVALO.CONFIANZA Devuelve el intervalo de confianza de la media

de una población
COEF.DE.CORREL Devuelve el coeficiente de correlación entre dos

conjuntos de datos
87
CONTAR Cuenta cuántos números hay en la lista de

argumentos
CONTARA Cuenta cuántos valores hay en la lista de

argumentos
CONTAR.BLANCO Cuenta el número de celdas en blanco de un

rango
CONTAR.SI Cuenta las celdas del rango que no están en

blanco y que cumplen los criterios especificados
COVAR Devuelve la covarianza, que es el promedio de

los productos de las desviaciones para cada
pareja de puntos de datos
BINOM.CRIT Devuelve el menor valor cuya distribución

binomial acumulativa es menor o igual a un
valor de criterio
DESVIA2 Devuelve la suma de los cuadrados de las

desviaciones
DISTR.EXP Devuelve la distribución exponencial
DISTR.F Devuelve la distribución de probabilidad F
DISTR.F.INV Devuelve la función inversa de la distribución de

probabilidad F
FISHER Devuelve la transformación Fisher
PRUEBA.FISHER.INV Devuelve la función inversa de la

transformación Fisher
PRONOSTICO Devuelve un valor en una tendencia lineal
FRECUENCIA Devuelve una distribución de frecuencia como

una matriz vertical
PRUEBA.F Devuelve el resultado de una prueba F
DISTR.GAMMA Devuelve la distribución gamma
DISTR.GAMMA.INV Devuelve la función inversa de la distribución

gamma acumulativa
GAMMA.LN Devuelve el logaritmo natural de la función
88
gamma, Γ(x)
MEDIA.GEOM Devuelve la media geométrica
CRECIMIENTO Devuelve valores en una tendencia exponencial
MEDIA.ARMO Devuelve la media armónica
DISTR.HIPERGEOM Devuelve la distribución hipergeométrica
INTERSECCION.EJE Devuelve la intersección de la línea de

regresión lineal
CURTOSIS Devuelve la curtosis de un conjunto de datos
K.ESIMO.MAYOR Devuelve el k-ésimo mayor valor de un conjunto

de datos
ESTIMACION.LINEAL Devuelve los parámetros de una tendencia

lineal
ESTIMACION.LOGARITMICA Devuelve los parámetros de una tendencia

exponencial
DISTR.LOG.INV Devuelve la función inversa de la distribución

logarítmico-normal
DISTR.LOG.NORM Devuelve la distribución logarítmico-normal

acumulativa
MAX Devuelve el mayor valor de una lista de

argumentos
MAXA Devuelve el valor máximo de una lista de

argumentos, incluidos números, texto y valores
lógicos
MEDIANA Devuelve la mediana de los números dados
MIN Devuelve el valor mínimo de una lista de

argumentos
MINA Devuelve el valor mínimo de una lista de

argumentos, incluidos números, texto y valores
lógicos
MODA Devuelve el valor más común de un conjunto de

datos
89
NEGBINOMDIST Devuelve la distribución binomial negativa
DISTR.NORM Devuelve la distribución normal acumulativa
DISTR.NORM.INV Devuelve la función inversa de la distribución

normal acumulativa
DISTR.NORM.ESTAND Devuelve la distribución normal estándar

acumulativa
DISTR.NORM.ESTAND.INV Devuelve la función inversa de la distribución

normal estándar acumulativa
PEARSON Devuelve el coeficiente de momento de

correlación de producto Pearson
PERCENTIL Devuelve el k-ésimo percentil de los valores de

un rango
RANGO.PERCENTIL Devuelve el rango porcentual de un valor de un

conjunto de datos
PERMUTACIONES Devuelve el número de permutaciones de un

número determinado de objetos
POISSON Devuelve la distribución de Poisson
PROBABILIDAD Devuelve la probabilidad de que los valores de

un rango se encuentren entre dos límites
CUARTIL Devuelve el cuartil de un conjunto de datos
JERARQUIA Devuelve la jerarquía de un número en una lista

de números
COEFICIENTE.R2 Devuelve el cuadrado del coeficiente de

momento de correlación de producto Pearson
COEFICIENTE.ASIMETRIA Devuelve la asimetría de una distribución
PENDIENTE Devuelve la pendiente de la línea de regresión

lineal
K.ESIMO.MENOR Devuelve el k-ésimo menor valor de un conjunto

de datos
NORMALIZACION Devuelve un valor normalizado
90
DESVEST Calcula la desviación estándar a partir de una

muestra
DESVESTA Calcula la desviación estándar a partir de una

muestra, incluidos números, texto y valores
lógicos
DESVESTP Calcula la desviación estándar en función de

toda la población
DESVESTPA Calcula la desviación estándar en función de

toda la población, incluidos números, texto y
valores lógicos
ERROR.TIPICO.XY Devuelve el error estándar del valor de "y"

previsto para cada "x" de la regresión
DISTR.T Devuelve la distribución de t de Student
DISTR.T.INV Devuelve la función inversa de la distribución de

t de Student
TENDENCIA Devuelve valores en una tendencia lineal
MEDIA.ACOTADA Devuelve la media del interior de un conjunto de

datos
PRUEBA.T Devuelve la probabilidad asociada a una prueba

t de Student
VAR Calcula la varianza de una muestra
VARA Calcula la varianza a partir de una muestra,

incluidos números, texto y valores lógicos
VARP Calcula la varianza en función de toda la

población
VARPA Calcula la varianza en función de toda la

población, incluidos números, texto y valores
lógicos
DIST.WEIBULL Devuelve la distribución de Weibull
PRUEBA.Z Devuelve el valor de una probabilidad de una

cola de una prueba z
91
View publication stats

Estadística en La Investigación Educativa: July 2019

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística en La Investigación Educativa: July 2019

Cargado por

Copyright:

Formatos disponibles

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Estadística en la Investigación Educativa

Book · July 2019

La creatividad en el Proceso de Enseñanza Aprendizaje View project

The user has requested enhancement of the downloaded file.

Dr.C., Ing. Tito Díaz Bravo

2.2.1.1 Método Estadístico 43

2.2.5 Muestreos en procesos continuos 54

Anexo 2. Funciones estadísticas del EXCEL 87

El presente documento recoge en síntesis información imprescindible para apoyar

Será especialmente útil la literatura científica pertinente y actualizada, accedida

1. Investigación educativa. Introducción a la Metodología de la Investigación

1.1 Investigación Educativa

La denominación de Investigación Educativa, un poco rara y que aparentemente

"Hablar de investigación educativa es hablar de un proceso de

En lo adelante se adopta el concepto expuesto anteriormente, en el que se

Las sociedades de los distintos países organizan sus distintos niveles de

siendo necesario atender la eficacia con el que transcurren estos procesos

"En conclusión, uno de los aspectos importantes en el que se desarrolló la

En el ámbito mexicano, una obra de especial importancia es la de Buendía y

I. Desigualdad, calidad y equidad en la educación

XIII. Sociedad, economía y políticas de ciencia y tecnología con calidad y con

Los trece temas integrados en la obra anterior, cubren un extenso e importante

Se investiga para obtener nuevos conocimientos que permitan resolver

En aquellas actividades en que nos desempeñamos y para las cuales hemos

Existe una necesidad imperiosa de mejorar la efectividad de los procesos de

1.2 Introducción a la Metodología de la Investigación Educativa

1.2.1 Algunas clasificaciones de las investigaciones científicas

Existen clasificaciones generales para las investigaciones científicas, que

El nivel de conocimiento precedente, de partida

I. De acuerdo al nivel de conocimiento de partida: Puras o Fundamentales,

Descriptivas, Explicativas (No experimentales y experimentales). En estas,

III. Respecto al paradigma (enfoque) de investigación, se subdividen en

A continuación ejemplos de investigaciones de los tres tipos de paradigmas o

En una investigación acerca de las preferencias de los estudiantes del nivel

Cuantitativas podrían ser investigaciones en las que se centraran los objetivos

Una investigación de rendimiento docente de los estudiantes que tome en

IV. En dependencia con el tiempo a ejecutarse: Longitudinales y Transversales.

longitudinal. Si se estuviera indagando entre los estudiantes, sobre la

V. Forma de proceder, posibilidad y necesidad o no de realización de

Un estudio no experimental sobre la influencia de la disponibilidad de

Suponga que se experimenta sobre el rendimiento docente en una asignatura,

investigación experimental; lo de una hora de estudio como se expuso, fue

Las anteriores clasificaciones trascienden lo formal para convertirse en

- Las Experimentales generalmente son Longitudinales y Mixtas. Y no son ni

- Las Descriptivas son No experimentales, y pudieran ser Transversales o

En particular, refiriéndose a los enfoques cualitativo y cuantitativo de investigación,

Tanto si se trabaja con un enfoque o con el otro, el investigador necesita ser

Las cualidades y el proceder del investigador formador, y el carácter riguroso,

Qué resultados científicos se espera obtener como resultado de una investigación

"Los resultados teóricos son aquellos que permiten enriquecer; modificar o

Existen una serie de pasos presentes en la mayor parte de las investigaciones,

Sin embargo, para el propósito del presente documento se prefiere dirigir la

cualitativa o investigación acción. De su Manual, y suponiendo que de las

El documento resultante de la propuesta de investigación recoge la información de

Figura 1. Pasos en la Investigación Educativa (Síntesis realizada a partir del

1.3 Variables en la investigación, tipos y escala de medición

1.3.1 Variables en la investigación

Al concepto de variable nos aproximamos desde edades tempranas en la vida,

Tabla 1. Ejemplos de variables y una posible variante de clasificación atendiendo a

Lo mostrado en la Tabla 1 puede cambiar como se verá de inmediato. Un poco

Es de esperar que según el tipo de investigación (Cualitativas, Cuantitativas y

Dependientes: Variables que indican si el tratamiento o manipulación de las