Está en la página 1de 23

Universidad de El Salvador

Facultad de Ciencias Naturales y Matemática, Licenciatura en


Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

Unidad I. Introducción a la Estadística


1.1. Breve reseña histórica y aplicaciones de la estadística.

Es difícil fijar los orígenes de la Estadística, pues se sabe que surgió en épocas muy remotas, por
ejemplo: en Grecia (594 a.C) se tuvo importantes observaciones estadísticas referentes a
distribución de terreno y servicio militar; el Imperio Romano fue el primer gobierno que recopiló
una gran cantidad de datos, según Hidalgo, 2016, cada cinco años realizaban un censo de
población y los funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y
matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas que poseían los
territorios conquistados.

En este apartado no se pretende hacer un desarrollo histórico de la Estadística, sino motivar al


lector para continuar investigando los origines y principales personajes que contribuyeron al
desarrollo de esta importante ciencia.

1.1.1. Desarrollo de la Estadística Descriptiva

Según Hidalgo 2016: La escuela estadística-descriptiva se origina en Alemania y su objetivo era la


descripción de los Estados “Staadenkunde". Esta escuela asignó a través de Gottfried Achenwall
(1749) el término Estadística a una nueva disciplina contemplada como una ciencia
independiente al servicio del estado y que, más tarde se consolidó como disciplina universitaria.

Posteriormente, los ingleses, John Graunt y William Petty crearon la escuela aritmética-política,
la cual planteó, además de los objetivos de la escuela alemana, la búsqueda de las leyes
cuantitativas que rigen los fenómenos objeto de estudio.

A fines del siglo XVI y principios del XVII, las graves pestes que asolaron a Inglaterra, dio lugar a
recuentos semanales de nacimientos y entierros los cuales fueron más regulares que los previos.
De esta manera, una gran recopilación de datos sistematizados estaba disponible desde principios
del siglo XVII para su análisis. John Graunt (1620-1674) a través de análisis desvinculados del
concepto de probabilidad, realizó estimaciones de la población de Londres y otros análisis
demográficos importantes que se recopilaron en su obra publicada en 1662, Natural and political
observations mentioned in a following Index, and made upon the Bilis of Mortality (Observaciones
políticas y naturales hechas a partir de los boletines de mortalidad).

Según Hurtado, 2013: Gaspar Neumann, un profesor alemán que vivía en Breslau, en 1691 se
propuso destruir la antigua creencia popular de que en los años terminados en 7 moría más gente
que en los restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales de la

1/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

ciudad. Después de revisar miles de partidas de defunción, pudo demostrar que en tales años no
fallecían más personas que en los demás.
Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor
del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos
sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros.
En 1760 Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra
estadística, que extrajo del término italiano statista (estadista). Creía, que los datos de la nueva
ciencia serían el aliado más eficaz del gobernante consciente.

Según Hidalgo 2016: William Petty, alrededor de 1670, realizó una revisión de la obra de Graunt,
siguiendo la misma línea de éste, escribiendo ensayos sobre lo que él denominó “Política
Aritmética", razón por la cual se le atribuye como fundador de esta escuela. Propuso además la
creación de una oficina central de estadística que recogiese datos sobre la nación inglesa.

Los trabajos de Graunt y Petty, contribuyeron a que en el siglo XVIII se realizaran los primeros
censos de población oficial. En Europa se realizaron en Irlanda en 1703 y luego en España en 1787.
En los primeros años del siglo XIX, la mayoría de países Europeos realizan de manera oficial censos
de datos económicos, demográficos, ambientales, etc.

1.1.2. Desarrollo de la Probabilidad

El cálculo de las probabilidades se inició como solución a problemas relativos a los juegos de azar.
El problema más importante era el conocido como “problema del reparto de apuestas” que
distribuía las ganancias entre jugadores cuando la partida se interrumpía antes de finalizar. Este
problema fue abordado por Luca Pacioli en 1487, por Niccolo Tartaglia en 1556, y por Girolamo
Cardano en 1565. En ninguno de los casos la solución fue satisfactoria, pero contribuyó al
desarrollo de la probabilidad.

Según Hidalgo 2016: El origen de una primera teoría matemática de las probabilidades habría
que ubicarla en Francia a mediados del siglo XVII, por ejemplo, en 1654 en correspondencia
entablada entre los matemáticos franceses Blaise Pascal y Pierre de Fermat se plantea el
problema del reparto de apuestas cuando el juego se suspende, y llegaron ambos de manera
independiente a la misma solución, que consistió en darse cuenta de que el reparto de las
apuestas debe hacerse en función de la probabilidad de ganar que tuviese cada jugador en el
momento de interrumpirse el juego. Pascal y Fermat resolvieron este problema y otros muchos y
fueron los que empezaron a formalizar la teoría de las probabilidades.

Pascal y Fermat no expusieron sus resultados por escrito y fue el físicomatemático holandés
Christian Huygens quien en 1657 publicó un breve tratado titulado “De Ratiocinnis in ludo aleae”

2/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

(sobre los razonamientos relativos a los juegos de dados) inspirado en la correspondencia


sostenida entre los dos creadores de la teoría de la probabilidad.

El primero en dar la definición clásica de probabilidad fue Jacob Bernoulli, matemático suizo que
trabajó en la universidad de Basilea en 1687, en su obra “Ars conjectandi” (El arte de la conjetura)
que fue publicada algunos años después de la muerte del autor. En esta obra se encuentra entre
otras cosas la importante proposición conocida como el Teorema de Bernoulli mediante el cual
se dio a la teoría de la probabilidad por primera vez el status de ciencia.

En 1718, el matemático francés exiliado en Inglaterra Abraham De Moivre aceptó la definición


dada por Bernoulli y la reformuló en términos modernos para la época: «una fracción en la que
el numerador es igual al número de apariciones del suceso y el denominador es igual al número
total de casos en los que el suceso pueda o no pueda ocurrir. Tal fracción expresa la probabilidad
de que ocurra el suceso».
El trabajo de De Moivre fue seguido y difundido en la mayoría de los círculos científicos
importantes de Europa y fue el reverendo británico, Thomas Bayes, probablemente alumno de
De Moivre en Londres, quien extendió el trabajo del francés y expresó la probabilidad condicional
en función de la probabilidad de la intersección. El Teorema de Bayes fue publicado en 1763 en
un ensayo titulado An Essay Toward Solving a Problem in the Doctrine of Chances (Un ensayo para
resolver un problema en la Doctrina de las Probabilidades ).

En 1812 Pierre Simon Laplace publicó un gran tratado, titulado "Théorie Analytique des
probabilités" (Teoría Analítica de las Probabilidades), donde no se limita a ocuparse de problemas
de probabilidades discretas, que son los que corresponden a los juegos de azar, sino que se
encarga también de estudiar problemas de probabilidades continuas.
Esta gran obra de Laplace contiene la formalización de la Teoría Clásica de la Probabilidad. Sus
formulaciones son las primeras en las que los temas tratados no se refieren a los juegos de azar.
A partir, fundamentalmente, de Laplace las dos disciplinas más importantes dentro de la teoría
de la probabilidad, que eran el cálculo de probabilidades y la estadística se fusionaron de manera
que el cálculo de probabilidades se convirtió en el andamiaje matemático de la estadística.

En 1823 el matemático alemán Karl Friedrich Gauss, desarrolló la teoría de errores


conjuntamente con Bessel y Laplace, llegando a establecer el método de mínimos cuadrados
como el procedimiento más elemental para resolver los problemas de la teoría de errores.
El estudio por parte de Gauss de la Teoría de los errores le lleva al estudio de la distribución de
probabilidad de errores, con lo que llega a la distribución Normal, hasta entonces obtenida como
aproximación de otras distribuciones. En nuestros días la distribución normal es conocida como
Gaussiana.

3/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

1.1.3. Desarrollo de la Estadística Moderna

Una vez sentadas las bases de la teoría de probabilidades, se puede situar el nacimiento de la
estadística moderna también conocida como inferencia estadística, y su empleo en el análisis de
experimentos, en los trabajos de Sir Francis Galton y Karl Pearson. Este último publicó en 1892
el libro The Grammar of Science (La gramática de la ciencia), un clásico en la filosofía de la ciencia,
y fue él quien ideó el conocido test de Chi-cuadrado. El hijo de Pearson, Egon, y el matemático
nacido en Polonia, Jerzy Neyman pueden considerarse los fundadores de las pruebas modernas
de contraste de hipótesis.
En 1908 William Sealey Gosset publica un artículo en el que aporta grandes resultados para el
estudio de muestras pequeñas, y deduce la distribución t, que se conoce como "t de student", ya
que este era el seudónimo con el que publicó dicho artículo.

Según Yañez 2000, sin duda alguna Ronald Arnold Fisher fue la figura más influyente de la
estadística moderna, pues la situó como una poderosa herramienta para la planeación y análisis
de experimentos, desarrolló el análisis de varianza y fue pionero en el desarrollo de numerosas
técnicas de análisis multivariante y en la introducción del método de máxima verosimilitud para
la estimación de parámetros. Su libro Statistical Methods for Research Workers (Métodos
estadísticos para los investigadores), publicado en 1925, ha sido probablemente el libro de
estadística más utilizado a lo largo de muchos años.

En 1933 Andrei Kolmogorov desarrolló una teoría de la probabilidad totalmente rigurosa basada
en axiomas fundamentales. La construcción axiomática de la teoría de la probabilidad procede de
las propiedades fundamentales de la probabilidad observada en los ejemplos que ilustran las
definiciones clásicas y frecuentista. Así, la definición axiomática las incluye como casos
particulares y supera las carencias de ambas.

En nuestros días, la estadística se ha convertido en un método efectivo para describir con


exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos, físicos,
etc. y sirve como herramienta para relacionar y analizar dichos datos.

4/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

1.1.4. Aplicaciones de la Estadística

Con la aparición y popularización de las computadoras, la estadística tiene un avance significativo,


ya que utiliza técnicas de computación intensiva para el análisis de grandes masas de datos, y se
empieza a considerar el método estadístico como un proceso iterativo de búsqueda del modelo
ideal para describir o predecir un determinado fenómeno con cierto grado de certidumbre
medible.

La Estadística es una ciencia que estudia las características de un conjunto de datos para hallar
en ellos regularidades en su comportamiento y para efectuar predicciones.
La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos
relativos a un conjunto de objetos, personas, procesos, etc. a través de la cuantificación y el
ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una
herramienta de suma utilidad para la toma de decisiones.

En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de
incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican técnicas
estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un
idioma.

El trabajo del experto estadístico no consiste sólo en reunir y tabular los datos, sino el proceso de
interpretación de esa información a través de modelos estadísticos-matemáticos, aumentando el
alcance de las aplicaciones de la estadística, esto se ha logrado, gracias al desarrollo de la teoría
de probabilidad y al avance computacional.

Dentro de las aplicaciones de la Estadística se destacan las siguientes:

1. La Estadística en el Periodismo

En general, los periodistas además de dedicarse al ámbito de la noticia, realizan crónicas y


estudios de investigación, que nos entregan preguntas y respuestas frente a determinados
sucesos o situaciones de interés público.

Ejemplo 1.1. (Encuesta periodística de opinión pública) Un periodista pregunta a las personas
que se encuentran en los alrededores de la Asamblea Legislativa.

5/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

Periodista Experto en estadística


Analiza las
Preguntas Analiza la representatividad
característica de los
de los entrevistados
entrevistados
Se debe aprobar la ley Personas que han Probablemente los datos no
contra la minería metálica llegado a la Asamblea sean “representativos” de todo
Los diputados deben Legislativa, porque les El Salvador, debido a que las
aprobar la ley del agua interesa el tema y entrevistas se realizaron a un
Se debe aprobar más representan a un grupo grupo de personas sumamente
préstamos para cubrir los muy reducidos de reducido y que llegaron a la
compromisos del gobierno ciudadanos. Asamblea Legislativa porque
les interesa el tema.

Ejemplo 1.2. (Encuesta de opinión calificada) Un presentador de un medio de comunicación


entrevista a un panel de expertos

Presentador Experto en estadística


Preguntas Analiza las característica Analiza la representatividad
de los entrevistados de los entrevistados
Se debe aprobar la ley El panel de entrevistados El panel de expertos no
contra la minería metálica está constituido por un representa a la población de
Los diputados deben grupo de personas El Salvador, pero sus
aprobar la ley del agua seleccionadas por su respuestas generan opinión
Se debe fortalecer los preparación, su en la población. Las
programas sociales que prominencia o por las autoridades pertinentes e
impulsa el gobierno funciones que interesadas en estos
desempeñan, estudios pueden adoptar las
características que medidas correctivas, si este
otorgan credibilidad y el caso.
validez a las opiniones
sobre el tema tratado.

El profesional de la comunicación en la actualidad debe entender la importancia y el impacto que


las cifras numéricas causan en la audiencia, por ello se requiere un entendimiento básico de
terminología estadística.

6/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

2. La Estadística en la Política

Son conocidas las famosas encuestas de tipo político, que entregan una orientación de la
intención de voto, de la aceptación de un candidato, del impacto de un programa o proyecto de
Estado, etc. También de todos es conocido que al aproximarse la fecha de las elecciones de cargos
públicos (Presidente, diputados, alcaldes, etc.) aparecen diferentes casas encuestadoras
presentando la opinión de la población salvadoreña sobre el apoyo o no a cierto partido político
o candidato.

3. La Estadística en la Publicidad

Cuando las grandes marcas transnacionales y/o nacionales diseñan slogans, música y colores en
sus comerciales, lo único que buscan es que la gente adquiera los productos y/o servicios que
ofrecen.

Se dedican, entonces, a realizar las llamadas “campañas publicitarias”, y, antes de lanzar una de
ellas, hacen un estudio de mercado para encontrar las mejores alternativas posibles a fin de lograr
el éxito de ventas deseado.

4. La Estadística en la Economía y las Finanzas

En la economía se utiliza como una herramienta de predicción para pronosticar el


comportamiento futuro, por ejemplo, de los precios de los metales (oro, plata, cobre) tomando
como base el comportamiento pasado de los precios de los mismos.
También, sirve para estudiar el comportamiento de la bolsa de valores, la demanda de energía
eléctrica de una región o país, el análisis del costo de la canasta básica, etc. En general, los
estadísticos y los economistas por lo regular se sienten magos que creen predecir o conocer el
comportamiento futuro de cierto fenómeno.

5. La Estadística en la Banca y Seguros

El profesional del seguro de vida ha de ser capaz de asignar primas suficientes para cubrir las
cantidades que habrá de pagar la compañía en el caso de muerte del asegurado. En consecuencia,
la predicción adecuada de las probabilidades de muerte constituye uno de los ejes centrales de
la reducción del riesgo que se asume. A continuación se presentan algunas situaciones de estudio
y se describen algunas características que se toman en cuenta para resolver la situación
planteada.

7/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

Situaciones Características a considerar


Sistemas de concesión de tarjetas de crédito y Para conceder una tarjeta de
fijación de su límite crédito mínimamente se debe
investigar:
Ingreso del solicitante, préstamos
sin pagar, personas que dependen
del solicitante, etc.
Tipologías de clientes en una compañía telefónica Buen cliente: Pago al día de su
factura y servicios que tiene con la
compañía, etc.
Análisis de colas para brindar un servicio de Número de personas que llegan
calidad en una agencia bancaria en una hora determinada, tiempo
de espera de las personas, tiempo
que se tarda el cajero en atender
a cada persona, etc.

6. La Estadística en Ciencias Sociales

Las ciencias sociales se han visto apabulladas en los últimos años por avances vertiginosos de la
informática y aplicaciones estadísticas, por ejemplo, en El Salvador, se ha elaborado el Mapa de
Pobreza, donde se ha interrelacionado una gran cantidad de variables de diferentes áreas:
educativas, económicas, salud, entre otras. También, se ha hecho investigación sobre los factores
que están asociados al rendimiento académico de los estudiantes.

7. La estadística en las ciencias médicas


Permite establecer pautas sobre la evolución de las enfermedades y los enfermos, el grado de
eficacia de un medicamento, la propagación de cierta enfermedad, entre otras.
Bajo este conjunto de ideas, se ha presentado un panorama de la utilidad de la estadística,
haciendo un recorrido por diversas áreas del conocimiento humano, con el fin, de conocer cómo
se relacionan con las diversas ciencias. Evidentemente, existen, muchas disciplinas donde se
aplica la estadística, que no han sido consideradas en este apartado, por ejemplo, las ingenierías,
la pintura, la música, etc. Finalmente, es de resaltar que en todos los temas donde se analice
información está presente la estadística e allí la importancia del estudio de esta ciencia.

8/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

1.1.5. Actividad de autoevaluación.

1. Identifica el estadístico que dedujo la distribución t de student:


a) Karl Pearson b) Ronald Arnold Fisher c) William Sealey Gosset.

2. Identifica los matemáticos que resolvieron el “problema del reparto de apuestas”:


a) Karl Pearson y Ronald Arnold Fisher b) Blaise Pascal y Pierre de Fermat c) William
Sealey Gosset y Karl Friedrich Gauss.

3. Una de las áreas de aplicación de la Estadística es Biología: por ejemplo el cruce de un


gato negro (N) con uno gris (n), en la primera generación se obtienen gatos negros
(Primera ley de Mendel)

NN nn

N n

Nn (100% gatos negros)


En la primera generación se obtiene el 100% de gatos negros, aunque estos gatos tienen el gen
de N: dominante y gen del n: recesivo.
En la segunda generación, obtiene el siguiente cruce de gatos, tal como se muestra en la siguiente
figura:

N n

N NN Nn
NN

n Nn nn

9/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

¿Qué porcentaje de gatos negros y grises se obtiene en la segunda generación?

1.2. Estadística descriptiva y estadística inferencial


La Estadística se divide en dos áreas: Estadística Descriptiva y Estadística Inferencial.

Estadística descriptiva: permite organizar y presentar un conjunto de datos de manera que describan en
forma precisa las variables analizadas haciendo rápida su lectura e interpretación.

Ejemplos 1.3. (Hipotético de estadística descriptiva)


1. Durante los últimos tres días de la pausa pedagógica que realizan los centros educativos públicos
de El Salvador se desarrolló dos talleres diarios de matemática.
2. La encuesta Cid Gallup informa una ventaja de 5% para el oficialismo en las próximas elecciones.

Estadística inferencial: Es una parte de la estadística que se dedica a la generación de modelos, generaliza
los resultados de una muestra a los de una población total teniendo en cuenta la aleatoriedad e
incertidumbre de las observaciones. Generalmente el análisis estadístico inferencial se lleva a cabo para
mostrar relaciones de causa y efecto, así como para probar hipótesis y teorías científicas.

Ejemplos 1.4. (Hipotético de estadística inferencial)


1. El BCR informa que en el 2017 el PIB tendrá un incremento del 2%.
2. La DIGESTYC informa que la población de El Salvador en 2025 será de 7, 057, 892.

Figura 1. Esquema de la división de la Estadística

Estadística descriptiva
Estadística

Estadística inferencial

1.2.1. Actividad de autoevaluación.

1. Contestar verdadero (V) o falso (F) y comentar sus respuestas según sea el caso:

Aspecto V F
La estadística inferencial generaliza los resultados de una muestra a los de la población total.
La estadística descriptiva tiene por objeto realizar los contrastes de hipótesis
La cantidad de pacientes atendidos en el Hospital Rosales en el último año, es un ejemplo de
estadística inferencial
Los datos del Censo de EL Salvador 2007, para San Miguel de un año determinado, es un
ejemplo de estadística descriptiva

10/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

2. Identifique en qué áreas se divide la estadística:


a) Estadística descriptiva e inferencial b) Probabilidad clásica y axiomática c) Estadística
Bayesiana y no paramétrica.

1.3. Método estadístico de investigación.

Según Sampieri; Collado y Baptista (2003), en la investigación científica existen dos enfoque:
cualitativo y cualitativo.

El enfoque cuantitativo utiliza la recolección y el análisis de datos para contestar preguntas de


investigación y probar hipótesis establecidas previamente, y confía en la medición numérica, el
conteo y frecuentemente en el uso de la estadística para establecer con exactitud patrones de
comportamiento en una población.

El enfoque cualitativo, por lo común, se utiliza primero para descubrir y refinar preguntas de
investigación. Con frecuencia se basa en métodos de recolección de datos sin medición numérica,
como las descripciones y las observaciones. Por lo regular, las preguntas e hipótesis surgen como
parte del proceso de investigación y éste es flexible, y se mueve entre los eventos y su
interpretación, entre las respuestas y el desarrollo de la teoría. Su propósito consiste en
"reconstruir" la realidad, tal y como la observan los actores de un sistema social previamente
definido.

Las etapas del método de investigación estadístico pueden escribirse de forma resumida o
detalladamente, por ejemplo una forma resumida: recolección, procesamiento, análisis de los
datos y conclusiones, sin embargo cada una estas etapas lleva subetapas, en este documento
para el desarrollo de una investigación estadística se consideran:
1. Planteamiento del problema.
2. Fijación de los objetivos.
3. Formulación de la hipótesis.
4. Definición de la unidad de observación y de la unidad de medida.
5. Determinación de la población y de la muestra.
6. La recolección.
7. Procesamiento de la información.
8. Depuración, clasificación y ordenación de los datos.
9. Tabulación.
10. Presentación.
11. Análisis.
12. Publicación.

11/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

A continuación se presenta una breve descripción de cada uno de los numerales antes descritos.
1. Planteamiento del problema: Al abordar una investigación se debe tener bien definido
qué se va a investigar y por qué se pretende estudiar algo. Además, se debe establecer
una delimitación clara, concreta e inteligible sobre el o los fenómenos que se pretenden
estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisión bibliográfica
del tema, para ver su accesibilidad y consultar los resultados obtenidos por
investigaciones similares, someter nuestras proposiciones básicas a un análisis lógico; es
decir, se debe hacer una ubicación histórica y teórica del problema.

2. Fijación de objetivos: Se debe presupuestar hasta dónde se quiere llegar y qué se quiere
lograr con la investigación; en otras palabras, debemos fijar cuales son las metas y
objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o
ambigüedades y debe, además, establecerse diferenciación entre lo de corto, mediano y
largo plazo, así como entre los objetivos generales y los específicos.

3. Formulación de hipótesis: Una hipótesis es ante todo, una explicación provisional de los
hechos objeto de estudio, y su formulación depende del conocimiento que el investigador
posea sobre la población investigada. Una hipótesis estadística debe ser susceptible de
contrastar, esto es, debe poderse probar para su aceptación o rechazo.

Una hipótesis que se formula acerca de un parámetro (media, proporción, varianza, etc.),
con el propósito de rechazarla, se llama hipótesis nula y se representa por Ho; a su
hipótesis contraria se llama hipótesis alternativa (Ha).

4. Definición de la unidad de observación y de la unidad de medida: La unidad de


observación, entendida como cada uno de los elementos constituyentes de la población
estudiada. Además, es el soporte de las técnicas de recolección de datos , es a ellas a las que
se les hará la medición. La unidad de observación puede estar constituida por uno o varios
individuos u objetos y denominarse respectivamente simple o compleja. La unidad de
medida: se refiere a qué medir en la unidad de observación, deben establecerse los
criterios sobre las condiciones en las cuales se ha de efectuar la toma de la información.

5. Determinación de la población y de la muestra. Estadísticamente, la población se define


como un conjunto de individuos o de objetos que poseen una o varias características
comunes. No se refiere esta definición únicamente a los seres vivientes; una población
puede estar constituida por los habitantes de un país o por los peces de un estanque, así
como por los establecimientos comerciales de un barrio o las viviendas de una ciudad.

Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el


término infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo,

12/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

los peces dentro de un estanque son un conjunto finito; sin embargo, en términos
estadísticos, puede ser considerado como infinito.
Muestra es un subconjunto de la población a la cual se le efectúa la medición con el fin de
estudiar las propiedades del conjunto del cual es obtenida.
En la práctica, estudiar todos y cada uno de los elementos que conforman la población no
es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus
elementos, porque a veces es necesario destruir lo que se está midiendo, por ser
demasiado grande el número de sus componentes o no se pueden controlar; por eso se
recurre al análisis de los elementos de una muestra con el fin de hacer inferencias respecto
al total de la población. Existen diversos métodos para calcular el tamaño de la muestra y
también para tomar los elementos que la conforman, pero no es el objetivo de este curso
estudiarlos. Diremos solamente que la muestra debe ser representativa de la población y
sus elementos escogidos al azar para asegurar la objetividad de la investigación.

6. La recolección: Una de las etapas más importantes de la investigación es la recolección de


la información, la cual ha de partir, a menos que se tenga experiencia con muestras
análogas, de una o varias muestras piloto en las cuales se pondrán a prueba los
cuestionarios y se obtendrá una aproximación de la variabilidad de la población, con el fin
de calcular el tamaño exacto de la muestra.

7. Procesamiento de la información: Almacenar la información recolectada en una base de


datos

8. Depuración, clasificación y ordenación: Después de haber reunido toda la información


pertinente en una base de datos, se necesita la depuración de los datos recogidos, esto es
validar la información con el fin de poder detectar falsedades en las respuestas,
incomprensión a las preguntas, respuestas al margen, información faltante, nulidad de
una pregunta o nulidad de todo un cuestionario.
Teniendo la información depurada se procede a establecer las clasificaciones respectivas
estableciendo los cruces necesarios entre las preguntas. Finalmente, se ordenan las
respuestas y se preparan los modelos de tabulación de las diferentes variables que
intervienen en la investigación.

9. Tabulación: Una tabla es un resumen de información respecto a una o más variables, que
ofrece claridad al lector sobre lo que se pretende describir; para su fácil interpretación
una tabla debe tener por lo menos: Un título adecuado, esto es que sea claro y conciso.

10. Presentación: Una información estadística adquiere más claridad cuando se presenta en
la forma adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener
cuidado con las variables que se van a presentar y la forma de hacerlo. No es aconsejable

13/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

saturar un informe con tablas y gráficos redundantes que, antes que claridad, crean
confusión.

11. Análisis: Las herramientas estadística ofrece métodos y procedimientos objetivos que
convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad
puede ser evaluada y ofrecer una premisa medible en la toma de una decisión. Es el
análisis donde se cristaliza la investigación, se hace inferencias respecto a la población, se
ajustan modelos y se prueban las hipótesis planteadas, con el fin de establecer y redactar
las conclusiones definitivas.

12. Publicación: Toda conclusión es digna de ser comunicada a un auditorio para cerrar la
investigación.

1.3.1. Actividad de autoevaluación.

1. Liste los primeros 6 pasos a seguir para el desarrollo de una investigación estadística.

2. Identifique la etapa más importante en el desarrollo de una investigación estadística;


a) Recolección de datos b) Definir el tema c) Definir los axiomas de probabilidad.

3. ¿Cuál es la etapa final del desarrollo de una investigación estadística?


a) Definir los objetivos b) Definir el tema c) Publicación de los resultados.

1.4. Variables estadísticas (Cualitativas y cuantitativas)


Las variables estadísticas son características que poseen todas las unidades del universo o
población en estudio.

Sea U el universo o población a investigar, formado por las unidades 𝑢1 , 𝑢2 , 𝑢3 , . . . , 𝑢𝑁 donde N


representa el tamaño de la población, el conjunto universal es:
U = {𝑢1 , 𝑢2 , 𝑢3 , . . . , 𝑢𝑁 }
Si el universo fuera los centros educativos públicos de El Salvador, entonces las 𝑢𝑖 representan
los centros educativos y las variables que se pueden investigar son: el nombre, la dirección, el
número de teléfono, la región donde está ubicado, número de alumnos, tipo de administración,
número de profesores, entre otras.
Las variables según el periodo de tiempo en que se miden se clasifican en transversales o
longitudinales. Una variable es de corte transversal cuando los resultados de la medición están
referidos a un mismo momento o período de tiempo.

14/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

Ejemplo 1.5. Variables de corte transversal.


1. Ingresos de los hogares de El Salvador en un mes determinado.
2. Ventas de las empresas de la industria manufacturera en un año determinado.
Una variable es de corte longitudinal o también llamada serie temporal, cuando los datos
corresponden a diferentes momentos o períodos de tiempo, a intervalos regulares (misma
amplitud de tiempo que transcurre en tomar las diferentes mediciones: diarias, semanales,
mensuales, trimestrales, anuales, etc.)

Ejemplo 1.6. Variables longitudinales.


1. La tasa de desempleo trimestral en un determinado país, durante los últimos 10 años.
2. El Producto Interno Bruto anual de un determinado país, durante los últimos 20 años.
Las variables dependiendo del tipo de datos que toma se clasifican en: cualitativas o
cuantitativas.
Figura 2: Clasificación de las variables según el tipo de datos

Cualitativas o atributos
Variables 
Cuantitativas : Discretas o Continuas
Las variables cualitativas o atributos son aquellas que no toman valores numéricos. Describen
diferentes cualidades que poseen las unidades objeto de estudio. Por ejemplo: sexo, estado civil,
color de los ojos, entre otras. Las variables cuantitativas están formadas por datos que toman
valores numéricos y pueden ser discretas, si sólo toman un número entero de valores o la
distancia entre dos datos consecutivos es constante, y continuas, si pueden tomar cualquier valor
real dentro de un intervalo.
Se utiliza, como notación habitual para las variables estadísticas, las letras mayúsculas del
alfabeto: X, Y, Z y los valores que toman las variables se representan con las letras minúsculas x,
y, z.

1.4.1. Actividad de autoevaluación.

1. Para cada una de las siguientes situaciones escribir el tipo de variable (Cualitativa o
cuantitativa) y justifica su respuesta.
Situación Variable cualitativa o cuantitativa y justifique
La felicidad de una persona
Estatura de una persona

15/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

Peso en kilogramos de un libro


El miedo de una persona
Enamoramiento de una persona
Total de niños nacidos en diciembre

2. De las siguientes variables indica cuáles son discretas, continuas o cualitativas:


Variables Tipo
Tiempo de duración de una bombilla
Número de hijos de 50 familias
El color de los ojos de tus compañeros de clase
Número de estudiantes matriculados en el curso de Probabilidad y Estadística
Matemática
Número de goles marcados por tu equipo favorito en la última temporada
Número de libros en un estante de la biblioteca

1.5. Escalas de medición


La medición puede definirse como la asignación de números a objetos y eventos de acuerdo con
ciertas reglas; la manera como se asignan esos números determina el tipo de escala de medición.
Las escalas de medición comúnmente conocidas son: nominales, ordinales, de intervalos y de
razón.
Escalas Nominales

Ejemplo 1.7.
1. Si vas a comprar pintura azul en la ferretería te presentan una escala con diferentes
tonalidades del color azul y cada tonalidad posee un número, pero este número sólo es
para facilitar al vendedor identificar el color solicitado entre cientos de colores.
2. En muchas solicitudes se le asigna el número 1 al sexo masculino y al número 2 al
femenino y esta clasificación sólo es para facilitar los cómputos y manejos de información
estadística, pero no quiere decir que las personas de sexo masculino tengan más o menor
valor que las del sexo femenino.
3. El número de DUI de los salvadoreños es un código para identificar a las personas.

En la escala nominal: las unidades observadas se agrupan en clases o categorías excluyentes


según determinada propiedad, con lo que se define una partición sobre el conjunto de tales
unidades. Los números que se utilizan para efectos de identificación en una escala nominal nunca

16/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

se utilizan para llevar a cabo los procedimientos matemáticos de suma, resta, multiplicación y
división; la única operación matemática permitida es el conteo.

Escalas Ordinales
Ejemplo 1.8.
1. Se realiza una carrera de atletismo sin medir el tiempo que tarda cada participante, en
este caso se puede saber quién llegó primero, segundo y tercero, pero no se sabe con
precisión la velocidad entre un corredor y otro. La diferencia que hay entre el primero y el
segundo no necesariamente es igual a la que hubo entre el segundo y el tercero.

2. En un determinado grupo escolar se seleccionan los cinco estudiantes (Juan, Ana, Esteban,
Jorge y Leticia) con el promedio más alto y resulta que Esteban quedó tercero con un
promedio de 8.9, seguido de Jorge con 8.8 y, luego Leticia con 8.5. Esteban como tercero
se le asigna el número tres, pero ésta designación numérica sólo indica su posición con
relación a los otros cuatro alumnos. Se sabe que Esteban tiene un mejor promedio que
Jorge y que su promedio es superior al Leticia. Sin embargo, no se puede saber hasta qué
punto es mejor su promedio comparado con los otros.

3. Etapas de desarrollo de los seres humanos: prenatal, infancia, niñez, adolescencia,


juventud, adultez y ancianidad.

Las escalas ordinales surgen a partir de la operación de ordenamiento y se utilizan para clasificar
a las personas, eventos u objetos en una posición con relación a cierto atributo, pero sin indicar
la distancia que hay entre las posiciones. Cuando se asignan números es sólo para indicar el orden
de las posiciones de lo que se está clasificando. Con las escalas ordinales no se pueden llevar a
cabo las operaciones aritméticas de suma, resta, multiplicación y división.

Escalas de intervalos
Ejemplo 1.9.
1. La temperatura en grados centígrados (°C) de una persona sana. La variación de la
temperatura normal dependerá de cada persona o del momento del día; por ejemplo: A
las 5 de la mañana la temperatura está más baja; y, a las 2 de la tarde, probablemente
alcanza su valor más alto. Considerando como normal la variación entre 35°C y 37.5°C.
Observe que si se selecciona una persona al azar y se le mide su temperatura, esta puede
tomar cualquier valor entre 35°C y 37.5°C. En este ejemplo qué interpretación se da al

17/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

valor (cero), la elección del origen (cero) es arbitraria, no implica que realmente haya cero
(ninguna) temperatura.
2. Ubicación en una carretera respecto de un punto de referencia (Kilómetro 17 de la
carretera Panamericana). Nuevamente qué interpretación se da al valor (cero), la elección
del origen (cero) es arbitraria, no implica que realmente haya cero (ninguna) distancia en
el kilómetro cero.
3. La puntuación obtenida en pruebas de IQ (Coeficiente Intelectual). La escala de
inteligencia posee un punto cero, pero administrando cualquier tipo de prueba que
intente medir la inteligencia, nunca va a encontrar un ser humano con cero inteligencia.
Nuevamente, concluimos que la elección del origen (cero) es arbitraria.

Las escalas de intervalos son aquellas que ordenan los objetos o eventos según la magnitud del
atributo que representan y proveen intervalos iguales entre las unidades de medida. Además, no
poseen un punto cero absoluto o verdadero ya que el mismo es establecido por convención de
forma arbitraria por los expertos en el área o materia de estudio y no implica la ausencia del
atributo o la propiedad en cuestión.

Una diferencia de cierta magnitud en una escala de intervalos significa lo mismo en todos los
puntos de la escala. Así por ejemplo, en la escala de temperatura en grados centígrados puede
decirse que la distancia entre 25° y 30°C es la misma que la existente entre 20° y 25° C, pero no
puede afirmarse que una temperatura de 40° C equivale al doble de 20° C en cuanto a intensidad
de calor se refiere, debido a la ausencia de cero absoluto.
Escalas de razón1
Ejemplo 1.10.
1. Estatura de las personas o largo de una columna. Se observa que si una columna mide seis
metros, este es el doble del largo de otra columna que mide tres metros. Si una columna
mide 0 metros, esta columna no existe (tiene cero de largo)
2. Litros de agua consumidos por persona al día.
3. Número de hijos en una familia, si una familia tiene 4 hijos, es el doble de hijos de otra
familia que tiene 2.

1
En la mayoría de textos estadísticos se usa la escala de razón, para obtener una escala que considere el cero absoluto
y se diferencie de la escala de intervalo. Además, la escala de razón compara dos magnitudes que pueden tener
diferentes unidades (cero salario mensual, compara dinero y tiempo).

18/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

La escala de razón o cociente se diferencian de la de intervalos en que el punto cero no es


arbitrario y corresponde a una total ausencia de la característica estudiada. Además pueden
llevarse a cabo las diferentes operaciones aritméticas.
A manera de conclusión es importante tener siempre presente la escala de medición que se está
usando, pues no todos los procedimientos estadísticos son apropiados para cualquier análisis.

1.5.1. Actividad de autoevaluación

Indicar el tipo de escala de las siguientes variables:

Características Escala
Niños, Jóvenes, Adultos
Ingeniería Eléctrica, Mecánica, Civil, Industrial
Calificaciones de un grupo de estudiantes
Directiva de sexto grado: Presidente, Vicepresidente, Tesorero y
Secretario
Guatemalteco, Salvadoreño, Hondureño, Nicaragüense
Número de carné de los estudiantes
Velocidad de un auto en la carretera
El miedo de una persona
Enamoramiento de una persona

1.6. Población objetivo y población muestral y muestra

Un paso inicial en una investigación estadística es definir claramente la población que va a ser
estudiada.

Población. Un conjunto de unidades (personas, establecimientos, empresas, etc.) respecto


de las cuales se desea conocer alguna o algunas de sus características para sacar
conclusiones.
Muestra. Un subconjunto de una población determinada, y las conclusiones que se obtengan
de dicha muestra solo podrán referirse a la población en referencia. Una muestra
representativa contiene las características relevantes de la población en las mismas
proporciones que están incluidas en tal población. En consecuencia muestra y población son
conceptos relativos. La población es un todo y la muestra es una fracción o segmento de ese
todo.

19/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

Ejemplo 1.11. Suponga que los titulares del Ministerio de Salud quieren saber cuántos niños
nacidos en los últimos 6 meses han sido vacunados y cuántos no, y las variables asociadas (nivel
socioeconómico, lugar donde se vive, educación), con el fin de tomar decisiones para formular
estrategias de vacunación y mensajes dirigidos a persuadir la pronta y oportuna vacunación de
los niños. Para esta situación responder los siguientes literales:

a) Definir la población objeto de estudio


b) ¿Es posible investigar toda la población o es recomendable analizar una muestra?
c) Definir la muestra.

Solución:
a) Población: Mujeres de El Salvador que en los últimos 6 meses han tenido hijo(a)
Población

Muestra

b) El total de mujeres que han dado a luz en los últimos 6 meses son muchas (según datos
del MINSAL en seis meses son más de 50,000). Para lograr entrevistar a todas las mujeres
de la población en estudio se requiere de mucho recurso humano, económico y tiempo;
por tanto, es recomendable tomar una muestra aleatoria representativa de la población.
c) Definir la muestra.
Definir el número de mujeres a entrevistar (Tamaño de la muestra n) debe ser un
subconjunto de la población objeto de estudios. Para resolver esta situación puede utilizar
fórmulas matemáticas, con base al tipo de muestreo a utilizar (el estudio de los diferentes
tipos de muestreo está fuera de los objetivos de este documento). Algunos textos

20/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

estadísticos sugieren que con muestras de tamaño entre un 5% y 10% de los elementos
de la población, se obtienen margen de error aceptable. En esta situación, se considerará
el 5%, así:
𝑛 = 50,000 ∗ 0.05 = 2,500
Comentario del ejemplo anterior. En este tipo de estudio, la población objeto es diferente a la
población muestral: Población objetivo: Niños nacidos en los últimos 6 meses y población
muestral: mujeres que dieron a luz en los últimos 6 meses. Muestra: Mujeres que fueron
entrevistadas, por tanto, es un subconjunto de la población.

En algunos estudios es importante diferenciar la población objetivo de la muestreada: Población


objetivo: grupo de individuos o elementos que pretendemos estudiar y población muestreada:
grupo del que realmente extraemos la muestra.
En un estudio estadístico es importante conseguir que la población objetivo coincida lo máximo
posible con la muestreada, esto en general corresponde al diseño estadístico.

Ejemplo 1.12: Preferencia políticas de la población mayor de 18 años del municipio de San Miguel.
Población objetivo: personas mayores de 18 años del municipio de San Miguel.
Población muestreada: la misma.

Ejemplo 1.13: Eficacia del fármaco A en enfermos de SIDA.


Población objetivo: enfermos de SIDA.
Población muestreada: enfermos de SIDA en El Salvador.

En el ejemplo 1.13 la población objetivo no coincide con la muestreada, ya que las conclusiones
que se obtengan del estudio se suponen válidas para los enfermos del SIDA en todo el mundo, sin
embargo, el fármaco se aplica solo en El Salvador.

1.6.1. Actividad de autoevaluación.


1. Suponga que se quiere conocer las preferencias electorales de los mayores de 18 años del
municipio de San Salvador, para ello, se entrevista a 500 personas de diferentes barrios y
colonias, se pide:
a) Definir la población objetivo.
b) Definir la población muestreada.
c) Existe alguna diferencia entre la población objetivo y la muestreada.
d) Definir la muestra.

21/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

2. Suponga que un biólogo quiere clasificar los tipos de mariposas del Jardín Botánico del
municipio de Antiguo Cuscatlán, para ello, coloca trampas en 5 puntos diferente del Jardín
Botánico, se pide:
a) Definir la población objetivo.
b) Definir la población muestreada.
c) Existe alguna diferencia entre la población objetivo y la muestreada.
d) Definir la muestra.

1.7. Parámetro y estadístico

Retome la situación planteada en el apartado 1.6 (ejemplo 1.11), para analizar y determinar qué
medidas corresponden a la población total o a la muestra.

Análisis de la situación:
En el ejemplo 1.11 se especifica que los titulares del Ministerio de Salud de El Salvador quieren
determinar cuántos niños nacidos en los últimos 6 meses han sido vacunados y cuántos no.

Si se denota por:
N: Total de niños nacidos en los últimos 6 en El Salvador.
n: Total de niños nacidos en los últimos 6 en El Salvador y que han sido vacunados.

Es evidente que tanto N como n no se conocen, ya que son medidas de la población objeto de
estudio, se podrían conocer sólo que se analice toda la población, estas medidas se conocen como
parámetros.
En la práctica se analiza una muestra de la población y las medidas que se obtienen de la muestra
se llaman estadísticos.

Parámetro: Es una cantidad numérica calculada sobre las unidades de una población y
resume los valores que ésta toma en algún atributo.

Estadístico: Es una cantidad numérica calculada sobre las unidades que pertenecen a la
muestra y que resume su información sobre algún aspecto. Se usa para estimar un
parámetro.

22/23
Universidad de El Salvador
Facultad de Ciencias Naturales y Matemática, Licenciatura en
Enseñanza de la Matemática, Eucación a distancia. Asignatura:
Probabilidad y Estadística Matemática, Unidad I

1.7.1. Actividad de autoevaluación

1. Contestar verdadero (V) o falso (F) y comentar sus respuestas según sea el caso:

Aspecto V F
A las medidas que se obtienen de una población se les da el nombre de
parámetro.
A las medidas que se obtienen de una población se les da el nombre de
estadísticos.
A las medidas que se obtienen de una muestra se les da el nombre de
parámetro.
A las medidas que se obtienen de una muestra se les da el nombre de
estadísticos.

2. De las siguientes medidas identificar si representan parámetro o estadísticos:

Situación Parámetro o
estadístico
Tiempo de duración de una bombilla
Población del municipio de Santa Ana
La estatura promedio de 5 alumnos seleccionados al azar
Número total de alumnos matriculados en el curso de
Probabilidad y Estadística Matemática en la Universidad en
Línea-UES
Número de goles marcados por tu equipo favorito en la última
temporada
Calificación promedio de 10 alumnos seleccionados al azar

23/23

También podría gustarte