Está en la página 1de 10

Unidad I

1.1 Breve historia de la Estadística


Métodos de adquisición del conocimiento
La búsqueda de la verdad ha sido una de las preocupaciones de siempre del
ser humano. Ahora bien, ¿Qué es la verdad? o ¿Cómo llegar a la verdad?. En
esta ocasión no nos centraremos en discutir sobre que es la verdad, nos
enfocaremos en cómo llegar a la verdad, o mejor dicho como llegar al
conocimiento válido.
Históricamente, la humanidad ha empleado cuatro métodos para adquirir el
conocimiento:
La autoridad. El conocimiento se considera válido por el sólo hecho de que una
tradición o alguna persona reconocida afirma que lo es.
El racionalismo. Al conocimiento se llega exclusivamente por la vía del
razonamiento, es decir, si las premisas de que se parte son válidas, y el
razonamiento que se sigue de acuerdo a la lógica es el correcto, entonces las
conclusiones son válidas también.
La intuición. El conocimiento proviene de una inspiración, esa idea que aclara y
salta a la conciencia como un todo. No se llega al conocimiento por medio de la
razón, sino que por el contrario, con frecuencia la idea surge después de que
falló el razonamiento consciente.
El método científico. El conocimiento válido es aquel que se cumple con las
exigencias del método. Aquí, ya sea mediante un razonamiento o por su
intuición, el investigador crea una hipótesis acerca de determinado aspecto de
la realidad, misma que somete a prueba. Para ello, recoge ciertos datos que
luego analiza estadísticamente y con ello confirma o rechaza su hipótesis.
En este caso, no importa lo que el científico crea que es válido, él debe
someter a prueba su hipótesis. Con el análisis estadístico de los datos, será
posible extraer una conclusión acorde a la realidad. Así, el método científico
permite garantizar que las afirmaciones que hagamos se ajusten a lo que se
demostró, antes de que las afirmaciones reciban la categoría de conocimiento
científico.
Así pues, el método científico se apoya en la estadística para evaluar las
hipótesis que hacemos, ahora es conveniente de que definamos Estadística.
1.2 Qué es la estadística
Es común que en los medios de comunicación o en nuestro entorno
escuchemos frases que de alguna manera involucran el término estadística:
 El cerebro de las mujeres pueden atender más tareas a la vez que el cerebro
de los hombres Las estadísticas del partido son…
 El desempleo aumenta en Delicias según las estadísticas del gobierno
 Datos estadísticos muestran el incremento de la violencia en el estado de
Chihuahua
En estos casos, el término estadística tiene un uso relacionado con el manejo
de números, que si bien es cierto se relaciona con el contenido de nuestro
curso, no es eso todo, ya que la estadística es más que sólo números, son los
datos y lo que se hace con éstos últimos.

Una definición concreta la propone Johnson (2004):


Estadística es la ciencia de recolectar, describir e interpretar datos
Así pues, la estadística nos ayudar en el conocimiento de la realidad en tres
etapas fundamentales:
1. Planear la búsqueda y la obtención de la información.
2. Sistematizar y organizar la información para describirla y analizarla con
facilidad.
3. Efectuar inferencias sobre la realidad a partir de la información obtenida,
haciendo estimaciones o verificando conjeturas.
1.3 Estadística descriptiva y 1.4 Estadística Inferencial
Para su estudio, la Estadística se divide en dos:
 Estadística descriptiva. Se refiere a las técnicas que se utilizan para la
organización, presentación y descripción de los datos. También se conoce
como estadística deductiva.
 Estadística inferencial. Se refiere a las técnicas que se emplean con los
datos obtenidos en la muestra, para a partir de ellos, hacer inferencias sobre
sus respectivas poblaciones. También se le conoce como estadística inductiva
Como se observa, comienzan a aparecer nuevos conceptos que tenemos que
comprender.
 Población. Conjunto de personas, objetos o de entidades, misma que se
simboliza con N. Algunos le llaman también “universo” y lo refieren como “la
totalidad de “todas las posibles observaciones”. Dicha población puede ser
finita o infinita.
 Población finita. Cuando la población tiene fin. Por ejemplo, el número de
alumnos del Centro Regional Delicias de la Universidad Pedagógica Nacional.
 Población infinita. Cuando se desconoce o no tiene fin la población. Por
ejemplo, todos los posibles resultados (águila o sello) de sucesivas tiradas de
una moneda.
 Muestra. Es un conjunto de medidas u observaciones tomadas a partir de
una población dada, por lo que es un subconjunto de la población que se
simboliza con N.
 Variable. Característica de interés sobre cada elemento individual de una
población o muestra.
 Dato. Valor de la variable asociada a un elemento de la población o muestra.
Este valor puede ser un número, una palabra o un símbolo.
 Datos. Conjunto de valores recolectados para la variable de cada uno de los
elementos que pertenecen a la muestra.
1.5 Breve introducción a la Inferencia Estadística.
Recapitulando, los conceptos de población y de muestra nos permiten
considerar las tres etapas de la estadística que hemos mencionado.
 La primera etapa refiere a la planeación de la búsqueda y la obtención de la
información; en particular, esta parte incluye métodos que permiten diseñar un
esquema para la selección de una muestra representativa de la población.

 La segunda parte de la estadística es la que se encarga de sistematizar y


organizar la información contenida en una muestra o en una población, es decir
los valores de la variable. Esta parte incluye métodos que permiten describir y
analizar la información.
 La tercera parte comprende métodos estadísticos que permiten inferir, a
partir de la información de una muestra, cuáles pueden ser los rasgos
principales de los valores de la población.
Pero ojo, cuando hacemos inferencias sobre la población a partir de una
muestra, estamos obteniendo ciertas conclusiones sobre la realidad. Por ello, el
proceso de selección de los individuos, objetos o entidades que se estudiarán
debe estar bien diseñado, para que la muestra sea representativa de la
población. Pero por muy representativa de la población que sea la muestra, no
deja de ser una subcolección de la población, una de las muchas muestras
posibles igualmente representativas. Es probable que si se hubiera obtenido
otra muestra, los valores de ésta habrían sido distintos. Si ambas muestras son
representativas de la población, los valores de cada una nos dan una idea
acerca de los valores de la población, pero no nos informan totalmente acerca
de ellos.
Con una muestra representativa, los métodos de la estadística inferencial
permiten hacer ciertas afirmaciones acerca de la población con la máxima
confianza posible, es decir con el mínimo riesgo posible de cometer error, pero
aún así hay probabilidad de error. La probabilidad ocupa un lugar importante en
este proceso, ya que aporta un lenguaje que permite expresar en forma
cuantificable tanto la confianza que podemos tener en una inferencia
estadística como el riesgo de cometer un error en esta inferencia.
La estadística inferencial hace posible no sólo hacer estimaciones sino también
probar hipótesis. Esto significa poner a prueba conjeturas que se hacen acerca
del fenómeno bajo estudio, es decir contrastar los hechos que se deducen de
ellas con los hechos observados. Los métodos estadísticos de prueba de
hipótesis permiten decidir si la información contenida en una muestra
contradice o corrobora una hipótesis planteada sobre la población.
Errores en el uso de la Estadística
¿Cómo se miente con estadística?
La estadística puede ser una herramienta poderosa que nos ayuda a conocer
la realidad. Sin embargo puede también servir para mentir... si no se tiene
cuidado de usar correctamente los métodos estadísticos y de interpretar
correctamente sus resultados.
Es famosa la siguiente frase del ministro inglés Disraelí: “hay tres clases de
mentiras: las mentiras, las grandes mentiras y la estadística”.
Curiosamente, la cita aparece con frecuencia en los libros de estadística,
aunque parece hacerle poca propaganda a la disciplina. Lo que ocurre es que
la estadística como toda herramienta, no puede cometer errores por sí misma:
los errores y las mentiras son responsabilidad de quien la usa incorrectamente.

Suele suceder que en la presentación de resultados de investigaciones poco


serias se utilice la estadística para dar la impresión de que todo ha sido
realizado en forma muy “científica”. Con frecuencia ocurre también que quienes
leen u oyen tales presentaciones presuponen, implícita
o explícitamente que el estudio es en efecto muy “científico”; no le prestan
atención al reporte de números y gráficos pero creen a ojos cerrados las
interpretaciones que se hacen de ellas.
Se le presentan una serie de siete preguntas que le pueden servir de guía para
un análisis crítico de los reportes serios y de los no tan serios.
1. ¿Qué se está midiendo, y cómo?
Como hemos visto, el uso de la estadística requiere que las características de
interés puedan ser medidas. Hay que tomar con alguna reserva los reportes de
investigaciones que involucren características cuya medición es tan compleja
como la de la herencia genética o del medio ambiente cultural si se reporta con
detalle el procedimiento utilizado en la medición.
Es pertinente preguntarse de qué manera surgieron los datos obtenidos.
Supongamos por ejemplo que un entusiasta estudiante de odontología decide
investigar con qué frecuencia se lavan los dientes los adultos de una
comunidad, y que para ello les hace la siguiente pregunta:
“usted se lava los dientes tres veces al día, ¿verdad?”.
2. ¿Cómo es la muestra?
Los reportes de estudios que se hicieron sobre una muestra no siempre
especifican cómo se observó ésta. Entonces cabe preguntarse si la muestra es
representativa de la población sobre la que se pretende hacer inferencias.
Supongamos, por ejemplo, que en una ciudad se desea investigar qué tipo de
películas les gustan a los adultos de clase media, y que para ello se hace una
encuesta de casa en casa, algunos barrios de clase media a mediodía entre
semana. Es obvio que los adultos que se entrevistan serán sobre todo amas de
casa, y que una muestra así sólo es representativa, si acaso, de la población
de adultos de clase media de esta ciudad que se encuentran en su casa a
mediodía entre semana.
La muestra puede también ser demasiado pequeña. Cuando las universidades
norteamericanas empezaron a admitir mujeres estudiantes, alguien reportó,
alarmado, que 33.3% de las estudiantes de una universidad se habían casado
con profesores de la institución. La cifra es impresionante, pero deja de serlo
cuando se sabe que en esa universidad había tres mujeres estudiantes y que
una de ellas se había casado con un profesor.
3. ¿Qué se está probando, y cómo?
Nunca está de más tener cuidado con frases que empiezan así: “se ha
demostrado que …”. Si el reporte incluye la prueba de alguna hipótesis, hay
que buscar el planteamiento explícito de ésta. Además, como veremos en el
transcurso de la asignatura, el uso de cada método, y en especial de los
inferenciales, requiere que los datos satisfagan ciertas condiciones.
Conviene, pues, preguntarse si el método estadístico utilizado es el más
apropiado para el tipo de datos obtenidos.
4. ¿Qué información falta?
Muchas de las “trampas” en las que incurren los reportes de investigaciones
consisten en que no se incluye información que puede ser relevante, ya sean
por falta de espacio o porque a los autores les interese ocultar dicha
información. Un caso típico es cuando no se reporta el tamaño de la muestra.
El reporte puede no incluir los datos obtenidos en la investigación. Esto no es
demasiado grave si se incluyen los resultados brindados por la estadística
descriptiva, pero lo es si se incluyen sólo los datos favorables a la conclusión
que se quiere obtener y se excluyen los que la contradicen.
Puede también omitirse información que, explica los resultados de modo
distinto al que se quiere presentar. Por ejemplo, un comerciante de cuadernos
escolares puede vanagloriarse de haber logrado que sus ganancias crecieran
en sólo el transcurso de un mes… mientras no informe que el crecimiento
ocurrió en septiembre y que además aumentó el precio de los cuadernos por el
inicio del año escolar.
5. ¿Se está hablando siempre de lo mismo?
Es frecuente que se utilicen datos reales para obtener conclusiones
disparatadas. Supongamos por ejemplo que se sabe que en cierta gran ciudad
el número de personas atropelladas por vehículos motorizados a mediodía es
el cuádruple del de los atropellados a medianoche. Alguien puede inferir que
entonces es mucho más seguro caminar por las calles de esa ciudad a
medianoche que a mediodía… claro, sin tomar en cuenta que el número de
personas que circulan por las calles en muchísimo mayor a mediodía que a
medianoche.
En algunos estudios las trampas de este tipo pueden estar en el proceso de
medición. Por ejemplo hace algunas décadas el número de indígenas que
había en la sierra tarahumara era de 28 mil sólo cinco años más tarde era de
105 mil.
Pero el aumento se explica, más que por un crecimiento real de la población
por el interés de en ser contada, ya que el primer censo se realizó para estudiar
el pago de impuestos y el segundo para repartir víveres después de una
sequía.
6. ¿Tiene sentido?
Esta pregunta es una invitación a que se considere si los resultados reportados
en un escrito son congruentes con el sentido común.
Supongamos que un estudio reporta que la cosecha de maíz va relación directa
con la precipitación pluvial: mientras más llueve, más maíz se cosecha. Esta
coherente sólo dentro de cierto rango: demasiada lluvia arruina la cosecha.
Es muy frecuente que se utilicen números impresionantemente “precisos” cuyo
significado es escaso, como un gasto familiar diario promedio de $201.58, o
una efectividad 54.813% mayor método de enseñanza (especialmente si no se
dice mayor que qué). Eso sí, números así hacen que los reportes se vean muy
verosímiles, o, como usualmente se dice, muy “científicos”.
7. ¿Quién lo dice?
Muchas de las “estadísticas” que oímos o leemos tienen fines publicitarios. “Se
ha demostrado estadísticamente que el fertilizando HHH es más efectivo para
el cultivo de la papa”. Si esta afirmación es firmada por los fabricantes del
fertilizante HHH, hay serias razones para hacer un escrutinio minucioso de los
datos, los métodos utilizados y los resultados obtenidos con el fin de determinar
si la conclusión es válida o no.
Las falacias pueden ser más sutiles. Supongamos que a los fabricantes del
fertilizante HHH les interesa parecer realmente “muy científicos”. Entonces
pueden “crear” el Laboratorio de Investigaciones Científicas Agropecuarias
Experimentales (o mejor aún, el LICAESA).
Tal vez, las preguntas y los ejemplos que hemos presentado le hayan dejado la
idea de que los reportes que incluyen un tratamiento estadístico de la
información mienten descaradamente y no es cierto.
Muchas veces la estadística se utiliza correctamente, y las conclusiones
obtenidas son validas. Nuestro deseo es que esto ocurra cada vez con mayor
frecuencia.

Y para no dejarse engañar, conviene manejar los aspectos elementales de la


estadística siempre con actitud crítica toda clase de reportes e informes,
particularmente aquellos en los involucrados intereses monetarios o de poder.
1.6 Teoría de Decisión en Estadística
DECISIONES ESTADÍSTICAS
Muy a menudo, en la práctica, se tienen que tomar decisiones sobre
poblaciones, partiendo de la información muestral de las mismas. Tales
decisiones se llaman decisiones estadísticas. Por ejemplo, se puede querer
decidir a partir de los datos del muestreo, si un suero nuevo es realmente
efectivo para la cura de una enfermedad, si un sistema educacional es mejor
que otro, si una moneda determinada está o no cargada, etc.
HIPÓTESIS ESTADÍSTICAS. HIPÓTESIS NULA
Para llegar a tomar decisiones, conviene hacer determinados supuestos o
conjeturas acerca de las poblaciones que se estudian. Tales supuestos que
pueden ser o no ciertos se llaman hipótesis estadísticas y, en general, lo son
sobre las distribuciones de probabilidad de las poblaciones.
En muchos casos se formulan las hipótesis estadísticas con el solo propósito
de rechazadas o invalidadas. Por ejemplo, si se quiere decidir si una moneda
está cargada, se formula la hipótesis de que la moneda está bien, es decir, p =
0,5; donde p es la probabilidad de cara. Análogamente, si se quiere decidir
sobre si un procedimiento es mejor que otro, se formula la hipótesis de que no
hay diferencia entre los procedimientos (es decir, cualquier diferencia
observada se debe meramente a fluctuaciones en el muestreo de la misma
población). Tales hipótesis se llaman también hipótesis nulas y se denotan por
H0.
Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis
alternativa. Por ejemplo, si una hipótesis es p = 0,5 hipótesis alternativas son p
= 0,7; p< 0,5 o p > 0,5. Una hipótesis alternativa de la hipótesis nula se denota
por H1
1.7 Componentes de una Investigación Estadística
Una investigación se puede denominar “estadística” cuando las hipótesis son
afirmaciones relativas a la distribución de una o más variables aleatorias. En
estas investigaciones pueden identificarse, entre otros, los siguientes
componentes:
 Un universo: un conjunto de entidades (personas, seres vivos, objetos
inanimados) respecto de los cuales se desea conocer alguna o algunas de sus
características.
 Variables: características medibles que poseen todas las unidades del
universo.
 Objeto de la investigación: no consiste en identificar las entidades del
universo con ciertas características, sino que se trata de resumir información
acerca de la distribución de dichas características en la población
 Procedimiento de recolección: es posible conocer, mediante un
procedimiento adecuado, el valor de la o las variables de algunas o de todas
las entidades del universo.
 Restricciones: en cuanto a los recursos disponibles (humanos, técnicos,
financieros) y en cuanto a la oportunidad en que deben darse a conocer los
resultados de la investigación, lo que obliga a elegir, entre varias estrategias
alternativas, la que resulte más eficiente.

La investigación estadística exige la participación de diferentes especialistas


(estadísticos, informáticos, especialistas en la materia investigada) en un
conjunto de actividades que deben seguir una secuencia lógica, aunque con
variantes que la pueden hacer más o menos eficiente, más o menos exitosa.
Una investigación estadística puede fracasar cuando no ha sido
adecuadamente planificada, cuando el presupuesto es insuficiente o no se
asigna en forma equilibrada entre las diferentes actividades, cuando no se
dispone de personal capacitado o cuando se cometen errores graves en la
ejecución de las tareas o en el procesamiento de la información. La materia
prima de la investigación estadística son los datos. La clave del éxito de la
investigación está relacionada con los procedimientos que se siguen para la
selección, la recolección y el tratamiento de los datos.
Las actividades que involucra una investigación estadística pueden clasificarse
con arreglo a diversos criterios. Uno de ellos se relaciona con el orden
cronológico en que deben ser realizadas. En este sentido, puede hablarse de
tres grandes etapas o fases:
- planificación
- ejecución y procesamiento
- análisis y divulgación.
1.8 Recolección de Datos
En el entorno de ingeniería, los datos son casi siempre una muestra que ha
sido seleccionado de alguna población. Hay tres métodos básicos de
recolección de datos:
 Un estudio retrospectivo usando datos históricos
 Un estudio observacional
 Un diseño de experimento
Un procedimiento eficaz de recolección de datos puede simplificar el análisis y
conducir a una mejor comprensión de la población o proceso que se está
estudiando.
¿Qué implica la Recolección de Datos?
Una vez que seleccionamos el diseño de investigación apropiado y la muestra
adecuada de acuerdo con nuestro problema de estudio e hipótesis, la siguiente
etapa consiste en recolectar los datos pertinentes sobre las variables
involucradas en la investigación.
Recolectar los datos implica tres actividades estrechamente vinculadas entre
sí:
Seleccionar un instrumento de medición de los disponibles en el estudio del
comportamiento o desarrollar uno (el instrumento de recolección de los datos).
Este instrumento debe ser válido y confiable, -de lo contrario no podemos
basamos en sus resultados.
Aplicar ese instrumento de medición. Es decir, obtener las observaciones y
mediciones de las variables que son de interés para nuestro estudio (medir
variables).
Preparar las mediciones obtenidas para que puedan analizarse
correctamente (a esta actividad se le denomina codificación de los datos).

¿QUÉ SIGNIFICA MEDIR?


De acuerdo con la definición clásica del término —ampliamente difundida—
medir significa “asignar números a objetos y eventos de acuerdo a reglas”
(Stevens, 1951), esta definición es más apropiada para las ciencias físicas que
para las ciencias sociales, ya que varios de los fenómenos que son medidos en
éstas no pueden caracterizarse como objetos o eventos, puesto que son
demasiado abstractos para ello.
Este razonamiento nos hace sugerir que es más adecuado definir la medición
como “el proceso de vincular conceptos abstractos con indicadores empíricos
proceso que se realiza mediante un plan explicito y organizado para clasificar
(y frecuentemente cuantificar) los datos disponibles —los indicadores— en
términos del concepto que el investigador tiene en mente. Y en este proceso,
el instrumento de medición o de recolección de los datos juega un papel
central. Sin él no hay observaciones clasificadas.
En toda investigación aplicamos un instrumento para medir las variables
contenidas en las hipótesis (y cuando no hay hipótesis, simplemente para
medir las variables de interés). Esa medición es efectiva cuando el instrumento
de recolección de los datos realmente representa a las variables que tenemos
en mente. Si no es así nuestra medición es deficiente y por lo tanto la
investigación no es digna de tomarse en cuenta. Desde luego, no hay medición
perfecta, es prácticamente imposible que representemos fielmente variables
tales como la inteligencia, la motivación, el nivel socioeconómico, el liderazgo
democrático, la actitud hacia el sexo y otras más; pero sí debemos de
acercarnos lo más posible a la representación fiel de las variables a observar,
mediante el instrumento de medición que desarrollemos.
¿QUÉ REQUISITOS DEBE CUBRIR UN INSTRUMENTO DE MEDICIÓN?
Toda medición o instrumento de recolección de los datos debe reunir dos
requisitos esenciales: confiabilidad y validez
La confiabilidad de un instrumento de medición se refiere al grado en que su
aplicación repetida al mismo sujeto u objeto, produce iguales resultados.
La validez, en términos generales, se refiere al grado en que un instrumento
realmente mide la variable que pretende medir.
El método más utilizado para recolectar datos es:
 Cuestionario
o Entrevista personal
o Entrevista telefónica
1.9 Estadística Paramétrica (población y muestras aleatorias)
Hay dos clases de pruebas estadísticas: Las paramétricas y las no
paramétricas. Las pruebas paramétricas tienen mayor capacidad para detectar
una relación real o verdadera entre dos variables, si es que la misma existe.
Por ello, exigen que los datos a los que se aplican, cumplan tres requisitos:
Variable numérica: Que las variables de estudio (dependiente) esté medida en
una escala que sea por lo menos de intervalo.
Normalidad: Que los valores de la variable dependiente sigan una distribución
normal; por lo menos, en la población a la que pertenece la muestra.
Prueba estadística: Kolmogorov Smirnov
Homocedasticidad: Que las varianzas de la variable dependiente en los
grupos que se comparan sean aproximadamente iguales (homogeneidad de las
varianzas).
Prueba estadística: Test de Levene.
Propiedades
1. Requieren que las variables se midan con la escala intervalo o de razón
2. Se relacionan con el estudio de un parámetro de la población (media,
varianza, desviación estándar, etc.)
Cuando se conoce la forma funcional de la función de distribución que sigue la
variable aleatoria objeto de estudio y sólo tenemos que estimar los parametros
que la determinan, estamos en un problema de inferencia estadística
paramétrica; por el contrario cuando no se conoce la forma funcional de la
distribución que sigue la variable aleatoria objeto de estudio, estamos ante un
problema de inferencia estadística no paramétrica.
En lo que sigue nos vamos a limitar a problemas de inferencia estadística
paramétrica, donde la variable aleatoria objeto de estudio sigue una distribución
normal, y sólo tendremos que tratar de estimar los parámetros que la
determinan, la media (medidas de tendencia central) y la desviación típica
(medidas de dispersión).
Esta situación se presenta con frecuencia debido a que es posible a menudo
conocer la forma funcional de la distribución de probabilidad, por
consideraciones teóricas, quedando únicamente indeterminados los
parámetros que determinan la función de distribución.
Promedio, media o media aritmética:
Se define como el cociente que se obtiene al dividir la suma de los valores de
la variable por el n° de observaciones. Se aplica a variables numéricas.
Su fórmula es la siguiente:
Para una muestra Para una población
Varianza:
Es la media aritmética de los cuadrados de las desviaciones. Se denota por S2
o σ2.
 Este valor cuantifica el grado de dispersión o separación de los valores de la
distribución con respecto a la media aritmética.
A mayor dispersión mayor valor de la varianza, a menor dispersión menor valor
de la varianza.

Su fórmula es la siguiente:
Desviación estándar:
La desviación estándar es una medida del grado de dispersión de los datos con
respecto al valor promedio. Dicho de otra manera, la desviación estándar es
simplemente el "promedio" o variación esperada con respecto a la media
aritmética. Se define como la raíz de la varianza.

También podría gustarte