Está en la página 1de 65

Unidad 1

Reseña Histórica -Aspectos


metodológicos.
Tabla Contenido
1.1 a. Reseña Histórica.
b. Formas del saber
Breve historia de la estadística

La historia de la estadística aclara en gran


medida la naturaleza de la misma en el siglo
XX. La perspectiva histórica también es
importante para ver las necesidades y las
presiones que la crearon.
El término estadística no es nuevo. La estadística debió comenzar como
una aritmética estatal para asistir al gobernante que necesitaba
conocer la riqueza y el número de sus súbditos con el objeto de
recaudar impuestos o presupuestar la guerra.

Es de presumir que todas las culturas que intencionalmente registraron


su historia también registraron sus estadísticas. Sabemos que César
Augusto decretó que todos los súbditos tenían que tributar y por lo
tanto exigió a todas las personas que se presentaran al estadístico más
cercano, que entonces era el recaudador de impuestos. Debido a lo
anterior, Jesús nació en Belén, no en Nazareth.

Guillermo el Conquistador ordenó un censo de las tierras de Inglaterra


para fines de tributación y de servicio militar. Este se llamé “Domesday
Book”. Tales estadísticas son historia.
Varios siglos después del “Domesday Book”,
encontramos una aplicación de la probabilidad
empírica al seguro de embarque, del cual parece haber
dispuesto la navegación flamenca del siglo XIV. Esto
pudo haber sido poco más que pura especulación o
juego de azar, pero llegó a ser la forma muy respetable
de la estadística llamada seguros.

El juego, en forma de juegos al azar, origino la teoría


de las probabilidades, desarrolladas por Pascal y
Fermat, a mediados del siglo XVII, debido a su interés
en las experiencias de juego del Caballero de Meré.
Para el estadístico y el científico experimental, tal
teoría tiene mucho uso práctico en la informática.
La curva normal o la curva normal de errores ha sido
muy importante en el desarrollo de la estadística.

La ecuación de esta curva fue originalmente publicada


en 1733 por de Moívre, quien no supo cómo aplicar sus
resultados a observaciones experimentales y su escrito
permaneció desconocido hasta que Karl Pearson lo
encontró en una biblioteca en 1924.

Sin embargo, al mismo resultado llegaron luego dos


astrónomos matemáticos, Laplace, 1749-1827,y Gauss,
1777-1855, independientemente el uno del otro.
Un razonamiento esencialmente estadístico fue aplicado en
el siglo XIX por Charles Lyell a un problema geológico.

En el período comprendido entre 1830 y 1833 aparecieron


tres volúmenes de Principies of Geology de Lyell, quien
estableció el orden de las rocas terciarias asignándoles los
nombres.

Con M. Deshayes, un conquiliólogo francés, identificó y


enumero las especies fósiles que se presentaban en uno o
más estratos, y también lograron dar las proporciones de
las que aún vivían en ciertas partes de los mares.

Basados en estas proporciones asignaron los nombres de:


Pleistoceno (novísimo), Plioceno (más reciente), Mioceno
(menos reciente) y Eoceno (reciente).
El razonamiento de Lyell fue esencialmente estadístico.

Una vez establecidos y aceptados los nombres, el


método fue casi inmediatamente olvidado. No había
geólogos evolucionistas que se preguntaran si se
trataba de etapas discretas, como lo implican los
nombres, o bien si era un proceso continuo y se podía
utilizar para hacer predicciones.
Otros descubrimientos científicos del siglo XX también
se hicieron sobre una base estadística sin que se
advirtiera apenas la naturaleza estadística de la
técnica, y desafortunadamente el método cayó
pronto en el olvido.

Esta afirmación es válida para las ciencias biológicas y


las físicas.
Charles Darwin,
( 12 de febrero de 1809 – 19 de abril de 1882 )
Naturalista inglés a traves del proceso de selección natural el cual postula que
todas las especies de seres vivos han evolucionado con el tiempo, en 1930 la
teoría de la evolución mediante la selección natural no fue considerada.

Biólogo, recibió en el Beagle el segundo volumen del libro de Lyell.

Posteriormente Darwin formuló sus teorías y bien pudo haber


influido en él la lectura de ese libro. La obra de Darwin fue, en
gran parte, la naturaleza biométrica o estadística, y ciertamente
renovó el entusiasmo por la Biología.

Mendel, con sus estudios sobre híbridos vegetales publicados en


1866, también tuvo un problema biométrico o estadístico.
En el siglo XIX, la necesidad de una base más sólida
para la estadística se hizo manifiesta.

Karl Pearson, 1857-1936, inicialmente físico


matemático aplicó sus matemáticas a la evolución,
como resultado del entusiasmo que generó Darwin
en la Biología.

Pearson dedicó casi medio siglo a la investigación


estadística rigurosa.

Además, fundó la revista Biometrika y una escuela de


estadística; con ello tomó impulso el estudio de la
estadística.
Si bien Pearson se ocupaba de muestras grandes, la
teoría correspondiente resultaba inadecuada para los
experimentadores que trabajan con muestras
necesariamente pequeñas.

Entre estos estaba W. 5. Gosset, 1876-1937, quien


estudiaba con Karl Pearson y era técnico de la firma
de cerveceros Guinness
Parece que la matemática de Gosset era
insuficiente para encontrar distribuciones
exactas de la desviación estándar de la
muestra, la relación entre la media de la
muestra y la desviación estándar de la
muestra, del coeficiente de correlación,
estadígrafo al que dedicó especial interés.
Por lo tanto, recurrió a sacar cartas calculando
y compilando distribuciones de frecuencia
empírica.

Sus escritos sobre los resultados aparecieron


en Biometrika en 1908 bajo el nombre de
Student, seudónimo de Gosset mientras
trabajaba con Guinness.
Hoy la t de Student es instrumento funda-
mental para estadísticos y experimentadores,
y “estudentizar” es expresión corriente en
estadística.

Ahora que el uso de la distribución t de Student


está tan generalizado, es interesante anotar
que el astrónomo alemán, Helmert, ya la
había obtenido matemáticamente en 1875.
R. A. Fisher, 1890-1962, recibió influencias de Karl
Pearson y de Student, e hizo numerosas e importantes
contribuciones a la estadística.

Fischer y sus estudiantes dieron considerable impulso al


uso de los procedimientos estadísticos en muchos
campos, particularmente en agricultura, biología y
genética.
J. Neyman, 1894, y E. 5. Pearson, 1895,
presentaron una teoría sobre la verificación o
prueba de hipótesis estadísticas en 1936 y
1938.

La teoría fomentó en forma considerable la


investigación y muchos de los resultados son
de uso práctico.
En esta breve historia, mencionaremos sólo
otro estadístico.

Abraham Wald, 1902-1950. Sus dos libros,


Sequential Analysis y Statistical Decision
Functions, se ocupan de grandes conquistas.
• En la estadística moderna proporciona el conocimiento
a los investigadores. La estadística comenzó en 1925
cuando apareció el libro de Fisher STATISTICAL
METHODS OF RESEARCH WORKERS (MÉTODOS
ESTADÍSTICOS DE OBREROS de la INVESTIGACIÓN ).

• La estadística es un tema de rápido crecimiento con


mucho material, que aún no se encuentra en textos ,
crece a medida que los estadísticos encuentran
respuestas a más y más problemas.

La estadística moderna proporciona conocimientos a
los investigadores. Es un tema nuevo y estimulante,
producto del siglo XX.

Para el científico, particularmente para el científico


en Biología, la estadística comenzó
aproximadamente en 1925 cuando apareció el libro
de Fisher, Statistical Methods for Research Workers.
La estadística es un tema de rápido crecimiento con
mucho material original que todavía no se encuentra
en textos; crece a medida que los estadísticos
encuentran respuestas a más y más problemas
propuestos por los investigadores.

Algunos de los primeros investigadores que


contribuyeron al desarrollo inicial de la estadística
todavía laboran activamente, y los nuevos encuentran
diversas oportunidades para sus talentos
investigativos.
En la aplicación de la estadística, los principios
son generales aun cuando las técnicas puedan
diferir, y la necesidad de formación estadística
crece a medida que se incrementa la aplicación
a las ciencias biológicas y sociales, la ingeniería
y la industria.

Este tema nuevo y vigoroso afecta a todos los


aspectos de la vida moderna.
Por ejemplo, el planeamiento estadístico y la evaluación de
la investigación contribuyen a los avances tecnológicos en
el cultivo y procesamiento de alimentos; el control
estadístico de calidad de los productos manufacturados
hace confiables los equipos automotores y eléctricos.

La estadística ayuda a los encuestadores a recolectar datos


para determinar las preferencias de esparcimiento del
público; proporciona información para los estudios de
impacto ambiental y ayuda en la evaluación de las
exigencias gubernamentales para que la industria
farmacéutica demuestre que un producto es benéfico y no
sólo inofensivo. Cada vez son más los grupos de
investigación en los cuales se encuentra un estadístico.
La extensión de la estadística hace difícil su definición.
Su desarrollo obedeció a la necesidad de tratar
problemas en los cuales, para observaciones
individuales, las leyes de causa y efecto no aparecen
claramente al observador y donde es necesario un
enfoque objetivo.

En tales problemas siempre existe un cierto grado de


incertidumbre en toda inferencia basada en un número
limitado de observaciones.

Por lo tanto, para nuestro propósito, una definición


razonable y satisfactoria sería: La estadística es la
ciencia, pura y aplicada, que crea, desarrolla y aplica
técnicas de modo que pueda evaluarse la incerti-
dumbre de inferencias inductivas.
Para la mayoría de los científicos, la estadística es lógica o
sentido común con un fuerte ingrediente de procedimientos
aritméticos.

La lógica proporciona el método mediante el cual se deben


recolectar los datos y determinar cuánto deben abarcar; la
aritmética, junto con ciertas tablas numéricas, produce el
material sobre el cual se basa la inferencia y se mide la
incertidumbre.

La parte aritmética es a menudo rutinaria, y el estudiante


necesita de formación matemática especial. No vamos a
ocupamos directamente con las matemáticas, ya que es
difícil encontrar un campo de esta materia que no haya
dado al estadístico alguna teoría útil.
Tres Núcleos o corrientes diferentes:

-La escuela administrativa

La escuela probabilística

La escuela demográfica

• A finales del siglo XX, escuela inglesa


Alexander Mood define la estadística como:

“La tecnología del método científico ya que le


proporciona instrumentos para la toma de
decisiones cuando prevalecen las condiciones
de incertidumbre ”

Así mismo Harald Crámer, Dugué de


Bernonville.
La Estadística es una ciencia que estudia cómo
obtener conclusiones de la investigación empírica y de
la información real mediante el uso de modelos
matemáticos.

Actualmente se le considera como el resultado de la


unión de dos disciplinas que han evolucionado
independientemente: el Cálculo de probabilidades y
la Estadística Descriptiva.

Es decir, constituye un puente entre los modelos


matemáticos y los fenómenos reales.
La Estadística permite evaluar y juzgar las
discrepancias y la incertidumbre que genera la teoría
expuesta a través del modelo cuando se aplica a la
realidad.

Se observa, en general, que cada aspecto de la


actividad humana es medido e interpretado en
términos estadísticos y que las grandes decisiones de
la humanidad se basan en hechos históricos
interpretados a través de la Estadística.
Las razones anteriores inducen la importancia del
estudio básico de la Estadística por parte de
quienes trabajan las ciencias aplicadas y que
requieren el análisis de información a partir de la
observación de los fenómenos y el diseño de
experimentos que motiven la toma de decisiones.

El objetivo de esta guía de trabajo es proporcionar


al Lector algunas herramientas básicas en el
campo específico de la estadística.
Se destaca la importancia de establecer una
base estadística adecuada para reconocer,
interpretar y analizar los problemas aplicados
a la Ingeniería y la administración de
empresas, con el propósito de brindar al
futuro profesional en estas áreas la
orientación suficiente para proponer y
establecer aplicaciones en su campo
profesional generando motivación y
creatividad en su desempeño profesional.
Formas del saber

Saber cotidiano
Saber Científico

(Racional, Cierto o probable ( Probabilidad


inductiva, metódica, Confrontación de la
realidad y sistematización orgánica, Objetos
de la misma naturaleza, Transmisibles)
METODO

Características del método científico:


a. Factico
b. Transciende de los hechos
c. Reglas metodológicas
d. Verificación empírica
e. Auto correctivo y progresivo
Etapas de la investigación y el procedimiento del Método
Científico:

Formulación correcta del problema a investigar

Definición concreta de los objetivos que se persiguen.

Elección de los procedimientos metodológicos para


realizar la investigación
Obtención de la información necesaria para el estudio

Tratamiento de la información

Análisis e interpretación de la información

Conclusiones del proceso investigativo


Características del método estadístico :

Lógico
Para alcanzar los objetivos es inductivo y para
el desarrollo propio es deductivo.

El método estadístico es numérico


Referido a fenómenos colectivos

El método estadístico es objetivo


Clasificación de los métodos estadísticos:

Métodos descriptivos

Métodos inductivos o inferencia estadística

Métodos teóricos o teoría estadística


Sistema conceptual básico

El colectivo, agregado, población, Universo.

Se puede entender como colectivo agregado, no


solo los colectivos humanos, si no cualquier
conjunto de hechos numerosos de la misma
naturaleza, cualquiera que ella sea.

Presentando ciertas características o modalidades


distintas cuyo comportamiento generalizado y/o
posible relación son objeto de estudio.
Población:

Conjunto de medidas obtenidas al observar


alguna característica de interés en los
elementos del colectivo , indicando que con
un mismo colectivo, pueden en general estar
asociadas varias poblaciones.
Clasificación de las variables.

Variables

Cualitativas
(Variable no numérica) Cuantitativa
(Numérica)

Discreta Continua
(conteo) (medición)

categorías
(Modalidades) Dominio
(Rango)
Una variable es cuantitativa cuando es susceptible de ser
expresada en términos numéricos.

Es discreta cuando toma únicamente valores enteros;


esta variable surge del conteo.

Ejemplos:

- Número de veces que usted frecuenta la biblioteca en


la semana
- Número de salones de la Universidad Nacional Sede
Bogotá.
- Número de automóviles que pasan por la entrada a la
Universidad Nacional de la calle 30, entre las
7:00 am - 7:20 am en un día especifico.
La variable cuantitativa es continua si toma valores
dentro de un intervalo y es el resultado de realizar
mediciones; por tanto puede asumir implícita o
explícitamente valores fraccionados.

Ejemplo:

La altura de los estudiantes del grupo de estadística G2


[ 1.72,…, 1.60 ]

Los datos de altura los podemos ordenar de menor a


mayor !

X máximo – X mínimo
Las variables se asumen como cualitativas o
atributos o categóricas o factores cuando no
son susceptibles de cuantificación, por tanto
describen cualidades.

Ejemplo:

Causas que provocan accidentes de tipo


laboral.
Escala nominal o clasificatoria

Esta medición supone la clasificación de objetos, personas o características. Las


observaciones solamente se pueden clasificar o contar. No existe algún orden
especifico entre as clases.

Permite por tanto distinguir entre sí los grupos a los cuales pertenecen y no hay un
orden natural.

Ejemplo:
De los datos de clase del semestre II- Grupo G2.
Asistieron 60 estudiantes, el primer día de clase.

Género Número de estudiantes


Masculino ( M ) 28
Femenino ( F ) 32
Total 60

No hay un orden natural, para masculino o femenino, entre categorías.


Las categorías pueden ser :
Mutuamente excluyentes: Propiedad de un conjunto de categorías, implica
que una persona, objeto o medición se ha de incluir en sólo una categoría

Exhaustivo : Propiedad de un conjunto de categorías que implica que cada


individuo, objeto o medición debe aparecer en solo una categoría.

Las categorías de la variable se excluyen mutuamente.

La codificación puede cambiarse arbitrariamente sin alterar la esencia del


dato representado. Es posible agregar nuevas categorías.

Los datos a nivel nominal tienen las siguientes propiedades:

Las categorías para los datos son mutuamente excluyentes y exhaustivas.

Las categorías para los datos no tienen un orden lógico.


Escala ordinal o escala de rango

En esta escala se posibilita la relación entre diferentes clases y por tanto entre sus
objetos.

Pueden compararse: altura, preferencia por un producto, dificultad para realizar


una tarea, perturbación producida por un factor de riesgo, madurez psicológica de
una persona.

Ejemplo:

Nivel de desempeño de un trabajador:

1-Ineficiente 2- Regular 3- Eficiente

Desempeño Frecuencia
Eficiente 23
Regular 15
Ineficiente 7
Total 45
Datos del nivel de intervalo.

Se presenta una escala de intervalo cuando se


tienen las características enunciadas en la escala
ordinal y además la distancia entre dos números
cualesquiera, es decir, la asignación de valores a
cada clase de elementos están precisa que se
conocen las distancias entre todos los elementos.

Es fundamental, en esta escala, que la


proporción de elementos de una clase es
independiente de la unidad de medida y del punto
cero de la medición ya que éstos se eligen
arbitrariamente.
Se trata de determinar el tiempo de permanencia
de los empleados de una fábrica. Puede darse
este tiempo arbitrariamente en semanas o en meses
así :

Tiempo (semanas) 40 60 96 144 160


Tiempo (meses) 10 15 24 36 40
La escala de intervalo es verdaderamente cuantitativa.

Las propiedades de la escala del intervalo son:

Las categorías para los datos son mutuamente


excluyentes y exhaustivas.

Las categorías en cuestión están ordenadas de acuerdo


con la cantidad de la característica que poseen.

Diferencias iguales en la característica se representan


por diferencias iguales en la medición.
Datos de nivel de razón

Son todos los datos cuantitativos son el nivel


de la razón de la medición.

El nivel de la razón es el nivel de la medición


“mas alto”. Esta medida tiene todas las
características de nivel de intervalo, pero
además el punto 0 si tiene significado, y la
razón (o cociente) entre dos números también
es significativa
Ejemplos de escala de razón , son los salarios,
las unidades de producción, el peso, los
cambios en los precios de los medicamentos
para la depresión.

El peso de una persona, si la bascula está en


cero, hay una total ausencia de peso.
Las propiedades del nivel de la razón:
Las categorías de los datos son mutuamente
excluyentes y exhaustivas.
Dichas categorías tienen un intervalo u orden de
acuerdo con la cantidad de la característica que
poseen.
Diferencias iguales en la característica están
representadas por diferencias iguales en los
números que han asignado a las categorías
mencionadas.
El punto (o valor) 0 representa la ausencia de la
característica.
Estadístico, Es el resultado de hacer operaciones u
observaciones sobre todos o parte de los datos de
una muestra, con el objetivo de obtener una
medida descriptiva de ella.

Entre tanto, cuando un investigador obtiene un


indicador o medida descriptiva de una población
con base en todos los datos de la misma, su
resultado se llama parámetro.
Parámetro :
Es el resultado de hacer operaciones u
observaciones sobre todos los datos de una
población, con el objetivo de obtener una medida
descriptiva de ella.

El estadístico es a la muestra lo que el parámetro es


a la población.

Los parámetros son estimados o aproximados a


partir de los estadísticos, por limitaciones de
tiempo y costo para realizar censos y o inspecciones
al 100%.
Cuando tomamos muestras al azar de una
población y estimamos sus parámetros, es
importante definir el concepto de error muestral,
el cual se define como la diferencia entre el
estadístico de la muestra y el parámetro
desconocido.

Otro concepto importante es el sesgo muestral, el


cual se define como la tendencia a favorecer la
elección de determinados elementos que tienen
una característica.
Metodología de la estadística

Objetivos:

Colectivo o Población

Determinación de la cobertura
( Censo o parcial muestreo )
Determinación del marco de muestreo

Marco de muestreo o marco muestral:

Todos los artificios o conjunto de artificios que


permita la ubicación de todos y cada uno de
los elementos de la población, de todas y
cada una de las unidades muestrales, ya que
es la base del proceso de selección de la
muestra.
Problemas del marco muestral :

Unidades vacías (Datos faltantes )

Conglomerados de unidades muestrales

Unidades duplicadas
Definición de unidades

Unidad Poblacional

Unidad Muestral

Unidades de observación
Muestreo No probabilístico

Diseño se realiza en forma subjetiva, arbitraria a


criterio del investigador.

No existe una oportunidad de que un elemento


en particular de la población, sea
seleccionado.

No es posible calcular el error de muestreo, ni la


confiabilidad en las inferencias.
Muestreo Probabilístico

El muestreo se realiza mediante reglas


estadísticas que no permiten ningún
elemento de juicio al investigador,
generando muestras mas objetivas.
El nivel del intervalo de medición es el
siguiente nivel en orden ascendente.

Incluye todas las características del nivel


ordinal pero además , la diferencia entre los
valores tiene un tamaño constante.
Pasos del Método Estadístico
_________________________________________________________________________

Planteamiento del problema: Definición de la población

Tipificación de variables - medición

Propuesta de objetivos generales y específicos

Elección de proceso metodológico: Población y Muestra


Tipo de estudio
Pasos del proceso

Planteamiento de hipótesis

Recolección de la información: Muestreo


Diseño de Experimentos
Cuestionario
Planilla de campo

Depuración de la información : Revisión de cuestionarios


Identificación de valores atípicos

Procesamiento y análisis

Conclusiones y recomendaciones

También podría gustarte