Informe I Estadistica (Jhonathan Rodriguez)

República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación

Universidad Nacional Experimental de Guayana
Upata Edo. Bolívar, Municipio Piar
Contaduría Pública, Sede Menca de Leoni
Asignatura: Estadística
LA ESTADISTICA
Facilitadora:
Emma Hernández Autor:
Jhonathan Rodriguez C.I 27.957.085
Upata, diciembre 2020

La Estadística
La estadística es una disciplina científica que se ocupa de la obtención, orden y

análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones
sobre fenómenos observados. La estadística consiste en métodos, procedimientos y
fórmulas que permiten recolectar información para luego analizarla y extraer de ella
conclusiones relevantes; se puede decir que es la Ciencia de los Datos y que su
principal objetivo es mejorar la comprensión de los hechos a partir de la información
disponible.
Cabe destacar que, la estadística NO es una rama de las matemáticas, Utiliza

herramientas de las matemáticas del mismo modo que lo hace la física, la ingeniería o
la economía, pero eso no las hace ser parte de las matemáticas. Es cierto que tienen
una relación estrecha, pero la estadística y las matemáticas son disciplinas diferentes.
Una de sus características fundamentales es su transversalidad; Su metodología es
aplicable al estudio de diversas disciplinas tales como: biología, física, economía,
sociología, etc.
Ramas de la Estadística
La estadística se puede subdividir en dos grandes ramas: descriptiva e inferencial.
 Estadística descriptiva: Se refiere a los métodos de recolección, organización,

resumen y presentación de un conjunto de datos. Se trata principalmente de
describir las características fundamentales de los datos y para ellos se suelen
utilizar indicadores, gráficos y tablas.
 Estadística inferencial: Se trata de un paso más allá de la mera descripción. Se
refiere a los métodos utilizados para poder hacer predicciones, generalizaciones
y obtener conclusiones a partir de los datos analizados teniendo en cuenta el
grado de incertidumbre existente.
La estadística inferencial se subdivide a su vez en dos grandes tipos: estadística

paramétrica y no paramétrica.
 Estadística paramétrica: Se caracteriza porque asume que los datos tienen una
determinada distribución o se especifican determinados parámetros que
deberían cumplirse. Así, por ejemplo, en un análisis paramétrico podemos
trabajar bajo el supuesto de que la población se distribuye como una Normal
(hay que justificar nuestro supuesto) y luego sacar conclusiones bajo el supuesto
que esta condición se cumple.
 Estadística no paramétrica: En ella no es posible asumir ningún tipo de
distribución subyacente en los datos ni tampoco un parámetro específico. Un
ejemplo de este tipo de análisis es la prueba binomial.
Origen de la Estadística
El término alemán Statistik, introducido originalmente por Gottfried Achenwall en

1749, se refería al análisis de datos del Estado, es decir, la “ciencia del Estado” (o más
bien, de la ciudad-estado). También se llamó aritmética política de acuerdo con la
traducción literal del inglés, no fue hasta el siglo XIX cuando el
término estadística adquirió el significado de recolectar y clasificar datos; éste concepto
fue introducido por el agrónomo y estadista escocés sir John Sinclair (1754-1835).
En su origen, por tanto, la estadística estuvo asociada a los Estados o ciudades

libres, para ser utilizados por el gobierno y cuerpos administrativos, la colección de
datos acerca de estados y localidades continúa ampliamente a través de los servicios
de estadística nacionales e internacionales. En particular, los censos comenzaron a
suministrar información regular acerca de la población de cada país, Así pues, los datos
estadísticos se referían originalmente a los datos demográficos de una ciudad o Estado
determinados. Y es por ello que en la clasificación decimal de Melvil Dewey, empleada
en las bibliotecas, todas las obras sobre estadística se encuentran ubicadas al lado de
las obras de o sobre la demografía.
Ya se utilizaban representaciones gráficas y otras medidas en pieles, rocas, palos de

madera y paredes de cuevas para controlar el número de personas, animales o ciertas
mercancías. Hacia el año 3000 a. C. los babilonios usaban ya pequeños envases
moldeados de arcilla para recopilar datos sobre la producción agrícola y de los géneros
vendidos o cambiados; los egipcios analizaban los datos de la población y la renta del
país mucho antes de construir las pirámides en el siglo XI a. C; los libros bíblicos
de Números y Crónicas incluyen en algunas partes trabajos de estadística, el primero
contiene dos censos de la población de la Tierra de Israel y el segundo describe el
bienestar material de las diversas tribus judías; en China existían registros numéricos
similares con anterioridad al año 2000 a. C; Los antiguos griegos realizaban censos
cuya información se utilizaba hacia el 594 a. C. para cobrar impuestos.
¿Qué es Significancia?
La significancia estadística es la probabilidad de que una relación entre dos o más

variables en un análisis no sea pura coincidencia, sino que en realidad sea causada por
otro factor, en otras palabras, la significancia estadística es una forma de demostrar
matemáticamente que puedes confiar en una estadística determinada.
En el mundo real, las empresas utilizan la significancia estadística para comprender

en qué grado deben influir los resultados de sus encuestas, experimentos, votaciones, o
datos del usuario en la toma de decisiones; la significancia estadística es importante
porque le da credibilidad a tu análisis y consecuentemente, a los insights que obtendrás
como resultado. No tiene ningún valor comercial tomar decisiones en base a
información engañosa o incorrecta, es más, la decisión tomada en base a información
engañosa también evitará que puedas invertir tus recursos correctamente.
El nivel de significación es comúnmente representado por el símbolo griego α (alfa),

son comunes los niveles de significación del 0.05, 0.01 y 0.001. Si un contraste de
hipótesis proporciona un valor p inferior a α, la hipótesis nula es rechazada, siendo tal
resultado denominado estadísticamente significativo; cuanto menor sea el nivel de
significación, más fuerte será la evidencia de que un hecho no se debe a una mera
coincidencia (al azar).
La Estadística aplicada a las Ciencias Sociales
Sabemos que las Ciencias Sociales son una rama de la ciencia que se encarga de
estudiar, comprender y explicar el comportamiento humano dentro de una sociedad,
cabe destacar que la Estadística se relaciona también con ésta ciencia. La estadística
como método de análisis en las Ciencias Sociales juega un papel muy importante, pues
nos permite a través de sus estudios ubicar, clasificar, interpretar, escoger, distinguir,
etc., una cantidad de elementos para la observación y análisis de los hechos; el objetivo
de la Estadística aquí es mejorar el nivel de vida de la sociedad.
La Estadística dentro del campo de las Ciencias Sociales se ocupa de las siguientes
cuestiones:
 ¿Qué datos se necesita recoger?

 ¿Cómo se pueden usar los recursos disponibles más eficientemente para
recolectar los datos?
 ¿Cómo especificar un modelo matemático que describa el proceso que ha
generado los datos?
 Depuración y transformación de los datos
 ¿Cómo presentar los datos de manera que transmitan sus rasgos más
esenciales de una manera clara?
 ¿Qué conclusiones se pueden extraer de los datos y cuál es el grado de
incertidumbre de estas conclusiones?
 ¿Qué acciones se deben tomar en base a las conclusiones extraídas delos
datos?
En las Ciencias Sociales la Estadística se estudia en tres secciones: la Estadística

Descriptiva, la Estadística Inferencial y el Diseño Experimental. La Estadística
Descriptiva sirve de herramienta para describir, resumir o reducir las propiedades de un
conglomerado de datos al objeto de que se pueda manejar; La Estadística Inferencial
se utiliza para estimar las propiedades de una población a partir del conocimiento de las
propiedades de una muestra de ella; Y, en tercer lugar, el diseño y análisis de
experimentos se desarrolla para determinar y confirmar relaciones causales entre
variables.
La Estadística aplicada en la Economía
La Estadística es ampliamente utilizada en el análisis económico, nos ayuda a

comprobar la aplicación de la teoría económica en la práctica; algunos ejemplos del uso
de Estadística en Economía son:
 Elaboración de indicadores macroeconómicos agregados.
 Predicciones acerca del comportamiento futuro de la demanda.
 Testear la validez de hipótesis basadas en la teoría económica.
 Calcular la tasa de paro.
 Organizar y presentar datos económicos como: evolución de los precios, PIB,
etc.
La Estadística Económica tiene sus antecedentes en el siglo XVII y su máximo

exponente fue William Petty quien es considerado por Carlos Marx como el creador de
esta ciencia sin olvidar a Gregory King que también realizo cálculos aproximados de los
índices económicos sociales de esta ciencia.
La Economía necesita de la Estadística, con la ayuda de ésta se confeccionan los

planes de desarrollo de la Economía Nacional, se supervisa el control de su
cumplimiento y se determinan las necesidades de recursos por territorios, así como las
reservas con que cuenta la economía a cualquier nivel. Además, la estadística
constituye un instrumento de suma importancia para que se conozca el comportamiento
de la economía a diferentes niveles ya sea en una empresa, municipio, provincia,
nación, así como a escala internacional.
Etapas de un estudio estadístico
El proceso estadístico es el conjunto de etapas o fases que deben completarse para

realizar una investigación basada en información cuantitativa y obtener unos resultados
fieles a la realidad estudiada; cuando hablamos de proceso estadístico, estamos
hablando de una serie de pasos que es recomendable realizar para obtener unos
resultados fieles a la realidad que estudiamos en el estudio estadístico que se pretenda
realizar. Esto es necesario, ya que si no realizamos estos pasos podemos obtener
conclusiones erróneas y, por ende, tomar malas decisiones.
Por ejemplo, imaginemos que tenemos una heladería. Necesitamos saber, en forma
aproximada, qué cantidad de helado debemos comprar en función de la cantidad de
demanda que tendremos. Así pues, si nos quedamos cortos podrían llegar clientes a los
que tendríamos que decirles que en esta heladería no queda helado; al contrario, si
tenemos demasiada cantidad, podría echarse a perder, por tanto, se hace necesario
intentar estimar qué cantidad debemos comprar, o al menos un rango aproximado. Si
para calcular ese rango, recolectamos datos que no son representativos (por ejemplo,
una heladería situada en otra ciudad con menos afluencia) podríamos equivocarnos; así
pues, teniendo esto claro, debemos conocer la serie de pasos y detalles que debemos
seguir para que los resultados se adecuen a la realidad y tomemos mejores decisiones.
Dependiendo del sitio visitado o del autor, podríamos ver diferentes etapas con
diferentes nombres, en esencia, casi todos los documentos sobre el tema recogen los
mismos apartados, solo que unos engloban varias fases en una y otros fragmentan más
el proceso.
En nuestro caso, consideramos que el proceso estadístico está formado por:
Planteamiento del problema
En el planteamiento del problema se sitúa el eje central sobre el que articular todo lo
demás, ésta fase responde a la siguiente pregunta: ¿Qué necesito estudiar y por qué?
En ocasiones, por increíble que parezca plantear el problema puede hacernos llegar a
la conclusión de que en realidad no necesitamos realizar un estudio estadístico.
Recogida de datos
Una vez hemos planteado el problema debemos recoger los datos, aquí es
importante la metodología, de tal modo que existen diferentes consideraciones; así
pues, debemos establecer el tipo de muestreo, el tamaño de la muestra, el tipo de
recolección de datos (por ejemplo, a través de bases de datos o de encuestas
personalizadas), en persona, por internet o por teléfono, etc.
Organización de los datos
Una vez tenemos todos los datos, queda unificarlos y organizarlos; como en todo,
necesitamos introducir los datos en programa o plataforma que luego nos permita
calcular determinadas métricas y analizar correctamente. Para ello, siempre es
conveniente organizar los datos, es más, a veces necesitaremos recoger datos de
diferentes bases de datos que ofrecen formatos de archivos diferentes y será necesario
unificarlo todo en el mismo formato.
Análisis de los datos
Una vez planteado el problema, recolectados los datos y organizados podemos

analizarlos de forma eficaz, dependiendo del planteamiento del problema, se realizará
un tipo de análisis u otro. Por ejemplo, si queremos saber si dos variables son
dependientes, podríamos utilizar un análisis de cointegración; Mientras que si lo que
queremos estudiar es la dispersión total de un activo financiero, calcularemos el rango
estadístico.
Interpretación de los datos
Por último, pero no por ello menos importante, tenemos la interpretación de los
datos; De nada sirve realizar todas las fases del proceso estadístico correctamente si al
final la interpretación es errónea. esto es debido a que, si la interpretación es errónea,
entonces las decisiones tendrán un efecto no deseado. Por ejemplo, imaginemos que
realizamos un estudio sobre la variabilidad de las ventas de una empresa; si una vez
obtenemos los resultados resulta que hay mucha dispersión, conviene reducirla y
nosotros interpretamos que no, esto podría afectar negativamente a la empresa.
Conceptos básicos
Datos estadísticos: Son los valores que se obtienen al llevar a cabo un estudio de tipo

estadístico; se trata del producto de la observación de aquel fenómeno que se pretende
analizar.
Universo: Es el conjunto de elementos (finito o infinito) definido por una o más

características, de las que gozan todos los elementos que lo componen.
Población: Es el conjunto sobre el que estamos interesados en obtener conclusiones

(hacer inferencia); normalmente es demasiado grande para poder abarcarlo.
Tipos de población:
Población finita: Aquella población que está compuesta por un número pequeño de
elementos, artículos o sujetos; Por ejemplo: número de motocicletas vendidas durante
el mes de septiembre o número de alumnos en determinada escuela.
Población infinita: Aquella población que está compuesta por un número grande de
elementos; Por ejemplo: la cantidad de litros de agua en el mar o la cantidad de granos
de arena de una playa.
Población real: Aquella población que se compone de un grupo de cosas existentes y

meramente comprobables; Por ejemplo: la cantidad de usuarios que visitan un sitio web
durante un mes o la cantidad de temporadas de una serie.
Población hipotética: Aquella población conformada por un grupo posible de

determinadas cosas, pero difícil de comprobar; Por ejemplo: cuántas personas se
supone que sobreviven a un determinado terremoto o cómo reaccionaría cierta
población frente a una crisis económica.
Población aleatoria: Aquella población que depende de las alteraciones de sus

cualidades, sin que exista una causa aparente; Por ejemplo: el peso de determinado
alimento que varía según su tamaño.
Población dependiente: Aquella población que depende de una causa determinada;

Por ejemplo: el incremento de ventas de un producto durante un buen período
económico del país.
Población polinomial: Aquella población cuyas características deben ser medidas y

tomadas en cuenta; Por ejemplo: cuando se realiza un censo poblacional, las
características y cualidades (edad, ingresos) de los habitantes serán diferentes.
Muestra: Es un subconjunto de la población al que tenemos acceso y sobre el que

realmente hacemos las observaciones (mediciones); está formado por miembros
“seleccionados” de la población.
Muestreo: Es la técnica empleada para la selección de elementos representativos de la
población de estudio que conformarán una muestra y que será utilizada para hacer
inferencias (generalización) a la población de estudio.
Tipos de Muestreo:
 Muestreo probabilístico: Cada unidad de análisis tiene una probabilidad de ser

elegida, lo cual determina la situación de poder generalizar los hallazgos del
estudio a toda la población objetivo. Sólo estos métodos de muestreo
probabilístico nos aseguran la representatividad de la muestra extraída y son, por
tanto, los más recomendables.
Entre estos tenemos:
 Muestreo aleatorio simple (MAS)
 Muestreo aleatorio estratificado (MAE)
 Muestreo aleatorio sistemático
 Muestreo aleatorio por conglomerados
 Muestreo aleatorio poli-etápico
1. Muestreo aleatorio simple (MAS): Primero se prepara un marco muestral, que
es una lista de todas las unidades, después se decide el tamaño de la muestra, y
se selecciona del marco, utilizando procedimientos aleatorios (números, tablas,
software, etc). Este procedimiento consiste en seleccionar n elementos de una
población de tamaño N, de modo que todas las muestras posibles de tamaño n,
tengan la misma probabilidad de ser seleccionada.
2. Muestreo aleatorio estratificado: Se basa en dividir el conjunto N de elementos
en L subconjuntos o estratos, mediante variables de control llamadas variables
claves de estratificación, las cuales deben estar correlacionadas con las
variables en estudio. Estas variables agrupan los elementos de la población en L
partes, tratando que sean cada uno de sus elementos lo más homogéneos
posibles y las L partes heterogéneas entre ellas.
3. Muestreo sistemático: Consiste en aplicar un método sistemático de selección
de los elementos que conformaran la muestra. Es decir, consiste en numerar los
elementos de la población del 1 a N, en cualquier orden, luego dividirla en n
partes de tamaño K=N/n (intervalo de selección sistemática) y elegir un numero
al azar entre 1 y K que se designa por i (origen aleatorio) y de allí en adelante
tomar los elementos que ocupen la misma posición en los K sucesivas partes
restantes, en total n-1.
4. Muestreo por conglomerados: Los conglomerados son grupos o agrupaciones
de elementos que existen naturalmente y no los define el investigador, se
selecciona una muestra aleatoria no de sujetos, sino de grupos de individuos,
como familias, casas, pueblos, escuelas, municipios, etc. Lo anterior implica que
debemos contar con un listado de los conglomerados, y no de los sujetos de
estudio; el muestreo por conglomerados es adecuado cuando las unidades de
estudio están geográficamente dispersas.
5. Muestreo poli-etápico: Muestreo en el que se procede en etapas. El muestreo
poli-etápico o multi-etápico consiste en seleccionar las unidades de investigación
en varias fases o etapas. Por ejemplo, en un muestreo de dos etapas (bi-
etápico), se divide a la población en unidades muestrales primarias (cursos
escolares, pacientes que acuden a consulta determinados días determinados al
azar), y se selecciona a continuación una muestra de dichas unidades primarias
mediante muestreo aleatorio simple, estratificado o sistemático. Por ejemplo, las
UPM son cursos y las USM son alumnos.
 Muestreo no probabilístico : El muestreo no probabilístico es una técnica de
muestreo donde las muestras se recogen en un proceso que no brinda a todos
los individuos de la población iguales oportunidades de ser seleccionados.
Los muestreos que componen este grupo son:
 Muestreo por cuotas
 Muestreo intencional
 Muestreo causal o incidental
 Muestreo bola de nieve
1. Muestreo por cuotas: En este tipo de muestreo se fijan unas "cuotas" que
consisten en un número de individuos que reúnen unas determinadas
condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y
residentes en Tegucigalpa. Una vez determinada la cuota se eligen los primeros
que se encuentren que cumplan esas características.
2. Muestreo intencional: Muestreo en el que la persona que selecciona la muestra
procura que esta sea representativa; los elementos de la muestra son elegidos a
criterio del investigador sobre lo que él cree que pueden aportar a su estudio.
3. Muestreo causal o incidental: El investigador selecciona directa e
intencionadamente los individuos de la población porque éste cree que son
convenientes para su estudio, o porque se tiene fácil acceso a la muestra;
algunos ejemplos son las muestras obtenidas de instituciones de salud, de
consulta externa, de los pacientes de un médico o de voluntarios disponibles.
4. Muestreo bola de nieve: Se localizan a algunos individuos (los que cumplan
con los criterios de admisión), los cuales conducen a otros, y estos a otros, y así
hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente
cuando se hacen estudios con poblaciones "marginales", delincuentes,
drogadictos, sectas, determinados tipos de enfermos o enfermedades raras, etc
Parámetros estadísticos
Son datos que resumen el estudio realizado en la población. Pueden ser de dos
tipos:
 Parámetros de centralización
 Parámetros de dispersión
1. Parámetros de centralización: Son datos que representan de forma global a
toda la población. Por ejemplo, si hacemos un examen en la clase y queremos
tener una idea global del resultado de dicho examen, ¿cómo lo podríamos
hacer? Parece lógico que sumando todas las notas y dividiendo el resultado por
el número de alumnos, es decir, lo que todos conocemos como calculando la
media.
Media aritmética: Se define la media aritmética como la suma de todos los datos
dividida por el número de datos. Se representa por
Para calcular la media aritmética hacemos:

Sin embargo, podemos observar que aparecen datos repetidos y que en un estudio
estadístico tenemos los datos agrupados en una tabla en la que aparecen las
frecuencias. Por tanto, podemos simplificar el cálculo de la media aritmética con la
fórmula:
Si la variable es continua, el cálculo se hace de la misma forma, pero utilizando las

marcas de clase.
Moda: Se define la moda como el valor de la variable que más se repite, es el decir,
aquél que tiene mayor frecuencia absoluta. Se representa por Mo.
Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas.
Si la variable es discreta, el cálculo de la moda no presenta ninguna dificultad,

únicamente observamos las frecuencias, vemos cuál es la mayor y la moda será el
valor de la variable correspondiente a dicha frecuencia.
En la siguiente escena podemos calcular la moda de una variable discreta.
Sin embargo, si la variable es continua la mayor frecuencia absoluta corresponde a

un intervalo, del que decimos que es el intervalo modal. Pero si queremos calcular un
único valor de la variable para la moda, aplicamos la siguiente fórmula:
en la que Li representa el límite inferior del intervalo modal, c es la amplitud del intervalo
y fMo, fMo-1 y fMo+1 son las frecuencias del intervalo modal, el anterior y el posterior.
Mediana: Si ordenamos todos los valores de la variable de menor a mayor, se define la
mediana como el valor de la variable que está en el centro. Se representa por Me. Aquí
tenemos que comprender que, si hay un número impar de valores, habrá un sólo valor
central; mientras que si hay un número par de valores habrá dos valores centrales.
También vamos a distinguir para su cálculo entre variable discreta y variable

continua.
Si la variable es discreta y el número de datos es impar, la mediana será el dato que

ocupe el lugar central.
Si la variable es discreta y el número de datos es par, la mediana será la media

aritmética de los dos valores centrales.
Si la variable es continua, no distinguiremos si el número de datos es par o impar,

tendremos un intervalo para la mediana. Igual que se ha hecho con la moda podemos
suponer que los datos se distribuyen uniformemente en los intervalos y calcular la
mediana con la siguiente fórmula:
En la que N representa el número de datos y F se refiere a la frecuencia absoluta

acumulada.
Cuartiles, deciles y percentiles: Entre las medidas de centralización y de dispersión

podemos citar éstas que tienen el cálculo similar al de la mediana.
Cuartiles: Son valores que dividen a la población en cuatro partes iguales. Los vamos
a representar por C1, C2 y C3. Entre cada dos de ellos estará el 25 % de los datos.
Lógicamente el segundo cuartil coincidirá con la mediana.
Deciles: Son valores que dividen a la población en diez partes iguales. Los
representaremos por Dn. El quinto decil coincide también con la mediana.
Percentiles: Son valores que dividen a la población en cien partes iguales. Los
representamos por Pn. Evidentemente los percentiles 25, 50 y 75 coinciden con los
cuartiles. Y los percentiles 10, 20, ..., 90 coinciden con los deciles.
El cálculo de estos parámetros, tanto para variables discretas como para variables
continuas, se hace de forma similar al cálculo de la mediana.
Si la variable es discreta, para calcular un percentil, calcularemos el porcentaje de

datos que corresponde a dicho percentil, es decir para calcular el percentil de orden "p",
calcularemos p·N/100. Si este valor no coincide con ninguna de las frecuencias
absolutas acumuladas, cogemos el primer valor de la variable cuya frecuencia absoluta
acumulada supera este dato. Pero si este valor coincide con una frecuencia absoluta
acumulada, el percentil buscado será la media aritmética entre el valor de la variable
correspondiente y el siguiente.
Si la variable es continua aplicamos la siguiente fórmula muy similar a la utilizada

para el cálculo de la mediana:
Variable
Una variable es una característica observable que varía entre los diferentes
individuos de una población; la información que disponemos de cada individuo es
resumida en variables.
Tipos de variables:
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos
encontrarnos dos tipos de variables:
 Variable cuantitativa: Son variables que se expresan numéricamente.

o Variable continua: Toman un valor infinito de valores entre un intervalo de
datos. El tiempo que tarda un corredor en completar los 100 metros lisos.
o Variable discreta: Toman un valor finito de valores entre un intervalo de datos.
Número de helados vendidos.
 Variable cualitativa: Son variables que se expresan, por norma general, en
palabras.
o Variable ordinal: Expresa diferentes niveles y orden. Por ejemplo, primero,
segundo, tercero, etc.
o Variable nominal: Expresa un nombre claramente diferenciado. Por ejemplo,
el color de ojos puede ser azul, negro, castaño, verde, etc.
Además, cada una de estas variables podría tener más subtipos, ya que tenemos
variables de tipo económico, categóricas, dicotómicas, dependientes, independientes.
Es decir, como ya hemos dicho, muchos tipos de variables estadísticas. Por ejemplo,
podríamos tener una variable estadística de tipo cuantitativo, discreta y dependiente.
Escala de medición
Para que los datos tengan sentido es necesario compararlos, y para poder
compararlos debemos utilizar escalas de medición; dichas escalas tendrán diferentes
propiedades en función de las características de los datos que se compararán. En
estadística existen cuatro escalas de medición: nominal, ordinal, de intervalo y de
razón.
 Escala nominal: Cuando un dato identifica una etiqueta (o el nombre de un

atributo) de un elemento, se considera que la escala de medición es una escala
nominal. En esta carecen de sentido el orden de las etiquetas, así como la
comparación y las operaciones aritméticas; La única finalidad de este tipo de
datos es clasificar a las observaciones. Un ejemplo: Una variable que indica si el
visitante de este post es “hombre” o “mujer”.
 Escala ordinal: Es cuando los datos muestran las propiedades de los datos
nominales, pero además tiene sentido el orden (o jerarquía) de estos. Ejemplo:
Una variable que mide la calidad de un post, la variable puede tomar valores
enteros del 1 al 5, donde el valor 1 es el peor y el 5 el mejor.
 Escala de intervalo: En una escala de intervalo, los datos tienen las
propiedades de los datos ordinales, pero a su vez la separación entre las
variables tiene sentido; este tipo de datos siempre es numérico, y el valor cero no
indica la ausencia de la propiedad. Ejemplo: La temperatura (en
grados centígrados) media de una ciudad.
 Escala de razón: En una escala de razón, los datos tienen todas las
propiedades de los datos de intervalo, y la proporción entre ellos tiene sentido;
para esto se requiere que el valor cero de la escala indique la ausencia de la
propiedad a medir, ejemplos de este tipo de variables son el peso de una
persona a el tiempo utilizado para una tarea. Ejemplo: Una variable que mide el
salario de una persona; En esta variable, si una persona gana 100, y otra 10, la
primera gana más que la segunda (comparación). También tiene sentido decir
que la primera gana 90 más que la segunda (diferencia), o que gana 10 veces
más (proporción).
Distribución de frecuencias
En estadística, se le llama distribución de frecuencias a la agrupación de datos en

categorías mutuamente excluyentes que indican el número de observaciones en cada
categoría, esto proporciona un valor añadido a la agrupación de datos.
Tipos de frecuencias:
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor

estadístico y técnico, se representa por fila; se suele representar con números.se
representa donde el subíndice representa cada uno de los valores.
Frecuencia relativa
La frecuencia relativa es igual al número de veces que se repite un evento o sea la
frecuencia multiplicado por el 100% y dividida entre el total de los datos
Ejemplo:
Frecuencia* % = % Total de frecuencia 15* 100% = 1,500 = 90%
Es el total de la frecuencia relativa del 100% o 99% dependiendo de los decimales

que uses, si no te da tu ejercicio tiene algún error.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los

valores inferiores o iguales al valor considerado.
La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de una

variable aleatoria (X) es menor que o igual a un valor de referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve(Xr), y

se calcula de:
Fc (Hr) = HXr / N
Donde MXr es el número de datos X con un valor menor que o igual a Xr, y N es
número total de los datos. En breve se escribe:
Fc = M / N
Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N,

porque M=1. Por otro lado, cuando Xr=Xmax, donde Xmax es el valor máximo
observado, se ve que Fc=1, porque M=N.
En porcentaje la ecuación es:
Fc(%) = 100 M / N
Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 44
Método de redondeo
Dentro de los procesos estadísticos hay ocasiones en la que los datos suministrados
para el análisis y sobre todo aquellos que son resultados de un proceso matemático, en
los que obtenemos datos con valoraciones decimales, lo más común es aplicar la
técnica del redondeo que consiste en aproximar lo más posible a un valor más cercano
o uno que sea más fácil para trabajar las operaciones matemáticas, por ejemplo, si el
valor obtenido o recolectado es 72.3, se tiene la tendencia de redondear la cantidad a
su valor más cercano, en este caso sería el 72 y se tiende a despreciar la tendencia
decimal, por lo contrario si el valor obtenido es 72.8 se redondea hacia el valor más
cercano que es el 73, en la práctica de estadística es preferible trabajar con los valores
suministrados u obtenidos en un cálculo de tal manera que se evite el error
del redondeo o redondeos acumulados.
Para tratar de minimizar el error de redondeo acumulado, se utiliza “la técnica del
redondeo al par anterior” al factor de aproximación que es el número cinco, para
demostrar cómo se aplica esta técnica, utilizaremos dos ejemplos:
 Redondear 114.565 a la centésima más cercana:
Aquí tendremos un dilema, puesto que esta cantidad estaría exactamente igual de
cerca y lejos de 114.56 y 111.57 respectivamente, si aplicamos esta técnica del par
antes que el cinco, el valor redondeado seria 114.56 porque el numero anterior al 5 es
par (6), la cifra de la centésima queda igual.
 Redondear 66.575 a la centésima más cercana:

Si redondeáramos cantidades en las que no contamos con números pares
anteriores a 5 se procede a redondear al número más cercano a 5, en este
ejemplo el 7 que antecede al 5 es impar, entonces se redondea a 8, así el
redondeo correcto sería 66.58
Bibliografía
Fuentes electrónicas:
 Autor: Domingo R. Ojeda L. Sitio web: servicio.bc.uc.edu.ve. URL:

http://servicio.bc.uc.edu.ve/educacion/revista/a3n6/3-6-15.pdf Consultado el: 10
de diciembre de 2020.
 Autores: Elier Mendez Delgado, María Elena Figueroa Gonzales y María del
Carmen Lloret Feijio. Sitio web: eumed.net. URL: https://www.eumed.net/libros-
gratis/2006b/emd2/1b.htm#:~:text=El%20conocimiento%20de%20la%20Estad
%C3%ADstica,condiciones%20imperantes%20en%20cada%20naci%C3%B3n.
Consultado el: 11 de diciembre de 2020.
 Autor: Blog Publico. Sitio web: es.wikipedia.org. URL:
https://es.wikipedia.org/wiki/Ciencias_sociales Consultado el: 11 de diciembre de
2020.
 Autor: José Francisco López. Sitio web: economipedia.com. URL:
https://economipedia.com/definiciones/proceso-estadistico.html Consultado el: 11
 Autor: Paula Nicole Roldán. Sitio web: economipedia.com. URL:
https://economipedia.com/definiciones/estadistica.html#:~:text=La%20estad
%C3%ADstica%20es%20ampliamente%20utilizada,Elaboraci%C3%B3n%20de
%20indicadores%20macroecon%C3%B3micos%20agregados. Consultado el: 11
 Autores: Julián Pérez Porto y María Merino. Sitio web: definicion.de. URL:
https://definicion.de/datos-estadisticos/ Consultado el: 11 de diciembre de 2020.
 Autor: Eleonora Espinoza. Sitio web: http://www.bvs.hn/. URL:
http://www.bvs.hn/Honduras/UICFCM/SaludMental/UNIVERSO.MUESTRA.Y.MU
ESTREO.pdf Consultado el: 11 de diciembre de 2020.
 Autor: Blog Público. Sitio web: explorable.com. URL:
https://explorable.com/es/muestreo-no-probabilistico#:~:text=El%20muestreo
%20no%20probabil%C3%ADstico%20es,iguales%20oportunidades%20de
%20ser%20seleccionados.&text=Muestreo%20estratificado,Muestreo%20sistem
%C3%A1tico Consultado el: 11 de diciembre de 2020.
 Autor: Luis Barrios Calmaestra. Sitio web: proyectodescartes.org. URL:
https://proyectodescartes.org/uudd/materiales_didacticos/estadistica-
JS/parametros_est.html Consultado el: 12 de diciembre de 2020.
JS/pcentralizacion_est.html Consultado el: 12 de diciembre de 2020.
JS/pdispersion_est.html Consultado el: 12 de diciembre de 2020.
 Autor: José Francisco López. Sitio web: economipedia.com. URL:
https://economipedia.com/definiciones/variable-estadistica.html Consultado el: 12
 Autor: Mauricio Anderson. Sitio web: mauricioanderson.com. URL:
https://mauricioanderson.com/escalas-de-medicion-estadistica/#:~:text=series
%20de%20tiempo-,Escalas%20de%20medici%C3%B3n%20en%20estad
%C3%ADstica,tengan%20sentido%20es%20necesario
%20compararlos.&text=Dichas%20escalas%20tendr%C3%A1n%20diferentes
%20propiedades,de%20intervalo%20y%20de%20raz%C3%B3n. Consultado el:
12 de diciembre de 2020.
 Autor: Blog Público. Sitio web: es.wikipedia.org. URL:
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias Consultado el:
12 de diciembre de 2020.

Informe I Estadistica (Jhonathan Rodriguez)

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Informe I Estadistica (Jhonathan Rodriguez)

Cargado por

Copyright:

Formatos disponibles

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación

Emma Hernández Autor:

Jhonathan Rodriguez C.I 27.957.085

Upata, diciembre 2020

La estadística es una disciplina científica que se ocupa de la obtención, orden y

Cabe destacar que, la estadística NO es una rama de las matemáticas, Utiliza

La estadística se puede subdividir en dos grandes ramas: descriptiva e inferencial.

 Estadística descriptiva: Se refiere a los métodos de recolección, organización,

La estadística inferencial se subdivide a su vez en dos grandes tipos: estadística

El término alemán Statistik, introducido originalmente por Gottfried Achenwall en

En su origen, por tanto, la estadística estuvo asociada a los Estados o ciudades

Ya se utilizaban representaciones gráficas y otras medidas en pieles, rocas, palos de

La significancia estadística es la probabilidad de que una relación entre dos o más

En el mundo real, las empresas utilizan la significancia estadística para comprender

El nivel de significación es comúnmente representado por el símbolo griego α (alfa),

La Estadística aplicada a las Ciencias Sociales

 ¿Qué datos se necesita recoger?

En las Ciencias Sociales la Estadística se estudia en tres secciones: la Estadística

La Estadística aplicada en la Economía

La Estadística es ampliamente utilizada en el análisis económico, nos ayuda a

La Estadística Económica tiene sus antecedentes en el siglo XVII y su máximo

La Economía necesita de la Estadística, con la ayuda de ésta se confeccionan los

Etapas de un estudio estadístico

El proceso estadístico es el conjunto de etapas o fases que deben completarse para

En nuestro caso, consideramos que el proceso estadístico está formado por:

Planteamiento del problema

Organización de los datos

Análisis de los datos

Una vez planteado el problema, recolectados los datos y organizados podemos

Interpretación de los datos

Datos estadísticos: Son los valores que se obtienen al llevar a cabo un estudio de tipo

Universo: Es el conjunto de elementos (finito o infinito) definido por una o más

Población: Es el conjunto sobre el que estamos interesados en obtener conclusiones

Población real: Aquella población que se compone de un grupo de cosas existentes y

Población hipotética: Aquella población conformada por un grupo posible de

Población aleatoria: Aquella población que depende de las alteraciones de sus

Población dependiente: Aquella población que depende de una causa determinada;

Población polinomial: Aquella población cuyas características deben ser medidas y

Muestra: Es un subconjunto de la población al que tenemos acceso y sobre el que

 Muestreo probabilístico: Cada unidad de análisis tiene una probabilidad de ser

Para calcular la media aritmética hacemos:

Si la variable es continua, el cálculo se hace de la misma forma, pero utilizando las

Vamos a distinguir para el cálculo de la moda entre variables discretas y continuas.

Si la variable es discreta, el cálculo de la moda no presenta ninguna dificultad,

En la siguiente escena podemos calcular la moda de una variable discreta.

Sin embargo, si la variable es continua la mayor frecuencia absoluta corresponde a

También vamos a distinguir para su cálculo entre variable discreta y variable

Si la variable es discreta y el número de datos es impar, la mediana será el dato que

Si la variable es discreta y el número de datos es par, la mediana será la media

Si la variable es continua, no distinguiremos si el número de datos es par o impar,

En la que N representa el número de datos y F se refiere a la frecuencia absoluta

Cuartiles, deciles y percentiles: Entre las medidas de centralización y de dispersión

Si la variable es discreta, para calcular un percentil, calcularemos el porcentaje de

Si la variable es continua aplicamos la siguiente fórmula muy similar a la utilizada

 Variable cuantitativa: Son variables que se expresan numéricamente.

 Escala nominal: Cuando un dato identifica una etiqueta (o el nombre de un

En estadística, se le llama distribución de frecuencias a la agrupación de datos en

La frecuencia absoluta es el número de veces que aparece un determinado valor

Frecuencia* % = % Total de frecuencia 15* 100% = 1,500 = 90%

Es el total de la frecuencia relativa del 100% o 99% dependiendo de los decimales

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los

La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de una

La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve(Xr), y