Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 caracteristicas
Volumen: macro datos, son demasiados grandes. Ley de moore
Velosidad: Los datos entran rapidos, Los datos que hemos registrados no cambian.
Cluster: Conjunto de datos “iris”. Conjunto de datos de 4 medidas conjunto de estadística
R.
Twitter: Manguera de incendios de twitter, procesa 500 millones de tuits al días.
Transmision de datos de un sensor. Afluencia constante(transmisión de datos), el conjunto
de datos es un objetivo móvil.
Variedad: No tenemos los datos de manera ordenada. Estructurados y no estructurados.
El 80% de las empresas tiene los datos no estructurados.
NoSQL: No solo datos SQL, como graficos de estructuras.
Estudio: la variedad es el factor mas potente.
Como se utiliza.
Para consumidores:
Tenemos procesamiento lso resultados son tan puro que solo nos demuestra una parte de
la aplicación/resultados, que es prácticamente la que necesitamos.
Siri: puede llevar a cabo recomendaciones según lo que han dicho los otros usuarios.
Yelp: extrae millones de reservas de otros usuarios.
Spotify: Sugerencias.
Amazon: recomendaciones de libros
Netflix: Si alguien podría mejorar las sugerencias podría ganarse 1M.
Neighborland: Utiliza fotos API de twittwr, Google e instragram. Utilzia sistemas de
transitos y quejas en 311. (Este muestra la variedad de datos que es capaz de integrar a
partir de fuentes y formatos diferentes)
Google now: recomendaciones antes que se las pida, como calendario y trafico. Te
proporciona de manera anticipada la información.
Opera de manera invicible, y con gran cantidad de fuentes e información y la sintetiza en 2
o 3 elementos que son los que necesita
Marketing predictivo:
Ayudar a decisidir quien prodia ser el publico destinatario de un producto incluso antes de
que sepa que lo necesite.
Predice hitos importantes: graduarse, casarse, trabajo nuevo, etc.
Se fija en el comportamiento del consumidor: Analiza cuantas veces a iniciado sesión en la
pagina
Utiliza información demográfica: distancia que vive a su tienda, tarjeta, paginas que
visitas. A que revistas a suscritos, si has ido a la universidad, etc.
Pueden comprar mas datos.
Deteccion de fraudes.
Punto de venta: como lleva a cabo la compra, que pagina web utilizas, geolocalicacion, en
eque lugar del mundo
Geolocalizacion y dirección IP
Inicio de sesión
Biometría
La investigación:
Google flutrends:
Se podían identificar brotes de gripes por las búsquedas, o en Wikipedia los hace con
mayor precisión.
The Brain Initiative
Telescopio Kepler: ubicar exoplanetas.
Investigacion psicológicas, tipos de personalidad en USA según las regiones.
Google books: analiza algunas palabras que hay en los libros.
El big data y la ciencia de datos.
1. Estadísticas:
Pueden ser contrario a la
intuición, pueden ser errores
como la paradoja de
cumpleaños. Los científicos de
datos buscan coincidencias y
asociaciones. Capaz de
determinar esas probabilidades.
2. Conocimientos de campo
Hadoop es mas fácil que aprender el negocio de una empresa.
3. Habilidad de programar.
Con saber algo de programación en Python es mucho. Capacidad de conbinar datos.
Pensamiento algorítmico, o racional paso a paso.
Habilidades:
La ciencia de datos sin el big data: