jueves, 15 de octubre de 2015

Qué es el Big Data

El mundo de la Minería de Datos es un tema que me interesa mucho, sobretodo por mi trabajo. En el podcast que he escuchado hoy he podido conocer algo más acerca del tema. Muy interesante y más aún el canal "Principio de Incertidumbre" Espero que os guste,


Ideas que podemos extraer:

  • Solemos ver titulares en prensa resultantes del análisis de datos (resultados del paro, crecimientos económicos, etc..) pero no sabemos muy bien lo que hay detrás.
  • El "Big Data" consiste básicamente en comparar y cruzar grandes conjuntos de datos.
  • En muchas ocasiones con fines comerciales
  • Para recopilar los datos se tienen muchos "sensores": datos de logs, datos de los cajeros, de las compras que realizamos, etc..
  • Todo para analizarlo, cruzarlo y extraer conocimiento de nosotros
  • "¿Que quieren los clientes?" Es lo que se preguntan las grandes compañías
  • Sin embargo las entidades públicas no cruzan los datos. Siguen métodos muy arcaicos.
  • ¡Ten cuidado cuando den los datos del paro! Los datos muy precisos son mentira. "234.012 nuevos empleos" Imposible tanta precisión.
  • La media no es buena métrica
  • Los 5 valores para describir un conjunto: mínimo, máximo, el rango natural y el valor de la mitad (mediana)
  • El análisis de tanto dato se usa para predecir.
  • Hay muchos usos curiosos del Big Data y Data Mining: Por ejemplo en la traducción de textos (traducción por probabilidad teniendo el mismo texto en distintos lenguajes)
  • Las tiendas por internet también lo usan para poner productos similares a los que estamos viendo.
  • "R" es un software matemático específico para miniería de datos.

0 comentarios:

Publicar un comentario