NoSQL vs Relational: Which database to use

Iván Alejandro Marugán Big Data Architecture Leave a Comment

Nowadays information collection has changed a lot. Everybody wants to save more data and allow our users to consume that information in real time and in an easy way. This means that performance, scalability and availability are three key factors for database implementations. For this reason NoSQL databases have made their appearance. What’s a NoSQL database? A NoSQL database (“non SQL”, …

La Reinvención del Data Center en la Era Digital

Jorge Vidal Business Leave a Comment

Datatons tuvo la ocasión de participar en el evento de IDG COMMUNICATIONS que consiguió reunir a diversos profesionales destacados en lo que al mundo del CPD se refiere.   En este evento se discutieron temas interesantes y,que a día de hoy son ya una realidad, que repercutirá de manera negativa a las empresas que no sean capaces de reciclarse, ya sea por falta …

Historia de una relación complicada y como Scala LX lo cambió

Datatons Business Leave a Comment

Hace tiempo que tengo un romance extraño con el lenguaje de programación de Scala. Normalmente me suele dar un poco igual que herramienta utilizar a la hora de desarrollar una analítica (diferentes problemas, diferentes soluciones), pero he de confesar que Scala tiene algo que me convence y que me asusta a la vez. La primera vez que lo utilicé fue …

Participación en el Congreso Informática para tod@s – Inés Huertas

Datatons Business 2 Comments

El pasado 5 de Mayo tuve el placer de ser seleccionada para hablar en el congreso Informática para tod@s organizado en Mallorca y patrocinado por la ACM-W. Y digo que tuve el placer porque de verdad me encontré con grandes talentos, mujeres que se reinventan y luchan por dar visibilidad a su trabajo además de ser grandes profesionales en el mundo …

Random Forest – Modeling The Titanic Voyage with R

David Carrasco Data Science Leave a Comment

What’s a Random Forest? Random Forest is a machine learning algorithm used normally for classification and regression tasks in supervised learning which consists on an ensemble or group of simple decision tree models to predict the value of a target variable based on a bunch of input variables. The main advantage regarding a simple decision trees is that reduces the …

Random Forest – The magic behind the algorithm

David Carrasco Data Science Leave a Comment

Random Forest is an ensemble model based on decision trees which is built through the Bagging technique used for classification and regression tasks in supervised learning (Although, it can be used in unsupervised learning too). Yes, it’s a bit more technical than the definition in the previous post, isn’t it? Well, let’s explain the main concept behind the Random Forest …

Ingest & Search JSON events in Real Time (III): Flume Architecture & BenchMarking

Manuel Lamelas Big Data Architecture Leave a Comment

To end this series of articles in Ingestion & Searching we are going to see the Flume Architecture for High Availability and see some benchmark tests. Flume Architecture To achieve high availability we have two flume characteristics to play with: 1. File Channel vs Memory Channel This is a decision on 100% delivery vs fast ingestion. With file channel the …

Big Data en Radio GUL con Betabeers y Datatons

Datatons Business Leave a Comment

Es divertido encontrarte con buena gente y gente buena después de unos años. A raíz del Betabeers del mes de Marzo en Campus Google que tenía como temática el OpenData, nos invitaron a las Rladies a presentar el eventazo del año para todos aquellos con ganas de retos de datos: Call of data .  Mi sorpresa llega cuando Pablo Rodríguez, organizador de …