Random Forest – The magic behind the algorithm

David Carrasco Data Science Leave a Comment

Random Forest is an ensemble model based on decision trees which is built through the Bagging technique used for classification and regression tasks in supervised learning (Although, it can be used in unsupervised learning too). Yes, it’s a bit more technical than the definition in the previous post, isn’t it? Well, let’s explain the main concept behind the Random Forest …

Ingest & Search JSON events in Real Time (III): Flume Architecture & BenchMarking

Manuel Lamelas BigData Architecture Leave a Comment

To end this series of articles in Ingestion & Searching we are going to see the Flume Architecture for High Availability and see some benchmark tests. Flume Architecture To achieve high availability we have two flume characteristics to play with: 1. File Channel vs Memory Channel This is a decision on 100% delivery vs fast ingestion. With file channel the …

Big Data en Radio GUL con Betabeers y Datatons

Datatons Business Leave a Comment

Es divertido encontrarte con buena gente y gente buena después de unos años. A raíz del Betabeers del mes de Marzo en Campus Google que tenía como temática el OpenData, nos invitaron a las Rladies a presentar el eventazo del año para todos aquellos con ganas de retos de datos: Call of data .  Mi sorpresa llega cuando Pablo Rodríguez, organizador de …

Meetup Big Data Madrid: 30 de marzo a las 19:00

Datatons BigData Architecture, Sin categoría Leave a Comment

El concepto Big Data está adquiriendo una gran importancia en los últimos tiempos y esta tendencia va en aumento. Los datos son muy valiosos, pero mucho más si sabemos cómo extraer la información importante, la que realmente necesitamos. Si aún no lo tienes muy claro, te aclaramos las ideas en nuestro Meetup Big Data Madrid ¿Quieres venir? Pues, ¡apunta en …

H2O.ai y Data Science Madrid: como agua de mayo

Datatons Data Science Leave a Comment

Parece que la primavera quiere aparecer: días más largos, temperaturas más suaves durante el día… todo empieza a florecer y nosotros no podíamos ser menos. Nos quitamos la bufanda y los guantes y nos lanzamos de lleno a la primavera. Así que, para celebrar el resurgir de la vida, ¿qué mejor manera que traeros el agua de mayo de los …

Data Science Madrid Meetup Enero 2017

Datatons BigData Architecture, Business, Data Science, Technology Leave a Comment

El pasado 21 de de Enero tuvo lugar el meetup mensual de Data Science Madrid, en esta ocasión además pudimos colaborar con nuestros colegas de Madrid 4 OpenStack para celebrar en el evento en el Auditorio de Medialab Prado. La agenda de las charlas fué la siguiente: • “Open Stack y Big Data” por Daniel Mellado y Carlos Camacho Introducción …

Ingest & Search JSON events in Real Time (I): Collecting Data

Manuel Lamelas BigData Architecture, Technology 2 Comments

Ingesting & searching data in real time is one of the most important needs companies have nowadays. If we are talking IoT or we want to collect data from a huge quantity of sources, this is where this post may come in handy. We searched a simple way of achieving the ingestion & storage of JSON events. The idea behind this …