¿Qué es R? Ventajas de la programación en R

Datatons Data Science, Technology 4 Comments

R_logo.svgR es un entorno y un lenguaje de programación enfocado en el análisis estadístico de los más utilizados en el campo de la minería de datos que pueden aplicarse a gran variedad de disciplinas.

Este lenguaje forma parte de GNU y se distribuye bajo licencia GNU GLP.

Características  y ventajas de la programación en R

  • El lenguaje de programación R es un proyecto colaborativo y abierto, los desarrolladores pueden descargar el código de forma gratuita y modificarlo para incluir mejoras.
  • Es un lenguaje interpretado, funciona mediante comandos.
  • R proporciona una amplia gama de herramientas estadísticas que incluyen análisis de datos y generación de gráficos. Este lenguaje tiene capacidad de generar gráficos de alta calidad. Estas características lo convierten en una potente herramienta de cálculo.
  • Gracias a este lenguaje de programación los Data Scientists pueden manejar grandes volúmenes de datos.
  • Puede integrarse con distintas bases de datos. Una de las ventajas más importantes de R es que funciona con diferentes tipos de hardware y software (Windows, Unix, Linux…)
  • El lenguaje R ofrece la posibilidad de cargar bibliotecas y paquetes con diversas funcionalidades lo que permite a los usuarios extender su configuración básica.
  • La comunidad en torno a R es muy activa por lo que es sencillo encontrar soluciones rápidamente a los problemas que los usuarios se puedan encontrar.

 

Datatons y R

Logo DatatonsEn Datatons tenemos un equipo especializado en desarrollo de analíticas basadas en R, “somos Erreros!” y participamos en la comunidad de usuarios de R de forma activa, una muestra de nuestra involucración es el patrocinio de las Jornadas Nacionales de R.

 

Comments 4

  1. Juan V.

    Buenos días,
    Según tengo entendido R trabaja en memoria, ¿eso le genera problemas al tratar volúmenes altos de datos?

    Gracias.

    1. Ines Huertas

      R es un lenguaje diseñado para tratar volúmenes de datos “medios” y en muchas ocasiones no hace un uso óptimo de los recursos de memoria. Una solución que se puede utilizar es emplear tipos de datos mas óptimos como data.table en lugar de objetos data.frame durante las analíticas, pero esto en ocasiones es insuficiente y requiere más RAM o no es aplicable a determinadas implementaciones de algoritmos.

      En estos casos la ejecución de la analítica pasa por cambiar de un entorno centralizado (en una única máquina) a un entorno de cluster, pero este paso depende de la cantidad de datos inicial que tengas, de los recursos que requieran las operaciones que vayas a realizar, etc. Hablaríamos entonces de analíticas aplicadas a entornos de Big Data, donde utilizar paquetería de R pasa por rediseñar tus analíticas a formato mapreduce de Hadoop o utilizar algunas de la librerías que te abstraigan determinadas operaciones distribuidas como RHadoop.

      Pronto publicaremos las fechas para un ciclo de conferencias de Big Data&Analytics donde podrás preguntar a nuestros equipo de Data Scientist sobre mas dudas que tengáis!

  2. Pingback: Historia de una relación complicada que LX Scala cambió - Inés Huertas

Leave a Reply

Your email address will not be published. Required fields are marked *