martes, 5 de abril de 2016

Presentación

Qué es R

El software para el análisis de encuestas tradicionalmente se ha repartido entre aplicaciones propietarias y de más bien elevado coste (tipo SPSS©, SAS©, etc.) o aplicaciones casi de tipo artesanal, de escaso respaldo y corto alcance.
Pero un reciente lenguaje de análisis estadístico llamado R está experimentando un crecimiento exponencial tanto en sus capacidades como en su uso y popularidad.

¿Por qué R?

Las ventajas de R como herramienta de análisis estadístico son abrumadoras:
  • Se trata de un lenguaje de código abierto, libre y gratuito (licencia GNU)
  • Abarca prácticamente cualquier tipo de operación de análisis estadístico, desde el manejo de datos hasta la estadística bayesiana, pasando por los análisis multivariables, las series temporales y el Data Mining
  • Tiene una gran potencia gráfica -incluyendo la simbiosis con la cartografía digital- y una versátil capacidad de volcado a distintos formatos de informes, lenguaje HTML, aplicaciones web, etc.
  • Se utiliza en un número creciente de cursos de estadística en prestigiosas universidades norteamericanas y de todo el mundo, así como en cursos de estadística en modalidad MOOC
  • Está respaldado por una entusiasta comunidad de desarrolladores, que han añadido más de 5.000 nuevos módulos (“packages” en la jerga al uso en R) al paquete base, totalizando más de 100.000 funciones disponibles

Comparativa según la Universidad de Nueva York

¿Qué ofrece R en comparación con otros paquetes de software estadístico? La Universidad de Nueva York (NYU) elaboró el siguiente cuadro:
Software
Interfaz
Curva de aprendizaje
Manejo de datos
Análisis estadístico
Gráficos
SPSS
Menús y sintaxis
Gradual
Moderado
Campo de aplicación moderado y baja versatilidad
Bien
Stata
Menús y sintaxis
Moderada
Potente
Campo de aplicación amplio y versatilidad media
Bien
SAS
Sintaxis
Empinada
Muy potente
Campo de aplicación muy amplio y alta versatilidad
Muy bien
R
Sintaxis
Empinada
Muy potente
Campo de aplicación muy amplio y alta versatilidad
Excelente
MATLAB
Sintaxis
Empinada
Muy potente
Campo de aplicación limitado y alta versatilidad
Excelente

Qué ofrece para el análisis de encuestas

Un ciclo completo:
  • Captura y volcado de datos: se importan ficheros desde una variedad de formatos, incluyendo SPSS©, SAS©, páginas web, hojas de cálculo, ficheros “.csv”, ficheros “planos” en formato ASCII, etc.
  • Tratamiento de los datos y generación de datos de prueba
  • Confección de tablas, incluyendo el manejo de etiquetas (“labels”) de variables y valores
  • Análisis estadísticos: más de 100.000 funciones disponibles
  • Confección de gráficos y mapas: R destaca por su potencia gráfica y las facilidades para la combinación de análisis geo-espaciales con aplicaciones tipo Google Maps
  • Análisis de textos: análisis estadístico de contenidos, generación de nubes de palabras, etc.
  • Creación de informes: volcado semi-automático a formatos tipo “.pdf”, “.word”, “.html”, “LaTex”, etc.

Qué otras investigaciones puedo realizar con R

  • Análisis de redes sociales, incluyendo la captura de datos a través de APIs de Twitter, FaceBook, etc.
  • Análisis de series temporales

Ventajas frente a las alternativas habituales

  • Es un lenguaje abierto, libre y gratuito
  • Existe una potente comunidad de desarrolladores, cuyo rasgo principal es la puesta a disposición de sus avances a toda la comunidad de usuarios
  • El volumen de paquetes para aplicación de análisis específicos crece exponencialmente, al igual que el volumen de funciones
  • Crece su popularidad entre usuarios en la conocida web www.stackoverflow.com

¿Son todo facilidades?

  • La familiarización inicial con R es algo dificultosa: tiene una empinada curva de aprendizaje
  • En efecto, R es un lenguaje de Programación Orientada a Objetos (POO) que se ejecuta escribiendo comandos por código
  • Además la mayoría de los manuales básicos y de tutoriales de los paquetes añadidos están escritos en inglés

Para empezar fácil: R-Commander (= R en formato menús)

Sin embargo existe una versión de R, llamada R-Commander que crea un interfaz de usuario en formato tipo menú, al estilo de SPSS©. Aunque esta versión no incorpora todos los paquetes disponibles añadidos en R, su versión actual ofrece una amplia variedad de los mismos, lo que hace de R-Commandeer un vehículo ideal para iniciarse en R sin un esfuerzo de partida importante.
Además La Universidad de Cádiz ha implentado una versión de R-Commander en español, lo que facilita grandemente su uso.

Referencias y ampliación de la información y ayudas gratis

Todas las referencias a las que se alude más arriba, junto con ayudas online ( = gratis) tanto en español como en inglés, pueden encontrarse en la página de recursos, que se actualiza periódicamente.

No hay comentarios:

Publicar un comentario