viernes, 28 de diciembre de 2012

R - Importar y exportar datos

Para hacer R más versátil a la hora de reconocer archivos diseñados con otros programas es casi imprescindible haber instalado antes el paquete "foreign" (es bueno mantenerlo siempre cargado, o si no, teclear > library (foreign) antes de intentar alguna carga de datos.

1 -  Importar tablas creadas con excel: 

El ejemplo explicado a continuación está realizado con las hojas de cálculo de libre office y el interface de Rstudio.



Una vez que tenemos la tabla que vamos a usar en R debemos guardar el archivo en formato ".csv", pero atención, en este caso nuestra tabla utiliza "," para definir los decimales y esto puede dar problemas al pasar los datos a R, asi que tenemos estas dos opciones entre otras.
  • Opción 1: Cambiar las comas por puntos en la hoja de cálculo antes de salvar como formato .csv ; esto se hace de forma sencilla con la opción "Buscar y reemplazar" del menú "Editar". Para abrir el archivo en R usaríamos la función read.csv () teniendo en cuenta de haber definido el directorio de trabajo donde está el archivo y poniendo el nombre del archivo entre " ".
>  MiTablaExcelenR = read.csv ("MiArchivo.csv") 

  • Opción 2: Guardar el archivo .csv pero haciendo que el delimitador de campo sea ";" y no ",". Si usamos libre office automáticamente nos da la opción al cambio antes de guardar el archivo en dicho formato (esta opción es la recomendada para los que usamos el sistema de notación español en las hojas de cálculo).

 
 

Una vez que tenemos el archivo salvado podemos echarle un ojo en un editor de texto. Encontraremos la siguiente apariencia:

;Nº de seguimiento;Sexo;Edad;Peso (Kg);Estatura (m);Estado físico
Paco;1234;H;25;80,5;1,8;1
Pepe;2345;H;45;73,8;1,77;2
Marius;3456;H;28;85,9;1,88;2
Silvia;4567;M;27;60,2;1,65;2
Javier;5678;H;34;90;1,83;4
Noelia;6789;M;31;58,5;1,66;3
Richard;9101;H;40;88,5;1,8;2
Daniel;1213;H;33;83,5;1,75;2
Ana;1415;M;29;63;1,7;1


Ahora ya tenemos la tabla de excel preparada para ser introducida en R (cada linea del .csv es una fila de la tabla y cada dato se separa mediante ";").
Procedemos definiendo el directorio de trabajo donde está el archivo en cuestión y después usamos el siguiente comando:

> MiTablaExcelenR = read.csv2 ("NombreDelArchivo.csv")

Vemos finalmente que R ha sustituido las "," de los decimales por puntos, asi que ya tenemos los datos listos para empezar a trabajar con ellos.

  2- Leer archivo de stata (.dta):

> data = read.dta ('elarchivoquesea.dta')


No hay comentarios: