통계, IT, AI

C#과 R을 연동하기 본문

IT/기타

C#과 R을 연동하기

Harold_Finch 2016. 9. 27. 23:20

1. 개요

이것 저것을 하다보니 C#과 R을 연동할 일이 생겼다.


학습을 목적으로 Visual Studio없이 진행한다.

2. 준비

(1) .Net Framework를 설치한 후 C# complier(csc.exe)가 존재하는지 확인한다.


(2) R을 설치한다.


(3) C#과 R을 연동시킬 수 있도록 도와주는 라이브러리, RDotNet을 설치한다.


공식 사이트에서는 nuget을 통하여 받도록 권장하고 있다.


여기에서 nuget의 window command line 최신 버전을 받자.


그리고 cmd를 켜고 nuget이 있는 폴더에서 nuget install R.NET.Community를 실행하자.


DynamicInterop, R.NET.Community 폴더가 생성되면 잘 받은 것이다.


해당 폴더 안의 dll, xml 파일을 csc.exe가 있는 폴더에 복사한다.

3. C#과 R연동하기

csc.exe가 있는 폴더에 다음과 같은 코드[각주:1]를 작성하고 test.cs라고 저장하자.

using System;
using System.Linq; // 이것이 없으면 .First가 있는 라인에서 에러가 난다.
using RDotNet;
using DynamicInterop; // 이것이 없으면 컴파일 자체가 되지 않는다.

namespace Sample1
{
   class Program
   {
      static void Main(string[] args)
      {
		 // 초기화
		 // engine이 바로 R이라고 생각하면 된다.
         REngine.SetEnvironmentVariables();
         REngine engine = REngine.GetInstance();
         engine.Initialize();

         // R에 데이터를 할당하는 두가지 방법
		 // 1. C#의 배열을 인식시킨다.
         NumericVector group1 = engine.CreateNumericVector(new double[] { 30.02, 29.99, 30.11, 29.97, 30.01, 29.99 });
         engine.SetSymbol("group1", group1);
         // 2. R의 명령을 실행한다.
         NumericVector group2 = engine.Evaluate("group2 <- c(29.89, 29.93, 29.72, 29.98, 30.02, 29.98)").AsNumeric();

         // 간단한 t-test를 수행한다.
         GenericVector testResult = engine.Evaluate("t.test(group1, group2)").AsList();
         double p = testResult["p.value"].AsNumeric().First();
		
		 // 결과를 console에 뿌려준다.
         Console.WriteLine("Group1: [{0}]", string.Join(", ", group1));
         Console.WriteLine("Group2: [{0}]", string.Join(", ", group2));
         Console.WriteLine("P-value = {0:0.000}", p);

         // 사용을 마쳤으면 R을 해제하자. 다시 사용하고자 한다면 처음부터 초기화해야 한다.
         engine.Dispose();

      }
   }
}       

그리고 cmd에서 csc /r:RDotNet.dll;DynamicInterop.dll t_test.cs[각주:2]를 실행하자.


아래와 같이 특별히 거슬리는 문구가 나오지 않는다면 성공한 것이다.



이제 cmd에서 test를 실행하자. 다음과 같은 결과가 나오면 성공한 것이다.



4. 마치며

Visual Studio를 사용한다면 훨씬 간단하게 수행할 수 있으니 괜히 사서 고생하지 말자.


R은 통계 패키지로서 매우 준수하지만 범용 언어라고 하기 어렵기 때문에 제약이 많다.


그러므로 위의 내용을 토대로 EXCEL 분석 보고서 자동화 등의 다양한 활용이 가능하다. 


질문 또는 조언을 매우 환영한다.





  1. 출처는 RDotNet의 github이며, 학습의 목적에 맞게 약간의 수정을 하였다. [본문으로]
  2. csc를 실행하여 컴파일을 하되, 프로그램에서 참조하고 있는 dll파일을 명시한다. [본문으로]

'IT > 기타' 카테고리의 다른 글

[python] mutable vs immutable  (0) 2017.11.28
[TensorFlow] 모델 저장 및 복원  (0) 2017.09.06
[기타] 티스토리 기초 설정  (1) 2017.07.09
C#에서 이벤트 사용하기  (1) 2017.01.29
C#에서 Zip 및 익명형식의 배열 사용하기  (0) 2016.11.14
Comments