맥OS 환경에서 RStudio에 관련된 문제 중 하나는 '한글 인코딩'입니다.

개발자가 아니라서 자세한 이유는 잘 모르지만, 


아무튼 R공부를 하는 중에 readLines()함수를 이용해 txt 파일을 불러올 때

한글이 제대로 불러와지지 않는 문제가 발생합니다.



> txt <- readLines("test.txt")

Warning message:

In readLines("test.txt") : incomplete final line found on 'test.txt'

> head(txt)

[1] "\"\xba\xb8\xb0\xed \xbdʹ\xd9"                                           

[2] "\xc0̷\xb8\xb0\xd4 \xb8\xbb\xc7ϴϱ\xee \xb4\xf5 \xba\xb8\xb0\xed \xbdʹ\xd9"

[3] "\xb3\xca\xc8\xf1 \xbb\xe7\xc1\xf8\xc0\xbb \xba\xb8\xb0\xed \xc0־"      

[4] "\xba\xb8\xb0\xed \xbdʹ\xd9"                                             

[5] "\xb3ʹ\xab \xbe\u07fc\xd3\xc7\xd1 \xbdð\xa3"                             

[6] "\xb3\xaa\xb4\xc2 \xbf츮\xb0\xa1 \xb9Ӵ\xd9" 



검색을 통해 알아낸 방법들로

파일을 불러올 때 옵션으로 인코딩을 지정한다던가,

txt 파일을 새로 만들면서 'UTF-8' 혹은 'euc-kr'으로 저장하는 방법을 사용해보기도 했지만

저는 제대로 해결되지 않았어요.


아무튼 어떻게 해결 했냐면, 일단 RStudio 자체의 인코딩 인식과 방법에 관련된 문제이지 싶어서

RStudio에서 txt 파일을 생성해 저장함으로써 간단하게 해결했습니다.


자세한 원리는 모르겠지만...

RStudio 환경에서 생성하면 사용가능한 인코딩으로 저장되지 않을까? 하는 생각으로 시도했는데 먹혀들었네요ㅎㅎ

환경설정에서 확인해 봤을 땐 system default가 UTF-8이던데

어째서 txt 파일을 UTF-8 인코딩으로 저장했을 때도 같은 문제가 발생했는지는 모르겠지만요...





Posted by Azel.Kim :