사용자 환경
macOS Sierra 버전 : 10.12.3
2017 MS Office Excel
R까기 2 추가부분개정판 실전예제 3
책 R까기 2를 공부하면서 csv파일 인코딩문제 때문에 고생을 많이 했다.
보통 read.csv() 함수를 쓸때는 뒤에 read.csv("@@@@.csv", fileEncoding = "euc-kr") 이런식으로 R Studio에서 인코딩이 가능했지만
fread()함수를 쓸때에는 'fileEncoding' 인자가 없어서 R Studio 안에서 인코딩이 불가능하다. 따라서 파일 자체를 인코딩해서 불러와야 한다.
여러 텍스트 편집 프로그램으로 인코딩을 해봤지만 다 실패 하고 마지막으로 성공했던 Excel로 인코딩하는 법을 알아보자.
Step 01 Excel을 켜서 새파일을 생성한 후 데이터 탭 선택!
Step 02 '텍스트에서' 버튼 클릭
Step 03 불러올 csv 파일 선택 후 데이터 가져오기 클릭
Step 04 원본 파일에서 인코딩을 선택 할 수 있다. Korean(Mac OS)선택 (이때 밑에 선택한 데이터 미리 보기에서 한글로 바뀌는지 확인) 그리고 다음 클릭
Step 05 구분기호를 선택하고 다음 클릭(이때도 선택한 데이터 미리 보기에서 데이터가 구분 되는지 확인)
Step 06 각 열을 선택하여 데이터 서식을 지정하는 단계, 마침 클릭
Step 07 데이터가 들어가는 위치 선택, 확인 버튼 클릭
Step 08 한글 깨짐 없는 데이터 확인
이 파일을 R Studio 불러 올 수 있도록 저장해보자
Step 09 파일->다른이름으로 저장하기 선택, 파일 이름 수정하고 파일 형식에서 CSV UTF-8(쉼표로 분리)(.csv)형식 선택 후 저장 클릭
Step 10 원래 파일명과 동일하게 했을 경우 덮어쓰냐는 안내창이 나온다. 덮어쓰려면 대치 클릭
파일 인코딩을 완료 했으니 R Studio에서 잘 불러와 지나 test를 해보자
Step 11 fread()함수를 이용해 csv파일을 불러오면 경고메세지가 뜨긴 하지만 한글이 깨지지 않고 이쁘게 들어가 있는 것을 확인 할 수 있다.
'IT > R' 카테고리의 다른 글
맥북 OS X용 R, R project plots에서 ggplot2 그래프의 한글이 깨져서 네모로 보일 때 (0) | 2017.04.05 |
---|