KoNLP에서 아래와 같은 에러가 나올 경우 대처 방법

library(KoNLP) 패키지 rJava를 로드중입니다 패키지 bitops를 로드중입니다 패키지 Sejong를 로드중입니다 Successfully Loaded Sejong Package.Java initialized. Error : .onLoad failed in loadNamespace() for ‘KoNLP’, details:call: .jinit(parameters = c("-Dfile.encoding=UTF-8", "-Xmx512m"))error: Cannot create Java virtual machine (-1)에러:’‘KoNLP’’ 에 대한 패키지/네임스페이스 로드가 실패했습니다 사실 위의 에러가 KoNLP와 독립적인 문제라는 것은 아래 명령어로 확인해 보면 된다.   library(rJava) .jinit() 대부분의 […]

계속 읽기

R 전문가가 되기 위한 1만 시간

사실 R학습이 어렵다고들 하는 분들이 많아서 얼마 전에 RA에서 제공한 슬라이드에서 한 장 발췌해서 올려본다. 말콤 글레드웰의 책인 ‘아웃라이어’에서 어떤 것을 성취하기 위한 조건은 환경과 더불어 절대적인 시간 투자가 있어야 된다고 언급하고 있다. 성취를 위한 적절한 환경, 그리고 1만 시간…. 아마도 우리가 뭔가를 성취하기 힘들다고 습관처럼 이야기 하는 건 성취를 위한 필요조건에 대해서 너무 과소평가하기 […]

계속 읽기

안철수 교수 대선 출마 선언문 텍스트 요약–2

워드 클라우드를 만들어 본 이전 예제에 이어, 문장을 끊어 단어간의 관계를 몇가지로 플로팅 해봤다. 여기서 눈여겨 볼 내용은 연관룰에서 subset을 제거하는 과정인데, 왜 이 부분을 제거하는지는 각자 고민에 맡기겠다. 오래전 포스팅에 igraph를 활용한 코드를 공유 했었는데, 그것보다 훨씬 간단하고 미려한 코드로 분석 결과를 뽑아준다.   ahn <- "안녕하십니까 안철수입니다. 저는 지난 7월말에 말씀 드린 대로 […]

계속 읽기

party를 활용한 모델 기반의 재귀 분할 방법

예를 들어 특정 데이터에 회귀모델을 적합한다고 하자…. 직관적으로 scatter plot을 그리면서 회귀모델 피팅을 하게 된다. 아래 처럼..     그러나 알다시피 오차의 분산이 일정하지 않은 잘못된 모델이 도출된다. (이 경우 가중 회귀를 쓰거나 변수 변환을 통해 모델을 튜닝해 나가는 과정이 필요하다고 학교에서 배우긴 했다.) 눈으로 보면 나쁘지 않아 보이나, 어떤 그룹 변수의 영향으로 인해 위 […]

계속 읽기

KoNLP를 저작물에 사용하신다면…..

가끔 KoNLP를 사용하셔서 논문을 쓰시는 분들을 볼 수 있는데, 이 패키지의 제작자로서 한가지 제안을 드리고 싶다. 사실 왜 출처 명시를 하지 않느냐의 문제가 아니다… 무엇보다 그 정도로 쪼잔한 마음으로 패키지를 만들고 공개하지는 않는다. ㅋㅋ    논문, 그리고 저작물 그리고 이를 활용한 출력물들은 다른 누가 같은 과정으로 돌리더라도 같은 내용의 출력이 가능해야 된다. 참 아름답게도 R […]

계속 읽기

안철수 교수 대선 출마 선언문 텍스트 요약

부제는 윈도우에서의 R 플로팅 폰트 설정이다.     ahn <- "안녕하십니까 안철수입니다. 저는 지난 7월말에 말씀 드린 대로 국민들의 의견을 듣고자 많은 분들을 만났습니다. 그 동안 저는 재미있는 별명도 얻었고. 또 최근에는 저를 소재로 한 유머도 유행하더군요. 그동안 제 답을 기다려오신 여러 분들의 애정이라고 생각하고 그 또한 무겁게 받아들이겠습니다. 기업인과 교수의 삶을 살아온 저로서는, 국가경영의 […]

계속 읽기

KoNLP 0.76.5 업데이트

금번 업데이트에서 크게 변경된 부분은 사용자 사전 데이터 추가의 용이성이다. 예를 들어 아래와 같다. useSystemDic() # Backup was just finished! # 13 words were added to dic_user.txt. mergeUserDic(data.frame("삼성전자", "ncn")) # 1 words were added to dic_user.txt. extractNoun("삼성전자에서는 아이폰에 대항할 무기를 준비하고 있다.") # [1] "삼성전자" "아이폰에" "대항" "무기" "준비" mergeUserDic(data.frame("아이폰", "ncn")) # 1 words were […]

계속 읽기

8th ACC R 데이터 마이닝 발표 예제코드

40분 동안에 데이터 마이닝을 가르치는 게 불가능하지만 단 하나의 목적만을 가지고 했다. 앞에 있는 분들이 R 데이터 마이닝을 시작하는데, 좋은 시작점을 제공해 주자! 어느정도 만족할만한 시간이었고, 따라서 교육에 쓰였던 예제 데이터를 공개한다. 오늘 내가 준비했던 것들 중에서 가장 만족한 것은 예제 코드를 R MarkDown으로 작성해서 이를 직접 발표 자료로 활용했다는 것이다. 상당히 만족 스럽고… 아래 […]

계속 읽기

KoNLP 0.76 업데이트

약 일주일 정도의 작업과 우역곡절 끝에 KoNLP 0.76 업데이트에 성공했다. 현재 윈도우 바이너리 버전 배포가 확정되었고, 맥 버전이야 거의 리눅스에서 돌아가면 빌드에 별로 문제가 없다.   내부적으로 많은 코드 변화가 있었으나, 사용자들은 잘 인지하기 힘들듯 하다. 일단 바뀐 부분은 사전 데이터를에 대해서 zip파일에 압축해서 배포하고(Sejong 패키지), 이에 대해 압축을 풀지 않고 바로 메모리로 읽어들이는 방식으로 […]

계속 읽기

KoNLP 0.75 업데이트

R core팀에서 지리하게 요청하던 사전과 로직 분리 작업을 마쳤다. 따라서 KoNLP패키지의 용량이 크게 줄었고, 코퍼스나 사전은 모조리 Sejong에 몰아 넣었다. Sejong의 배포 크기를 얼마로 제한을 할지 모르겠지만, 앞으로 세종계획에서 나온 리소스들이 그쪽으로 들어가지 않을까 한다. KoNLP의 dependency가 Sejong에 걸려있기 때문에 KoNLP의 새로운 버전을 업데이트 하게되면 아래와 같은 화면이 출력된다.   > install.packages("KoNLP") Installing package(s) into […]

계속 읽기