-
RmecabKo update to version 0.1.6.1
잘 지내셨는지요? RmecabKo을 0.1.6.1로 판올림했습니다. 이번에 추가한 중요한 기능은 역시 tokenizer일 것 같고, 다음 판올림을 위해 추가한 기능이 몇 가지 있습니다. 오늘은 tokenizer가 어떤 것인지부터 좀 더 상세하게 설명드리면 좋을 것 같아요. 아직 CRAN에는 등록하지 않았습니다. 몇 가지 문제가 해결되면 한꺼번에 올려야 할 것 같아요.
-
지대넓얕 팟캐스트 분석, XML parsing
-
소설 분석, googleLanguageR 소개
ropensci에서
googleLanguageR
패키지를 공개했습니다. 패키지에 관한 자세한 설명은 페이지에서 확인하실 수 있습니다. 간단히 말씀드리면,googleLanguageR
패키지는 google Cloud API의 언어 관련 API인 Google Natural Language API, Google Cloud Translation API, Google Cloud Speech API의 R interface입니다. 패키지로 할 수 있는 것을 살펴볼까요? -
RmecabKo update to version 0.1.6
안녕하세요? 지난번 소개한 RmecabKo의 중요 판올림이 있었습니다. 드디어 Windows를 지원합니다. 아쉽게도 Rcpp 자체의 문제로, Windows에서는 R에서 직접 C++ 소스를 구동해서 빠르게 형태소 분석 결과를 확인할 수는 없어요. Rcpp를 개발한 Dirk Eddelbuettel이 Rcpp는 Visual C++를 지원하지 않는다고 몇 번이나 강조하고 있었다는 걸 이번 판올림에서 배웠습니다. R core가 Mingw 기반으로 빌드되어 있으므로, Visual Studio library를 섞으면 오류가 발생한다고 하네요.
-
RmecabKo package version 0.1
한글 형태소 분석기인 은전한닢 프로젝트 mecab-ko의 R wrapper를 만들었습니다. 한달동안 틈틈히 C++ 프로그래밍 기본부터 익히기 시작해서 패키지 완성까지 진행하면서 어려움이 많았지만, 올려놓고 나니 시원섭섭하네요. 천천히 수정, 보완해 나갈 예정입니다.