R프로그래밍 - 한글을 소리나는대로 영어로 변환하기

R 언어에서 stringi는 문자열 처리를 위한 강력한 패키지 중 하나이다. 이 패키지는 다양한 문자열 연산을 수행하는데 사용되며, 유니코드 문자열, 정규표현식, 문자열 분할, 결합, 변환 등 다양한 기능을 제공한다. 그 중에 한글을 소리나는대로 알파벳으로 변환하는 기능을 알아보려 한다.

[더 읽기]
r 

RStudio 에서 R 기본 파이프(pipe) 연산자로 단축키 셋팅하기

R 언어에서 pipe는 데이터를 효과적으로 전달하고 조작하는데 사용되는 연산자이다. R에서 가장 널리 사용되는 파이프 연산자는 magrittr 패키지의 %>% 기호이고, 데이터를 연속적으로 다루는데 효과적이다. 파이프 연산자는 일반적으로 함수를 연결하여 코드를 더 읽기 쉽게 만들어주고 중첩된 함수 호출을 방지한다. 개인적으로는 파이프를 사용하면 데이터 처리 단계를 자연스럽게 나타낼 수 있어 코드 가독성이 좋다고 생각한다.

[더 읽기]
r 

MAC에서 R 버전 업그레이드

R 프로그램을 설치한지 꽤나 지난 것 같아서 오랜만에 콘솔창에서 R 버전을 확인해봤더니 2021년 8월 배포된 4.1.1 버전이다. M1 맥북 구매하고 나서, R 프로그램의 Apple 칩셋 빌드버전이 나오자마 설치했던 기억이 있는데 벌써 2년이 지났다니 시간이 참 빠르다. R 버전 업데이트를 오랜만에 해보고 과정을 기록한다.

[더 읽기]
r 

R 프로그래밍 - tibble 에서 하나의 문자열을 여러개의 컬럼으로 나누기

tibble 을 사용해서 데이터를 구성하면, 수많은 tidyverse 의 패키지들을 이용해서 데이터를 정리하거나 원하는 형태로 가공하기 편하다. 그 중에서 하나의 문자열을 특정 구분자나 규칙(정규식)을 이용하여 여러개의 컬럼으로 나누는 방법을 설명하려 한다.

[더 읽기]
r 

R 에러메시지 - Error in file(file, "rt") : cannot open the connection

R 프로그래밍을 하다가 아래와 같은 에러메시지를 봤다면, 대부분 read.file read.table read.csv 등의 함수로 파일을 읽어오는 과정에서 생기는 오류이다. 에러메시지가 발생하는 이유는 경로지정을 틀리게 했기 때문이다. 경로는 상대경로가 있고, 절대경로 방식이 있는데 그 유형에 따라 각각 대처가 가능하다.

[더 읽기]
r 

tidyr::pivot_longer 사용법 - 피벗테이블 표로 변환하기

데이터의 형식은 다양하다. 피벗형태일수도 있고, 그냥 테이블과 같은 표형식일 수도 있고, 아니면 한 컬럼에 여러가지 항목들이 구분자로 뭉쳐져 있을 수도 있다. 그 데이터들을 본인이 분석하기 편한 데이터로 만들기 위해 분해하고 다시 조립하는 과정이 있는데, 그중에 피벗형태의 데이터를 테이블 형태로 변경하는 tidyr::pivot_longer 를 살펴보고자 한다.

[더 읽기]
r  ggplot2 

R 벡터(vector) 합치기, 병합 방법

R프로그래밍에서 벡터(Vector)가 가장 기본적인 자료형이다. 벡터를 얼마나 잘 다루는지에 따라 R을 잘 다루는지 아닌지 알 수가 있다. 벡터를 만들어서 각각 결과치를 만들었을때, 여러개의 벡터끼리 합치기도 하고 나누려 했을 때, 막상 잘 생각이 나질 않는다. 내가 알고 있는 방법을 정리해본다.

[더 읽기]
r