인터넷에서 파일을 다운로드할 때 파일 이름이 %EA%B5%AC%EC%97%AD%EC%9D%98%...
이와 같이 저장되는 경우가 종종 있다. 한글이 깨져서 저장된건 아니고 맥(Mac) 환경에서 다운로드한 파일이 한글 대신 URL 인코딩된 형태로 저장되는 경우인데, 이런 파일명을 R 프로그램을 사용하여 한글로 제대로 수정하는 과정을 정리해본다.
채권 현재가치(PV)와 듀레이션(Duration) 산출방법
금리가 오르면 채권 가격은 하락하고, 금리가 내리면 채권 가격은 상승하는 반비례 관계가 있다. 그리고 듀레이션을 짧게 유지하면 금리 변동에 덜 민감해지고, 길게 유지하면 수익률을 극대화할 수 있지만 금리 변화의 리스크가 커진다.이 때문에 금리 리스크를 관리하고자 현재 가치(PV, Present Value)와 듀레이션(Duration) 같은 개념을 사용하는데, 대략 어떻게 산출되는지 정리해보려한다.
[더 읽기]R프로그래밍 - 한글을 소리나는대로 영어로 변환하기
R 언어에서 stringi
는 문자열 처리를 위한 강력한 패키지 중 하나이다. 이 패키지는 다양한 문자열 연산을 수행하는데 사용되며, 유니코드 문자열, 정규표현식, 문자열 분할, 결합, 변환 등 다양한 기능을 제공한다. 그 중에 한글을 소리나는대로 알파벳으로 변환하는 기능을 알아보려 한다.
RStudio 에서 R 기본 파이프(pipe) 연산자로 단축키 셋팅하기
R 언어에서 pipe
는 데이터를 효과적으로 전달하고 조작하는데 사용되는 연산자이다. R에서 가장 널리 사용되는 파이프 연산자는 magrittr
패키지의 %>%
기호이고, 데이터를 연속적으로 다루는데 효과적이다. 파이프 연산자는 일반적으로 함수를 연결하여 코드를 더 읽기 쉽게 만들어주고 중첩된 함수 호출을 방지한다. 개인적으로는 파이프를 사용하면 데이터 처리 단계를 자연스럽게 나타낼 수 있어 코드 가독성이 좋다고 생각한다.
MAC에서 R 버전 업그레이드
R 프로그램을 설치한지 꽤나 지난 것 같아서 오랜만에 콘솔창에서 R 버전을 확인해봤더니 2021년 8월 배포된 4.1.1 버전이다. M1 맥북 구매하고 나서, R 프로그램의 Apple 칩셋 빌드버전이 나오자마 설치했던 기억이 있는데 벌써 2년이 지났다니 시간이 참 빠르다. R 버전 업데이트를 오랜만에 해보고 과정을 기록한다.
[더 읽기]R 프로그래밍 - tibble 에서 하나의 문자열을 여러개의 컬럼으로 나누기
tibble
을 사용해서 데이터를 구성하면, 수많은 tidyverse
의 패키지들을 이용해서 데이터를 정리하거나 원하는 형태로 가공하기 편하다. 그 중에서 하나의 문자열을 특정 구분자나 규칙(정규식)을 이용하여 여러개의 컬럼으로 나누는 방법을 설명하려 한다.
R프로그램을 이용한 SOFR 룩백기간 적용하기
SOFR(The Secured Overnight Financing Rate)금리를 다운받아 R프로그램을 이용해서 룩백기간에 따른 금리정보 shift 하는 정도만 해보려 한다. 뉴욕연방준비은행 사이트에서 전체 sofr 금리내역을 받을 수 있으며, 여기를 클릭해서 찾아 다운로드하면 된다. 그리고 ARRC 웹사이트에 sofr 관련 자료가 많으니 참고하면 좋다.
[더 읽기]R 에러메시지 - Error in file(file, "rt") : cannot open the connection
R 프로그래밍을 하다가 아래와 같은 에러메시지를 봤다면, 대부분 read.file
read.table
read.csv
등의 함수로 파일을 읽어오는 과정에서 생기는 오류이다. 에러메시지가 발생하는 이유는 경로지정을 틀리게 했기 때문이다. 경로는 상대경로가 있고, 절대경로 방식이 있는데 그 유형에 따라 각각 대처가 가능하다.
tidyr::pivot_longer 사용법 - 피벗테이블 표로 변환하기
데이터의 형식은 다양하다. 피벗형태일수도 있고, 그냥 테이블과 같은 표형식일 수도 있고, 아니면 한 컬럼에 여러가지 항목들이 구분자로 뭉쳐져 있을 수도 있다. 그 데이터들을 본인이 분석하기 편한 데이터로 만들기 위해 분해하고 다시 조립하는 과정이 있는데, 그중에
피벗형태의 데이터를 테이블 형태로 변경하는 tidyr::pivot_longer
를 살펴보고자 한다.
R 벡터(vector) 합치기, 병합 방법
R프로그래밍에서 벡터(Vector)가 가장 기본적인 자료형이다. 벡터를 얼마나 잘 다루는지에 따라 R을 잘 다루는지 아닌지 알 수가 있다. 벡터를 만들어서 각각 결과치를 만들었을때, 여러개의 벡터끼리 합치기도 하고 나누려 했을 때, 막상 잘 생각이 나질 않는다. 내가 알고 있는 방법을 정리해본다.
[더 읽기]