tidyr::pivot_longer 사용법 - 피벗테이블 표로 변환하기

데이터의 형식은 다양하다. 피벗형태일수도 있고, 그냥 테이블과 같은 표형식일 수도 있고, 아니면 한 컬럼에 여러가지 항목들이 구분자로 뭉쳐져 있을 수도 있다. 그 데이터들을 본인이 분석하기 편한 데이터로 만들기 위해 분해하고 다시 조립하는 과정이 있는데, 그중에 피벗형태의 데이터를 테이블 형태로 변경하는 tidyr::pivot_longer 를 살펴보고자 한다.

[더 읽기]
r  ggplot2 

R 그래프 - 21년 교통사고 통계를 이용한 막대그래프(연령층별/성별)

도로교통공단의 21년 교통사고 사망자 통계를 가지고 막대그래프로 만들어봤다. 흔히 성별로 그룹핑된 데이터는 좌우로 수평막대그래프 펼쳐 그려서 데이터를 표현한다. 잘 그리지 않는 유형이어서, 조금은 오래걸린거 같다. 색상이 너무 대비되는 걸 선택하면 약간 막대그래프끼리 어긋나보이는 착시(?) 현상이 있어서 비슷한 색감으로 채도만 조금 조정해봤다. 그래프 데이터 만들기 여기를 클릭해서 들어간 사이트에서 엑셀파일을 받을 수 있다. 도로교통공단에서 제공된 자료이며, 아래에 보듯이 엑셀파일 내에는 연령층별 남녀별 사망자/중상자/경상자 등의 데이터를 볼 수 있다. 다운받았다면, 엑셀파일을 read_excel 함수로 읽어준다. [더 읽기]

reorder 로 ggplot2 막대그래프 정렬하기

ggplot 으로 막대그래프를 그리는 건 2줄 코딩이면 만들 수 있다. 다만, 그전에 데이터를 이해하고 그래프를 그리기 적합한 구조로 만들어놓는 것이 오래걸린다. 오늘은 건강보험심사평가원 - 전국 병의원 및 약국 현황 정보를 이용해서 아래와 같은 간단한 막대그래프를 그려보고 높은순으로 내림차순까지 해볼까 한다.

[더 읽기]

github 브랜치(branch) 병합 방법

git 을 정말 오랫동안 사용하고 있긴한데, 나는 branch 기능은 몬가 어렵고 잘못될까봐 잘안쓰는 경향이 있다. 그래도 잘만 사용하면, 소스의 버전을 여러개 만들어서 건별 이슈를 대응하거나 테스트계 등을 구현할때 편리하게 사용할 수 있다.

git branch 기능은 실수를 하게 되면 돌이키기가 좀 어렵다보니, 별도의 저장소를 하나 만들어서 테스트와 훈련을 열심히 하고난 후에 실제 프로젝트에 적용해보시길 권한다. 하더라도 소스 백업 등 zip 으로 묶어 별도 저장하고나서 진행하는 것도 하나의 방법이다.

[더 읽기]
git 

파이썬(python) 폴더 생성 방법

파이썬은 이제 정말 대중화된 프로그래밍 언어가 되었다. 고수준의 퍼포먼스를 요하는 프로세스나 업무가 아닌이상 단순한 작업을 자동화하는 데에는 이만한 프로그램이 없는 것 같다. 나 역시도 파이썬을 가지고 뭐 어려운 프로그래밍을 하진 않고, 리눅스서버에서 간단히 파일/폴더생성이나 웹크롤링 등 패턴화된 작업을 프로그래밍하는 수준이다.

[더 읽기]
python 

R 그래프 - geom_bump 를 이용한 선그래프

R 패키지중에 ggbump 라고, 일반적인 선그래프와는 달리 랭킹간 변화추이를 보여주기 좋은 패키지가 있다. 아래 그림처럼 부드러운 곡선으로 라인으로 이어져 있어서 색다른 그래프를 만들 수 있다. tidytuesday 데이터를 활용해서 한번 그려본 차트이며, 자세한 설명과 구현방법은 github 페이지를 참고하시기 바란다.

[더 읽기]

Hugo 버전 업그레이드 방법

docker 를 이용해서 hugo 개발환경을 구성중인데, golang 과 데비안os 를 최신 이미지로 받더라도, hugo 버전이 항상 v0.80 으로 설치되고 있었다. 방법이 있나 해서 찾아보니, hugo github 에서 release 되는 버전을 직접받아 설치하면 되었다. 짧게 정리해본다.

[더 읽기]
hugo 

Hugo - 기본 문법/구조 이해하기

Hugo 는 웹사이트 프레임워크인데, 블로그를 구축하기에 아주 편하게 되어있다. 기본적으로 아예 맨땅에 헤딩하듯 만들지는 않고, 대부분 구글링하면서 마음에 드는 Hugo 테마를 찾아 사용하면 된다. 그러면 바로 블로그 사이트가 만들어지는 경이로움을 볼 수 있다. 그래도 사용하다보면, 웹사이트의 구성을 조금씩 손을 보고 싶을 때가 있다. 그러면 Hugo의 템플릿 관련 문법을 조금은 알아야 수정을 할 수 있는데, 그 중에서 반복부(looping) 처리하는 로직을 수정할 일이 있어 일부 노하우를 기록해본다.

[더 읽기]

도메인 구매 - 나만의 웹주소를 가져보자

블로그를 만드는 가장 쉬운 방법은 네이버(naver)나 티스토리(tistory)의 블로그 서비스를 이용하는 방법이다. 이와 같은 서비스들은 사용자가 별도서버를 구성할 필요도없고, 블로그 작성에만 신경쓸 수 있도록 블로그 기능을 토탈로 제공하고 있는 블로그 서비스이다. 무료이기 때문에 당연히 사이트 주소가 https://blog.naver.com/xxxx 혹은 https://xxxx.tistory.com/ 와 같이 호스트 서비스명이 붙어있다. 블로그를 좀 오래하다보니, 나만의 웹사이트 주소를 가지고 싶다는 생각이 들었다.

[더 읽기]

R 그래프 - 부채꼴 모양 도넛차트 만들기

도넛차트인데, 각 영역의 길이는 동일하지만 높이를 다르게 표현한 그래프를 그려보고자 한다. 그려놓고 보니 약간 부채꼴 모양이긴해서 제목을 부채꼴 그래프라고 지어봤다. 일반적인 도넛차트를 그리는 방식과 거의 동일한데, 조금 방식이 다르다. geom_col 을 하나의 x좌표값에다가 쌓아놓고 y 축을 기준으로 coord_polar 함수를 사용하는게 아니라, 막대그래프를 쌓지않고 일반적으로 나누어 그리고, x축을 기준으로 coord_polar를 사용할 예정이다. 완성된 그림은 아래와 같다.

[더 읽기]