R프로그래밍으로 막대그래프를 그리면서, 선을 이용하여 연결선을 이어 데이터를 강조하고 싶을 때, ggrepel
패키지를 사용하고 있다. 그냥 직선으로 할 수도 있지만, 아래 그림처럼 약간 꺾은선으로 이어서할 수도 있다. 기능을 하나씩 추가하면서 살펴보려 한다.
R프로그래밍으로 간단한 간트차트(Gantt Chart) 만들기
ggplot2
패키지의 geom_crossbar
함수는 중앙값 또는 평균과 같은 중심 경향을 보여주는 막대를 포함하여 범위를 시각화하는 데 유용하다. 하지만, 용도와 다르게 아래와 같이 간트차트(Gantt Chart)를 만드는 도구로 사용해 볼 예정이다. 간트차트는 주로 프로젝트 관리에서 작업 일정과 진행 상황을 시각적으로 표현하는 도구로, 작업의 시작 및 종료 시점과 기간을 막대 형태로 보여준다.
R프로그램으로 버블차트 그리기
버블차트(Bubble Chart)는 데이터 시각화의 한 형태로, 세 가지 변수의 관계를 동시에 표현할 수 있는 그래프이다. 일반적인 X,Y좌표만을 이용한 스캐터 플롯(scatter plot)과 유사하지만, 추가로 각 데이터 포인트의 크기를 나타내기 위해 원(bubble)의 크기를 사용한다. 그래서 버블 차트는 특히 다차원 데이터를 시각화할 때 유용하다.
[더 읽기]여러 그래프를 하나의 대시보드로 만들기
R프로그래밍으로 대시보드 이미지를 만들 수 있다. 터치나 클릭도 하면서 보는 인터렉티브한 대시보드는 아니지만, patchwork
패키지를 사용하면 아래와 같이 막대그래프, 원그래프, 꺾은선그래프를 하나의 대시보드로 쉽게 구성할 수 있다. 그 방법을 간단하게 정리해본다.
R프로그램으로 도넛차트 그리기
도넛차트를 그리기 위해 제공되는 ggplot2
함수는 사실상 없다. 약간의 편법같이 느껴질 수 있는데, 누적막대그래프를 그려놓고 coord_polar
함수를 사용하여 x축 혹은 y축 기준으로 구부려 만든다고 생각하면 편하다. 아래 그래프는 22대 총선 투표율을 간단하게 도넛차트로 만든 예시이다.
ggplot 그래프에 색상 적용법(viridis, brewer scales)
그래프를 만들 때 구도를 정하는데도 시간이 많이 걸리지만, 어떤 색상을 사용할지 고민 하는 시간이 훨씬 더 많은 편이다. 왜냐하면, 색상을 어떤 걸 사용하는지에 따라 촌스러운 그래프가 될 수도, 아니면 감각적인 그래프로 보일 수도 있기 때문이다. 그래서 이런 부분에 시간을 할애하는 편인데, 디자인에 조예가 깊지 않아 결과물에는 크게 영향을 미치지 않는다. 그런 나에게 색상선정 고민을 없애주는 함수가 있어 간단하게 정리해본다. 사용한 프로그램은 R프로그램이며, ggplot2
패키지를 사용하였다.
실폭도로 데이터를 이용하여 도로지도 그리기
시군구, 읍면동 등의 경계데이터를 받아 지도를 그리는 건 해봤으니, 이번에는 도로를 그려보는 걸 해볼 예정이다. 필요한 프로그램은 R프로그램으로 할 것이고, 패키지는 sf
, tidyverse
정도면 가능하다. 대략 아래의 이미지처럼 하나의 시군구를 선택해서 혹은 범위를 조정해서 그릴 부분을 정할 수 있다.
R프로그래밍 - 불필요한 지도 영역 제거하기
서울시 선거구지도를 그려봤으니, 경기도 선거구까지만 지도로 표현해보려고 했는데, 몇가지 문제가 생겼다. 안산시 선거구를 그릴때, 행정동 정보를 이용해서 그룹화해서 경계를 병합하여 아래 그림과 같이 그릴 수 있었다. 그런데 좌측하단에 작은 섬이 하나 포함되면서 전체적으롤 지도가 넓은지역을 포함해야 하다보니 공백영역이 많아 보여 효율적인 표현이 어려웠다.
[더 읽기]국회위원선거 서울특별시 선거구 지도 만들기
R프로그래밍 언어의 ggplot2
, sf
패키지 등을 이용해서 제22대 총선 선거구 지도를 그려볼까한다. 전국지도를 다 그릴수는 없고, 서울특별시만 대상으로 데이터를 가공해서 그려보았다. 디자인은 최근 여론조사들을 참고했고, 왼쪽에는 전체 서울시의 지도를, 오른쪽은 특정 선거구를 그려보았다.
(ggplot2) 래스터(Raster) 데이터로 지도 그리기
지도 데이터는 벡터(Vector) 또는 래스터(Raster) 데이터로 나뉜다. 이 포스팅에서는 래스터(Raster) 데이터를 이용하여 지도를 그려볼까한다. 래스터(Raster) 데이터 모델은 셀의 연속 그리드로 공간을 나타낸다. raster 데이터를 읽고 활용할 수 있는 패키지는 대표적으로 terra
와 raster
정도 있다. 각각 함수명이나 파라메터 사용법 정도 다를 뿐 원리는 동일하다. 하나씩 알아보려 한다.