Membuat Grafik Scatterplot dan Matrix di R
R memungkinkan kita untuk membuat grafik scatterplot yang dapat membantu dalam visualisasi data. Dalam artikel ini, kita akan membahas cara membuat grafik scatterplot dan matrix di R.
Grafik Scatterplot
Grafik scatterplot adalah salah satu jenis grafik yang paling umum digunakan dalam analisis data. Grafik ini digunakan untuk memvisualisasikan hubungan antara dua variabel. Dalam R, kita dapat membuat grafik scatterplot menggunakan fungsi scatterplot() dari paket GGally.
Contoh berikut menunjukkan cara membuat grafik scatterplot di R:
library(GGally)
# Membuat data
x <- rnorm(1000)
y <- rnorm(1000)
# Membuat grafik scatterplot
scatterplot(y ~ x | group)
Dalam contoh di atas, kita menggunakan fungsi scatterplot() untuk membuat grafik scatterplot yang menunjukkan hubungan antara variabel x dan y. Fungsi ini juga memungkinkan kita untuk mengaktifkan atau menonaktifkan legenda dengan cara mengatur argument legend menjadi FALSE.
Selain itu, kita juga dapat mengaktifkan grid di grafik scatterplot dengan cara mengatur argument grid menjadi TRUE, dan menambahkan elipses dengan cara mengatur argument ellipse menjadi TRUE.
scatterplot(x, y,
boxplots = "", # Disable boxplots
grid = FALSE, # Disable plot grid
ellipse = TRUE) # Draw ellipses
Grafik Scatterplot Matrix
Ketika kita memiliki lebih dari dua variabel, maka grafik scatterplot matrix adalah salah satu cara yang paling efektif untuk memvisualisasikan hubungan antara variabel-variabel tersebut. Grafik ini dapat dibuat dengan cara menggunakan fungsi pairs() di R.
Contoh berikut menunjukkan cara membuat grafik scatterplot matrix di R:
library(Fahrenwaldt)
# Membuat data
data(mtcars)
pairs(~disp + wt + mpg + hp, data = mtcars)
Dalam contoh di atas, kita menggunakan fungsi pairs() untuk membuat grafik scatterplot matrix yang menunjukkan hubungan antara variabel disp, wt, mpg, dan hp dari dataset mtcars.
Grafik Scatterplot dengan ggplot2
Ketika kita ingin membuat grafik scatterplot dengan tema yang lebih modern, maka kita dapat menggunakan paket ggplot2. Paket ini memungkinkan kita untuk membuat grafik dengan cara yang lebih flexible dan customizable.
Contoh berikut menunjukkan cara membuat grafik scatterplot dengan ggplot2:
library(ggplot2)
# Membuat data
my_df <- data.frame(x = x, y = y, group = group)
ggplot(my_df, aes(x = x, y = y)) +
geom_point(aes(colour = group)) + # Points and color by group
scale_color_discrete("Groups") + # Change legend title
xlab("Variable X") + # X-axis label
ylab("Variable Y") + # Y-axis label
theme(axis.line = element_line(colour = "black", # Changes the default theme
size = 0.24))
Dalam contoh di atas, kita menggunakan fungsi ggplot() untuk membuat grafik scatterplot yang menunjukkan hubungan antara variabel x dan y. Fungsi ini juga memungkinkan kita untuk mengaktifkan atau menonaktifkan legenda dengan cara mengatur argument colour menjadi nama grup.
Grafik Scatterplot 3D
Ketika kita memiliki tiga variabel, maka grafik scatterplot 3D adalah salah satu cara yang paling efektif untuk memvisualisasikan hubungan antara variabel-variabel tersebut. Grafik ini dapat dibuat dengan cara menggunakan paket scatterplot3d dan rgl.
Contoh berikut menunjukkan cara membuat grafik scatterplot 3D di R:
library(scatterplot3d)
library(rgl)
# Membuat data
set.seed(2)
x <- rnorm(1000)
y <- rnorm(1000)
z <- rnorm(1000)
scatterplot3d(x, y, z, pch = 19, color = "blue")
plot3d(x, y, z,
type = "s", # Type of the plot
radius = 0.1, # Radius of the plot
colkey = FALSE) # Hide the key
Dalam contoh di atas, kita menggunakan fungsi scatterplot3d() untuk membuat grafik scatterplot 3D yang menunjukkan hubungan antara variabel x, y, dan z. Fungsi ini juga memungkinkan kita untuk mengaktifkan atau menonaktifkan grid dengan cara mengatur argument grid menjadi TRUE.
Dalam artikel ini, kita telah membahas cara membuat grafik scatterplot dan matrix di R. Grafik-grafik ini dapat membantu dalam visualisasi data dan memungkinkan kita untuk mendapatkan insights yang lebih baik dari data.