Grafik scatter plot adalah salah satu jenis grafik yang paling umum digunakan dalam visualisasi data. Tujuan utama dari grafik ini adalah untuk menampilkan hubungan antara dua variabel numerik dengan menggunakan titik-titik yang tersebar di atas bidang koordinat. Namun, tidak semua scatter plot memiliki ukuran dan luas permukaan yang sama, sehingga dapat mempengaruhi bagaimana grup-grupnya dipahami.

Dalam beberapa kasus di mana warna tidak dapat digunakan (seperti dalam cetak), bentuk mungkin menjadi opsi terbaik untuk membedakan antara grup. Bentuk-bentuk di atas telah diskala untuk menggunakan jumlah tinta yang sama.

Ketiga Variabel Numerik

Untuk variabel ketiga yang memiliki nilai numerik, encoding umum datang dari perubahan ukuran titik. Grafik scatter plot dengan ukuran titik berdasarkan variabel ketiga sebenarnya mempunyai nama yang lebih spesifik, yaitu grafik bubble. Titik-titik yang lebih besar menunjukkan nilai yang lebih tinggi. Diskusi detail tentang bagaimana grafik bubble seharusnya dibangun dapat dibaca dalam artikel tersendiri.

Warna juga dapat digunakan untuk menggambarkan nilai numerik sebagai opsi lainnya. Sebagai ganti menggunakan warna yang berbeda untuk titik-titik seperti pada kasus kategori, kita ingin menggunakan rangkaian warna kontinu, sehingga contohnya, warna yang lebih gelap menunjukkan nilai yang lebih tinggi.

Perlu diingat bahwa, untuk ukuran dan warna, legenda sangat penting untuk interpretasi variabel ketiga, karena mata kita kurang mampu membedakan ukuran dan warna sebagaimana posisi.

Menggunakan Annotation dan Warna

Jika Anda ingin menggunakan grafik scatter plot untuk menampilkan insinyur, maka dapat membantu dengan menggarisbawahi titik-titik yang lebih penting melalui penggunaan annotation dan warna. Membuat titik-titik yang tidak penting menjadi lebih gelap membuat titik-titik lainnya tampak lebih jelas, dan memberikan referensi untuk membandingkan titik-titik lainnya.

Grafik Scatter Map

Jika dua variabel dalam grafik scatter plot adalah koordinat geografi – lintang dan bujur – maka kita dapat meng overlay titik-titik pada peta untuk mendapatkan grafik scatter map (aka dot map). Hal ini dapat sangat berguna jika konteks geografis sangat penting untuk menarik kesimpulan.

Grafik Heatmap

Sebagai catatan di atas, grafik heatmap dapat menjadi alternatif yang baik terhadap grafik scatter plot jika ada banyak titik data yang perlu diplot dan densitas titik-titik tersebut menyebabkan masalah overplotting. Namun, heatmap juga dapat digunakan dalam cara yang sama untuk menampilkan hubungan antara variabel jika salah satu atau kedua variabel bukan numerik. Jika kita mencoba memplot nilai discrete dengan grafik scatter plot, semua titik-titik pada level yang sama akan terlihat seperti garis lurus.

Grafik Connected Scatter

Jika variabel ketiga yang ingin ditambahkan ke dalam grafik scatter plot menunjukkan timestamps, maka satu jenis grafik yang dapat dipilih adalah grafik connected scatter. Sebagai ganti memodifikasi bentuk titik untuk menunjukkan tanggal, kita menggunakan garis-garis untuk menghubungkan observasi-observasi sebagaimana. Hal ini dapat membuatnya lebih mudah untuk melihat bagaimana dua variabel utama tidak hanya berelasi dengan satu sama lain, tapi juga bagaimana hubungan tersebut berubah seiring waktu.

Alat Visualisasi

Grafik scatter plot adalah grafik dasar yang seharusnya dapat dibuat oleh alat visualisasi apapun atau solusi. Perhitungan garis trend linear dasar juga umum sebagai opsi, serta pewarnaan titik-titik menurut level variabel ketiga kategori. Opssi lain, seperti garis trend non-linear dan encoding nilai variabel ketiga dengan bentuk, namun tidak begitu umum ditemukan. Namun, bahkan tanpa opsi-opsi tersebut, grafik scatter plot masih dapat menjadi chart type yang sangat berguna untuk digunakan jika Anda perlu meneliti hubungan antara variabel numerik dalam data.

Grafik scatter plot adalah salah satu dari banyak jenis grafik yang dapat digunakan dalam visualisasi data. Dengan menggunakan berbagai opsi dan fitur, Anda dapat membuat grafik yang lebih informatif dan memudahkan Anda untuk menarik kesimpulan dari data.