Dalam analisis prediktif atau hubungan korrelasional antara variabel, plot skalar seringkali digunakan untuk menunjukkan hubungan antara dua variabel. Dalam hal ini, penambahan garis trend pada plot dapat memberikan sinyal tambahan tentang kekuatan hubungan antara dua variabel tersebut, serta apakah terdapat titik yang tidak biasa dan mempengaruhi perhitungan garis trend.

Kategorikal Third Variable

Modifikasi umum plot skalar adalah penambahan variabel ketiga. Nilai variabel ketiga dapat di-encode dengan cara mengubah bagaimana titik-titik tersebut dipresentasikan. Untuk variabel ketiga yang menunjukkan nilai kategori (seperti wilayah geografi atau gender), encoding umumnya melalui warna titik. Dengan memberikan warna unik untuk setiap titik, dapat membantu menunjukkan anggota masing-masing titik ke dalam kelompok tertentu.

Contoh: Pada plot skalar di atas, warna kuning menunjukkan bahwa Fersons (Ferson) biasanya lebih lebar namun lebih pendek untuk diameter yang sama. Opisi lainnya untuk encoding variabel ketiga adalah melalui bentuk. Namun, perlu diperhatikan bahwa bentuk-bentuk tersebut dapat memiliki ukuran dan luas permukaan yang berbeda, sehingga mempengaruhi cara masyarakat memperkenalkannya.

Variabel Numerik Third

Untuk variabel ketiga yang memiliki nilai numerik, encoding umumnya melalui perubahan ukuran titik. Plot skalar dengan ukuran titik yang didasarkan pada variabel ketiga sebenarnya dikenal sebagai chart "bubble". Ukuran titik yang lebih besar menunjukkan nilai yang lebih tinggi. Diskusi lebih rinci tentang cara membuat chart bubble dapat dibaca dalam artikel sendiri.

Selain itu, warna juga dapat digunakan untuk mewakili nilai numerik sebagai alternatif lain. Dalam hal ini, kita ingin menggunakan rangkaian warna yang kontinu sehingga warna yang lebih gelap menunjukkan nilai yang lebih tinggi. Perlu diingat bahwa, baik ukuran dan warna, legenda adalah sangat penting untuk interpretasi variabel ketiga, karena mata manusia kurang mampu membedakan ukuran dan warna dengan mudah.

Highlight menggunakan Annotation dan Warna

Jika kita ingin menggunakan plot skalar untuk menampilkan insights, dapat membantu menunjukkan titik-titik yang menarik melalui penggunaan annotation dan warna. Meredupkan titik-titik yang tidak penting membuat titik-titik lainnya lebih tampak, serta memberikan rujukan untuk membandingkan titik-titik lainnya.

Scatter Map

Ketika dua variabel pada plot skalar adalah koordinat geografi – lintang dan bujur – kita dapat menempatkan titik-titik tersebut di atas peta untuk mendapatkan scatter map (atau dot map). Dalam hal ini, dapat membantu ketika konteks geografis sangat penting untuk menarik insights dan dapat dikombinasikan dengan encoding variabel ketiga lainnya seperti ukuran dan warna.

Contoh: Scatter map yang terkenal adalah peta kejadian kolera 1854 oleh John Snow, menunjukkan bahwa kasus kolera (baris hitam) berpusat di sekitar sebuah sumur air pada Jalan Broad Street (titik tengah). Sumber: Wikimedia Commons

Heatmap

Sebagaimana disebutkan di atas, heatmap dapat menjadi alternatif yang baik untuk plot skalar ketika terdapat banyak titik data yang perlu dipresentasikan dan kepadatan mereka menyebabkan masalah overplotting. Namun, heatmap juga dapat digunakan dalam cara yang serupa untuk menunjukkan hubungan antara variabel ketika salah satu atau kedua variabel bukan kontinu dan numerik. Jika kita mencoba mempresentasikan nilai diskret dengan plot skalar, semua titik dari level yang sama akan berada pada garis lurus. Heatmap dapat mengatasi overplotting melalui penggumpulan nilai menjadi kotak-kotak hitam.

Connected Scatter Plot

Jika variabel ketiga yang kita ingin tambahkan pada plot skalar menunjukkan timestamps, maka chart type yang kita dapat pilih adalah connected scatter plot. Sebagai gantinya, kita menggunakan garis-garis untuk menghubungkan titik-titik tersebut daripada membuat garis lurus. Plot skalar dengan titik-titik yang terhubung dapat membantu menunjukkan hubungan antara variabel lebih jelas.

Trend Line pada Plot Skalar: Membantu Menjelaskan Hubungan Variabel

Dalam kesimpulan, penambahan garis trend pada plot skalar dapat membantu menjelaskan hubungan antara dua variabel serta menunjukkan titik-titik yang tidak biasa. Selain itu, encoding variabel ketiga melalui warna dan ukuran dapat membantu mempresentasikan insights lebih jelas.