Scatter Plot: Definisi, Penggunaan, Contoh, dan Tantangan
Scatter plot adalah tipe diagram yang biasanya digunakan untuk memeriksa dan menampilkan hubungan visual antara variabel. Nilai variabel-variabel tersebut diwakili oleh titik-titik. Letak titik-titik pada sumbu vertikal dan horizontal akan memberikan informasi nilai data point terkait, sehingga scatter plot menggunakan koordinat Kartesius untuk menampilkan nilai variabel dalam set data.
Ringkasan
Scatter plot adalah diagram yang digunakan untuk memeriksa dan menampilkan hubungan visual antara variabel. Diagram ini juga dikenal sebagai scattergram, scatter graph, atau scatter chart. Titik-titik atau dot pada scatter plot mewakili nilai individual setiap data point dan memungkinkan identifikasi pola ketika melihat data secara keseluruhan. Penggunaan yang paling umum dari scatter plot adalah untuk menampilkan hubungan antara dua variabel dan memeriksa sifat hubungan tersebut. Hubungan-hubungan yang diamati dapat berupa positif, negatif, tidak linear, atau linear, serta kuat atau lemah.
Penggunaan dan Manfaat Scatter Plot
- Menampilkan hubungan antara dua variabel Penggunaan paling umum dari scatter plot adalah untuk menampilkan hubungan antara dua variabel dan memeriksa sifat hubungan tersebut. Hubungan-hubungan yang diamati dapat berupa positif, negatif, tidak linear, atau linear, serta kuat atau lemah.
- Identifikasi relasi korrelasional Penggunaan lain dari scatter plot adalah bahwa mereka memungkinkan identifikasi relasi korrelasional. Scatter plot biasanya memiliki variabel bebas pada sumbu horizontal dan variabel tergantung pada sumbu vertikal. Diagram ini memungkinkan pengamatan untuk mengetahui atau menduga nilai vertikal yang mungkin, jika ada informasi tentang nilai horizontal.
- Identifikasi pola data Identifikasi pola data juga dapat dilakukan dengan scatter plot. Data point dapat disebutkan berdasarkan seberapa dekat nilainya, dan ini juga memungkinkan identifikasi titik-titik outlier ketika ada celah data.
Tantangan Dalam Menggunakan Scatter Plot
Dua masalah yang paling umum ditemukan dalam menggunakan scatter plot adalah overplotting dan interpretasi kausalitas sebagai korrelasi. Overplotting terjadi saat terlalu banyak data point untuk diplot, sehingga data point berbeda dapat saling menutup. Hal ini dapat membuat identifikasi relasi antara variabel menjadi sulit. Perlu diingat bahwa korrelasi tidak berarti perubahan yang diamati pada satu variabel adalah penanggung jawab perubahan pada variabel lain. Korrelasi tidak boleh diinterpretasikan sebagai kausalitas. Kausalitas berarti bahwa suatu kejadian terjadi dan akan memiliki dampak pada hasil.
Sumber Daya Tambahan
Untuk membantu Anda menjadi analis keuangan dunia dan meningkatkan karier Anda hingga potensi penuh, sumber daya tambahan ini akan sangat bermanfaat:
- Cara Membaca Diagram Garis Saham
- Diagram Hockey Stick
- Serial Correlation
- Vertical Line Charting
- Kursus Dashboard dan Data Visualization
Lihat semua sumber daya ilmu data.