Scatter plot adalah sebuah grafik yang biasa digunakan untuk melihat suatu pola hubungan antara 2 variabel. Untuk bisa menggunakan scatter plot, skala data yang digunakan haruslah skala interval dan rasio.

Contoh grafik scatter plot bisa dilihat seperti gambar dibawah ini :

Gambar 1. Scatter Plot

Gambar 1 adalah scatter plot antara prosentase kepemilikan mobil pada suatu kota di Amerika Serikat dengan pendapatan rumah tangga. Gambar 1 menunjukkan bahwa peningkatan prosentase kepemilikan mobil juga diikuti oleh pendapatan rumah tangga.

Jika scatter plot membentuk pola yang menyerupai garis lurus seperti pada gambar 2, mengindikasikan bahwa ada hubungan yang erat antara variabel 1 dengan variabel 2. Hubungan yang membentuk garis lurus biasa disebut dengan hubungan linier. Hubungan linier bisa membentuk hubungan yang positif dan negatif.

Gambar 2. Keeratan Hubungan

Gambar 3. Hubungan Positif

Jika plot yang terjadi seperti pada gambar 3, maka variabel 1 dan variabel 2 menunjukkan hubungan yang positif. Peningkatan yang terjadi pada variabel 1 juga diikuti peningkatan pada variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 juga mengalami penurunan.

Bahasa mudahnya adalah kalau naik ya naik semua dan kalau turun ya turun semua.

Gambar 3. Hubungan Negatif

Jika plot yang terjadi seperti pada gambar 4, maka variabel 1 dan variabel 2 menunjukkan hubungan yang negatif. Peningkatan yang terjadi pada variabel 1 diikuti penurunan oleh variabel 2. Dan jika variabel 1 mengalami penurunan, variabel 2 akan mengalami peningkatan.

Bahasa mudahnya adalah kalau satunya naik yang lain turun dan kalau satunya turun maka yang lain akan naik.

Gambar 4. Hubungan Negatif

Jika plotnya menyebar seperti pada gambar 5, maka bisa disimpulkan bahwa hubungan antara variabel 1 dengan variabel 2 sangatlah kecil Atau tidak ada hubungan.

Hubungan non-liner

Selain hubungan linier, kita juga bisa melihat hubungan yang lain seperti hubungan non linier.

Gambar 6. Hubungan Non Linier

Jika plot yang terjadi membentuk curva seperti gambar 6, maka diindikasikan terjadi hubungan non linier antara 2 variabel.

Scatter Plot juga bisa digunakan untuk melihat penyebaran data. Apakah data menyebar ataukah mengumpul disuatu area.

Gambar 7. Data Menyebar

Gambar 8. Data Mengumpul di Suatu Area

Scatter plot juga bisa menunjukkan kita adanya outlier. Outlier adalah data yang ekstrim yang kemungkinan dihasilkan dari situasi yang tidak normal. Kebanyakan peneliti akan mengambil data outlier ini untuk diteliti lebih lanjut.

Menentukan Nilai Rata-Rata

Dalam analisis statistik, nilai rata-rata dapat digunakan untuk mengetahui trend dan pola hubungan antara 2 variabel. Dalam kasus ini, kita menggunakan rumus =AVERAGE() di Microsoft Excel untuk mendapatkan nilai rata-rata pada 2 variabel data yaitu Engine-size dan juga Price.

Menghitung Nilai R

Nilai R dapat ditemukan dari nilai R2 dengan menggunakan fungsi =SQRT() untuk mengembalikan akar kuadrat. Jika semua langkah telah dilakukan maka akan mendapatkan hasil diagram scatter seperti gambar di bawah ini.

Dengan membuat diagram diatas bisa kita dapatkan :

  • Rata-rata dari variable data Highway-mpg adalah 30,75122
  • Rata-rata dari variable data Price adalah 13207,13
  • Nilai R2 adalah 0,4709
  • Nilai R adalah 0,686222

Dapat disimpulkan, semakin tinggi nilai pada variable Highway-mpg maka akan semakin rendah nilai variable Price, hubungan kedua variable tersebut dapat dikatakan kuat negatif dengan nilai korelasi yaitu 0,686222