Scatter plot adalah visualisasi persebaran titik-titik data yang setiap titiknya berada di koefisien variabel x dan y. Garis tengah dalam visualisasi regresi merepresentasikan line of best fit, yaitu garis yang menjelaskan tren dari persebaran data.

Pada artikel ini, kita akan membahas cara membuat visualisasi Scatter plot dengan Microsoft Excel dan menganalisis hasilnya.

Data

Data yang digunakan pada portofolio berasal dari https://www.kaggle.com/datasets/toramky/automobile-dataset. Langkah pertama adalah merapikan data, yaitu menggabungkan beberapa kolom menjadi satu.

Membuat Visualisasi Scatter Plot

Setelah merapikan data, kita memulai membuat visualisasi Scatter plot dengan Excel. Cara membuatnya adalah sebagai berikut:

  1. Pilih data yang akan dirapihkan
  2. Klik kolom "A" -> Data -> Text to Columns
  3. Copy variable yang akan kita uji (Scatter diagram dan Engine-size) pada lembar ke-2
  4. Klik Price-> Insert -> Scatter
  5. Klik Desain -> pilih format diagram
  6. Merapihkan posisi titiknya agar tampilan lebih rapih dengan cara: klik kanan pada diagram (angka vertical/horizontal) -> format axis ->axis option -> pada pilihan minimum kita ketik angka telah ditentukan.
  7. Hasilnya

Analisis Hasil

Dari Scatter Diagram antara Engine-size dan Price, terlihat bahwa ada hubungan linier antara Engine-size dan Price, dimana semakin tinggi engine-size semakin tinggi pula pricenya. Hubungannya dapat dikatakan kuat positif melalui hasil korelasi sebesar 0,704202.

Dengan demikian, kita dapat mengetahui bahwa Engine-size dan Price memiliki hubungan linier yang positif.

Membuat Visualisasi Scatter Plot lainnya

Kita juga dapat membuat visualisasi Scatter plot antara Highway-mpg dan Price. Caranya sama seperti Scatter diagram antara Engine-size dan Price, hanya dibedakan dengan mengcopy variable saja, yaitu copy variable Highway-mpg dan Price.

Dari Scatter Diagram antara Highway-mpg dan Price, terlihat bahwa ada hubungan linier antara Highway-mpg dan Price, dimana semakin tinggi highway-mpg semakin rendah pricenya. Hubungannya dapat dikatakan kuat negatif melalui hasil korelasi sebesar 0,686222.

Dengan demikian, kita dapat mengetahui bahwa Highway-mpg dan Price memiliki hubungan linier yang negatif.

Rumus Scatter Plot

Rumus Scatter plot adalah sebagai berikut:

  • Rata-rata Engine-size: =AVERAGE(range of Engine-size)
  • Rata-rata Price: =AVERAGE(range of Price)
  • R2: =SQRT(cell value of R2)
  • R: =sqrt(R2)

Dengan menggunakan rumus-rumus di atas, kita dapat mengetahui nilai rata-rata dan korelasi antara Engine-size dan Price.

Kesimpulan

Pada artikel ini, kita telah membahas cara membuat visualisasi Scatter plot dengan Microsoft Excel dan menganalisis hasilnya. Dalam proses analisis, kita menemukan bahwa ada hubungan linier antara Engine-size dan Price yang positif, serta antara Highway-mpg dan Price yang negatif.

Dengan demikian, kita dapat menggunakan rumus-rumus di atas untuk menghitung nilai rata-rata dan korelasi antara variabel-variabel tersebut.