Exploring plt.scatter(): Membuat Grafik Scatter dengan Variabel Lebih dari Dua
plt.scatter() adalah salah satu fungsi paling powerful dan flexible dalam matplotlib, sebuah library Python untuk visualisasi data. Fungsi ini dapat digunakan untuk membuat grafik scatter dengan lebih dari dua variabel.
Mengenal plt.scatter() Lebih Dekat
plt.scatter() menawarkan kemampuan-kemampuan lain untuk mempersonalisasi grafik scatter. Dalam bagian ini, kita akan menelusuri cara menggunakan NumPy dan plt.scatter() untuk membuat grafik scatter dengan dua wilayah yang berbeda dalam grafik yang sama.
Contoh: Membuat Grafik Scatter dengan Variabel Lebih dari Dua
Seorang penggemar bus yang ingin mengumpulkan data telah mengumpulkan waktu kedatangan bus di halte busnya selama enam bulan. Ia menemukan bahwa waktu sebenarnya tidak sesuai dengan waktu timetabled, melainkan memiliki distribusi normal sekitar waktu tersebut.
Grafik di atas menunjukkan kemungkinan relatif bus tiba di setiap menit dalam satu jam. Distribusi ini dapat diwakili menggunakan NumPy dan np.linspace().
Kita telah menciptakan dua distribusi normal yang terkait pada 15 menit dan 45 menit, serta menjumlahkan mereka. Kita juga mengatur waktu tiba bus ke nilai 1 dengan membagi oleh nilai maksimum.
Kita dapat sekarang simulasi kedatangan bus menggunakan distribusi ini. Untuk melakukannya, kita dapat menciptakan waktu tiba bus dan kemungkinan relatif acak menggunakan module built-in Python, yaitu random.
Mengustomisasi Grafik Scatter
plt.scatter() menawarkan kemampuan-kemampuan lain untuk mempersonalisasi grafik scatter. Kita dapat mengustomisasi ukuran marker, warna, dan bentuk marker menggunakan parameter s, c, dan marker.
Contoh di atas menunjukkan bahwa kita dapat membuat grafik scatter dengan variasi ukuran marker, warna, dan bentuk marker yang berbeda.
Menggunakan NumPy untuk Mempersonalisasi Grafik Scatter
plt.scatter() juga dapat digunakan dengan NumPy untuk mempersonalisasi grafik scatter. Kita dapat menggunakan NumPy untuk mengubah data menjadi bentuk yang lebih sesuai untuk diplot.
Contoh di atas menunjukkan bahwa kita dapat membuat grafik scatter dengan dua wilayah yang berbeda dalam grafik yang sama, yaitu wilayah dalam dan wilayah luar.
Ringkasan Input Parameter
plt.scatter() memiliki beberapa input parameter yang digunakan untuk mempersonalisasi grafik scatter. Berikut adalah ringkasan input parameter yang paling penting:
- x dan y: Variabel utama yang dapat diwakili oleh array-like data types, seperti list atau NumPy arrays.
- s: Ukuran marker.
- c: Warna marker.
- marker: Bentuk marker.
- cmap: Peta warna untuk menyesuaikan nilai dengan warna.
- alpha: Transparansi marker.
Itu semua input parameter yang tersedia dalam plt.scatter(). Kita dapat mengakses daftar lengkap input parameter dari dokumentasi.
Kesimpulan
Sekarang kita telah memahami cara membuat dan mempersonalisasi grafik scatter menggunakan plt.scatter(), kita siap untuk mulai praktik dengan dataset dan contoh yang kita miliki. Fungsi ini sangat versatile dan memberikan kemampuan kita untuk menjelajahi data dan presentasikan hasilnya dalam bentuk yang jelas.
Dalam tutorial ini, kita telah belajar:
- Membuat grafik scatter menggunakan plt.scatter()
- Menggunakan input parameter yang dibutuhkan dan opsional
- Mempersonalisasi grafik scatter untuk plot dasar dan lanjutan
- Menyajikan lebih dari dua dimensi dengan plt.scatter()
Kita dapat mendapatkan hasil terbaik dengan menggunakan plt.scatter() dengan belajar lebih lanjut tentang fitur-fitur dalam Matplotlib dan menggunakan NumPy.