Analisis Numerik dan Kategorikal dalam Plotting
Dalam analisis statistik, memiliki kemampuan untuk memvisualisasikan data menjadi sangat penting. Salah satu cara yang efektif adalah dengan menggunakan plotting. Dalam artikel ini, kita akan membahas tentang plotting dengan menggunakan Python dan library seaborn.
Penggunaan Dataset "tips"
Dataset "tips" adalah dataset yang menyimpan informasi tentang total bill, tip, gender, smoker status, day of the week, time of the day, dan jumlah orang yang memesan. Kita dapat melihat dataset ini dengan menggunakan fungsi head() seperti berikut:
import seaborn as sns
import pandas as pd
tips = sns.load_dataset("tips")
tips.head()
Plotting dengan Seaborn
Dalam plotting, kita dapat menggunakan library seaborn untuk membuat plot yang lebih menarik. Salah satu contoh adalah dengan membuat scatter plot antara variabel "total_bill" dan "tip". Kita dapat melakukan ini dengan menggunakan fungsi scatterplot() seperti berikut:
sns.scatterplot(data=tips, x="total_bill", y="tip")
Kita juga dapat menambahkan warna ke plot dengan menggunakan parameter hue. Misalnya, kita dapat membuat plot yang membagi data menjadi beberapa warna berdasarkan variabel "time" seperti berikut:
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="time")
Kita juga dapat menambahkan gaya marker ke plot dengan menggunakan parameter style. Misalnya, kita dapat membuat plot yang membagi data menjadi beberapa warna dan marker berbeda untuk setiap level "time" seperti berikut:
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="time", style="time")
Penggunaan Variabel Numerik
Jika variabel yang kita gunakan adalah numerik, maka plot akan menggunakan warna yang berbeda untuk setiap level. Kita dapat melihat contoh ini dengan membuat plot antara "total_bill" dan "tip" dengan menggunakan parameter hue seperti berikut:
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size")
Penggunaan Variabel Kategorikal
Jika variabel yang kita gunakan adalah kategorikal, maka plot akan menggunakan warna yang berbeda untuk setiap level. Kita dapat melihat contoh ini dengan membuat plot antara "total_bill" dan "tip" dengan menggunakan parameter hue seperti berikut:
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="day")
Penggunaan Palette
Kita juga dapat menambahkan palette warna ke plot dengan menggunakan parameter palette. Misalnya, kita dapat membuat plot yang membagi data menjadi beberapa warna berbeda untuk setiap level "size" seperti berikut:
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="size", palette="deep")
Penggunaan relplot()
relplot() adalah fungsi yang memungkinkan kita membuat plot dengan menggunakan FacetGrid. Kita dapat melihat contoh ini dengan membuat plot antara "total_bill" dan "tip" dengan menggunakan parameter col untuk menentukan kolom, hue untuk menentukan warna, dan style untuk menentukan gaya marker seperti berikut:
sns.relplot(data=tips, x="total_bill", y="tip", col="time", hue="day", style="day", kind="scatter")
Dalam artikel ini, kita telah membahas tentang plotting dengan menggunakan Python dan library seaborn. Kita dapat membuat plot yang lebih menarik dengan menggunakan parameter-parameter seperti hue, style, dan palette. Plotting adalah salah satu cara untuk memvisualisasikan data dan dapat membantu kita dalam analisis statistik.