Hubungan Linear dan Outlier dalam Analisis Data
Dalam analisis data, hubungan linear antara variabel dependen dan independen adalah suatu konsep yang penting. Dalam artikel ini, kita akan membahas tentang hubungan linear, outliers, dan bagaimana kedua hal itu mempengaruhi hasil analisis.
Hubungan Linear Kuat
Dalam diagram scatterplot, jika semua titik data sangat ketat berkelompok, maka tidak ada outlier yang signifikan. Dalam kasus seperti ini, data menunjukkan hubungan linear kuat. Jika data memiliki beberapa atau banyak outlier yang jauh dari trend line, maka data menunjukkan hubungan linear moderat.
Hubungan Linear Sedang
Jika data memiliki beberapa atau banyak outlier, maka hubungan linear menjadi lemah. Sebaliknya, jika tidak ada outlier dan semua titik data sangat ketat berkelompok, maka hubungan linear kuat.
Outliers
Sebuah outlier adalah titik data yang jauh dari trend line. Jika terdapat beberapa atau banyak outlier, maka hubungan linear menjadi lemah. Sebaliknya, jika tidak ada outlier dan semua titik data sangat ketat berkelompok, maka hubungan linear kuat.
Contoh
Mari kita lihat contoh bagaimana hubungan linear dan outliers mempengaruhi hasil analisis. Dalam scatterplot di bawah ini, kita dapat melihat bahwa data memiliki hubungan linear moderat dengan beberapa outlier yang jauh dari trend line.
5090
5092 5094 5096 5105 5111 5123 5135 5147 5161 5179