Penelitian Skripsi — Sistem Klasifikasi Citra Digital

Klasifikasi Kematangan
Buah Pinang

Menggunakan metode K-Nearest Neighbor (KNN) dengan ekstraksi fitur warna RGB, HSV, dan tekstur GLCM pada citra digital beresolusi 64×64 px.

1
K Optimal
300
Data Latih
60
Data Uji
17
Jumlah Fitur
K-Nearest Neighbor (KNN)Euclidean DistanceMin-Max Scaling5-Fold Cross Validation

Ringkasan Performa Model

Evaluasi akhir KNN dengan K=1 pada data uji 60 sampel

96.67%
Akurasi

58 dari 60 data uji diklasifikasikan dengan benar

97.06%
Precision

Rata-rata tertimbang ketepatan prediksi per kelas

96.67%
Recall

Rata-rata tertimbang sensitivitas model per kelas

96.65%
F1-Score

Harmonic mean dari precision dan recall

Konfigurasi Model Final

KNN
Algoritma
1
K Optimal
Euclidean
Metrik Jarak
Min-Max
Normalisasi
5-Fold CV
Validasi

Informasi Dataset

300 data latih dan 60 data uji — 4 kelas kematangan buah pinang

Distribusi Dataset

MUDA
Latih75
Uji15
SEDANG
Latih75
Uji15
TUA
Latih75
Uji15
KERING
Latih75
Uji15
Total Latih: 300Total Uji: 60

Deskripsi Kelas

MUDA

Buah pinang muda berwarna hijau, belum mencapai kematangan optimal

SEDANG

Buah pinang setengah matang berwarna kuning-oranye, transisi kematangan

TUA

Buah pinang tua berwarna oranye-merah, siap untuk dipanen

KERING

Buah pinang kering berwarna coklat tua, sudah melewati masa panen

Optimasi Nilai K

Pengujian nilai K ganjil 1, 3, 5, 7, 9 — semua menghasilkan akurasi konsisten 96.67%

Grafik Pengaruh Nilai K terhadap Akurasi
Grafik akurasi pengujian pada nilai K ganjil 1, 3, 5, 7, 9. K=1 dipilih sebagai nilai optimal.
1
K Optimal Terpilih

K=1 terpilih karena menghasilkan akurasi tertinggi (96.67%) pada data uji. Pengujian dilakukan pada K ganjil 1, 3, 5, 7, dan 9.

Akurasi per K (K ganjil 1–9)

1
96.67%
3
96.67%
5
96.67%
7
96.67%
9
96.67%

5-Fold Cross Validation

Validasi generalisasi model dengan 5-fold CV pada nilai K ganjil

Grafik Optimasi K dengan 5-Fold Cross Validation
Optimasi nilai K menggunakan 5-Fold Cross Validation. K=5 memperoleh akurasi CV tertinggi.
97.5%
Akurasi Cross Validation

Rata-rata akurasi 5-fold CV pada nilai K optimal = 5, menunjukkan model generalisasi yang baik.

Detail CV per K

1
97.5%
3
97.0%
5
97.5%
7
97.5%
9
97.5%

Nilai K ditampilkan: ganjil 1, 3, 5, 7, 9 sesuai grafik CV.

Confusion Matrix

Matriks konfusi dan metrik evaluasi per kelas pada data uji

Confusion Matrix K=5
Confusion Matrix — K=5, Dataset Uji 60 Sampel

Matriks Konfusi (K=5)

Aktual ↓ / Pred →MUDASEDANGTUAKERING
MUDA15000
SEDANG01320
TUA00150
KERING00015

Metrik per Kelas

MUDAn=15
100.0%
P
100.0%
R
100.0%
F1
SEDANGn=15
100.0%
P
86.7%
R
92.9%
F1
TUAn=15
88.2%
P
100.0%
R
93.8%
F1
KERINGn=15
100.0%
P
100.0%
R
100.0%
F1

Hasil Prediksi Data Uji

Detail hasil klasifikasi 60 sampel data uji oleh model KNN

60
Total Data Uji
58
Prediksi Benar
2
Prediksi Salah
96.67%
Akurasi

Akurasi per Kelas

MUDA100%
15 benar
SEDANG87%
13 benar2 salah
TUA100%
15 benar
KERING100%
15 benar

Detail Hasil Prediksi

60 data

#Label AsliLabel PrediksiStatus
1MUDAMUDA✓ Benar
2MUDAMUDA✓ Benar
3MUDAMUDA✓ Benar
4MUDAMUDA✓ Benar
5MUDAMUDA✓ Benar
6MUDAMUDA✓ Benar
7MUDAMUDA✓ Benar
8MUDAMUDA✓ Benar
9MUDAMUDA✓ Benar
10MUDAMUDA✓ Benar
11MUDAMUDA✓ Benar
12MUDAMUDA✓ Benar
13MUDAMUDA✓ Benar
14MUDAMUDA✓ Benar
15MUDAMUDA✓ Benar
16SEDANGSEDANG✓ Benar
17SEDANGTUA✗ Salah
18SEDANGSEDANG✓ Benar
19SEDANGTUA✗ Salah
20SEDANGSEDANG✓ Benar
Hal. 1 / 3

Contoh Prediksi pada Citra

Visualisasi 8 sampel data uji beserta label asli dan hasil prediksi

Contoh Prediksi KNN pada Data Uji
8 sampel data uji — judul hijau = prediksi benar, merah = prediksi salah. SEDANG vs TUA adalah satu-satunya kesalahan klasifikasi.

Ringkasan 8 Sampel

Prediksi Benar7/8
Prediksi Salah1/8

Analisis Kesalahan

Satu sampel kelas SEDANG diklasifikasikan sebagai TUA. Hal ini dikarenakan kesamaan visual warna kuning-oranye antara kematangan SEDANG tahap akhir dan TUA tahap awal.

Kelas dalam Sampel

MUDA
SEDANG
TUA
KERING

Analisis Ablasi Fitur

Perbandingan kontribusi fitur warna (RGB+HSV), tekstur (GLCM), dan gabungan

Perbandingan Kontribusi Fitur
Perbandingan akurasi pada tiga skenario fitur — warna saja, tekstur saja, dan gabungan

Hasil Ablasi Fitur

Warna saja (RGB+HSV)

12 fitur

Terbaik
Akurasi98.33%
F1-Score98.33%

Tekstur saja (GLCM)

5 fitur

Akurasi71.67%
F1-Score71.17%

Gabungan (Warna + GLCM)

17 fitur

Akurasi96.67%
F1-Score96.65%

Temuan Utama

Fitur warna (RGB+HSV) memberikan akurasi tertinggi (98.33%), menunjukkan bahwa informasi warna adalah pembeda utama tingkat kematangan buah pinang. Fitur tekstur GLCM saja hanya menghasilkan 71.67%.

Perbandingan Metrik Jarak

Analisis pengaruh pilihan fungsi jarak terhadap akurasi KNN

Perbandingan Metrik Jarak terhadap Akurasi
Perbandingan 4 metrik jarak — semua menghasilkan akurasi identik 96.67%

Perbandingan Metrik Jarak

MetrikAkurasiF1-Score
EuclideanDigunakan
96.67%96.65%
Manhattan
96.67%96.65%
Minkowski
96.67%96.65%
Chebyshev
96.67%96.65%

Kesimpulan

Semua metrik jarak menghasilkan akurasi yang identik (96.67%), menunjukkan bahwa fitur yang diekstraksi memiliki distribusi yang baik dan tidak sensitif terhadap pilihan fungsi jarak. Euclidean dipilih sebagai default.

Formula Metrik Jarak

Euclidean: √Σ(xᵢ - yᵢ)²

Manhattan: Σ|xᵢ - yᵢ|

Minkowski: (Σ|xᵢ - yᵢ|ᵖ)^(1/p)

Chebyshev: max|xᵢ - yᵢ|

Citra Salah Klasifikasi

Analisis 2 citra yang diklasifikasikan salah oleh model

Citra yang Salah Diklasifikasikan
2 citra dari kelas SEDANG yang diklasifikasikan sebagai TUA oleh model KNN (K=5).
2
Citra Salah Klasifikasi

Dari 60 data uji, hanya 2 sampel yang tidak berhasil diklasifikasikan dengan benar (tingkat kesalahan 3.33%).

Detail Kesalahan

SEDANG (Aktual)TUA (Prediksi)

Terjadi sebanyak 2 kali pada data uji

Penyebab:

  • Transisi warna SEDANG→TUA sangat gradual
  • Fitur warna oranye dominan di kedua kelas
  • Batas keputusan KNN pada area ambigus
✓ Performa Keseluruhan

Model berhasil mengklasifikasikan 58 dari 60 sampel uji dengan benar, mencapai akurasi 96.67%.

Dataset Fitur

300 data latih (75/kelas) + 60 data uji — 17 fitur per sampel (RGB, HSV, GLCM)

75
MUDA
75
SEDANG
75
TUA
75
KERING

Fitur Latih (kolom dipilih)

300 sampel

#R MeanG MeanB MeanH MeanS MeanV MeanContrastHomogeneityEnergyCorrelationKelas
1214.711216.595204.52110.28432.072216.855186.6150.7450.6740.981MUDA
2232.135233.465222.1637.73622.699234.170158.1920.7830.7570.970MUDA
3217.563224.972201.01212.26147.375225.015159.8050.7440.6810.981MUDA
4223.607225.421210.0109.63631.199225.979127.0870.7440.6900.982MUDA
5234.163237.134227.0557.57120.830237.280111.0400.8170.7920.978MUDA
6221.352227.679217.51612.08322.132227.742106.4050.7740.7270.986MUDA
7218.998223.647210.50111.32930.203223.939146.6900.7650.7060.982MUDA
8222.690225.452217.7799.83821.036225.85195.9830.7830.7320.988MUDA
9220.401221.582211.0639.33926.308222.044116.0310.7530.6960.986MUDA
10219.934223.861204.65511.86736.593224.106105.5430.7160.6600.986MUDA
11224.646227.897217.2459.75724.063228.214139.6240.7670.7370.981MUDA
12232.181234.300223.7397.65723.163234.565121.6330.7850.7720.979MUDA
13213.509217.052207.19312.37427.259217.572110.0770.7340.6670.989MUDA
14219.727224.781213.46112.80724.947224.945137.0480.7480.6930.983MUDA
15225.201230.839223.92011.16116.802230.861160.2080.8130.7670.977MUDA
Halaman 1 dari 20