Pengenalan pola
Dari Wikipedia Indonesia, ensiklopedia bebas berbahasa Indonesia.
Pengenalan pola merupakan bidang dalam pembelajaran mesin dan dapat diartikan sebagai "tindakan mengambil data mentah dan bertindak berdasarkan klasifikasi data" [1] [2]. Dengan demikian, ia merupakan himpunan kaidah bagi pembelajaran diselia (supervised learning).
Salah satu aplikasinya adalah pengenalan suara, klasifikasi teks dokumen dalam kategori (contoh. surat-E spam/bukan-spam), pengenalan tulisan tangan, pengenalan kode pos secara otomatis pada sampul surat, atau sistem pengenalan wajah manusia. Aplikasi ini kebanyakan menggunakan analisis citra bagi pengenalan pola yang berkenaan dengan cita digital sebagai input ke dalam sistem pengenalan pola
Daftar isi |
[sunting] Teknik Pengenalan Pola
Pengenalan pola biasanya merupakan langkah perantaraan bagi proses lebih lanjut. Langkah ini biasanya merupakan dapatan data (gambar, bunyi, teks, dll.) untuk dikelaskan, pre-pemrosesan untuk menghilangkan gangguan atau menormalkan gambar dalam satu cara (pemrosesan gambar (image processing), teks dll.), pengiraan ciri-ciri, pengkelasan dan akhirnya post-pemrosesan berdasarkan kelas pengenalan dan aras keyakinan.
Pengenalan pola itu sendiri khususnya berkaitan dengan langkah pengkelasan. Dalam kasus tertentu, sebagaimana dalam jaringan syaraf (neural networks), pemilihan ciri-ciri dan pengambilan juga boleh dilaksanakan secara semi otomatis atau otomatis sepenuhnya.
Sementara terdapat banyak kaidah untuk pengkelasan, ia menyelesaikan satu dari tiga masalah matematis berkaitan.
Pertama adalah mencari peta ruang ciri (feature space) (biasanya pelbagai dimensi ruang vektor (vector space)) bagi set label. Secara bersamaan ia membagi ruang ciri menjadi kawasan-kawasan, kemudian meletakkan label kepada setiap kawasan. Algoritma yang demikian ini (contohnya the nearest neighbour algorithm) biasanya belumlah menghasilkan kepercayaan atau class probabilities, sebelum diterapkannya post-processing.
Masalah kedua adalah untuk menganggap masalah sebagai anggaran, dimana matlamat adalah untuk menganggar fungsi bagi bentuk
dimana input vektor ciri adalah , dan fungsi f biasanya diparameter oleh sebagian parameter . Dalam pendekatan statistik Bayesian bagi masalah ini, berlainan dengan memilih satu vektor parameter , hasil dibentuk bagi kesemua thetas yang mungkin, dengan turutan berat bagi ketepatan berdasarkan data latihan D:
Masalah ketiga terkait dengan masalah kedua, tetapi masalahnya adalah untuk menganggar kebangkalian bersyarat (conditional probability) dan kemudian menggunakan aturan Bayes untuk menghasilkan kemungkinan kelas sebagaimana dalam masalah kedua.
Contoh algoritma klasifikasi termasuk:
- Klasifikasi linear
- Diskriminan linier Fisher
- Regresi Logistik
- Naive Bayes classifier
- Perceptron
- Metode Nearest neighbor
- Boosting
- Decision tree
- Jaringan Saraf Tiruan
- Jaringan Bayesian
- Mesin sokongan vektor (Support vector machine)
- Model Markov Tersembunyi (Hidden Markov model)
[sunting] Domain Aplikasi
- komputer visi
- pengenalan karakter medis (Medical image analysis)]]
- Pengenalan karakter optis
- Pengenalan suara (speech recognition)
- Pengenalan tulisan tangan (handwritten recognition)
- Identifikasi biometrik
- klasifikasi dokuman
- Internet
- Credit scoring
[sunting] Lihat juga
- Pembelajaran mesin
- Statistika
- Kecerdasan buatan (Artificial intelligence)
- Sistem Temu Balik Informasi (Information Retrieval Systems)
- Algoritma Viterbi
[sunting] Rujukan
- ^ Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0471056693.
- ^ J. Schuermann: Pattern Classification: A Unified View of Statistical and Neural Approaches, Wiley&Sons, 1996, ISBN 0471135348