pengenalan ucapan sebagai pengendali gerakan kursi roda secara real-time dengan metode mfcc dan bp-nn

Hai Inovator,

Pada kesempatan ini kita akan menjelaskan mengenai proyek pengenalan ucapan sebagai pengendali gerakan kursi roda secara real-time dengan metode mfcc dan bp-nn. Terdapat 2 metode utama yaitu MFCC dan BPNN (JST).

Jaringan syaraf tiruan (JST) atau Neural Network (NN) adalah sistem pemroses informasi yang mempunyai karakteristik mirip dengan jaringan syaraf biologi. JST dibentuk sebagai generalisasi model matematika dari jaringan saraf biologi dengan asumsi bahwa: Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron). Sinyal dikirimkan di antara neuron melalui penghubung. Penghubung antar neuron memiliki bobot yang akan memperkuat atau memperlemah sinyal. Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi yang dikenakan pada jumlahan input yang diterima. Besarnya output ini selanjutnya dibandingkan dengan suatu batas ambang. Jaringan syaraf tiruan ditentukan oleh 3 hal, yaitu:

Pola hubungan antar neuron (disebut arsitektur jaringan).
Metode untuk menentukan bobot penghubung (disebut metode training/
learning/ algoritma).
Fungsi aktivasi.

Jaringan Syaraf Tiruan (JST) memiliki kemampuan untuk belajar dan beradaptasi terhadap masukan-masukannya. Berdasarkan algoritma pelatihannya, JST dapat dibedakan menjadi dua jenis yaitu: pelatihan terbimbing (supervised learning) dan pelatihan tidak terbimbing (unsupervised learning). Ada beberapa metode yang biasa digunakan pada jaringan syaraf tiruan. Salah satunya adalah metode backpropagation. Jaringan Syaraf Tiruan adalah paradigma pemrosesan suatu informasi yang terinspirasi oleh sistem sel syaraf biologi, sama seperti otak yang memproses suatu informasi.

Jaringan Back Propagation Neural Network (BPNN) biasanya digunakan untuk melakukan pengenalan pola, klasifikasi, pengolahan citra, dan pengambilan keputusan. BPNN merupakan JST dengan pembelajaran yang supervised, artinya data pembelajaran terdiri dari vektor pasangan
input dan target (output yang diharapkan). Pelatihan suatu jaringan dengan algoritma backpropagation pada Gambar 3.1 meliputi dua tahap yaitu perambatan maju dan perambatan mundur. Selama perambatan maju, tiap unit masukan (Xi) menerima sebuah masukan sinyal ini ke tiap-tiap lapisan tersembunyi Z1,…..,Zp. Tiap unit tersembunyi ini kemudian menghitung aktivasinya dan mengirimkan sinyalnya (Zj) ke tiap unit keluaran. Gambar 2.8 merupakan arsitektur dari multilayer jaringan BP-NN yang berfungsi sebagai pengambilan keputusan dari pola yang telah didapatkan oleh MFCC.

Gambar 3.1 Arsitektur Multilayer Jaringan Back Propagation

Mel-Frequency Cepstrum Coefficients atau yang dikenal dengan nama MFCC merupakan salah satu metode untuk menetukan pola suara. MFCC digunakan sebagai vektor ciri yang baik untuk merepresentasikan suara manusia dan sinyal musik. MFCC telah terbukti bermanfaat untuk pengenalan suara.

Analisis suara pada Mel-Frequency didasarkan pada persepsi pendengaran manusia karena telinga manusia telah diamati dapat berfungsi sebagai filter pada frekuensi tertentu. Filter-filter tersebut memiliki jarak yang tidak seragam pada sumbu frekuensi yaitu banyak filter pada daerah frekuensi rendah dan sedikit pada daerah frekuensi tinggi. Hal tersebut dikarenakan oleh sensitifitas pendengaran manusia yang tidak merata.

MFCC pada Proyek ini berfungsi untuk membuat pola dari suara. MFCC terdiri dari beberapa tahapan, seperti pada Gambar 3.2

Gambar 3.2 Tahapan MFCC

Perancangan sistem pengenalan perintah suara pada Proyek ini dapat ditunjukkan pada Gambar 3.3 di bawah ini.

Gambar 3.3 Perancangan Sistem Pengenalan Perintah Suara

Pada Gambar 3.3 menjelaskan konsep awal dalam perancangan sistem pengenalan suara untuk menjalankan kursi roda. Sistem ini menggunakan mikrofon yang dihubungkan pada PC untuk mendapatkan sinyal suara dengan format wav. Sinyal suara berupa wav tersebut akan diproses oleh software MATLAB menggunakan metode MFCC, metode MFCC ini terdiri dari beberapa proses, dimana masing-masing proses memiliki fungsi yang berbeda-beda. Proses MFCC terdiri dari silence detection, windowing, FFT, mel-frequency warping, dan DCT. Dari proses MFCC ini akan menghasilkan sebuah data yang selanjutnya akan dilakukan training dengan metode BP-NN sehingga mendapatkan keluaran yang dapat dibaca oleh Arduino untuk menjalankan perintah berdasarkan suara yang diucapkan oleh user.

Prinsip kerja sistem dalam Proyek ini ditunjukkan pada Gambar 3.4 yaitu flowchart kerja sistem.

Gambar 3.4 Flowchart Kerja Sistem

Dari flowchart diatas, prinsip kerja sistem pada Proyek ini adalah :

Pada kondisi awal dilakukan perekaman suara dengan perintah maju, mundur, kanan, kiri, dan berhenti. Data yang telah didapat kemudian dibaca dengan format .wav yang kemudian akan dilakukan pemotongan segmen kata atau yang disebut silence detection, setelah itu diakukan proses pengekstraksian ciri menggunakan metode MFCC (Mel-Frequency Cepstrum Coefficient), proses ini bertujuan untuk mendapatkan parameter-parameter dari sinyal suara. Parameter inilah yang nantinya akan membedakan karakteristik dari masing masing suara. Setelah nilai MFCC didapatkan kemudian dijadikan nilai input bagi Back Propagation Neural Network dan akan diproses sehingga mendapatkan error paling kecil. Setelah data yang diproses oleh BP-NN terkenali, makan sistem akan mengeluarkan output yang akan menggerakkan motor DC. Dengan demikian sistem selesai dalam melakukan proses pengenalan perintah suara.

Block Diagram Pemrosesan Suara

Berikut merupakan proses mendapatkan data dari suara yang dideteksi.

Proses memodelkan suara.

Gambar 3.5 Block Diagram Pembelajaran Pola

Pada Gambar 3.5 diatas merupakan proses awal dalam mendapatkan model karakteristik dari masing-masing perintah yang akan menjadi input metode BP-NN. Dimana suara pada proses ini dinamakan sebagai suara pembelajaran yang kemudian akan diekstraksi dan dilakukan pembelajaran pola sehingga mendapatkan model pola yang yang nantinya akan menjadi perbandingan.

Proses pengujian suara dengan yang telah dimodelkan.

Gambar 3.56Block diagram pengenalan suara

Pada Gambar 3.6 dilakukan perbandingan pola karena model dari suara pembelajaran telah didapatkan. Setelah suara uji terdeteksi maka akan dilakukan pengekstraksian ciri yang hasilnya akan dibandingkan dengan pola model yang telah didapatkan. Setelah dibandingkan maka akan diputuskan perintah apa yang harus dijalankan.

Sekian dulu penjelasan kita kali ini jika inovator butuh bantuan untuk implementasi hebatnya di bidang Teknologi Otomasi yang meliputi Internet Of Things (IoT), Elektronika (Ardunio, STM32, Raspberry, dll) , Instrumentasi dan informatika (Pengolahan Citra, Kecerdasan Buatan (AI), Software Aplikasi) langsung saja kontak akun sosial media kami dengan link WA berikut ini.

Jasa Arduino Bandung Internet of Things Bandung. Jasa Arduino Surabaya Internet of Things Surabaya. Jasa Arduino Jakarta Internet of Things Jakarta. Jasa Arduino Depok. Jasa Arduino Malang. Jasa Arduino Bandung. Jasa Arduino Batam. Jasa Arduino Bekasi. Jasa Arduino Surabaya. Jasa Arduino Semarang. Jasa Arduino Surakarta. Jasa Arduino Pekanbaru. Jasa Arduino Tangerang Selatan. Jasa Arduino Bekasi. Jasa Arduino Makassar. Jasa Arduino Tangerang. Jasa Arduino Medan. Jasa Arduino Palembang. Jasa Arduino Jogja. Jasa Arduino Yogyakarta.

	CV. Elmech Technology Indonesia Jl. Raya Putra Bangsa III No.1-E, Medokan Ayu, Rungkut Surabaya City East Java
	082258888984
	support@elmechtechnology.com

Pengenalan Ucapan Sebagai Pengendali Gerakan Kursi Roda Secara Real-Time Dengan Metode Mfcc Dan Bp-Nn

Artikel Terpopuler

Download Full Library Arduino Di Simulasi Proteus Terbaru

Elmech Technology (Your Innovation Partner)

Download Eagle Versi 6.3.0 Full Version Solution For Computer With Low Specification

Download Visual Studio 2010 Full Version Format Iso