KOPI Delft 5

Kawan-kawan PPI Delft,

Dingin-dingin gini enaknya ngapain? NGOPI Delft!

Yak, KOPI Delft hadir kembali setelah sekian lamanya ‘njingkrung’ kedinginan. Hadir untuk memuaskan dahaga kawan-kawan akan ilmu, diskusi, dan pemecahan masalah bangsa. KOPI Delft 5 kali ini menghadirkan sosok wanita karir yang aktif di berbagai kegiatan PPI dan KMD. Seseorang yang sudah termasuk senior di Delft, Ibu Safreni Candra Sari, PhD candidate di ITB dan TUDelft. Beliau menyempatkan waktu untuk berbagi dan memaparkan topik Aplikasi Multi Agent Reinforcement Learning dalam Robotika, plus, ada demo robot Robita!

Jadi, kawan-kawan yang punya pertanyaan mengenai robot, mengenai bagaimana robot bisa diprogram? sejauh apa perkembangan robot di Indonesia? sesulit apa bikin robot? bagaimana main bola dengan robot? apa saja kompetisi2 robot? bagaimana kebijakan pemerintah Indonesia tentang robot? Apa itu multi agent? bagaimana caranya beelajar robot yang baik? kapan Indonesia bisa bikin robot? serta pertanyaan -pertanyaan penting lainnya.. Hadirilah forum santai tapi serius tapi lebih ke santainya ini!

Kapan? Dimana?
Tanggal 15 November 2013 
Ruang 2.62, Gedung CiTG (Civil Engineering), TUDelft 
Pukul 16.30 – 19.00 ECT

Ayo-ayo, utamanya anak-anak Delft yang baru yang masih ‘kinyis2’.. dipersilahkan hadir dalam acara yang selalu disebut, dibanggakan tapi jarang sekali dijelaskan dalam setiap acara PPI yang lain! inilah KOPI Delft!

Biar tambah semangat, saksikan terlebih dahulu goyang Gangnam Style ala Robita di sini: httpv://www.youtube.com/watch?v=DqUSBkbdghw

=====================================================
Aplikasi Multi Agent Reinforcement Learning dalam Robotika
-Safreni Candra Sari

Sistem multi robot telah banyak dikembangkan untuk menjawab masalah-masalah produksi, automatisasi, industri, pengaturan, dan lain-lain. Dalam suatu sistem multi robot, satu unit robot dimodelkan sebagai sebuah agen yang dapat mengobservasi lingkungan sekitarnya, melakukanreasoning, dan memutuskan melakukan suatu aksi untuk mencapai tujuan akhir/goal dari sistem tersebut.

Sering sekali, robot-robot dalam sistem ini harus saling bekerjasama (cooperate) sehingga dapat mencapai goalnya dengan waktu dan biaya yang lebih efisien. Dalam mencapai goalnya tersebut, sistem multi robot dapat diaktifkan/dieksekusi dengan melakukan pra pemrograman pada robot. Pra pemrograman ini dapat membawa grup robot mencapai goalnya, apabila lingkungan dimana robot berada bersifat stasioner. Sementara itu dalam situasi lingkungan yang acak dan stokastis, pra pemrograman tidak lagi menjadi solusi bagi sistem multi robot. Multi agent planning dan multi agent learning adalah dua bidang yang telah lama dikembangkan dalam multi agent system untuk menjawab masalah lingkungan yang random dan stokastis.

Untuk agen yang mampu berkomunikasi dengan agen lain, multiagent planning memberikan jawaban, dimana robot-robot dalam sistem multi robot terlebih dahulu mengkomunikasikan aksi yang hendak dilakukan sebelum mengeksekusinya. Sementara dalam multiagent learning robot-robot mendapatkan keputusan atas aksi berdasarkan hasil belajar berinteraksi dalam kurun waktu tertentu. Metoda-metoda learning yang dikembangkan untuk lingkungan yang bersifat random dan acak adalah model free learning, dan yang tidak kalah penting lagi, bahwa learning harus dapat dilakukan secara online.

Reinforcement Learning (RL) adalah sebuah metoda learning yang bersifat online. RL menjawab masalah-masalah seputar lingkungan yang stokastis, learning dilakukan dengan online, lingkungan dan sistem tidak memerlukan model,dan dapat diterapkan pada sistem multi agen menjadi Multiagent Reinforcement Learning (MARL).

MARL memberikan banyak harapan akan penyelesaian masalah masalah yang telah disebutkan diatas. Namun demikian terdapat juga tantangan-tantangan, diantaranya: ketidakstasioneran dalam multiagent learning, Curse of Dimensionality (CD), konvergensi waktu belajar yang lama.

Dalam Kopi Delft kali ini pembicara akan menjabarkan bagaimana Multi Agent Reinforcement Learning diaplikasikan dalam sistem multi robot dalam mencari lokasi target dan juga dalam sebuah game mengoper bola. Sebagai tambahan, juga akan didemonstrasikan bagaimana sebuah robothumanoid dapat melakukan beberapa rangkaian perintah sederhana.
============================================================

Proudly presented by, Divisi Ilmiah PPI Delft 

Leave a Comment