Penerapan Reinforcement Learning pada Perilaku Agent dalam Permainan Tag

Biseka, Brilly Jalu Kumara (2023) Penerapan Reinforcement Learning pada Perilaku Agent dalam Permainan Tag. S1 thesis, Universitas Ahmad Dahlan.

[thumbnail of JUDUL] Text (JUDUL)
T1_1900018294_JUDUL__231219013603.pdf

Download (708kB)
[thumbnail of BAB I] Text (BAB I)
T1_1900018294_BAB_I__231219013603.pdf

Download (210kB)
[thumbnail of BAB II] Text (BAB II)
T1_1900018294_BAB_II__231219013603.pdf
Restricted to Registered users only

Download (405kB) | Request a copy
[thumbnail of BAB III] Text (BAB III)
T1_1900018294_BAB_III__231219013603.pdf
Restricted to Registered users only

Download (441kB) | Request a copy
[thumbnail of BAB IV] Text (BAB IV)
T1_1900018294_BAB_IV__231219013603.pdf
Restricted to Registered users only

Download (2MB) | Request a copy
[thumbnail of BAB V] Text (BAB V)
T1_1900018294_BAB_V__231219013603.pdf
Restricted to Registered users only

Download (195kB) | Request a copy
[thumbnail of Daftar Pustaka] Text (Daftar Pustaka)
T1_1900018294_DAFTAR_PUSTAKA__231219013603.pdf

Download (198kB)
[thumbnail of Lampiran] Text (Lampiran)
T1_1900018294_LAMPIRAN__231219013603.pdf
Restricted to Registered users only

Download (335kB) | Request a copy
[thumbnail of Naskah Publikasi] Text (Naskah Publikasi)
T1_1900018294_NASKAH_PUBLIKASI__231219015003.pdf

Download (586kB)

Abstract

Pada saat ini terdapat banyak jenis variasi game namun tidak banyak dari game tersebut yang memiliki NPC dengan perilaku yang sulit ditebak sehingga pemain merasa cepat bosan dengan game yang dimainkan dikarenakan NPC mudah ditebak dan game dapat mudah diselesaikan. Kebanyakan game masih menggunakan metode rule-based dalam pengembangan NPC-nya. Penelitian ini bertujuan untuk membuat agent NPC yang perilakunya sulit ditebak menggunakan metode Reinforcement Learning dan dalam pelatihanya menggunakan ML- Agents Toolkit dan Game Engine Unity dengan algoritma Proximal Policy Optimization (PPO).
Metode yang digunakan dalam penelitian ini adalah Reinforcement Learning dan algoritma PPO. Pelatihan agent NPC menggunakan game engine unity. Dalam pelatihanya terdapat dua agent yang akan dilatih yaitu agent pengejar dan agent pemain serta satu objek target koin. Proses pelatihan ini ditentukan oleh total percobaan percobaan agent yang disebut MaxSteps. Dalam pelatihan-nya setiap episode yang dijalankan diberikan waktu 60 detik untuk melakukan pelatihan. Hasil pelatihan ini akan ditunjukkan dalam bentuk grafik Cumulative Reward, Episode Length, Policy Loss, dan Value Lost.
Penelitian ini menunjukkan hasil pelatihan Reinforcement Learning pada agent-agent permainan tag ini mampu bersaing untuk mengejar target dan menghindari rintangan dengan baik. Hasil pada pengujian pada agent pemain menunjukkan rata-rata koin yang terambil meningkat dari 61% menjadi 79%, sedangkan pada agent pengejar menunjukkan rata-rata menangkap agent pemain sedikit menurun dari 66% menjadi 63%. Dapat disimpulkan bahwa kemampuan agent pemain mengalami peningkatan sedangkan kemampuan agent pengejar mengalami sedikit penurunan.

Item Type: Thesis (S1)
Keyword: Unity, Ml-agents, Proximal Policy Optimization, Agent
Subjects: G Geography. Anthropology. Recreation > GV Recreation Leisure
Q Science > QA Mathematics > QA75 Electronic computers. Computer science
Q Science > QA Mathematics > QA76 Computer software
Depositing User: userperpus2 userperpus2
Date Deposited: 24 May 2025 03:06
Last Modified: 24 May 2025 03:06
URI: http://eprints.uad.ac.id/id/eprint/83819

Actions (login required)

View Item View Item