Vandyta, Joe Aqilla (2026) IMPLEMENTATION OF LLAMA MODEL FOR AUTOMATIC IMAGE CAPTION GENERATION IN ANDROID-BASED APPLICATION. Undergraduate thesis, Universitas Pendidikan Ganesha.
|
Text (COVER)
Cover-pengesahan.pdf Download (2MB) |
|
|
Text (ABSTRAK)
Abstrack.pdf Download (310kB) |
|
|
Text (BAB 1 PENDAHULUAN)
BAB 1.pdf Download (511kB) |
|
|
Text (BAB 2 KAJIAN TEORI)
BAB 2.pdf Restricted to Repository staff only Download (823kB) | Request a copy |
|
|
Text (BAB 3 METODELOGI PENELITIAN)
BAB 3.pdf Restricted to Repository staff only Download (680kB) | Request a copy |
|
|
Text (BAB 4 HASIL DAN PEMBAHASAN)
BAB 4.pdf Restricted to Repository staff only Download (5MB) | Request a copy |
|
|
Text (BAB 5 PENUTUP)
BAB 5.pdf Restricted to Repository staff only Download (443kB) | Request a copy |
|
|
Text (DAFTAR PUSTAKA)
Reference.pdf Download (478kB) |
|
|
Text (LAMPIRAN)
Appendices.pdf Download (1MB) |
Abstract
Penelitian ini bertujuan merancang dan membangun aplikasi Android bernama Descripix yang memanfaatkan model LLaMA Vision untuk generate caption gambar otomatis. Latar belakang penelitian adalah banyaknya content creator, fotografer, dan pengguna media sosial yang mengalami creative block dalam membuat caption gambar, sehingga menghambat konsistensi publikasi konten mereka. Survei awal menunjukkan 90% responden mengalami kesulitan menulis caption, sering menunda unggahan atau bahkan mengunggah tanpa caption selama periode creative block. Metode pengembangan Waterfall digunakan dengan backend Django REST Framework dan database MySQL yang mengintegrasikan LLaMA Vision dari Groq.com melalui REST API. Sistem memproses metadata gambar sebagai input tambahan untuk In-Context Learning (ICL) prompting, menghasilkan caption kontekstual yang konsisten dan sesuai pola Linguistik yang diharapkan. Perbandingan hasil generate caption dengan dan tanpa ICL membuktikan peningkatan akurasi dan konsistensi output. Frontend Android menggunakan Jetpack Compose dengan arsitektur MVVM dan menggunakan Retrofit untuk berkomunikasi dengan backend. Aplikasi memiliki dua mode pengguna: guest dapat mengunggah gambar dan menghasilkan caption, sementara authenticated user dapat menyimpan, mengedit, dan mengelola riwayat caption. Pengujian sistem mencakup integration testing dengan 19 skenario yang menunjukkan keberhasilan 100% pada semua fungsi utama, serta usability testing SUS pada 20 responden dengan skor rata-rata 84.25, menunjukkan usability baik di atas rata-rata global 68, mengindikasikan aplikasi Descripix mudah digunakan dan dapat diterima pengguna.
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Uncontrolled Keywords: | Caption Generator, LLaMA Vision, In-Context Learning, Android, Django Rest Framework |
| Subjects: | T Technology > T Technology (General) |
| Divisions: | Fakultas Teknik dan Kejuruan > Jurusan Teknik Informatika > Program Studi Ilmu Komputer (S1) |
| Depositing User: | Joe Aqilla Vandyta |
| Date Deposited: | 09 Feb 2026 09:20 |
| Last Modified: | 09 Feb 2026 09:20 |
| URI: | http://repo.undiksha.ac.id/id/eprint/28031 |
Actions (login required)
![]() |
View Item |
