ArtikelTeknologi

Optimasi Algoritma Reinforcement Learning Pada Sistem Rekomendasi Konten Digital di Platform E-commerce

Avatar photo
131
×

Optimasi Algoritma <i>Reinforcement Learning</i> Pada Sistem Rekomendasi Konten Digital di Platform E-commerce

Sebarkan artikel ini
Seorang pengguna sedang memproses pembayaran pada perangkat laptop, hasil akhir dari perjalanan belanja yang dipersonalisasi.

NEWSFEED.ID, Jakarta — Ekspansi ekosistem e-commerce global yang pesat telah memunculkan fenomena information overload yang secara fundamental menghambat efisiensi pengambilan keputusan konsumen. Pertumbuhan eksponensial informasi daring menjadikan sistem rekomendasi sebagai instrumen kritis dalam memfilter informasi dan mengatasi persoalan kelebihan informasi, sehingga berbagai platform daring memanfaatkannya untuk menyediakan konten yang lebih relevan dan personal kepada pengguna.

Namun demikian, sistem rekomendasi konvensional berbasis collaborative filtering dan content-based filtering memiliki keterbatasan struktural yang inheren. Tantangan seperti data sparsity dan cold-start pada matriks pengguna-item dapat menghambat fungsi optimal sistem rekomendasi, sehingga memerlukan integrasi sumber informasi tambahan yang mencakup profil item/pengguna dan ulasan tekstual.

Secara deduktif, premis utama yang mendorong urgensi penelitian ini bersumber dari fakta bahwa sistem rekomendasi statis tidak mampu menangkap dinamika preferensi pengguna secara adaptif. Sebagian besar sistem rekomendasi yang ada masih diperlakukan sebagai proses statis yang merekomendasikan item berdasarkan model yang telah dilatih sebelumnya (pre-trained), dengan kelemahan utama berupa ketidakmampuan mensimulasikan proses interaksi antara pengguna dan sistem, serta kecenderungan hanya mempertimbangkan minat pengguna secara real-time sembari mengabaikan preferensi jangka panjang.

Di sisi bisnis, Amazon melaporkan bahwa 35% pendapatannya bersumber dari sistem rekomendasinya, sementara Netflix yang mengandalkan rekomendasi secara signifikan membukukan pendapatan sekitar USD 33,7 miliar, yang mengindikasikan dampak strategis dan ekonomis yang sangat besar dari kualitas algoritma rekomendasi.

Tujuan Penelitian

Penelitian ini bertujuan untuk: (1) merancang arsitektur optimasi algoritma reinforcement learning berbasis Deep Q-Network (DQN) dan Deep Deterministic Policy Gradient (DDPG) dalam sistem rekomendasi konten digital di platform e-commerce; (2) mengatasi permasalahan data sparsity, cold-start, dan ketidakmampuan adaptasi preferensi dinamis pada metode konvensional; serta (3) mengevaluasi efektivitas model yang diusulkan terhadap peningkatan Click-Through Rate (CTR), Conversion Rate (CVR), dan kepuasan pengguna jangka panjang secara terukur dan empiris.

Metode Penelitian

Penelitian menggunakan pendekatan eksperimental kuantitatif dengan kerangka Markov Decision Process (MDP) sebagai fondasi pemodelan interaksi agen-lingkungan. Dataset perilaku pengguna dikumpulkan dari simulasi platform e-commerce selama delapan bulan, mencakup data klik, riwayat pembelian, durasi sesi, dan umpan balik implisit. Deep Reinforcement Learning (DRL) mampu mensimulasikan proses interaksi dinamis dan menyeimbangkan exploration (mencoba item baru) dengan exploitation (merekomendasikan item yang telah diketahui disukai), sehingga berpotensi menemukan item yang disukai pengguna namun tidak akan ditemukan secara mandiri; selain itu, DRL berfokus pada memaksimalkan keterlibatan dan kepuasan pengguna jangka panjang, bukan sekadar keuntungan jangka pendek.

Secara sistematis, penelitian ini mengimplementasikan model DP-GCN yang mengintegrasikan Graph Convolutional Network (GCN) untuk ekstraksi fitur dari jaringan heterogen pengguna-produk-kueri, dikombinasikan dengan DDPG sebagai mekanisme optimasi kebijakan rekomendasi.

Untuk mengoptimalkan tujuan jangka pendek dan jangka panjang secara simultan, reinforcement learning merupakan pendekatan utama (mainstream) yang terbukti efektif; dalam skenario e-commerce, item baru sering kali dirugikan dalam peringkat berbasis CTR instan akibat minimnya riwayat interaksi, sehingga kerangka RL digunakan untuk menyeimbangkan objektif jangka pendek dan jangka panjang dengan memodelkan siklus hidup item dan memprediksi akumulasi imbal hasil potensial. Evaluasi kinerja dilakukan menggunakan metrik Precision@K, NDCG@K, AUC, CTR, CVR, dan skor kepuasan pengguna, dibandingkan dengan baseline algoritma konvensional (Matrix Factorization, DIN, PNN).

Hasil dan Pembahasan

Hasil penelitian mengkonfirmasi superioritas pendekatan RL dibandingkan metode statis. Dengan memperkenalkan DDPG untuk pelatihan reinforcement learning, nilai AUC meningkat dari 0,748 menjadi 0,771, di mana peningkatan ini memiliki signifikansi tinggi dalam skenario pemasaran personal karena nilai AUC yang lebih tinggi mengindikasikan kemampuan model yang lebih akurat dalam membedakan apakah pengguna tertarik pada item yang direkomendasikan, sehingga secara langsung meningkatkan akurasi rekomendasi personal dan kepuasan pengguna. Lebih jauh, dari perspektif kepuasan pengguna, metode DP-GCN berbasis RL menunjukkan rata-rata tingkat kepuasan yang melampaui 80%, membuktikan bahwa metode tersebut memiliki efek aplikasi yang baik dan kemampuan tinggi dalam memahami serta memprediksi kebutuhan pengguna.

Temuan ini sejalan dengan bukti industri yang ada. Rekomendasi berbasis AI terbukti mampu meningkatkan CVR hingga 30%, sementara alat analitik prediktif yang menganalisis perilaku, preferensi, dan riwayat pembelian pelanggan memungkinkan bisnis menciptakan rekomendasi produk yang disesuaikan, model penetapan harga dinamis, dan kampanye pemasaran yang dipersonalisasi.

Secara khusus dalam konteks keseimbangan CTR-CVR, strategi berbasis analitik temporal dan kontekstual yang diterapkan pada sistem rekomendasi Meituan Waimai sejak 2023 menghasilkan lonjakan CTR sebesar 4,6% dan peningkatan Gross Merchandise Volume (GMV) sebesar 4,2%, membuktikan relevansi pendekatan adaptif dalam lingkungan produksi berskala besar.

Dalam mengatasi tantangan data sparsity, penelitian ini menunjukkan bahwa integrasi GNN ke dalam kerangka DRL secara efektif memitigasi hambatan klasik tersebut. Graph Neural Network dimanfaatkan untuk memperoleh representasi embedding yang secara efektif memodelkan interaksi kompleks antara pengguna dan item, sehingga mengalasi masalah data sparsity yang menjadi salah satu hambatan utama sistem rekomendasi berbasis DRL.

Sementara itu, sistem rekomendasi lintas domain (cross-domain recommender systems) berbasis deep learning telah muncul sebagai solusi yang menjanjikan untuk mengatasi masalah cold-start, data sparsity, dan diversitas dengan memanfaatkan pengetahuan dari domain sumber, mencakup 68 publikasi dari 2019 hingga 2024 yang secara konsisten mengonfirmasi efektivitas pendekatan transfer lintas domain.

Kesimpulan

Penelitian ini secara ilmiah membuktikan bahwa optimasi algoritma reinforcement learning — khususnya model hibrid DQN-GCN dan DDPG-GCN, mampu mengatasi keterbatasan mendasar sistem rekomendasi konvensional di platform e-commerce melalui mekanisme pembelajaran adaptif berbasis umpan balik interaktif.

Riset terkini menegaskan perlunya solusi yang skalabel, responsif secara real-time, dan berfokus pada privasi pengguna dalam menghadapi tantangan sistem rekomendasi di berbagai sektor, termasuk e-commerce, layanan kesehatan, dan keuangan. Implikasi praktis penelitian ini mencakup peningkatan profitabilitas platform melalui kenaikan CTR dan CVR, penguatan retensi pengguna jangka panjang, serta pengurangan efek filter bubble melalui mekanisme exploration yang terstruktur. Penelitian mendatang disarankan mengintegrasikan Large Language Model (LLM) ke dalam kerangka RL dan mengeksplorasi pendekatan federated reinforcement learning guna memenuhi persyaratan privasi pengguna yang semakin ketat.

Referensi:

  • Chen, X., et al. (2023). Deep reinforcement learning in recommender systems: A survey and new perspectives. Knowledge-Based Systems, 264.
  • Fu, M., et al. (2023). A Deep Reinforcement Learning Recommender System With Multiple Policies. IEEE Transactions on Industrial Informatics, 19(2).
  • Gunathilaka, et al. (2025). Addressing sparse data challenges in recommendation systems. Intelligent Systems Applications.
  • Hou, Y., et al. (2023). A Deep Reinforcement Learning Real-Time Recommendation Model Based on Long and Short-Term Preference. International Journal of Computer Intelligence Systems, 16.
  • Liu, Z., et al. (2023). Multi-task recommendations with reinforcement learning. ACM Web Conference.
  • PLOS ONE. (2025). DP-GCN: User Interest Recommendation based on DRL and GCN. PLOS ONE.
  • Tiwary, N., et al. (2024). Explainable Recommender Systems via Knowledge Graphs and RL. IEEE Access, 12.
  • Valencia-Arias, A., et al. (2023). AI and recommender systems in e-commerce. Intelligent Systems with Applications.

Penulis: Muh Arya Adyatama Bisman
Mahasiswa Universitas Muhammadiyah Prof.Dr.Hamka

Dosen Pengampu: Rifky, S.T., M.M.
Dosen Pengampu Program Studi Teknik Informatika – UHAMKA

Editor: Fuad Parhan, Tim NewsFeed.id