GEN AI, GAN, LLM, DM, VAE, DAN DEEPFAKE: MEMBACA WAJAH-WAJAH KECERDASAN BUATAN DI ZAMAN KITA

05 Apr 2026 | Dilihat: 11 kali

oleh: Riri Satria

Beberapa waktu yang lalu, saya ditanya oleh beberapa wartawan dari beberapa media dan beberapa kalangan terkait dengan generative AI dan saudara-saudaranya. Pertanyaan itu datang bukan hanya sebagai rasa ingin tahu atas istilah-istilah yang kini begitu sering beredar di ruang publik, tetapi juga sebagai kegelisahan yang lebih mendalam tentang arah zaman yang sedang kita jalani.

Maka tulisan ini adalah rangkuman dari jawaban saya untuk mereka, sebuah upaya untuk menjelaskan dengan bahasa yang lebih dekat, lebih naratif, sekaligus lebih reflektif, tentang bagaimana dan mengapa ia begitu penting untuk kita pahami hari ini.

Di tengah arus perkembangan teknologi yang bergerak begitu cepat, istilah artificial intelligence atau kecerdasan buatan (AI) semakin akrab di telinga kita. Hampir setiap hari kita mendengar percakapan tentang mesin yang mampu menulis puisi, membuat gambar, menyusun musik, bahkan meniru suara dan wajah manusia dengan tingkat kemiripan yang nyaris sempurna.

Namun di balik berbagai istilah yang sering disebut generative AI, generative adversarial network (GAN), large language model (LLM), diffusion model, variational autoencoder (VAE), dan deepfake, sering kali tersimpan kebingungan yang wajar pada yang awam, apakah semuanya sama, atau justru masing-masing berdiri di ruang yang berbeda?

Pada dasarnya generative AI atau Gen AI adalah ruang besar tempat semua teknologi yang mampu “menciptakan” sesuatu berada. Ia dapat dibayangkan sebagai sebuah jagat kreatif yang memungkinkan mesin tidak hanya membaca dan mengenali data, tetapi juga melahirkan bentuk-bentuk baru dari apa yang telah dipelajarinya.

Jika pada masa lalu AI lebih banyak digunakan untuk mengidentifikasi wajah, menerjemahkan bahasa, atau memprediksi pola, maka generative AI melangkah lebih jauh, ia menulis, melukis, menggubah, dan membangun simulasi realitas. Ketika sebuah sistem mampu membuat teks seperti artikel, puisi, atau percakapan, menghasilkan gambar pemandangan yang belum pernah ada; atau menciptakan musik yang terdengar seperti komposisi seorang komponis, maka kita sedang berhadapan dengan dunia Gen AI.

Di dalam jagat yang luas itu, GAN hadir sebagai salah satu metode yang sangat khas dan sangat menarik secara filosofis. GAN bekerja melalui semacam dialektika antara dua kekuatan, satu pihak bertugas menciptakan, pihak lain bertugas menguji. Ada sebuah jaringan yang berperan sebagai pencipta, yang terus-menerus membuat data sintetis, misalnya gambar wajah manusia, dan ada jaringan lain yang bertindak sebagai pengkritik, yang mencoba membedakan mana yang asli dan mana yang palsu.

Keduanya saling berhadapan, saling menantang, dan dari pertarungan itulah kualitas hasil menjadi semakin tinggi. Dalam proses ini, GAN tampak seperti metafora tentang kehidupan itu sendiri: sesuatu menjadi lebih baik justru karena diuji, dipertanyakan, dan dipaksa untuk terus memperbaiki diri.

Sementara itu, LLM menempati ruang yang berbeda, meskipun tetap berada dalam keluarga besar Gen AI. Jika GAN sering berurusan dengan citra visual dan realitas sintetis yang berbentuk gambar atau video, maka LLM adalah spesialis bahasa. Ia hidup di dalam kata-kata, kalimat, dan struktur makna.

LLM dirancang untuk memahami pola bahasa manusia dalam skala yang sangat besar, mempelajari miliaran kata dari buku, artikel, situs web, dan berbagai bentuk teks lainnya, lalu menggunakan pengetahuan itu untuk menghasilkan bahasa yang terasa alami.

Ketika sebuah model mampu menjawab pertanyaan, menulis esai, menyusun makalah, atau bahkan merespons dengan nuansa emosional tertentu, di situlah kita melihat kerja LLM.

Perkembangan yang sangat menonjol dalam beberapa tahun terakhir adalah diffusion mode atau DMl. Jika GAN bekerja dengan logika pertarungan antara pencipta dan pengkritik, DM justru bekerja melalui logika yang lebih halus, yaitu dengan menambahkan gangguan lalu memulihkan kembali. Secara sederhana, model ini mula-mula “merusak” data dengan menambahkan noise atau derau secara bertahap hingga bentuk aslinya nyaris hilang sama sekali.

Setelah itu, model belajar membalik proses tersebut, yaitu menghapus noise sedikit demi sedikit sampai terbentuk kembali gambar atau data yang koheren dan realistis. Inilah fondasi banyak generator gambar modern.

Di sisi lain, VAE atau variational autoencoder membawa pendekatan yang lebih tenang dan lebih struktural. Jika GAN berkarakter kompetitif dan diffusion model bekerja dengan logika rekonstruksi dari noise, maka VAE berangkat dari gagasan pemampatan makna.

Ia belajar merangkum data ke dalam ruang laten yaitu semacam inti esensial dari sebuah gambar, suara, atau teks, lalu dari ruang yang telah dipadatkan itu, ia membangun kembali bentuk baru yang masih memiliki kemiripan dengan data asli. VAE sering dipakai ketika sistem perlu memahami “esensi” sebuah wajah atau objek sebelum membentuk ulang variasinya.

Di sinilah deepfake menemukan ruang kerjanya. Deepfake pada dasarnya adalah salah satu bentuk media sintetis yang dibangun dengan memanfaatkan model-model di atas, terutama GAN dan VAE, dan kini semakin sering menggunakan DM.

Secara sederhana, deepfake bekerja dengan mempelajari wajah seseorang dari banyak foto atau cuplikan video, lalu menanamkan ciri-ciri wajah itu ke wajah orang lain dalam video target. Hasilnya adalah ilusi visual yang sangat meyakinkan di ana seseorang tampak mengatakan atau melakukan sesuatu yang sesungguhnya tidak pernah ia lakukan.

Secara teknis, salah satu pendekatan klasik deepfake menggunakan arsitektur autoencoder dengan shared encoder dan dua decoder. Encoder belajar menangkap struktur umum wajah seperti posisi mata, bentuk hidung, kontur wajah, dan ekspresi, kemudian dua decoder berbeda digunakan untuk memetakan hasil encoding itu ke identitas dua orang yang berbeda.

Bayangkan ada wajah A dan wajah B. Sistem belajar memahami “struktur wajah” keduanya dalam ruang laten yang sama. Ketika ekspresi wajah A dimasukkan, decoder milik B akan membangun ulang ekspresi itu dengan identitas wajah B. Di situlah proses face swap terjadi.

Ketika GAN ditambahkan, hasilnya menjadi jauh lebih realistis. Generator berusaha menciptakan wajah palsu yang sangat menyerupai target, sementara discriminator menguji apakah wajah itu terlihat asli. Proses saling menantang ini membuat hasil deepfake menjadi semakin sulit dibedakan dari video nyata.

Kini DM juga mulai memainkan peran besar dalam deepfake generasi baru karena mampu menghasilkan detail tekstur kulit, pencahayaan, dan transisi ekspresi yang lebih halus.

LLM pun mulai masuk ke ekosistem deepfake, bukan pada aspek visual, tetapi pada aspek naratif dan suara. LLM dapat membantu menyusun naskah dialog yang terdengar alami, meniru gaya bahasa seseorang, atau dikombinasikan dengan model suara sintetis untuk menghasilkan percakapan palsu yang meyakinkan.

Dengan kata lain, jika GAN, VAE, dan DM membentuk “wajah” dan “suara” dari sebuah deepfake, maka LLM membantu membentuk “bahasa” dan “narasi” yang membuat kebohongan itu tampak hidup.

Pada akhirnya, memahami semua ini bukan hanya soal memahami teknologi, tetapi juga memahami bagaimana realitas kini dapat direkayasa. Kita hidup di masa ketika batas antara yang nyata dan yang sintetis menjadi semakin tipis.

Mesin tidak hanya menciptakan gambar, tetapi juga menciptakan kemungkinan-kemungkinan baru tentang kebenaran dan kepalsuan. Di titik inilah teknologi menjadi cermin yang memaksa kita bertanya ulang, ketika sebuah wajah dapat dipinjam, suara dapat ditiru, dan kata-kata dapat direkayasa, apa yang masih tersisa sebagai penanda paling autentik dari kemanusiaan kita?

--- Riri Satria ---

Riri Satria

Riri Satria lahir di Padang, Sumatera Barat 14 Mei 1970, aktif bergiat di dunia kesusastraan Indonesia, pendiri serta Ketua Jagat Sastra Milenia (JSM) di Jakarta, serta menulis puisi. Namanya tercantum dalam buku “Apa dan Siapa Penyair Indonesia’ yang diterbitkan Yayasan Hari Puisi Indonesia (2018). Puisinya sudah diterbitkan dalam buku puisi tunggal: “Jendela” (2016), “Winter in Paris” (2017), “Siluet, Senja, dan Jingga” (2019), “Metaverse” (2022), serta “Login Haramain” (2025), di samping lebih dari 60 buku kumpulan puisi bersama penyair lainnya, termasuk buku kumpulan puisi duet bersama penyair Emi Suy berjudul “Algoritma Kesunyian” (2023).

Riri juga menulis esai dengan beragam topik: sains dan matematika, teknologi dan transformasi digital, ekonomi dan bisnis, pendidikan dan penelitian, yang dibukukan dalam beberapa buku: “Untuk Eksekutif Muda: Paradigma Baru dalam Perubahan Lingkungan Bisnis” (2003), trilogi “Proposisi Teman Ngopi” (2021) yang terdiri tiga buku “Ekonomi, Bisnis, dan Era Digital”, “Pendidikan dan Pengembangan Diri”, dan “Sastra dan Masa Depan Puisi” (2021), serta “Jelajah” (2022). Diperkirakan buku kumpulan esai terbaruya tentang kesusastraan, kesenian, kebudayaan, serta kemanusiaan akan terbit pada tahun 2026.

Dalam beberapa tahun terakhir ini sejak tahun 2018, Riri Satria aktif menekuni dampak teknologi kecerdasan buatan (artificial intelligence) atau AI) terhadap dunia kesusastraan, terutama puisi. Riri diundang menjadi narasumber untuk membahas topik ini di berbagai acara sastra, antara lain: Seminar Internasional Sastra di Universitas Pakuan, Bogor (2018), Seminar Perayaan Hari Puisi Indonesia, Jakarta (2019), Banjarbaru’s Rainy Day Literary Festival, Banjarbaru Kalimantan Selatan (2019), Seminar Perayaan Hari Puisi Indonesia, Jakarta (2021), Malay Writers and Cultural Festival (MWCF) 2024 di Jambi (2024), Seminar Jambore Sastra Asia Tenggara (JSAT) di Banyuwangi (2024), Seminar Etika Kreasi di Era Digital, Diskusi Hak Cipta dan Filosofi AI yang diselenggarakan oleh Dewan Kesenian Jakarta (2025), serta memberikan kuliah umum tentang topik pada Pertemuan Penyair Nusantara XIII (2025) di Perpustakaan Nasional RI.

Saat ini Riri Satria menjabat sebagai Komisaris Utama PT. ILCS Pelindo Solusi Digital PSD sejak April 2024, sebuah perusahaan teknologi dalam grup Pelabuhan Indonesia atau Pelindo. Sebelumnya selama 5 tahun Riri menjabat sebagai Komisaris Independen pada PT. Jakarta International Container Terminal (JICT) 2019-2024, sebuah pelabuhan petikemas terbesar di Indonesia yag merupakan joint venture antara Pelabuhan Indonesia dengan Hutchison Port Holdings Hongkong melalui Hutchison Ports Indonesia.

Riri juga pernah menjabat sebagai Staf Khusus Menteri Koordinator Politik dan Keamanan Republik Indonesia (Meko Polkam RI) bidang Digital, Siber, dan Ekonomi sejak Oktober 2024 s/d September 2025,

Riri juga anggota Dewan Juri untuk Indonesia Digital Culture Excellence Award serta Indonesia Human Capital Excellence Award sejak tahun 2021. Riri juga dosen Fakultas Ilmu Komputer Universitas Indonesia, dan mengajar topik Sistem Korporat, Bisnis Digital, Manajemen Strategis Sistem Informasi, serta Metodologi Penelitian untuk program Magister Teknologi Informasi (MTI). Selain itu Riri adalah Anggota Dewan Pertimbangan Ikatan Alumni Universitas Indonesia dan sebelumnya Ketua Ikatan Alumni Fakultas Ilmu Komputer Universitas Indonesia.

Riri Satria

Riri Satria lahir di Padang, Sumatera Barat 14 Mei 1970, aktif bergiat di dunia kesusastraan Indonesia, pendiri serta Ketua Jagat Sastra Milenia (JSM) di Jakarta, serta menulis puisi. Namanya tercantum dalam buku “Apa dan Siapa Penyair Indonesia’ yang diterbitkan Yayasan Hari Puisi Indonesia (2018). Puisinya sudah diterbitkan dalam buku puisi tunggal: “Jendela” (2016), “Winter in Paris” (2017), “Siluet, Senja, dan Jingga” (2019), “Metaverse” (2022), serta "Login Haramain" (2025), di samping lebih dari 60 buku kumpulan puisi bersama penyair lainnya, termasuk buku kumpulan puisi duet bersama penyair Emi Suy berjudul “Algoritma Kesunyian” (2023).

Riri juga pernah menjabat sebagai Staf Khusus Menteri Koordinator Politik dan Keamanan Republik Indonesia (Meko Polkam RI) bidang Digital, Siber, dan Ekonomi sejak Oktober 2024 s/d September 2025,

Berita Terkait

DI BAWAH BAYANG-BAYANG OPINI, ALGORITMA, DAN ILUSI...

Oleh Riri Satria 06 Apr 2026

Terkini

RENUNGAN PAGI SETELAH SUBUH

Oleh Riri Satria 05 Apr 2026

Terkini

Konten Populer

Terkini Teknologi & Transformasi Digital Ekonomi dan Bisnis

EKONOMI DIGITAL INDONESIA 2025 🇮🇩

Pada tahun 2025, transaksi ekonomi digital diperkirakan se besar Rp 1.775 T. Ekonomi digital Indonesia diperkirakan akan terus berkembang dengan nilai transaksi diprediksi akan mencapai US$124 miliar atau sekitar Rp1.775 triliun pada tahun 2025. Dengan proyeksi tersebut, Indonesia akan berada pada peringkat pertama di ASEAN sebagai negara dengan nilai transaksi ekonomi digital terbesar dengan kontribusi […]

Jul 02, 2025
Teknologi & Transformasi Digital Sastra (Puisi dan Esai) Apa Kata Media?

Riri Satria, Kecerdasan Buatan (AI), ChatGPT, Prompting, Dan Puisi

Mengawali tulisan ini, saya ingin mengucapkan alhamdulillah puji syukur kepada Allah Jalla wa Alaa atas segala karunia di setiap detik dan hela napas pada hamba-hamba-Nya. Saya mengucapkan selamat serta ikut bangga dan bahagia atas amanah baru yang diembankan negara kepada Ketua Komunitas Jagat Sastra Milenia (JSM), abang, sahabat, penyair, sang inspirator Riri Satria sebagai Komisaris Utama […]

Apr 13, 2024
Apa Kata Media?

The Art of Perception Engineering

Era digital ini dengan segala kemajuannya seperti kecerdasan buatan, metaverse, bahkan media sosial sederhana pun seperti Facebook ini memiliki potensi dahsyat untuk melakukan rekayasa terhadap persepsi atau perception engineering. Ya, sekarang eranya post truth society dan dunia penuh dengan yang namanya perseption engineering. Saat ini, perception is the reality, walaupun mereka yang sanggup berpikir […]

May 27, 2024
Teknologi & Transformasi Digital

Peresmian Digital Maritime Development Center (DMDC) PT. Integrasi Logistik Cipta Solusi (ILCS) / Pe...

oleh: Riri Satria Hari ini adalah Hari Kebangkitan Nasional, 20 Mei 2024. Kita memperingatinya saat ini dengan meresmikan Digital Maritime Development Center (DMDC) PT. Integrasi Logistik Cipta Solusi (ILCS) / Pelindo Solusi Digital (PSD), yang sama-sama kita banggakan. Ini adalah pusat penelitian, pengembangan, dan inovasi solusi digital terintegrasi untuk ekosistem logistik maritim di Indonesia. […]

May 20, 2024
Apa Kata Media?

TENTANG RIRI SATRIA

Riri Satria adalah seorang pengamat ekonomi digital dan kreatif, sekaligus pencinta puisi yang lahir di Padang, Sumatera Barat, 14 Mei 1970. Sarjana Ilmu Komputer (S. Kom) dari Fakultas Ilmu Komputer Universitas Indonesia yang mengambil Magister Manajemen (MM) dari Sekolah Tinggi Manajemen PPM ini tengah menempuh program S3 Doctor of Business Administration (DBA) di Paris School […]

Nov 14, 2021
Dokumen Terkini

9 Langkah Riri Satria

MENJAWAB TANTANGAN, MENJEMPUT MASA DEPAN SASTRA KOTA Ketika UNESCO menetapkan Jakarta sebagai City of Literature pada tahun 2021, banyak dari kita yang bersorak—dengan bangga, tentu saja. Sebuah pengakuan internasional untuk kota yang sibuk, padat, dan penuh riuh—tapi ternyata juga menyimpan denyut sastra yang tak pernah mati. Namun bersamaan dengan sorak itu, sebuah pertanyaan segera […]

May 17, 2025
Terkini

Pohon Soekarno di Arafah

Assalamu alaikum wr wb. Salam dari Arafah, Mekkah Al Mukarramah. Tahukah sahabat bahwa nama Sukarno sangat terkenal di Arafah? Ya, pohon yang di belakang saya itu disebut oleh orang sini sebagai Pohon Sukarno. Pohon Soekarno di Padang Arafah adalah warisan hijau yang berasal dari usulan Presiden Sukarno saat melaksanakan ibadah haji pada tahun 1955. Usulan […]

May 27, 2025
Apa Kata Sahabat?

Riri Satria, Sang Polymath

Mungkinkah seseorang mengeluti 3 profesi sekaligus secara serius dan sepenuh hati?. Bisa. Inilah yang dilakukan oleh Riri Satria, Sang Polymath Di suatu siang, Riri memasuki pelataran Taman Ismail Marzuki (TIM) dengan santai. Berkaos oblong, bercelana jeans serta beralas sandal. Di perjalanan memasuki sebuah ruang sastra, ia bertegur sapa dengan sejumlah seniman yang sedang berkumpul. Tanpa […]

Jun 06, 2021