Model Bahasa AI dan Pemahaman Dunia Nyata — Bahasa Indonesia Level B2

Penelitian ini meneliti apakah model bahasa besar yang dilatih pada teks internet benar-benar menangkap batasan dunia nyata, atau hanya meniru pola bahasa. Karena data pelatihan mengandung fakta, kesalahan, dan pernyataan absurd, peneliti ingin tahu apakah model bisa membedakan peristiwa yang umum, tidak mungkin, mustahil, atau tidak masuk akal.

Tim dari Brown University mempresentasikan hasil pada Konferensi Internasional tentang Representasi Pembelajaran (ICLR) di Rio de Janeiro. Michael Lepori, kandidat PhD yang memimpin studi, menyatakan bahwa ada "bukti bahwa model bahasa telah menyandi sesuatu seperti kendala kausal dunia nyata." Untuk menguji ini, tim menyusun kalimat contoh — misalnya mendinginkan minuman dengan es, dengan salju, dengan api, atau dengan kata "kemarin" — lalu memeriksa keadaan matematis internal model menggunakan interpretabilitas mekanistik, yang mereka bandingkan dengan penilaian manusia.

Eksperimen dijalankan pada beberapa model open-source agar hasil tidak bergantung pada satu arsitektur, termasuk GPT-2 dari OpenAI, Llama 3.2 dari Meta, dan Gemma 2 dari Google. Studi menunjukkan bahwa model berukuran cukup besar mengembangkan vektor internal berbeda untuk kategori plausibilitas; vektor ini bahkan bisa membedakan kategori mirip seperti tidak mungkin versus mustahil dengan akurasi sekitar 85%. Vektor itu juga mencerminkan ketidakpastian manusia pada pernyataan yang ambigu.

Para peneliti melaporkan bahwa vektor-vektor tersebut mulai muncul pada model dengan lebih dari 2 miliar parameter, sementara model masa kini bisa memiliki lebih dari satu triliun parameter. Temuan ini dianggap berguna untuk mengembangkan model yang lebih cerdas dan lebih dapat dipercaya.

Interpretabilitas mekanistik mengungkap apa yang disandi model.
Vektor internal memetakan penilaian plausibilitas manusia.
Temuan membantu pengembangan model lebih cerdas dan dapat dipercaya.

Kata-kata sulit

sandi — mengubah informasi menjadi bentuk yang tersimpan

menyandi

interpretabilitas mekanistik — cara menjelaskan fungsi internal model secara rinci

vektor — representasi angka yang menyimpan informasi di model

vektor internal, vektor-vektor

plausibilitas — seberapa mungkin suatu peristiwa atau pernyataan

parameter — nilai atau ukuran yang menentukan perilaku model

akurasi — tingkat kebenaran atau ketepatan hasil model

kausal — berkaitan dengan hubungan sebab dan akibat

mencerminkan — menunjukkan sesuatu secara jelas atau menggambarkan

Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.

Pertanyaan diskusi

Bagaimana temuan tentang vektor yang memetakan plausibilitas bisa membantu membuat model lebih dapat dipercaya? Berikan alasan atau contoh.

Apa konsekuensi jika model bahasa hanya meniru pola bahasa tanpa memahami batasan dunia nyata? Jelaskan risiko yang mungkin muncul.

Apakah ambang munculnya vektor pada model lebih dari 2 miliar parameter berarti pengembangan model harus fokus pada ukuran besar saja? Mengapa atau mengapa tidak?

Metabolit Ditemukan pada Tulang Fosil Jutaan Tahun

Peneliti mengekstrak dan menganalisis metabolit dari tulang fosil berusia jutaan tahun. Analisis molekul ini memberi petunjuk tentang hewan, pola makan, dan lingkungan yang lebih hangat serta lebih basah dari masa lalu.

Level

Baca

28 Nov 2025

Metode Baru Daur Ulang Baterai Lithium Tanpa Asam

Para peneliti Rice University mengembangkan proses dua langkah FJH-ClO untuk memisahkan lithium dan logam dari baterai bekas. Metode ini bebas asam, memulihkan bahan bernilai, dan memakai lebih sedikit energi dan bahan kimia.

Level

Baca

12 Okt 2025

Kerja Sama untuk Memantau Danau Glasial di Hindu Kush-Himalaya

Gletser di wilayah Hindu Kush-Himalaya mencair dan membentuk banyak danau glasial. Banjir dari danau ini (GLOF) berbahaya, tetapi ketegangan politik dan kerahasiaan data menghambat pemantauan dan peringatan dini.

Level

Baca

22 Des 2025

Wombat Pakai Feses Kubus untuk Berkomunikasi

Sebuah studi menyelidiki apakah feses berbentuk kubus membantu wombat berkomunikasi lewat bau. Peneliti menganalisis kimia kotoran dan mengamati bahwa wombat lebih lama menyelidiki feses non-residen di latrin.

Level

Baca

21 Okt 2021

Survei: Jurnalisme Sains Menonjol Saat Pandemi

Laporan Global Science Journalism 2021 oleh SciDev.Net menyurvei jurnalis sains dari banyak negara. Hasil menunjukkan beban kerja naik, penggunaan pra-cetak meningkat, dan perbedaan pandangan tentang masa depan profesi.

Level

Baca

Model Bahasa AI dan Pemahaman Dunia Nyata^{CEFR B2}

Kata-kata sulit

Pertanyaan diskusi

Artikel terkait

Metabolit Ditemukan pada Tulang Fosil Jutaan Tahun

Metode Baru Daur Ulang Baterai Lithium Tanpa Asam

Kerja Sama untuk Memantau Danau Glasial di Hindu Kush-Himalaya

Wombat Pakai Feses Kubus untuk Berkomunikasi

Survei: Jurnalisme Sains Menonjol Saat Pandemi

Model Bahasa AI dan Pemahaman Dunia Nyata CEFR B2

Kata-kata sulit

Pertanyaan diskusi

Artikel terkait

Metabolit Ditemukan pada Tulang Fosil Jutaan Tahun

Metode Baru Daur Ulang Baterai Lithium Tanpa Asam

Kerja Sama untuk Memantau Danau Glasial di Hindu Kush-Himalaya

Wombat Pakai Feses Kubus untuk Berkomunikasi

Survei: Jurnalisme Sains Menonjol Saat Pandemi

Model Bahasa AI dan Pemahaman Dunia Nyata^{CEFR B2}