- Penelitian menemukan model bahasa besar sulit mengalikan empat digit angka.
- Masalah utama adalah bagaimana menyimpan hasil sementara selama perhitungan.
- Pelatihan standar membuat model hanya belajar pola permukaan data.
- Metode baru bernama ICoT mengajarkan model memegang nilai antara.
- Model ICoT dapat mengkodekan dan menyimpan nilai antara penting.
- Mekanisme perhatian membantu model mengambil kembali nilai-nilai itu kemudian.
- Menambah tujuan pelatihan membuat model dua lapis belajar melacak jumlah.
- Studi menekankan arsitektur dan tujuan pelatihan penting untuk penalaran.
Kata-kata sulit
- mengalikan — melakukan operasi matematika untuk menghasilkan produk
- menyimpan — menaruh atau menjaga data untuk digunakan nanti
- sementara — bersifat tidak tetap dan hanya untuk waktu singkat
- pelatihan — proses mengajar model dengan data
- mekanisme perhatian — cara model fokus pada informasi penting
- nilai — angka atau informasi yang digunakan dalam perhitungannilai antara, nilai-nilai
Tips: arahkan kursor, fokus, atau ketuk kata yang disorot di dalam teks untuk melihat definisi singkat sambil membaca atau mendengarkan.
Pertanyaan diskusi
- Pernahkah kamu kesulitan mengalikan angka besar?
- Saat menghitung, apakah kamu menulis nilai sementara?
Artikel terkait
AI dan risiko bagi komunitas LGBTQ+
Kecerdasan buatan semakin hadir, tetapi data dan desain model dapat menghasilkan bias terhadap orang LGBTQ+. Advokat meminta perlindungan lebih kuat, kerja sama dengan pengembang, dan larangan pada sistem yang mendeteksi atau mengklasifikasi gender.
Sel T di amandel berbeda dari sel di darah
Penelitian menemukan bahwa sel T di amandel memiliki perbedaan penting dibanding sel T dalam darah. Tim peneliti menganalisis jutaan sel dari donor berbagai usia dan merekomendasikan memperhatikan lokasi jaringan saat menilai vaksin dan terapi.
Jurnalis Minta Bantuan untuk Lawan Berita Palsu AI
Perwakilan media dari negara berpenghasilan rendah dan menengah meminta kelompok jurnalis China membantu melawan berita palsu yang dibuat oleh AI pada forum Belt and Road di Ganzhou. Mereka menuntut label jelas pada konten AI dan tindakan terhadap platform.
Alat AI OSIA untuk Bimbingan Sekolah Menengah di Kamerun
OSIA adalah platform kecerdasan buatan yang dibuat oleh Frédéric Ngaba untuk membantu siswa sekolah menengah di Kamerun memilih jalur akademik dan karier. Platform ini menawarkan tutor virtual dalam 20 bahasa dan bank lebih dari 400 tes.