Terobosan ini diumumkan oleh Sapient Intelligence melalui riset yang dipublikasikan secara daring. Mereka mengembangkan arsitektur baru bernama Hierarchical Recurrent Model (HRM) yang disebut jauh lebih efisien dalam memproses data dibandingkan model Transformer standar yang selama ini menjadi tulang punggung AI generatif seperti GPT atau Llama.
Alih-alih memproses triliunan kata dari internet, model bernama HRM-Text ini hanya dilatih dengan 40 miliar token data. Jumlah itu 100 hingga 900 kali lebih kecil dari model seukurannya.
Hasilnya, model dengan satu miliar parameter ini mampu mencapai skor kompetitif pada tolok ukur industri. Ia mencatatkan 60,7 persen di MMLU (pengujian pengetahuan umum), 84,5 persen di GSM8K (soal matematika), dan 56,2 persen di MATH. Angka-angka ini sebanding dengan model berparameter 2 miliar hingga 7 miliar milik pesaing.
Kunci efisiensi ini terletak pada arsitektur HRM yang memisahkan komputasi menjadi dua lapisan: lapisan strategis yang bergerak lambat dan lapisan eksekusi yang bergerak cepat. Pendekatan ini mengurangi beban komputasi yang selama ini terbuang untuk menghafal urutan kata acak di internet.
“Yang kita inginkan dari model adalah pemahaman mendalam tentang logika dan penalaran, bukan kemampuan menghafal utas Reddit tahun 2014,” kata Guan Wang, CEO Sapient Intelligence, kepada VentureBeat. Ia menyebut praktik industri saat ini sebagai “kecanduan skala” yang mencapai titik diminishing returns.
Wang secara spesifik menyasar perusahaan seperti hedge fund, asuransi, dan bank. Institusi-institusi ini memiliki data kepemilikan yang sangat sensitif—catatan riset internal, logika transaksi, aturan kepatuhan—dan enggan mengirimkannya ke model AI eksternal.
“Yang mereka butuhkan bukan model raksasa yang menghafal internet. Mereka butuh mesin penalaran kompak yang bisa belajar struktur tugas mereka,” ujar Wang. Dengan HRM-Text, perusahaan dapat melatih model dari awal hanya dalam 1,9 hari menggunakan 16 GPU.
Meski hasilnya impresif, Wang bersikap realistis. “HRM-Text belum bisa menjadi pengganti ChatGPT yang siap pakai,” katanya. Model ini lebih tepat disebut sebagai bukti konsep—mirip dengan rilis awal GPT—yang menunjukkan bahwa arsitektur yang lebih cerdas dapat menggantikan kekuatan komputasi mentah.
Untuk mengatasi masalah stabilitas matematis pada model rekuren berskala besar, tim peneliti Sapient memperkenalkan dua inovasi: MagicNorm, teknik normalisasi khusus, dan metode pemanasan bertahap selama pelatihan. Mereka juga mengubah sasaran pelatihan dari prediksi token berikutnya menjadi penyelesaian tugas, sehingga model hanya diberi hadiah untuk respons akhir, bukan setiap kata yang dihasilkan.
Terobosan ini membuka peluang bagi perusahaan di Indonesia yang selama ini bergantung pada API model asing atau solusi cloud mahal. Biaya pelatihan yang turun ke level ribuan dolar berarti pengembangan model AI spesifik-domain—misalnya untuk bahasa daerah atau regulasi lokal—kini lebih terjangkau secara ekonomi.
“Ketika biaya melatih model penalaran yang mumpuni turun ke sekitar 1.500 dolar, AI berhenti menjadi soal infrastruktur dan berubah menjadi soal strategi,” kata Wang. “Perusahaan Fortune 500 tidak perlu lagi bertanya ‘mampukah kita membeli model?’, melainkan ‘pengetahuan bisnis apa yang harus model kita pelajari, dan penalaran macam apa yang perlu dioptimalkan?’”