Startup Sapient Latih Model AI Dasar Hanya dengan Biaya Rp 24 Juta, Tantang Dominasi Raksasa Teknologi

Penulis: Fajar • Kamis, 11 Juni 2026 | 17:01:01 WIB

Sapient Intelligence kembangkan model AI HRM-Text dengan biaya pelatihan hanya Rp 24 juta.

Terobosan ini diumumkan oleh Sapient Intelligence melalui riset yang dipublikasikan secara daring. Mereka mengembangkan arsitektur baru bernama Hierarchical Recurrent Model (HRM) yang disebut jauh lebih efisien dalam memproses data dibandingkan model Transformer standar yang selama ini menjadi tulang punggung AI generatif seperti GPT atau Llama.

Efisiensi Ekstrem: 40 Miliar Token vs Triliunan Token

Alih-alih memproses triliunan kata dari internet, model bernama HRM-Text ini hanya dilatih dengan 40 miliar token data. Jumlah itu 100 hingga 900 kali lebih kecil dari model seukurannya.

Hasilnya, model dengan satu miliar parameter ini mampu mencapai skor kompetitif pada tolok ukur industri. Ia mencatatkan 60,7 persen di MMLU (pengujian pengetahuan umum), 84,5 persen di GSM8K (soal matematika), dan 56,2 persen di MATH. Angka-angka ini sebanding dengan model berparameter 2 miliar hingga 7 miliar milik pesaing.

Arsitektur Baru yang Membagi Beban Kerja

Kunci efisiensi ini terletak pada arsitektur HRM yang memisahkan komputasi menjadi dua lapisan: lapisan strategis yang bergerak lambat dan lapisan eksekusi yang bergerak cepat. Pendekatan ini mengurangi beban komputasi yang selama ini terbuang untuk menghafal urutan kata acak di internet.

“Yang kita inginkan dari model adalah pemahaman mendalam tentang logika dan penalaran, bukan kemampuan menghafal utas Reddit tahun 2014,” kata Guan Wang, CEO Sapient Intelligence, kepada VentureBeat. Ia menyebut praktik industri saat ini sebagai “kecanduan skala” yang mencapai titik diminishing returns.

Target Pasar: Perusahaan dengan Data Sensitif

Wang secara spesifik menyasar perusahaan seperti hedge fund, asuransi, dan bank. Institusi-institusi ini memiliki data kepemilikan yang sangat sensitif—catatan riset internal, logika transaksi, aturan kepatuhan—dan enggan mengirimkannya ke model AI eksternal.

“Yang mereka butuhkan bukan model raksasa yang menghafal internet. Mereka butuh mesin penalaran kompak yang bisa belajar struktur tugas mereka,” ujar Wang. Dengan HRM-Text, perusahaan dapat melatih model dari awal hanya dalam 1,9 hari menggunakan 16 GPU.

Bukan Pengganti ChatGPT, Tapi Bukti Konsep

Meski hasilnya impresif, Wang bersikap realistis. “HRM-Text belum bisa menjadi pengganti ChatGPT yang siap pakai,” katanya. Model ini lebih tepat disebut sebagai bukti konsep—mirip dengan rilis awal GPT—yang menunjukkan bahwa arsitektur yang lebih cerdas dapat menggantikan kekuatan komputasi mentah.

Untuk mengatasi masalah stabilitas matematis pada model rekuren berskala besar, tim peneliti Sapient memperkenalkan dua inovasi: MagicNorm, teknik normalisasi khusus, dan metode pemanasan bertahap selama pelatihan. Mereka juga mengubah sasaran pelatihan dari prediksi token berikutnya menjadi penyelesaian tugas, sehingga model hanya diberi hadiah untuk respons akhir, bukan setiap kata yang dihasilkan.

Implikasi bagi Industri AI Indonesia

Terobosan ini membuka peluang bagi perusahaan di Indonesia yang selama ini bergantung pada API model asing atau solusi cloud mahal. Biaya pelatihan yang turun ke level ribuan dolar berarti pengembangan model AI spesifik-domain—misalnya untuk bahasa daerah atau regulasi lokal—kini lebih terjangkau secara ekonomi.

“Ketika biaya melatih model penalaran yang mumpuni turun ke sekitar 1.500 dolar, AI berhenti menjadi soal infrastruktur dan berubah menjadi soal strategi,” kata Wang. “Perusahaan Fortune 500 tidak perlu lagi bertanya ‘mampukah kita membeli model?’, melainkan ‘pengetahuan bisnis apa yang harus model kita pelajari, dan penalaran macam apa yang perlu dioptimalkan?’”

Reporter: Fajar

Sumber: venturebeat.com This article was automatically rewritten by AI based on the source above without altering the facts of the original article.

Artikel Terpopuler

Indeks ›

Terkini

Indeks ›

Startup Sapient Latih Model AI Dasar Hanya dengan Biaya Rp 24 Juta, Tantang Dominasi Raksasa Teknologi

Efisiensi Ekstrem: 40 Miliar Token vs Triliunan Token

Arsitektur Baru yang Membagi Beban Kerja

Target Pasar: Perusahaan dengan Data Sensitif

Bukan Pengganti ChatGPT, Tapi Bukti Konsep

Implikasi bagi Industri AI Indonesia

Artikel Terpopuler

Jadwal Kapal Pelni KM Sinabung, Ciremai, dan Dobonsolo Rute Jayapura-Surabaya Juli-Agustus 2026, Tiket Mulai Rp 500 Ribuan

Pertamina Siap Dukung Pembalap Indonesia di MotoGP Mandalika 2026, Ini Bentuk Komitmennya

9 Orang Tewas Akibat Utak-atik Bom Sisa Perang Dunia II di Biak Numfor, Polisi Setop Penyidikan 5 Tersangka

Jadwal Kapal Pelni KM Ciremai 17-27 Juli 2026: Simak Waktu Sandar di Pelabuhan Jayapura dan Rute Lengkap

Sidang Gugatan SK Bupati Merauke di PTUN Jayapura: Dua Saksi Adat Malind Bersaksi Proyek Jalan 135 Km Tak Libatkan Pemilik Ulayat

Terkini

Peluang Usaha Kuliner Khas Papua bagi Pemula, Berpotensi Cuan

Panduan Lengkap Daftar Kartu Prakerja di Papua

Bengkel Motor Resmi di Jayapura, Pilihan Tepat untuk Servis Berkualitas

Bank BRI: Jenis Pinjaman dan Syarat Pengajuan yang Perlu Diketahui

Kolaborasi Tiga Negara di Smelter Nikel Morowali: Autoclave Raksasa Terpasang, Target Pabrik Baterai Global