Artikel

Jika Anda sedang mengusahakan pengadaan AI dalam skala yang berarti saat ini, kisah minggu ini mungkin dapat membantu Anda menegosiasikan kontrak vendor AI yang ada di meja Anda dengan lebih baik.

Written By

William Kiong Wai Lun

Product Manager

More from Twimbit

Minggu ini, Anthropic melontarkan salah satu tuduhan paling mengejutkan dalam sejarah singkat industri AI pasca-ChatGPT. Berikut adalah temuan dari apa yang mereka sebut sebagai "serangan distilasi skala industri" (industrial-scale distillation attack).

DeepSeek menjalankan lebih dari 150.000 pertukaran data yang berfokus pada logika dasar dan penyelarasan (alignment), menyelidiki bagaimana Claude menangani kueri yang sensitif terhadap kebijakan. Moonshot AI menjalankan 3,4 juta pertukaran data yang menargetkan penalaran agen (agentic reasoning), penggunaan alat, dan visi komputer. Anthropic mendeskripsikan satu operasi dari lab Tiongkok lainnya yang menjalankan hydra cluster: puluhan ribu akun simultan yang menyebarkan permintaan melalui kunci API dan penyedia cloud yang berbeda untuk menghindari deteksi. Saat Anthropic merilis model Claude baru, lalu lintas data secara spesifik dialihkan untuk memanen versi terbaru tepat saat model tersebut diluncurkan.

Teknik ini memiliki nama resmi: distilasi model (model distillation). Sebuah model yang lebih kecil belajar dengan mempelajari output dari model yang lebih besar dan lebih mumpuni. Dalam perspektif mereka, melakukan hal ini melalui cara-cara curang merupakan pencurian Kekayaan Intelektual (IP), pelanggaran ketentuan layanan, dan masalah keamanan nasional, karena alasan yang jelas.

Temuan ini dilaporkan secara independen oleh Bloomberg, CNBC, dan CNN pada 23 dan 24 Februari. Belum ada laboratorium yang disebutkan namanya memberikan tanggapan publik pada saat publikasi ini.

Ini bukan pertama kalinya terjadi. Awal bulan itu, lab AI besar Amerika lainnya mengirim surat terbuka kepada legislator AS yang mengutip pelaku yang sama, mendeskripsikan metode ekstraksi baru yang dikaburkan yang masih terus dikembangkan. Pada Februari 2026, Google Threat Intelligence Group menerbitkan AI threat tracker miliknya sendiri yang mendokumentasikan lonjakan dari apa yang secara independen mereka sebut sebagai "serangan distilasi." Google mengamati pola yang sama dari entitas sektor swasta di seluruh dunia, dan mendeskripsikan mekanisme dasarnya dengan istilah sederhana: menggunakan akses API yang sah untuk secara sistematis mengkloning penalaran sebuah model tanpa membangun kemampuan dasarnya sendiri. Laporan mereka juga mencatat bahwa aktivitas ini "secara efektif mewakili bentuk pencurian kekayaan intelektual."

Dua laboratorium terbesar di industri ini, dalam kuartal yang sama, mendokumentasikan pola serangan yang sama.

Di sinilah metafora resep makanan menunjukkan relevansinya.

Setiap koki belajar dari hidangan yang tidak mereka temukan sendiri. Setiap insinyur membangun sesuatu berdasarkan makalah yang tidak mereka tulis. Pertanyaannya bukanlah apakah pengetahuan itu dibagikan: melainkan apakah pembagian itu disetujui, dikompensasi, atau setidaknya diakui.

Hal ini membawa kita pada pertanyaan yang layak direnungkan: Apakah Google atau Anthropic sendiri memasak dari resep orang lain?

Jawabannya: bukan dari model lain. Melainkan dari kita, dan kehidupan daring kita yang ada di mana-mana.

Pada September 2025, Anthropic menyelesaikan gugatan hak cipta senilai US$1,5 miliar. Para penulis yang bukunya digunakan untuk melatih Claude tanpa izin dan tanpa bayaran mengajukan kasus tersebut.

Mekanismenya berbeda dengan apa yang dilakukan laboratorium Tiongkok. Namun pola dasarnya sama: Ambil karya yang dihasilkan orang lain. Gunakan itu untuk membangun sesuatu yang lebih mumpuni. Selesaikan ketentuan ekstraksi itu belakangan, jika memang diselesaikan. Logika yang sama, diterapkan pada kekayaan intelektual dalam skala yang belum bisa dijangkau oleh hukum.

Apa yang membedakan apa yang dilakukan laboratorium-laboratorium tersebut minggu ini adalah spesifikasinya: pembuatan akun palsu, ekstraksi berskrip dalam skala besar, dan penghindaran deteksi yang terkoordinasi. Distilasi itu sendiri adalah fondasi modern dari industri AI saat ini. Apa yang diperdebatkan dalam kisah ini adalah varian rahasia bervolume tinggi yang dijalankan melalui akun palsu, bukan prinsipnya itu sendiri, yang diam-diam diandalkan oleh sebagian besar ekosistem AI "terbuka".

Apa artinya bagi para pengambil keputusan AI?

Perusahaan yang membeli AI atas dasar asal-usul etis (ethical provenance) sedang bertaruh di lahan yang diperebutkan. Dan sebagian besar kerangka kerja pengadaan saat ini tidak dibangun untuk medan tersebut.

Asal-usul model (model provenance) belum menarik pengawasan yang sebanding dengan jutaan nilai kontrak yang dipertaruhkan padanya. Ketika seorang CIO atau CTO memilih platform AI garda depan karena reputasi keamanannya, komitmen AI yang bertanggung jawab, atau nilai-nilai yang dinyatakannya: mereka membuat asumsi tentang konsistensi dan silsilah. Bahwa perusahaan yang menerbitkan kebijakan penskalaan yang bertanggung jawab menerapkan prinsip-prinsip yang sama saat membangun model-model ini.

Asumsi itu lebih sulit dipertahankan minggu ini dibandingkan minggu lalu. Tidak ada rantai pasok yang "bersih" dalam AI garda depan. Setiap model terkemuka membawa akumulasi kecerdasan dari konten yang tidak mereka pesan, karya yang tidak mereka lisensi, dan output yang tidak mereka bayar. Definisi-definisi tersebut masih terus ditulis, oleh industri yang membangun di atas fondasi yang belum sepenuhnya mereka bayar.

Pertanyaan yang relevan untuk tahun 2026 bukanlah apakah ini terjadi. Melainkan apakah kerangka kerja pengadaan dan tata kelola Anda telah dikalibrasi untuk dunia di mana asal-usul setiap model AI, sampai taraf tertentu, masih diperdebatkan.

Silsilah model, asal-usul data pelatihan, dasar di mana kemampuan "cerdas" ini dibangun: ini adalah pertanyaan pengadaan yang sah. Hal-hal ini sebagian besar absen dari kontrak perusahaan saat ini. Vendor yang menetapkan aturan debat ini adalah vendor yang sama yang mencari kontrak multitahun berdasarkan aturan tersebut. Verifikasi independen adalah tanggapan yang perlu ditambahkan oleh setiap tim hukum dan tata kelola ke dalam daftar tindakan strategis mereka.

Implikasinya bagi pemimpin AI perusahaan bisa sangat besar. Asal-usul model dan risiko distilasi harus masuk dalam kriteria evaluasi yang sama dengan akurasi dan biaya. Pembicaraan itu sudah sangat mendesak seiring perusahaan melangkah melampaui proyek percontohan (pilot projects).

Untungnya, kerangka regulasi sudah ada. EU AI Act dan California AB 2013, yang keduanya berlaku pada tahun 2026, mewajibkan pengungkapan data pelatihan yang terdokumentasi untuk sistem AI berisiko tinggi. Pada tahun 2025, otoritas perlindungan data Italia mendenda sebuah lab AI besar sebesar €15 juta karena pelanggaran data pelatihan.

Tekanan tata kelola datang dari luar, dan akhirnya dari dalam sebagian besar dewan direksi. Sebagian besar kerangka pengadaan tidak dapat berevolusi cukup cepat. Jadi, ubahlah apa yang Anda kendalikan: pertanyaan kontrak Anda.

Mintalah "struk pembayarannya". Pengungkapan data pelatihan, silsilah model, risiko distilasi, dan verifikasi pihak ketiga. Jika mereka tidak bisa menunjukkannya, jangan beli ceritanya.

Pemeriksaan Runtime (Runtime Check)

Tiga poin untuk diangkat dalam pertemuan Anda berikutnya:

Kesenjangan Transparansi: Apa yang dikatakan vendor tentang etika dan apa yang ada di dalam model mereka adalah dua hal yang berbeda. Komitmen AI yang bertanggung jawab mendeskripsikan niat ke depan, bukan data apa yang membangun model tersebut atau apakah penciptanya dikompensasi.

Titik Buta Struktural: Metode serangan yang didokumentasikan minggu ini sekarang menjadi pengetahuan publik, namun sebagian besar kebijakan AI perusahaan ditulis sebelum hal itu ada. Jika kebijakan organisasi Anda belum diperbarui untuk memperhitungkan bagaimana kapabilitas dapat diekstraksi secara rahasia, Anda memiliki titik buta.

Fragmentasi Kepemilikan: Di dalam sebagian besar organisasi, tidak ada yang benar-benar "memiliki" pertanyaan tentang dari mana model berasal. Pertanyaan data pelatihan dan lisensi terpecah di antara departemen Hukum, Pengadaan, dan TI. Fragmentasi ini tetap tidak terlihat sampai terjadi sengketa pelanggan atau audit regulator.