AI kuno yang baik tetap dapat bertahan meskipun LLM sedang bangkit

5 Min Read

Ingat setahun yang lalu, kembali ke bulan November lalu sebelum kita mengetahui tentang ChatGPT, ketika pembelajaran mesin hanya tentang membangun model untuk menyelesaikan satu tugas seperti persetujuan pinjaman atau perlindungan penipuan? Pendekatan tersebut tampaknya tidak berlaku lagi seiring dengan munculnya LLM yang digeneralisasikan, namun faktanya adalah model yang digeneralisasikan tidak cocok untuk setiap masalah, dan model berbasis tugas masih tetap berlaku dan baik di perusahaan.

Model berbasis tugas ini, hingga munculnya LLM, telah menjadi dasar bagi sebagian besar AI di perusahaan, dan model ini tidak akan hilang begitu saja. Ini adalah apa yang disebut CTO Amazon Werner Vogels sebagai “AI kuno yang baik” dalam ceramahnya minggu ini, dan dalam pandangannya, ini adalah jenis AI yang masih memecahkan banyak masalah di dunia nyata.

Atul Deo, manajer umum Amazon Bedrock, produk yang diperkenalkan awal tahun ini sebagai cara untuk menyambungkan ke berbagai model bahasa besar melalui API, juga percaya bahwa model tugas tidak akan hilang begitu saja. Sebaliknya, mereka telah menjadi alat AI lainnya di gudang senjata.

“Sebelum munculnya model bahasa besar, kita sebagian besar berada di dunia yang memiliki tugas khusus. Dan idenya adalah Anda akan melatih model dari awal untuk tugas tertentu,” kata Deo kepada TechCrunch. Dia mengatakan perbedaan utama antara model tugas dan LLM adalah yang satu dilatih untuk tugas tertentu, sementara yang lain dapat menangani hal-hal di luar batasan model.

Jon Turow, partner di perusahaan investasi Madrona, yang sebelumnya menghabiskan hampir satu dekade di AWS, mengatakan bahwa industri ini sedang membicarakan tentang kemampuan yang muncul dalam model bahasa besar seperti penalaran dan ketahanan di luar domain. “Hal ini memungkinkan Anda untuk memperluas melampaui definisi sempit tentang apa yang awalnya diharapkan dapat dilakukan oleh model tersebut,” katanya. Namun, tambahnya, masih banyak perdebatan mengenai sejauh mana kemampuan ini dapat dimanfaatkan.

Seperti Deo, Turow mengatakan model tugas tidak akan hilang begitu saja. “Jelas masih ada peran model tugas spesifik karena model tersebut bisa lebih kecil, lebih cepat, lebih murah, dan dalam beberapa kasus bahkan lebih berperforma karena dirancang untuk tugas tertentu,” ujarnya. .

Namun daya tarik model serba guna sulit untuk diabaikan. “Saat Anda melihat tingkat agregat di sebuah perusahaan, ketika ada ratusan model pembelajaran mesin yang dilatih secara terpisah, hal itu tidak masuk akal,” kata Deo. “Sedangkan jika Anda menggunakan model bahasa besar yang lebih mumpuni, Anda akan langsung mendapatkan manfaat penggunaan kembali, sekaligus memungkinkan Anda menggunakan satu model untuk menangani banyak kasus penggunaan yang berbeda.”

Bagi Amazon, SageMaker, platform operasi pembelajaran mesin perusahaan, tetap menjadi produk utama, yang ditujukan untuk ilmuwan data, bukan pengembang, seperti halnya Bedrock. Ini melaporkan puluhan ribu pelanggan membuat jutaan model. Akan sangat bodoh untuk menyerah, dan sejujurnya hanya karena LLM adalah tren saat ini tidak berarti bahwa teknologi yang ada sebelumnya tidak akan tetap relevan untuk beberapa waktu mendatang.

Perangkat lunak perusahaan khususnya tidak bekerja seperti itu. Tidak ada seorang pun yang membuang investasi besarnya begitu saja hanya karena ada hal baru, bahkan hal yang sama kuatnya dengan model bahasa besar yang ada saat ini. Perlu dicatat bahwa Amazon mengumumkan peningkatan ke SageMaker minggu ini, yang bertujuan untuk mengelola model bahasa besar.

Sebelum adanya model bahasa besar yang lebih mumpuni ini, model tugas merupakan satu-satunya pilihan, dan itulah cara perusahaan melakukan pendekatan terhadap model tersebut, dengan membangun tim ilmuwan data untuk membantu mengembangkan model ini. Apa peran ilmuwan data di era model bahasa besar yang alatnya ditujukan untuk pengembang? Turow berpendapat mereka masih memiliki pekerjaan penting yang harus dilakukan, bahkan di perusahaan yang berkonsentrasi pada LLM.

“Mereka akan berpikir kritis mengenai data, dan hal ini sebenarnya merupakan peran yang sedang berkembang, bukan menyusut,” katanya. Apa pun modelnya, Turow yakin data scientist akan membantu masyarakat memahami hubungan antara AI dan data di dalam perusahaan besar.

“Saya pikir kita semua perlu benar-benar berpikir kritis tentang apa yang bisa dan tidak bisa dilakukan oleh AI, serta apa arti dan arti data,” katanya. Dan hal ini berlaku terlepas dari apakah Anda sedang membangun model bahasa besar yang lebih umum atau model tugas.

Itu sebabnya kedua pendekatan ini akan terus bekerja secara bersamaan untuk beberapa waktu ke depan karena terkadang lebih besar lebih baik, dan terkadang tidak.

Baca selengkapnya tentang AWS re:Invent 2023 di TechCrunch

____________

Diterjemahkan dari situs techcrunch.com

Share This Article