Meta Meluncurkan Llama 3, Model AI Dengan Kemampuan Unggul

Meta, perusahaan yang memiliki Facebook, baru saja merilis versi terbaru dari model AI open source mereka yang bernama Llama 3.
7 Min Read
Llama 3 (analytics Vidhya)
Llama 3 (analytics Vidhya)

Model AI Llama 3 menggantikan Llama 2 yang rilis pada tahun 2023 dengan berbagai peningkatan kemampuan. Saat ini, tersedia dua varian Llama 3, yaitu Llama 3 8B dan Llama 3 70B.

Menariknya, Meta mengatakan bahwa Model AI Llama 3 adalah model kecerdasan buatan terbaik dalam kelasnya yang dapat melebihi model terkenal seperti GPT-3.5 dari OpenAI dan Claude dari Anthropic. Karena sifatnya yang open source, komunitas AI sangat antusias dengan peluncuran ini.

Llama 3 (FavTutor)
Llama 3 (FavTutor)

1. Llama 3 Cerdas dalam berbagai tes standar keterampilan

Dalam bidang kecerdasan buatan (AI), kemampuan suatu model sering diukur melalui serangkaian pengujian standar yang disebut sebagai benchmark.

Meta dengan bangga mengumumkan bahwa varian Llama 3 8B, yang memiliki 8 miliar parameter, berhasil melampaui beberapa model sejenis lainnya seperti Mistral 7B dan Gemma 7B.

Keunggulan Llama 3 8B terlihat dalam setidaknya 9 benchmark, termasuk MMLU untuk menguji pengetahuan umum, ARC untuk mengukur kemampuan pemecahan masalah, dan DROP untuk menguji pemahaman dalam membaca.

Luar biasa, Llama 3 70B, varian dengan 70 miliar parameter, klaimnya dapat bersaing dengan model-model AI terbaik saat ini. Beberapa model tersebut termasuk Gemini 1.5 Pro dari Google dan Claude 3 Sonnet dari Anthropic.

BACA JUGA:  Mengenal WhatsApp Beta: Uji Coba Fitur Terbaru Sebelum Dirilis!

Bahkan, Llama 3 70B bisa kita katakan lebih unggul dalam beberapa benchmark seperti MMLU, HumanEval (yang mengukur kemampuan pemrograman), dan GSM-8K (yang menguji keterampilan matematika) dibandingkan dengan kedua model tersebut.

Menariknya, Meta juga telah mengembangkan serangkaian uji kemampuan mereka sendiri untuk membandingkan performa Llama 3 70B dengan model-model lain. Dalam uji ini, Llama 3 70B terbukti lebih unggul dalam berbagai tugas, mulai dari pemrograman, penulisan kreatif, hingga meringkas teks.

2. Llama 3 Berlatih dengan jumlah data yang Relatif Banyak

Sama seperti manusia yang belajar dari pengalaman, kemampuan AI juga sangat tergantung pada kualitas dan jumlah data yang digunakan selama proses pelatihan.

Dalam pengembangan Llama 3, Meta menggunakan dataset yang jauh lebih besar daripada versi sebelumnya, dengan peningkatan hingga 7 kali lipat. Total data yang digunakan untuk melatih Llama 3 setara dengan 750 miliar kata, sebuah jumlah yang sangat besar.

Selain jumlahnya yang lebih banyak, data latih Llama 3 juga lebih beragam. Sebagai contoh, data yang mengandung kode komputer meningkat hingga empat kali lipat jika kita bandingkan dengan Llama 2.

Selain itu, ada juga data dalam 30 bahasa selain bahasa Inggris yang mencakup 5 persen dari total data latih. Untuk memastikan Llama 3 belajar dari contoh-contoh terbaik, Meta juga mengembangkan sistem khusus yang dapat otomatis menyaring dan memilih data berkualitas tinggi.

3. Penyempurnaan dalam model arsitektur dan metode pelatihan

Dalam pengembangan Llama 3, perusahaan Meta tidak hanya fokus pada meningkatkan jumlah data, tetapi juga meningkatkan kualitas arsitektur model dan metode pelatihan.

BACA JUGA:  Threads, Aplikasi Pesaing Twitter Buatan Meta Rilis Sembunyi-Bunyi?

Salah satu inovasi yang diterapkan adalah penggunaan sistem encoding kata yang lebih efisien untuk mengubah teks menjadi representasi numerik yang dapat diproses oleh AI. Teknik attention juga di-upgrade untuk meningkatkan performa Llama 3 dengan menentukan bagian data yang memerlukan perhatian lebih.

Fine-tuning adalah proses terakhir dalam mengatur model AI agar dapat mengikuti instruksi dengan lebih baik, serta mendapatkan sentuhan inovatif. Beberapa metode terbaru digunakan untuk menciptakan model yang lebih mahir dan fleksibel.

Tidak hanya dalam hal algoritma, Meta juga mengembangkan perangkat keras dan perangkat lunak yang mendukung pelatihan Llama 3. Akibatnya, durasi untuk melatih Llama 3 menjadi tiga kali lebih singkat jika kita bandingkan dengan versi sebelumnya.

BACA JUGA:

4. Dapat Mendeteksi Kerentanan Pada sistem Keamanan

Seiring dengan kemampuan Llama 3 yang semakin meningkat, Meta juga semakin menyoroti pentingnya keamanan dan tanggung jawab dalam pengembangan AI.

Untuk mengidentifikasi konten berbahaya yang mungkin Llama 3 hasilkan, Meta meluncurkan dua perangkat canggih, yaitu Llama Guard 2 dan CyberSecEval 2. Kedua perangkat ini juga dapat mendeteksi potensi kerentanan keamanan siber dalam sistem AI.

Meta tidak hanya fokus pada isi yang berbahaya, tetapi juga pada kode yang dapat memiliki dampak negatif. Code Shield adalah alat terbaru dari Meta yang berfungsi sebagai filter cerdas untuk mengidentifikasi dan mencegah kode berbahaya yang dapat Llama 3 hasilkan.

BACA JUGA:  Mengenal Metaverse, Teknologi yang Wujudkan Isekai?

Sebagai tambahan, Meta juga telah menerbitkan panduan komprehensif yang bernama Responsible Use Guide yang berisi praktik-praktik terbaik dalam menerapkan AI dengan etika dan tanggung jawab.

5. Llama 3 Berlatih Dengan Lebih Dari 400 miliar Parameter

Meta memiliki komitmen untuk terus meningkatkan Llama 3 agar lebih maju dan berguna. Di masa mendatang, Meta berencana untuk membuat Llama 3 tersedia di berbagai platform cloud populer dan penyedia model AI melalui API. Saat ini, Llama 3 hanya bisa kita akses melalui meta.ai. Namun, platform ini belum tersedia untuk pengguna di Indonesia.

Di belakang layar, tim Meta sedang sibuk mengembangkan model Llama 3 yang lebih besar. Saat ini, mereka sedang melatih model dengan lebih dari 400 miliar parameter, melebihi varian Llama 3 70B.

Nantinya, varian baru ini akan memiliki kemampuan yang lebih maju, seperti pemahaman multibahasa, pemrosesan berbagai jenis data, dan memori yang lebih besar untuk mengatasi konteks yang lebih luas.

Penutup

Llama 3 adalah model open-source yang memberikan kesempatan kepada peneliti dan pengembang untuk belajar, mengubah, dan mengadaptasi teknologinya dengan bebas.

Ini dapat mendorong inovasi yang lebih cepat dan kolaborasi yang lebih luas dalam komunitas AI. Diharapkan bahwa manfaat dari Llama 3 akan dirasakan oleh lebih banyak orang dalam waktu dekat.

TAGGED:
Halo. kamu bisa memanggil saya dengan nama Tanti. Saya berdarah Jogja kelahiran Cirebon. Suka kucing, buku, dan ... ...
Leave a Comment