Google Bard

Google Bard: Semua yang Perlu Anda Ketahui
Bard adalah chatbot AI generatif yang diberdayakan oleh LaMDA. Memahami Bard dan bagaimana Bard dapat berintegrasi dengan pencarian sangat penting bagi siapa saja yang berkecimpung di SEO atau penerbitan online

Google baru saja merilis Bard, jawabannya untuk ChatGPT, dan para pengguna mulai mengenalnya untuk melihat bagaimana perbandingannya dengan chatbot bertenaga kecerdasan buatan OpenAI.

Nama ‘Bard’ murni digerakkan oleh pemasaran, karena tidak ada algoritme yang bernama Bard, tetapi kita tahu bahwa chatbot ini didukung oleh LaMDA.

Berikut ini semua yang kami ketahui tentang Bard sejauh ini dan beberapa penelitian menarik yang dapat memberikan gambaran tentang jenis algoritme yang dapat mendukung Bard.

Apa itu Google Bard?


Bard adalah chatbot eksperimental Google yang didukung oleh model bahasa besar LaMDA.

Ini adalah AI generatif yang menerima perintah dan melakukan tugas-tugas berbasis teks seperti memberikan jawaban dan rangkuman serta membuat berbagai bentuk konten.

Bard juga membantu mengeksplorasi topik dengan meringkas informasi yang ditemukan di internet dan menyediakan tautan untuk menjelajahi situs web dengan informasi lebih lanjut.

Google Bard
Google Bard

Mengapa Google Merilis Bard?


Google merilis Bard setelah peluncuran ChatGPT OpenAI yang sangat sukses, yang menciptakan persepsi bahwa Google tertinggal dalam hal teknologi.

ChatGPT dianggap sebagai teknologi revolusioner yang berpotensi mengganggu industri pencarian dan menggeser keseimbangan kekuatan dari pencarian Google dan bisnis periklanan pencarian yang menguntungkan.

Pada tanggal 21 Desember 2022, tiga minggu setelah peluncuran ChatGPT, New York Times melaporkan bahwa Google telah menyatakan “kode merah” untuk segera menentukan responsnya terhadap ancaman yang ditimbulkan terhadap model bisnisnya.

Empat puluh tujuh hari setelah penyesuaian strategi kode merah, Google mengumumkan peluncuran Bard pada tanggal 6 Februari 2023.

Apa Masalah yang Dihadapi Google Bard?


Pengumuman Bard adalah kegagalan yang menakjubkan karena demo yang dimaksudkan untuk memamerkan AI chatbot Google mengandung kesalahan faktual.

Ketidakakuratan AI Google mengubah apa yang seharusnya menjadi sebuah kemenangan menjadi sebuah kegagalan.

Saham Google kemudian kehilangan nilai pasar sebesar seratus miliar dolar dalam satu hari, yang mencerminkan hilangnya kepercayaan terhadap kemampuan Google untuk menavigasi era AI yang menjulang.

Bagaimana Cara Kerja Google Bard?


Bard didukung oleh versi “ringan” dari LaMDA.

LaMDA adalah model bahasa besar yang dilatih pada kumpulan data yang terdiri dari dialog publik dan data web.

Ada dua faktor penting yang terkait dengan pelatihan yang dijelaskan dalam makalah penelitian terkait, yang dapat Anda unduh sebagai PDF di sini: LaMDA: Model Bahasa untuk Aplikasi Dialog (baca abstraknya di sini).

A. Keamanan: Model ini mencapai tingkat keamanan dengan menyetelnya dengan data yang telah dianotasi oleh para pekerja yang banyak.
B. Membumi: LaMDA membumikan dirinya secara faktual dengan sumber-sumber pengetahuan eksternal (melalui pencarian informasi, yaitu penelusuran).
Makalah penelitian LaMDA menyatakan:

“… landasan faktual, melibatkan memungkinkan model untuk berkonsultasi dengan sumber pengetahuan eksternal, seperti sistem pencarian informasi, penerjemah bahasa, dan kalkulator.

Kami mengukur faktualitas dengan menggunakan metrik groundedness, dan kami menemukan bahwa pendekatan kami memungkinkan model untuk menghasilkan respons yang didasarkan pada sumber-sumber yang diketahui, daripada respons yang hanya terdengar masuk akal.”

Google Bard
Google Bard

Google menggunakan tiga metrik untuk mengevaluasi keluaran LaMDA:

Sensibilitas: Pengukuran apakah sebuah jawaban masuk akal atau tidak.
Kekhususan: Mengukur apakah jawaban yang diberikan merupakan kebalikan dari jawaban yang umum/samar atau spesifik secara kontekstual.
Kemenarikan: Metrik ini mengukur apakah jawaban LaMDA memiliki wawasan yang luas atau menimbulkan rasa ingin tahu.
Ketiga metrik tersebut dinilai oleh para penilai crowdsourced, dan data tersebut dimasukkan kembali ke dalam mesin untuk terus memperbaikinya.

Makalah penelitian LaMDA menyimpulkan dengan menyatakan bahwa ulasan urun daya dan kemampuan sistem untuk memeriksa fakta dengan mesin pencari adalah teknik yang berguna.

Para peneliti Google menulis:

“Kami menemukan bahwa data yang dianotasi oleh orang banyak merupakan alat yang efektif untuk mendorong keuntungan tambahan yang signifikan.

Kami juga menemukan bahwa memanggil API eksternal (seperti sistem pencarian informasi) menawarkan jalan menuju peningkatan groundedness secara signifikan, yang kami definisikan sebagai sejauh mana respons yang dihasilkan berisi klaim yang dapat dirujuk dan diperiksa terhadap sumber yang diketahui.”

Bagaimana Rencana Google Untuk Menggunakan Bard Dalam Pencarian?

Masa depan Bard saat ini dibayangkan sebagai fitur dalam pencarian.

Pengumuman Google pada bulan Februari lalu tidak cukup spesifik tentang bagaimana Bard akan diimplementasikan.

Detail-detail penting terkubur dalam satu paragraf di akhir pengumuman blog tentang Bard, di mana Bard dideskripsikan sebagai fitur AI dalam penelusuran.

Ketidakjelasan tersebut memicu persepsi bahwa Bard akan diintegrasikan ke dalam penelusuran, padahal tidak demikian.

Pengumuman Google tentang Bard pada bulan Februari 2023 menyatakan bahwa Google pada suatu saat akan mengintegrasikan fitur AI ke dalam penelusuran:

“Sebentar lagi, Anda akan melihat fitur-fitur bertenaga AI di Penelusuran yang menyaring informasi kompleks dan berbagai perspektif ke dalam format yang mudah dicerna, sehingga Anda dapat dengan cepat memahami gambaran besar dan belajar lebih banyak dari web: apakah itu mencari perspektif tambahan, seperti blog dari orang-orang yang bermain piano dan gitar, atau mendalami topik terkait, seperti langkah-langkah untuk memulai sebagai pemula.

Fitur-fitur AI baru ini akan segera diluncurkan di Google Penelusuran.”

Jelas bahwa Bard bukanlah pencarian. Sebaliknya, fitur ini dimaksudkan sebagai fitur dalam penelusuran dan bukan sebagai pengganti penelusuran.

Google Bard
Google Bard

baca juga

Apa yang dimaksud dengan Fitur Penelusuran?
Fitur adalah sesuatu seperti Panel Pengetahuan Google, yang menyediakan informasi pengetahuan tentang orang, tempat, dan hal-hal penting.

Halaman web “Cara Kerja Penelusuran” Google tentang fitur menjelaskannya:

“Fitur penelusuran Google memastikan bahwa Anda mendapatkan informasi yang tepat pada waktu yang tepat dalam format yang paling berguna untuk kueri Anda.

Terkadang berupa halaman web, dan terkadang berupa informasi dunia nyata seperti peta atau inventaris di toko lokal.”

Dalam sebuah pertemuan internal di Google (dilansir dari CNBC), para karyawan mempertanyakan penggunaan Bard dalam pencarian.

Salah satu karyawan menunjukkan bahwa model bahasa yang besar seperti ChatGPT dan Bard bukanlah sumber informasi yang berbasis fakta.

Karyawan Google tersebut bertanya:

“Mengapa kita berpikir bahwa aplikasi pertama yang besar seharusnya adalah pencarian, yang pada intinya adalah menemukan informasi yang benar?”

Jack Krawczyk, pemimpin produk untuk Google Bard, menjawab:

“Saya hanya ingin memperjelas: Bard bukanlah pencarian.”

Pada acara internal yang sama, Wakil Presiden Teknik Google untuk Penelusuran, Elizabeth Reid, menegaskan bahwa Bard bukanlah penelusuran.

Dia mengatakan:

“Bard benar-benar terpisah dari penelusuran…”

Apa yang dapat kami simpulkan dengan yakin adalah bahwa Bard bukanlah iterasi baru dari pencarian Google. Ini adalah sebuah fitur.

Bard Adalah Metode Interaktif Untuk Menjelajahi Topik
Pengumuman Google tentang Bard cukup eksplisit bahwa Bard bukanlah pencarian. Ini berarti bahwa, sementara pencarian menampilkan tautan ke jawaban, Bard membantu pengguna menyelidiki pengetahuan.

Pengumuman tersebut menjelaskan:

“Ketika orang berpikir tentang Google, mereka sering kali berpikir untuk mencari jawaban faktual yang cepat, seperti ‘berapa banyak tuts yang dimiliki piano?

Namun semakin banyak orang yang beralih ke Google untuk mendapatkan wawasan dan pemahaman yang lebih dalam – seperti, ‘apakah piano atau gitar lebih mudah dipelajari, dan berapa banyak latihan yang dibutuhkan?

Mempelajari topik seperti ini membutuhkan banyak upaya untuk mengetahui apa yang benar-benar perlu Anda ketahui, dan orang sering kali ingin menjelajahi beragam pendapat atau perspektif.”

Mungkin akan sangat membantu jika kita menganggap Bard sebagai metode interaktif untuk mengakses pengetahuan tentang suatu topik.

Contoh Informasi Web Bard


Masalah dengan model bahasa yang besar adalah bahwa model tersebut meniru jawaban, yang dapat menyebabkan kesalahan faktual.

Para peneliti yang menciptakan LaMDA menyatakan bahwa pendekatan seperti memperbesar ukuran model dapat membantu mendapatkan informasi yang lebih faktual.

Tetapi mereka mencatat bahwa pendekatan ini gagal di area di mana fakta terus berubah selama perjalanan waktu, yang oleh para peneliti disebut sebagai “masalah generalisasi temporal.”

Kesegaran dalam arti informasi yang tepat waktu tidak dapat dilatih dengan model bahasa yang statis.

Solusi yang ditempuh oleh LaMDA adalah dengan menggunakan sistem temu kembali informasi. Sistem pencarian informasi adalah mesin pencari, jadi LaMDA memeriksa hasil pencarian.

Fitur dari LaMDA ini tampaknya merupakan fitur dari Bard.

Pengumuman Google Bard menjelaskan:

“Bard berusaha untuk menggabungkan luasnya pengetahuan dunia dengan kekuatan, kecerdasan, dan kreativitas model bahasa kami yang besar.

Bard memanfaatkan informasi dari web untuk memberikan tanggapan yang segar dan berkualitas tinggi.”

Tangkapan layar dari Google Bard Chat, Maret 2023
LaMDA dan (mungkin juga Bard) mencapai hal ini dengan apa yang disebut toolset (TS).

Perangkat ini dijelaskan dalam makalah peneliti LaMDA:

“Kami membuat sebuah toolset (TS) yang mencakup sistem pencarian informasi, kalkulator, dan penerjemah.

TS mengambil satu string sebagai masukan dan mengeluarkan daftar satu atau lebih string. Setiap alat dalam TS mengharapkan sebuah string dan mengembalikan daftar string.

Sebagai contoh, kalkulator menerima “135+7721”, dan mengeluarkan daftar yang berisi [“7856”]. Demikian pula, penerjemah dapat mengambil “halo dalam bahasa Prancis” dan menghasilkan [‘Bonjour’].

Terakhir, sistem pencarian informasi dapat mengambil “Berapa umur Rafael Nadal?”, dan menghasilkan [‘Rafael Nadal / Umur / 35’].

Sistem temu kembali informasi juga mampu mengembalikan cuplikan konten dari web terbuka, dengan URL yang sesuai.

TS mencoba sebuah string masukan pada semua alatnya, dan menghasilkan daftar keluaran akhir berupa string dengan menggabungkan daftar keluaran dari setiap alat dengan urutan sebagai berikut: kalkulator, penerjemah, dan sistem temu kembali informasi.

Sebuah alat akan mengembalikan daftar hasil yang kosong jika tidak dapat menguraikan input (misalnya, kalkulator tidak dapat menguraikan ‘Berapa umur Rafael Nadal?’), dan oleh karena itu tidak berkontribusi pada daftar output akhir.”

Berikut adalah tanggapan Bard dengan cuplikan dari web terbuka:

Tangkapan layar dari Google Bard Chat, Maret 2023
Sistem Penjawab Pertanyaan Percakapan
Tidak ada makalah penelitian yang menyebutkan nama “Bard.”

Namun, ada cukup banyak penelitian terbaru yang terkait dengan AI, termasuk oleh para ilmuwan yang terkait dengan LaMDA, yang mungkin berdampak pada Bard.

Berikut ini tidak mengklaim bahwa Google menggunakan algoritme ini. Kami tidak dapat mengatakan dengan pasti bahwa salah satu dari teknologi ini digunakan di Bard.

Nilai dari mengetahui tentang makalah penelitian ini adalah mengetahui apa yang mungkin terjadi.

Berikut ini adalah algoritma yang relevan dengan sistem penjawab pertanyaan berbasis AI.

Salah satu penulis LaMDA bekerja pada sebuah proyek tentang membuat data pelatihan untuk sistem pengambilan informasi percakapan.

Anda dapat mengunduh makalah penelitian tahun 2022 dalam bentuk PDF di sini: Pelukisan Dialog: Mengubah Dokumen menjadi Dialog (dan baca abstraknya di sini).

Masalah dalam melatih sistem seperti Bard adalah bahwa kumpulan data tanya-jawab (seperti kumpulan data yang terdiri dari pertanyaan dan jawaban yang ada di Reddit) terbatas pada perilaku orang-orang di Reddit.

Hal ini tidak mencakup bagaimana orang-orang di luar lingkungan tersebut berperilaku dan jenis pertanyaan yang mereka ajukan, dan apa jawaban yang tepat untuk pertanyaan-pertanyaan tersebut.

Para peneliti mengeksplorasi pembuatan sistem yang membaca halaman web, kemudian menggunakan “pelukis dialog” untuk memprediksi pertanyaan apa yang akan dijawab oleh bagian tertentu dalam apa yang dibaca oleh mesin.

Sebuah bagian dalam halaman web Wikipedia yang dapat dipercaya yang mengatakan, “Langit berwarna biru,” dapat diubah menjadi pertanyaan, “Apa warna langit?”

Para peneliti membuat kumpulan data pertanyaan dan jawaban mereka sendiri dengan menggunakan Wikipedia dan halaman web lainnya. Mereka menamakan kumpulan data tersebut WikiDialog dan WebDialog.

WikiDialog adalah sekumpulan pertanyaan dan jawaban yang berasal dari data Wikipedia.
WebDialog adalah kumpulan data yang berasal dari dialog halaman web di internet.
Dataset baru ini 1.000 kali lebih besar dari dataset yang ada. Pentingnya hal ini adalah memberikan kesempatan kepada model bahasa percakapan untuk belajar lebih banyak.

Para peneliti melaporkan bahwa dataset baru ini membantu meningkatkan sistem penjawab pertanyaan percakapan hingga lebih dari 40%.

Makalah penelitian menjelaskan keberhasilan pendekatan ini:

“Yang terpenting, kami menemukan bahwa dataset yang kami inpainted merupakan sumber data pelatihan yang kuat untuk sistem ConvQA…

Ketika digunakan untuk melatih arsitektur retriever dan reranker standar, mereka memajukan teknologi mutakhir di tiga tolok ukur pengambilan ConvQA yang berbeda (QRECC, OR-QUAC, TREC-CAST), memberikan keuntungan relatif hingga 40% pada metrik evaluasi standar…

Hebatnya, kami menemukan bahwa hanya dengan melakukan pra-pelatihan di WikiDialog, kami dapat menghasilkan kinerja pengambilan tanpa hasil yang kuat – hingga 95% dari kinerja retriever yang telah disetel ulang – tanpa menggunakan data ConvQA dalam domain. “

Apakah mungkin Google Bard dilatih menggunakan kumpulan data WikiDialog dan WebDialog?

Sulit untuk membayangkan skenario di mana Google akan meneruskan pelatihan AI percakapan pada dataset yang lebih dari 1.000 kali lebih besar.

Namun kami tidak tahu pasti karena Google tidak sering mengomentari teknologi yang mendasarinya secara mendetail, kecuali pada kesempatan langka seperti untuk Bard atau LaMDA.

Model Bahasa Besar yang Menghubungkan ke Sumber
Google baru-baru ini menerbitkan sebuah makalah penelitian yang menarik tentang cara untuk membuat model bahasa yang besar mengutip sumber informasi mereka. Versi awal makalah ini diterbitkan pada bulan Desember 2022, dan versi kedua diperbarui pada bulan Februari 2023.

Teknologi ini disebut sebagai eksperimental pada Desember 2022.

Anda dapat mengunduh PDF makalah tersebut di sini: Penjawaban Pertanyaan yang Diatribusikan: Evaluasi dan Pemodelan untuk Model Bahasa Besar yang Diatribusikan (baca abstrak Google di sini).

Makalah penelitian tersebut menyatakan maksud dari teknologi ini:

“Model bahasa besar (LLM) telah menunjukkan hasil yang mengesankan

Para peneliti berbagi:

“Kami menganggap penilaian manusia sebagai standar emas untuk evaluasi sistem, namun kami menemukan bahwa AutoAIS berkorelasi dengan baik dengan penilaian manusia di tingkat sistem, menawarkan janji sebagai metrik pengembangan di mana penilaian manusia tidak dapat dilakukan, atau bahkan sebagai sinyal pelatihan yang berisik. “

Teknologi ini masih bersifat eksperimental; mungkin belum digunakan. Namun, ini menunjukkan salah satu arah yang sedang dieksplorasi oleh Google untuk menghasilkan jawaban yang dapat dipercaya.

Makalah Penelitian Tentang Mengedit Tanggapan Untuk Faktualitas
Terakhir, ada teknologi luar biasa yang dikembangkan di Cornell University (juga berasal dari akhir tahun 2022) yang mengeksplorasi cara berbeda untuk mencari sumber atribusi dari keluaran model bahasa yang besar dan bahkan dapat mengedit jawaban untuk mengoreksi dirinya sendiri.

Universitas Cornell (seperti Universitas Stanford) melisensikan teknologi yang terkait dengan pencarian dan bidang lainnya, menghasilkan jutaan dolar per tahun.

Ada baiknya untuk mengikuti perkembangan penelitian universitas karena hal ini menunjukkan apa yang mungkin dan apa yang mutakhir.

Anda dapat mengunduh PDF makalahnya di sini: RARR: Meneliti dan Merevisi Apa yang Dikatakan oleh Model Bahasa, Menggunakan Model Bahasa (dan baca abstraknya di sini).

Abstrak tersebut menjelaskan tentang teknologi tersebut:

“Model bahasa (LM) sekarang unggul dalam banyak tugas seperti pembelajaran dengan sedikit pengambilan gambar, menjawab pertanyaan, penalaran, dan dialog.

Namun, mereka terkadang menghasilkan konten yang tidak didukung atau menyesatkan.

Pengguna tidak dapat dengan mudah menentukan apakah output mereka dapat dipercaya atau tidak, karena sebagian besar LM tidak memiliki mekanisme bawaan untuk mengaitkan dengan bukti eksternal.

Untuk mengaktifkan atribusi sambil tetap mempertahankan semua keuntungan kuat dari model generasi terbaru, kami mengusulkan RARR (Retrofit Atribusi menggunakan Riset dan Revisi), sebuah sistem yang 1) secara otomatis menemukan atribusi untuk keluaran model pembuatan teks apa pun dan 2) menyunting keluaran untuk memperbaiki konten yang tidak didukung sambil mempertahankan keluaran asli sebanyak mungkin.

… Kami menemukan bahwa RARR secara signifikan meningkatkan atribusi sementara mempertahankan input asli ke tingkat yang jauh lebih besar daripada model pengeditan yang telah dieksplorasi sebelumnya.

Selain itu, implementasi RARR hanya membutuhkan beberapa contoh pelatihan, model bahasa yang besar, dan pencarian web standar.”

Bagaimana Cara Mendapatkan Akses ke Google Bard?
Google saat ini menerima pengguna baru untuk menguji Bard, yang saat ini masih dalam tahap eksperimental. Google meluncurkan akses untuk Bard di sini.

Tangkapan layar dari bard.google.com, Maret 2023
Google dalam catatannya mengatakan bahwa Bard bukanlah pencarian, yang seharusnya dapat menenangkan mereka yang merasa cemas dengan fajarnya AI.

Kita berada di titik balik yang tidak seperti yang pernah kita lihat dalam, mungkin, satu dekade.

Memahami Bard sangat membantu siapa saja yang mempublikasikan di web atau mempraktikkan SEO karena akan sangat membantu untuk mengetahui batas-batas dari apa yang mungkin dilakukan dan masa depan dari apa yang dapat dicapai.

Leave a Comment