Apa Itu LSI dan Mengapa Tidak Penting untuk SEO

Jasa

Bisakah kata kunci LSI berdampak positif pada strategi SEO Anda? Berikut adalah ikhtisar berbasis fakta tentang Pengindeksan Semantik Laten dan mengapa itu tidak penting untuk SEO.


Apa Itu Pengindeksan Semantik Laten dan Mengapa Tidak Penting untuk SEO


Bisakah kata kunci LSI berdampak positif pada strategi SEO Anda? Berikut adalah ikhtisar berbasis fakta tentang Pengindeksan Semantik Laten dan mengapa itu tidak penting untuk SEO.

  • Ini Adalah Pengindeksan Semantik Laten
  • LSI Tidak Praktis untuk Web
  • Apakah Ada Makalah Penelitian Kata Kunci Google LSI?
  • Apakah Google Menggunakan Kata Kunci LSI?
  • Mengapa Google Dikaitkan dengan Analisis Semantik Laten
  • Analisis Semantik & SEO
  • Fakta Tentang Pengindeksan Semantik Laten
  • Banyak klaim dibuat untuk Pengindeksan Semantik Laten (LSI) dan “Kata Kunci LSI” untuk SEO.

Beberapa bahkan mengatakan bahwa Google mengandalkan “kata kunci LSI” untuk memahami halaman web.

Ini telah dibahas selama hampir dua puluh tahun dan fakta berbasis bukti telah ada sepanjang waktu.

Ini Adalah Pengindeksan Semantik Laten


Pengindeksan semantik laten (juga disebut sebagai Analisis Semantik Laten) adalah metode analisis sekumpulan dokumen untuk menemukan kemunculan statistik bersama dari kata-kata yang muncul bersamaan yang kemudian memberikan wawasan tentang topik kata dan dokumen tersebut.

Dua dari masalah (di antara beberapa) yang ditetapkan untuk dipecahkan oleh LSI adalah masalah sinonim dan polisemi.

Sinonimi adalah referensi tentang berapa banyak kata yang dapat menggambarkan hal yang sama.

Seseorang yang menelusuri “resep flapjack” sama dengan menelusuri “resep pancake” (di luar Inggris Raya) karena flapjack dan pancake adalah sinonim.

Polisemi mengacu pada kata dan frasa yang memiliki lebih dari satu makna. Kata jaguar dapat berarti binatang, mobil, atau tim sepak bola Amerika.

LSI mampu memprediksi secara statistik arti kata yang diwakili dengan menganalisis secara statistik kata-kata yang muncul bersamaan dalam dokumen.

Dengan memahami bagaimana kata-kata muncul bersamaan, komputer lebih mampu menjawab pertanyaan dengan mengaitkan kata kunci yang tepat dengan benar ke permintaan pencarian.

The paten untuk LSI diajukan pada tanggal 15 September 1988. Ini adalah teknologi lama yang datang tahun sebelum internet seperti yang kita tahu itu ada.

LSI bukanlah hal baru dan juga tidak canggih.

Penting untuk dipahami bahwa pada tahun 1988, LSI sedang mengembangkan seni pencocokan teks sederhana.

LSI adalah teknologi yang sudah ada sejak dulu.

Sama seperti komputer dari tahun 1988, kemajuan dalam Information Retrieval telah berkembang pesat selama lebih dari 30 tahun terakhir.

undercover co id

LSI Tidak Praktis untuk Web


Kekurangan utama dalam menggunakan Pengindeksan Semantik Laten untuk seluruh web adalah bahwa kalkulasi yang dilakukan untuk membuat analisis statistik harus dihitung ulang setiap kali laman web baru diterbitkan dan diindeks.

Kekurangan ini disebutkan dalam makalah penelitian tahun 2003 (non-Google) tentang penggunaan LSI untuk mendeteksi spam email (Menggunakan Pengindeksan Semantik Laten untuk Menyaring PDF Spam).

Makalah penelitian mencatat:

“Satu masalah dengan LSI adalah bahwa LSI tidak mendukung penambahan ad-hoc dokumen baru setelah set semantik dibuat. Pembaruan apa pun pada nilai sel apa pun akan mengubah koefisien di setiap vektor kata lainnya, karena SVD menggunakan semua hubungan linier dalam dimensi yang ditetapkan untuk menginduksi vektor yang akan memprediksi setiap sampel teks tempat kata tersebut muncul… ”

ketidaksesuaian LSI untuk pengambilan informasi mesin pencari dan dia setuju, dengan mengatakan:

LSI adalah pendekatan pengindeksan lama yang dikembangkan untuk database statis yang lebih kecil. Ada kemiripan dengan teknologi yang lebih baru seperti penggunaan vektor kata atau word2Vec.

Salah satu batasan LSI adalah jika konten baru ditambahkan ke korpus, maka pengindeksan untuk seluruh korpus diperlukan, sehingga kegunaannya terbatas untuk korpus yang berubah dengan cepat seperti Web. ”

Apakah Ada Makalah Penelitian Kata Kunci Google LSI?


Beberapa di komunitas pencarian percaya Google menggunakan “Kata Kunci LSI” dalam algoritma pencarian mereka seolah-olah LSI masih merupakan teknologi mutakhir.

Untuk membuktikannya, beberapa merujuk pada makalah penelitian 2016 berjudul, Meningkatkan Pengelompokan Topik Semantik untuk Kueri Pencarian dengan Word Co-kejadian dan Bigraph Co-clustering (PDF).

Makalah penelitian itu sama sekali bukan contoh Pengindeksan Semantik Laten. Ini adalah teknologi yang sama sekali berbeda.

Faktanya, makalah penelitian itu bukan tentang LSI (alias Analisis Semantik Laten) yang mengutip makalah penelitian LSI 1999 ([5] T. Hofmann. Pengindeksan semantik laten probabilistik. … 1999) sebagai bagian dari penjelasan mengapa LSI adalah tidak berguna untuk masalah yang penulis coba pecahkan.

Inilah yang dikatakannya:

“Alokasi dirichlet laten (LDA) dan analisis semantik laten probabilistik (PLSA) adalah teknik yang banyak digunakan untuk mengungkap tema laten dalam data teks. … Model ini mempelajari topik tersembunyi dengan secara implisit memanfaatkan pola kejadian bersama kata di tingkat dokumen.

Namun, teks pendek – seperti kueri penelusuran, tweet, atau pesan instan – kekurangan data, yang menyebabkan masalah untuk teknik pemodelan topik tradisional. ”

Salah jika menggunakan makalah penelitian di atas sebagai bukti bahwa Google menggunakan LSI sebagai faktor peringkat penting. Makalah ini bukan tentang LSI dan bahkan bukan tentang menganalisis halaman web.

Ini adalah makalah penelitian yang menarik dari tahun 2016 tentang kueri penelusuran singkat data mining untuk memahami apa artinya.

Selain makalah penelitian itu, kami tahu bahwa Google menggunakan BERT dan teknologi pencocokan saraf untuk memahami kueri penelusuran di dunia nyata.

Singkat cerita: penggunaan makalah penelitian itu untuk membuat pernyataan definitif tentang algoritme peringkat Google masih samar-samar.

Apakah Google Menggunakan Kata Kunci LSI?


Dalam pemasaran penelusuran, ada dua jenis data yang tepercaya dan berwibawa:

Ide faktual yang didasarkan pada dokumen publik seperti makalah penelitian dan paten.
Ide SEO yang didasarkan pada apa yang telah diungkapkan oleh Googler.
Yang lainnya hanyalah opini.

Penting untuk mengetahui perbedaannya.

Menurut siaran pers Google :

“Semantik Terapan adalah inovator yang terbukti dalam pemrosesan teks semantik dan periklanan online,” kata Sergey Brin, salah satu pendiri dan presiden Teknologi Google. “Akuisisi ini akan memungkinkan Google untuk menciptakan teknologi baru yang membuat iklan online lebih berguna bagi pengguna, penerbit, dan pengiklan.

Produk Applied Semantics didasarkan pada teknologi CIRCA yang dipatenkan, yang memahami, mengatur, dan mengekstrak pengetahuan dari situs web dan repositori informasi dengan cara yang meniru pemikiran manusia dan memungkinkan pengambilan informasi yang lebih efektif. Aplikasi utama dari teknologi CIRCA adalah produk AdSense Semantik Terapan yang memungkinkan penayang web memahami tema utama pada laman web untuk menayangkan iklan yang sangat relevan dan bertarget. ”

Analisis Semantik & SEO
Frasa “Analisis Semantik” adalah kata kunci populer di awal tahun 2000-an, mungkin sebagian didorong oleh teknologi pencarian semantik Ask Jeeves.

Pembelian Semantik Terapan Google mempercepat tren mengaitkan Google dengan Pengindeksan Semantik Laten, meskipun tidak ada bukti yang dapat dipercaya.

Jadi, pada tahun 2005 komunitas pemasaran penelusuran membuat pernyataan yang tidak berdasar seperti ini :

“Selama beberapa bulan saya melihat perubahan dalam peringkat situs web di Google dan jelas ada sesuatu yang berubah dalam algoritme mereka.

Salah satu perubahan terpenting adalah kemungkinan bahwa Google sekarang memberi bobot lebih pada Latent Semantic Indexing (LSI).

Ini seharusnya tidak mengherankan mengingat Google membeli Semantik Terapan pada bulan April 2003 dan dilaporkan telah menayangkan iklan AdSense mereka menggunakan pengindeksan semantik laten. ”

Mitos SEO bahwa Google menggunakan Kata Kunci LSI sangat mungkin berasal dari popularitas frasa seperti “Analisis Semantik,” “Pengindeksan Semantik”, dan “Pencarian Semantik” telah menjadi kata kunci SEO, yang diberikan oleh teknologi pencarian semantik Ask Jeeves dan pembelian semantik oleh Google perusahaan analisis Semantik Terapan.

baca juga

    Fakta Tentang Pengindeksan Semantik Laten


    LSI adalah metode lama untuk memahami apa itu dokumen.

    Itu dipatenkan pada tahun 1988, jauh sebelum internet seperti yang kita kenal.

    Sifat LSI membuatnya tidak cocok untuk diterapkan di seluruh internet untuk tujuan pengambilan informasi.

    Tidak ada makalah penelitian yang secara eksplisit menunjukkan bahwa pengindeksan semantik laten adalah fitur penting dari peringkat pencarian Google.

    Fakta-fakta yang disajikan dalam artikel ini menunjukkan bahwa hal ini telah terjadi sejak awal tahun 2000-an.

    Rumor tentang penggunaan LSI dan LSA oleh Google muncul pada tahun 2003 setelah Google mengakuisisi Applied Semantics, perusahaan yang memproduksi produk periklanan kontekstual AdSense.

    Namun Googler telah berkali-kali menegaskan bahwa Google tidak menggunakan yang namanya Kata Kunci LSI.

    Izinkan saya mengatakannya lebih keras lagi untuk mereka yang ada di belakang: Tidak ada yang namanya Kata Kunci LSI.

    Mengingat banyaknya bukti, masuk akal untuk menyatakan bahwa konsep Kata Kunci LSI salah.

    Fakta juga menunjukkan bahwa LSI bukanlah bagian penting dari algoritme peringkat Google.

    Sehubungan dengan kemajuan terkini dalam AI, pemrosesan bahasa alami, dan BERT, gagasan bahwa Google akan secara mencolok menggunakan LSI sebagai fitur peringkat benar-benar di luar kepercayaan dan konyol.

    Jasa

    Leave a Reply

    error: Content is protected !!