Latent Semantic Indexing: Bagaimana Algoritma LSI Bekerja?

Laten pengindeksan semantik, atau algoritma LSI, adalah cara Google untuk mengatasi penggunaan kata kunci yang berlebihan. Pelajari cara LSI bekerja dan mengapa sangat berguna.

A+ A-

Google menggunakan LSI untuk menilai makna dari konten yang ditulis di blog atau website Anda. Laten pengindeksan semantik adalah keliru untuk 'analisis semantik laten,' teknik analisis statistik yang dapat digunakan karakter string untuk menentukan semantik teks - apa yang teks sebenarnya berarti.

Latent Semantic Indexing

Di sini kita akan membahas beberapa aspek dari LSI yang membuat Anda berpikir secara berbeda tentang kata kunci dan bagaimana Anda menulis konten Anda. Perlu diingat bahwa Google lebih besar dalam lalu lintas pencarian itu mendapat bahwa semua mesin pencari lainnya digabungkan. Juga, beberapa orang lain ini menggunakan data Google. Itulah sebabnya kami fokus pada itu.

Apa Latent Semantic Indexing?

Tujuan Google adalah untuk menyediakan klien dengan informasi terbaik yang dapat ketika mereka melakukan pencarian. Google harus karena itu sepenuhnya memahami apa pencari informasi cari ketika mereka menggunakan kata kunci untuk informasi, dan juga seberapa baik setiap halaman web yang diindeks memberikan informasi tersebut.

semantik pengindeksan (LSI) algoritma laten Google dikembangkan untuk menggunakan karakter string dalam dokumen untuk menetapkan relevansi semantik untuk istilah pencarian (keyword) yang digunakan. Dengan kata lain, untuk membantu membangun makna sebenarnya dari teks pada posting blog atau halaman web.

Algoritma LSI menganggap semua hal konstituen yang digunakan dalam teks dokumen untuk menetapkan arti yang benar dalam kaitannya dengan kata kunci yang digunakan. Itulah mengapa penting untuk lebih spesifik ketika mencari informasi di Google. Jika Anda menggunakan kata 'Apache' sebagai istilah pencarian di Google, pertama Anda enam hasil mencakup aplikasi web server, asli suku Amerika, helikopter apache dan perusahaan eksplorasi minyak dan gas menggunakan nama itu.

Anda tidak dapat berasumsi bahwa Google akan kembali definisi yang sama untuk istilah pencarian yang Anda pikirkan. Anda harus tidak hanya menggunakan kata kunci utama Anda, tetapi menentukan definisi dalam kaitannya dengan penggunaan itu.

Hasil Pencarian Google - Apache

Dengan cara yang sama, jika Anda menggunakan konsep LSI dalam teks Anda, maka Anda dapat meningkatkan potensi untuk halaman Anda atau posting blog yang terdaftar untuk istilah pencarian ini dalam konteks di mana Anda menggunakannya. Itu benar, bahkan jika teks pada halaman web atau posting blog tidak menyebutkan kata kunci 'apache' - atau kata kunci lain yang Anda gunakan. Di sini adalah mengapa.

LSI Melibatkan Analisis Karakter String

algoritma tidak menggunakan kamus seperti yang kita kenal, tetapi melibatkan analisis statistik dan matematika yang kompleks dari karakter individu dan string karakter yang digunakan dalam teks yang membuat sebuah halaman web tertentu. Tidak penting apakah itu adalah halaman blog, posting, satu halaman penuh di situs web atau bahkan posting komentar atau forum tali. LSI digunakan untuk mengevaluasi isi dari file individual dipublikasikan di web.

Karena itu, Google telah memperkenalkan sarana yang sangat kuat untuk membedakan antara bahasa, kosakata dan semantik. Bagaimana ini berbeda? Berikut caranya:

Bahasa: Kata biasanya mengacu pada bentuk tertulis atau lisan kata-kata tertentu untuk negara tertentu atau masyarakat. Dengan demikian, string teks 'sakit' berarti 'roti' di Perancis, tapi tidak dalam bahasa Inggris. Google tidak bisa membedakan kecuali mengerti bahasa yang digunakan.

Kosakata: Kata ini merujuk pada kata-kata yang digunakan dalam bahasa tertentu. Hal ini juga dapat merujuk pada berbagai kata-kata yang dikenal oleh orang tertentu dalam bahasa. 'Bahasa Bad' mengacu pada penggunaan kosa kata dan bukan bahasa. 'Kotak' adalah kata dalam kosa kata bahasa Inggris, tapi kata yang memiliki banyak makna, membawa kita untuk:

Semantik: Kata yang sama dapat digunakan untuk berarti banyak hal. Jadi kata 'kotak' bisa berarti sebuah wadah, untuk melawan, untuk membaca poin dari kompas atau jenis semak. Semantik mengacu pada makna kata-kata dalam konteks tertentu. bahasa yang buruk dapat mengekspresikan berarti sangat baik - sehingga dapat membentuk semantik yang efektif!

Sintaks: Cara di mana kata-kata digabungkan dalam sebuah kalimat. Dengan demikian, kata-kata 'anjing menggigit orang' dapat diekspresikan menggunakan sintaks yang berbeda sebagai 'pria menggigit anjing.' Sebelum LSI Google tidak bisa membedakan perbedaan - itu hanya terdeteksi kata-kata.

algoritma LSI Google mengambil masing-masing faktor-faktor ini. Jika Anda berpikir cukup mendalam, Anda akan dapat memahami mengapa pengulangan kata kunci adalah sia-sia, dan mengapa kepadatan kata kunci yang rendah (KD) dapat memberikan hasil peringkat yang lebih baik daripada KD tinggi.

Algoritma ini menganalisis makna dari kata-kata dalam halaman web atau blog menggunakan semantik dan sintaksis, dan cocok ini dengan makna yang dirasakan dari kata kunci yang digunakan oleh orang yang melakukan pencarian.

Kata kunci atau Arti?

Apa yang lebih penting untuk pembaca Anda? Kata kunci atau makna? Katakanlah Anda sedang mencari informasi online menggunakan mesin pencari. Apa yang akan Anda lebih suka mencari: Halaman yang menawarkan banyak pengulangan kata kunci, tapi sangat sedikit lain, atau salah satu yang menyediakan Anda dengan apa yang Anda cari, bahkan jika Anda tidak dapat menemukan istilah pencarian Anda dalam teks?

Anda tahu jawabannya, dan begitu juga Google. Masalahnya adalah, bahwa pada hari-hari awal keberadaannya, mesin pencari Google mampu menemukan, indeks dan peringkat hanya halaman web yang berisi istilah pencarian (kata kunci / frase) yang digunakan oleh mereka yang mencari informasi.

Jika posting blog Anda atau halaman web tidak mengandung frase kata kunci yang digunakan dalam istilah pencarian beberapa kali, maka tidak akan terdaftar dan dibuat terlihat kepada siapa saja menggunakan frase yang - di masa depan kita lihat kata kunci sebagai satu kata atau beberapa. Jadi coba tebak!

Stuffing kata kunci dan Software

Ini menjadi praktek umum untuk halaman web barang penuh kata kunci. Semakin meriah, dan Google akan peringkat mereka tinggi di halaman hasil untuk kata kunci tersebut. Pengusaha membuat kekayaan mereka dengan merancang software (aplikasi untuk Anda orang yang lebih muda) yang akan mengambil satu halaman teks dan menghasilkan ratusan orang lain, mengubah apa-apa tapi kata kunci yang digunakan untuk halaman tersebut.

Banyak orang yang menggunakan mesin pencari untuk menemukan apa yang mereka informasi yang sangat penting, sedang disajikan dengan halaman pada halaman omong kosong tidak berguna yang memberi mereka apa-apa tapi iklan dan hal-hal yang sama berulang-ulang lagi dan lagi.

Bahkan webmaster mengeluh kepada Google tentang bagaimana halaman tersebut dapat tercantum di atas orang-orang yang benar-benar menawarkan informasi. Alasannya, tentu saja, pengulangan kata kunci. Cara algoritma peringkat didirikan adalah bahwa semakin banyak kata kunci, semakin tinggi peringkat. Ini harus berhenti.

Google melihat ini, dan memutuskan untuk melakukan sesuatu tentang hal itu, tapi apa? Ini dimulai dengan menggunakan algoritma Adsense yang digunakan semantik untuk menetapkan jenis terbaik iklan untuk setiap halaman web tertentu. Ini mengembangkan konsep ini lebih lanjut, dengan menggunakan analisis semantik laten untuk menciptakan algoritma pengindeksan semantik laten. Lebih lanjut tentang ini tak lama.

LSI menggunakan konsep analisis semantik laten untuk survei semua kosa kata, sintaksis dan semantik pada halaman untuk membangun arti yang sebenarnya. Dengan cara LSI, Google dapat membandingkan istilah pencarian yang digunakan oleh pelanggan dengan halaman web diindeks dan membangun yang paling cocok istilah pencarian / keyword dengan menganalisa semua kosa kata pada halaman, tidak hanya kata kunci. Bagaimana cara melakukannya?

Masalah Ambiguitas dalam Bahasa dan Kosakata

Katakanlah bahwa Anda menulis buku tentang penemuan dan penggunaan kunci sepanjang sejarah. Anda perlu beberapa informasi online tentang topik, sehingga Anda memasukkan istilah pencarian 'kunci dan sejarah mereka.' Atau mungkin, 'sejarah kunci. "

Pertanyaan pertama untuk mempertimbangkan akan "apa jenis kunci?" Apakah Anda menulis tentang kunci keamanan - kunci dan kunci, atau sekitar kunci kanal? Atau mungkin Anda bahkan mengacu pada rambutnya? Untuk kebanyakan orang, hanya dua opsi pertama akan cenderung - kanal kunci atau mereka yang membutuhkan kunci untuk membuka.

Untuk Google, namun, semua adalah sama. kata kunci adalah 'kunci' atau bahkan 'sejarah kunci' tapi bagaimana mesin tahu apa yang Anda bicarakan? Tidak dapat meminta Anda - semua itu dapat lakukan adalah untuk mengambil string karakter yang membentuk kata-kata, dan mencarinya dalam posting blog-nya diindeks dan halaman web.

Pengaruh Terapan Semantik Akuisisi

Jawabannya datang setelah Google membeli sebuah perusahaan Santa Monica pada tahun 2003 yang dikenal sebagai Terapan Semantik. Perusahaan ini bekerja pada algoritma yang diterapkan semantik untuk memahami makna sebenarnya dari teks tertulis. Google membeli perusahaan dan kemudian diterapkan prinsip-prinsip program Adsense-nya.

Ini adalah program yang disebutkan sebelumnya, di mana Google menempatkan relevan iklan PPC pada halaman web Anda. prinsip Semantik Terapan digunakan untuk menetapkan jenis terbaik iklan untuk halaman Anda, berdasarkan fokus sebenarnya dari isinya.

Google terus perkembangan teknik analisis matematika ini dan akhirnya datang dengan apa yang disebut sebagai Semantic Indexing laten. Menggunakan LSI, adalah mungkin bagi Google untuk mengindeks dan kemudian peringkat halaman Anda untuk arti dan isi total bukan pada hanya penggunaan kata kunci.

Bagaimana LSI Algoritma Kerja: Kata kunci dan Semantik?

Google akan melihat kosa kata lain pada halaman Anda kemudian melakukan analisis statistik dari konteks dan sintaks dari kosa kata tersebut. Jika pengguna Google mencari 'sejarah kunci keamanan' maka Google akan mengambil kosakata lain dari halaman-halamannya diindeks ke rekening. Jika halaman Anda berisi kata-kata seperti 'kunci,' 'tuas,' dan 'pintu' maka akan mengasosiasikan kosakata ini dengan kunci keamanan.

Setelah mengambil faktor peringkat lainnya diperhitungkan, maka akan daftar halaman Anda di halaman hasil pencarian untuk kata kunci tersebut (sejarah kunci keamanan) peringkat sesuai dengan manfaat yang Google percaya akan menawarkan untuk pencari. Sebelum LSI, pencari juga akan diberikan halaman berfokus pada kunci kanal dan bahkan pada rambut.

Hindari Kata Kunci Stuffing

Inti makhluk dibuat di sini adalah bahwa tidak ada lagi kebutuhan untuk pengulangan kata kunci yang berlebihan. Sejak Google memperkenalkan LSI, semua yang perlu Anda lakukan adalah memastikan bahwa Anda menggunakan banyak sinonim dan istilah terkait yang Anda bisa untuk kata kunci yang Anda mengejar.

Tapi jangan sampai kita salah - kata kunci masih menghitung. Anda masih harus menggunakan kata kunci yang relevan, namun Google menggunakan konsep LSI untuk menentukan apa isi website benar-benar tentang: apa itu benar-benar mengatakan. Ini adalah penangkapan keluar halaman ditulis secara khusus untuk mendapatkan terdaftar untuk setiap kata kunci, tapi itu memiliki sedikit konten yang bermanfaat selain pengulangan berarti dari kata kunci.

Anda masih dapat menggunakannya, meskipun bahkan 1,5% KD atau kurang akan cukup memadai. Gunakan kata kunci hemat dan juga menggunakan istilah lain yang berarti hal yang sama dalam konteks niche Anda. Itulah jawaban untuk pertanyaan Anda - Bagaimana LSI Algoritma Kerja - dan mengapa laten pengindeksan semantik adalah istilah Anda tidak perlu mengingat selama Anda memahami dan menerapkan konsep Google menggunakan ketika mempekerjakan LSI di pengindeksan dan algoritma peringkat.