içinde

9 Maddede Arama Motorlarının Makine Öğrenimi

Teknoloji devleri, makine öğrenimine büyük yatırım yapıyor.

2019’da Microsoft , yalnızca OpenAI için 1 milyar dolar olmak üzere 11 yapay zeka (AI) girişimine yatırım yaptı . Ve AI girişimlerine akan en büyük kurumsal risk sermayesi kaynağı bile değiller.

Aynı yıl Intel Capital 19, Google Ventures ise 16 yatırım yaptı.

Bu devasa sermaye akışı, AI bilgi işlem gücünün sağlıktan inşaata, pazarlamadan arama motoru optimizasyonuna kadar çeşitli sektörlerde hızlı ilerlemeler kaydettiği anlamına geliyor.

Ancak, SEO uzmanları için makine öğreniminin etkilerine girmeden önce, yapay zeka ile ne demek istediğimizi tanımlayalım.

3 tür yapay zeka vardır:

  • Dar veya Zayıf AI: Bu AI türü, algoritmaya “öğretilmesi” gereken özel görevleri gerçekleştirmek için tasarlanmıştır (Google’ın arama algoritmalarını düşünün). Kapsamda son derece uzmanlaşmış olmasına rağmen, dar AI (ANI), kalıpları hızlı bir şekilde tanıyabilir ve görevleri insan yeteneğini geride bırakacak şekilde gerçekleştirebilir.
  • Genel veya Güçlü Yapay Zeka: Sorunları kendi kendine öğrenip çözebilen genel yapay zeka (AGI), makine öğrenimini bir sonraki seviyeye taşır. Bu yapay zeka, insan beyninin sinir ağlarını yansıtmak için tasarlanmış derin öğrenme süreçleriyle destekleniyor ve algoritmanın talimat olmadan karar vermesine izin veriyor.
  • Yapay Süper Zeka: Şu anda, yapay süper zeka (ASI) hala tamamen bilim kurgu kategorisine giriyor. Bu tür bir yapay zeka, teorik olarak, zamanımızın “çözülemeyen” sorunlarını çözmek için insan yeteneklerini geride bırakabilir.

OpenAI ve Conversion.ai gibi şirketler, doğal dil işleme için genel AI geliştirmeye doğru ilerlerken, şu anda AGI’nin net bir örneği yok.

ANI’den AGI’ye ilerlemek için derin öğrenme, karmaşık, yapılandırılmamış verileri analiz etmek ve bağımsız kararlar almak için tümdengelimli akıl yürütmeyi kullanabilen daha güçlü AI oluşturmanın anahtarı olacaktır.

2016’da Google, “önce makine öğrenimi” yapan bir şirket olma niyetini ilan etti . O zamandan beri, 2017’de Google AI’yı ve 2019’da BERT’yi kullanıma sunarak bu hedefe doğru istikrarlı adımlar attılar.

Makine öğrenimine her şeyi dahil etmedeki amaçları nedir?

Google’a göre , sadece hayatımızı kolaylaştırmakla kalmayıp aynı zamanda “sağlık hizmetlerini yeniden düşünmekten bilimsel keşifleri ilerletmeye kadar mevcut sorunlara bakmanın yeni yollarını” bulmak için AI’yı kullanmak istiyorlar.

Geleceğe yönelik bu yüce hedeflerin yanı sıra, insanlık, her gün etkileşimde bulunduğumuz bir şey olan arama motoru algoritmalarında daha küçük ölçekte bu makine öğrenimi ilerlemelerini zaten görüyor.

Google, arama motorlarının şu anda makine öğrenimini kullandığını bildiğimiz bu dokuz yol da dahil olmak üzere, kullanıcıları aradıkları içeriğe bağlama biçiminde sürekli ilerleme kaydediyor.

1. Desen Algılama

Arama motorları, spam veya yinelenen içeriği belirlemeye yardımcı olan kalıp algılamaları için makine öğrenimini kullanıyor .

Düşük kaliteli içeriğin tipik olarak belirgin benzerlikleri vardır, örneğin:

  • İlgisiz sayfalara giden birkaç giden bağlantının varlığı.
  • Durdurma sözcüklerinin veya eşanlamlıların birçok kullanımı.
  • Tanımlanan “spam” anahtar kelimelerin oluşma oranı.

Makine öğrenimi bu kalıpları tanır ve işaretler. Ayrıca, yeni spam yapılarının ve tekniklerinin ne zaman kullanıldığını tespit etmek, yeni kalıpları tanımak ve bunları başarılı bir şekilde işaretlemek için kullanıcı etkileşimlerinden elde edilen verileri kullanır.

Google, insan kalitesi değerlendiricilerini kullanmaya devam etse de, bu kalıpları tespit etmek için makine öğrenimini kullanmak, içeriği incelemek için gereken insan gücünü büyük ölçüde azaltır.

Bu şekilde, Google, gerçek bir insan dahil olmak zorunda kalmadan önce düşük kaliteli içeriği ayıklamak için sayfaları otomatik olarak gözden geçirebilir.

Makine öğrenimi sürekli gelişen bir teknolojidir, bu nedenle ne kadar çok sayfa analiz edilirse o kadar doğru olur (en azından teoride).

2. Yeni Sinyallerin Tanımlanması

RankBrain , Google tarafından geliştirilen ve yalnızca sorgulardaki kalıpları tanımlamaya yardımcı olmakla kalmayıp aynı zamanda arama motorunun olası yeni sıralama sinyallerini tanımlamasına yardımcı olan makine öğrenimi algoritmasıdır.

RankBrain’den önce Google’ın algoritması tamamen elle kodlanıyordu. Arama sorgusu sonuçlarını analiz etmek, bu sonuçların kalitesini iyileştirmek için testler yapmak ve değişiklikleri uygulamak bir mühendis ekibine bağlıydı.

Şimdi, hala algoritma üzerinde çalışan insan mühendisler varken, RankBrain arka planda sessizce çalışır ve testler yürütür ve değişikliklerin kullanıcı etkileşimlerini nasıl etkilediğini ölçer.

RankBrain, daha önce Google’a hiç girilmemiş arama terimlerinin nasıl ele alınacağı da dahil olmak üzere, Google’ın geleneksel algoritmalarla karşılaştığı bazı zorlu sorunları çözer.

2019 Reddit AMA’sında Google’dan Gary Illyes’e göre :

“RankBrain, bir kullanıcının [sic] daha önce görülmemiş bir sorgu için büyük olasılıkla neyi tıklayacağını tahmin etmek için geçmiş arama verilerini kullanan bir  makine öğrenimi sıralama bileşenidir.”

Arama motorları teknolojiye tahminleri ve verileri kendi başlarına nasıl çalıştıracaklarını öğretebildiğinden, daha az efor gerektirir ve çalışanlar, inovasyon veya insan merkezli projeler gibi makinelerin yapamayacağı diğer şeylere yönelebilir.

3. Küçük Bir Porsiyon Olarak Ağırlıklandırılmıştır

Bununla birlikte, makine öğrenimi, arama motorlarının web sitelerini bulma ve sıralama şeklini yavaş yavaş değiştiriyor olsa da, bu, SERP’lerimiz üzerinde (şu anda) büyük ve önemli bir etkiye sahip olduğu anlamına gelmiyor.

2019 Web Yöneticisi Merkez Ofis Saatleri tartışmasında, Google’dan John Mueller, makine öğreniminin Google mühendislerinin çeşitli sorunları daha iyi anlamalarına nasıl yardımcı olduğuna atıfta bulunuyor:

“…makine öğrenimi, sizin için her şeyi yapan, bir tarafta interneti beslediğiniz ve diğer tarafta arama sonuçlarının çıktığı bir kara kutu değildir.”

Daha yakın zamanda, Mayıs 2021 Ofis Saatleri tartışmasında , makine öğreniminin çeşitli sıralama sinyallerinin ağırlığını ayarlayabileceğini açıkladı. Ancak yine de, bu değerleri manuel olarak kontrol eden ve ayarlayan gerçek insanlar var.

Google’ın nihai hedefi, kullanıcılara daha iyi bir deneyim sunmak için teknolojiyi kullanmaktır.

 

4. Spesifik Sorguya Dayalı Özel Sinyaller

Google’ın mevcut gizlilik politikaları , arama motorunun bir kullanıcının davranışına dayalı olarak şu anda nasıl kişiselleştirilmiş arama sonuçları oluşturduğunu tartışır.

Google’ın kişiselleştirilmiş arama patenti US200501028282A1 , şunları belirtir:

“…kişiselleştirilmiş arama, arama motorunun farklı kullanıcılarına ilgi alanlarına ve geçmiş davranışlarına göre farklı arama sonuçları üretir.”

Bunu eylemde açıkça görebiliriz. Genellikle konferans sunumlarında kullanılan bu işlemi kanıtlamak, bir oturuşta Google’a bir dizi sorgu yazmak ve sonuçların en son ne aradığınıza bağlı olarak nasıl değiştiğini görmek kadar basit.

Örneğin, gizli bir tarayıcıda [New York Futbol stadyumu] araması yaparsam [MetLife Stadyumu] yanıtını alıyorum.

Daha sonra, aynı tarayıcıda yalnızca [jetler] için arama yaparsam, Google, son sorgumun bir futbol stadyumu ile ilgili olması nedeniyle bu sorgunun da futbolla ilgili olduğunu varsayar.

Aramama devam ederken Google, ilgimin ne zaman değişmeye başladığını öğreniyor.

Aynı tarayıcıda [Jaguarlar] aratmak, NFL takımı Jacksonville Jaguars (son iki aramamla ilgili) hakkında bilgi getirecektir.

Ancak [San Diego yakınlarındaki hayvanat bahçesi] aramaya başladığım ve sorgu kutusuna [hayvanat bahçesi] yazdığım anda, ikinci kez jaguar aramamış olmama rağmen Google [jaguarlı hayvanat bahçeleri] öneriyor.

Arama geçmişi, makine öğreniminin daha iyi sonuçlar sağlamak için kullandığı arama deneyiminin yalnızca bir bileşenidir.

5. Doğal Dil İşleme

Bir arama motorunun bir metin parçasının diğerine ne kadar benzer olduğunu anlayabilmesi önemlidir. Bu sadece kullanılan kelimeler için değil, aynı zamanda daha derin anlamları için de geçerlidir.

Transformers’dan Çift Yönlü Kodlayıcı Temsilleri – kısaca BERT – Google’ın bir kullanıcının arama sorgusunun bağlamını daha iyi anlamak için kullandığı doğal bir öğrenme işleme çerçevesidir.

İnsanlar her zaman bir makinenin onlardan beklediği gibi konuşmazlar. Yeni ifade biçimleri yarattığımız sık sık oluyor.

Farklı şeyleri tanımlamak için aynı kelimeyi kullanırız. Bazen, kasıtlı olarak bile belirsiz olabiliyoruz.

Ancak, daha fazla kişi çevrimiçi olarak yeni ifadeler kullanıp aradıkça, makine öğrenimi bu sorgular için daha doğru bilgiler gösterebiliyor.

Google Trendler , bunun harika bir  örneğidir. İlgi çeken yeni bir kelime öbeği veya kelime (örneğin, “glow up” veya “spill the tea”) ilk başta saçma sapan arama sonuçlarına sahip olabilir.

BERT, kullanıcıların içerikle nasıl etkileşime girdiğini öğrenerek ve arama sorgularını daha alakalı sonuçlarla eşleştirerek bu bağlamsal nüansları çözmek için mümkün olduğunca insan tanımayı çoğaltmak için tasarlanmıştır.

Dil geliştikçe ve dönüştükçe, makineler söylediğimiz kelimelerin ardındaki anlamlarımızı daha iyi tahmin edebilir ve bize daha iyi bilgi sağlayabilir.

6. Fotoğrafları Anlamak için Görsel Arama

Her saniye Instagram’a yaklaşık 1087 fotoğraf, Facebook’a ise 4000 fotoğraf yükleniyor. Bu, her gün yalnızca bu iki sosyal ağa yüklenen yüz milyonlarca fotoğraf demek.

Bu kadar çok gönderiyi analiz etmek ve kataloglamak bir insan için zorlu bir görev olacaktır, ancak bu, makine öğrenimi için hiç de zor değil.

Makine öğrenimi, renk ve şekil modellerini analiz eder ve arama motorunun bir görüntünün gerçekte ne olduğunu anlamasına yardımcı olmak için bunları fotoğrafla ilgili mevcut şema verileriyle eşleştirir.

Google bu şekilde yalnızca Google Görsel arama sonuçları için görselleri kataloglamakla kalmaz, aynı zamanda kullanıcıların metin sorgusu yerine görsel kullanarak arama yapmasına olanak tanıyan ters görsel arama özelliğini de güçlendirir .

Kullanıcılar daha sonra fotoğrafın diğer örneklerini ve aynı konulara veya renk paletine sahip benzer fotoğrafları ve fotoğraftaki konularla ilgili bilgileri çevrimiçi olarak bulabilirler.

Buna karşılık, kullanıcının bu sonuçlarla etkileşim şekli gelecekte SERP’lerini şekillendirebilir.

7. Reklam Kalitesi ve Hedefleme İyileştirmeleri

Tıpkı organik arama sonuçları gibi, Google da bireysel kullanıcıları için en alakalı reklamları sağlamak istiyor. Google, ABD patentleri US20070156887 ve US9773256 Reklam kalitesi üzerinde iyileştirmek için makine öğrenimi kullanılabilir.

Bu, Reklam Sıralamasının bir makine öğrenimi sisteminden etkilenebileceği anlamına gelir .

8. Eş Anlamlı Tanımlama

Anahtar kelimeyi snippet’te içermeyen arama sonuçları gördüğünüzde, bunun nedeni büyük olasılıkla Google’ın eş anlamlıları belirlemek için RankBrain kullanmasıdır.

[Orman koruma] terimini ararken, bu durumda “koruma” kelimesi ile birbirinin yerine kullanılabildiğinden “muhafaza” kelimesiyle çeşitli sonuçlar göreceksiniz.

Google, bazı durumlarda eş anlamlıları vurgulayarak, eş anlamlıları tanıdığını da gösterir.

9. Sorgu Açıklaması

Bir arama motorunu çalıştırmak için birçok neden vardır. Kullanıcılar, herhangi bir arama için satın almak (işlemsel), araştırma (bilgi amaçlı) veya kaynak bulmak (gezinme amaçlı) için arama yapıyor olabilir.

Ayrıca, tek bir anahtar kelime bu amaçlardan biri veya için faydalı olabilir .

Bir arama motoru, tıklama kalıplarını ve kullanıcıların etkileşimde bulunduğu içerik türünü (ör. içerik türüne göre TO’lar) analiz ederek, kullanıcının aramasının arkasındaki amacı belirlemek için makine öğreniminden yararlanabilir.

Özet

Makine öğrenimi mükemmel olmasa da (ve muhtemelen asla olmayacak), insanlar onunla ne kadar çok etkileşime girerse, o kadar doğru ve “akıllı” olur.

Bu, bazıları için endişe verici olabilir, “Terminatör” filmlerinden Skynet vizyonları yaratır.

Ancak asıl sonuç, karmaşık sorunları çözen ve insanların yaratıcılığı ve yeniliği yönlendirmeye odaklanmasını sağlayan teknolojiyle daha iyi bir deneyim olabilir.

2018’de Pew Research , ankete katılanların %63’ünün AI ile ilgili olarak insanlığın geleceği için umutlu olduklarını söylediği bir anket yaptı ve 2030 yılına kadar insanların yapay zeka yardımıyla daha iyi durumda olacağını ifade etti.

Yaşam kalitesindeki bu artışı görmemizin bir yolu da aramadır. Google ve diğer arama motorları makine öğreniminde devrim yarattığından, ihtiyacımız olan bilgileri ve hizmetleri ihtiyaç duyduğumuzda daha kolay bulabiliyoruz.

Kaynak:searchenginejournal

Kriptoparalar ve blockchain hakkındaki her türlü sorunuz için telegram kanalımıza davetlisiniz. Kanala katılmak için tıklayınız.

Beyza Gül Yardım tarafından yazıldı.

İstanbul Üniversitesi Amerikan Kültürü ve Edebiyatı bölümünden mezun olduktan sonra İngilizce öğretmenliği yaptı. Uluslararası İlişkiler bölümünde lisans eğitimi devam ediyor. Aktif olarak Blockchain teknolojisi üzerine araştırma yapıyor ve bu konuda içerik üretiyor.

Koinsaati, Veri, Teknoloji

Walmart, Mağazalarında Bitcoin ATM’leri Bulunduracak

NFT

NFT’ler Film Endüstrisi İçin Ne İfade Ediyor?