Kasım 2008
Nasıl Yapılır?

Arama Motoru İyileştirme ve Dizinleme

Bugün bazı alanlarda çok popüler olan siteler var. Şimdi bunları görebilmek için sizlerle küçük bir arama yapalım. Google arama motorunu açalım ve “C++” yazalım. Karşımıza çıkan ilk siteler: “wikipedia.org” ve “cplusplus.com”. Bir de yemek siparişi yazalım: “adrese yemek.com” ve “yemek sepeti.com”. Son olarak da “video” anahtar sözcüğü sonucunda, "youtube.com” ve “video.google”. Eminin bunlardan en az dört tanesini daha önce duymuşuz ve bu sitelere girmişizdir. Peki, bu siteleri Google’ın en üst sırasına taşıyan ve herkesin bilmesini sağlayan şey nedir? Bu yazımda sizlere arama motoru iyileştirmesinden ve Google’ın sıralama yöntemlerinden bahsedeceğim.

Arama Motoru İyileştirmesi Nedir?

Arama motoru iyileştirmesi (SEO - Search Engine Optimization), bir sitenin arama motorlarının sonuçlarında daha iyi sıralamaya sahip olması ve daha nitelikli, daha fazla ziyaretçi alması için sitede yapılan düzenlemelerdir. Bu düzenlemeler tasarım, teknik ve kalite gibi üç ana başlık altında toplanabilir. SEO farklı arama sonuçları için iyileştirmeyi de içermektedir: resim arama, yerel arama, sektör-bazlı dikey arama gibi.

   İyileştirme

İnternet pazarlama stratejisi olarak SEO, arama motorlarının nasıl çalıştığıyla ve insanların daha çok ne aradıklarıyla ilgilenir. Bir sitenin iyileştirilmesi, onun özellikle bazı anahtar kelimeler açısından içeriğini zenginleştirmeyle ve arama motorlarının dizinleme faaliyetlerine engel olabilecek şeylerin ortadan kaldırılmasıyla, içeriğinin ve HTML kodunun gözden geçirilmesiyle başlar.

Yapılan araştırmalara göre internet trafiğinin %80’ini arama motorları oluşturmaktadır. Google ise bu oranın %50’sini oluşturmaktadır. Arama sonuçlarında tıklamaların çok büyük bir kısmı ise ilk 2-3 siteye gitmektedir. Yani sitemizin ilk 3 sırada gözükmesi, özellikle de rakipleri olan bir siteyse, çok önemlidir. Çünkü arama sonuçlarında ilk sıralarda yer alan bir site daha fazla ziyaretçi almaktadır ve hatta kullanıcıların çoğu ilk birkaç bağlantıdan sonrasıyla ilgilenmemektedir. Bu sebeple işletmeciler ve ticari siteleri ile bilgi amaçlı siteler her zaman sitelerinde düzenlemeler yaparak arama motorlarındaki sıralamalarını yükseltmeye çalışırlar.

Tarihçe

Web geliştiricileri ve içerik sağlayıcıları, arama motorları ilk ortaya çıktığı zaman, 1990’ın ortalarında, mevcut siteleri geliştirmeye başladılar. Onların tek yapması gereken şey sayfayı ya da adresini arama motorlarına göndermek ve onların siteye bir “örümcek” gönderip taramasını beklemekti. Gitgide bir arama motorunun sıralamasında ilk sıralarda yer almanın önemini anlayan site sahipleri, beyaz şapka* ve siyah şapka* SEO ile ilgilenen insanlara fırsat yaratmışlardır. Sektör analisti Danny Sullivan’a göre bilinen ilk kullanıldığı yer 1997‘de Usenet üzerinden atılan bir gereksiz iletidir.

Önceleri arama motorları arama yaparken siteyi hazırlayanları sağladığı bilgiyi kullanırlardı. Dizin sayfaları ve meta etiketleri gibi bilgiler site yöneticilerinin site hakkında bilgi verdikleri yerlerdi. Ancak bu metot elbette ki güvenilir değildi. Çünkü insanlar, en çok aranan anahtar kelimeleri ilgili ya da ilgisiz meta etiketlerinde kullanabiliyor ve aramaların ilgisiz sonuçlar vermesine neden olabiliyordu. Aynı yöntemle HTML kodlarında da bu tarz oynamalar yaparak arama motorları kandırılabiliyordu. Sonuç olarak kullanıcılar memnun olmuyor ve içeriksiz kaynaklara ulaşmış oluyorlardı. Bu yöntem işe yaramayınca artık daha iyi sonuç veren ve site yöneticilerinin oynamaları kolay olmayan alanlar üzerine bir algoritma arayışı başladı. Stanford Üniveristesi’nden Larry Page ve Sergey Brin 1995’te bir web sayfasının popülerliğini bulan “backrub” algoritmasını geliştirdiler. Bu algoritma ile bulunan sayı o sayfanın “Pagerank”ini yani sayfa değerini (sayfa popülaritesini) veriyordu. Sayfa değeri, diğer sayfalardan bir sayfaya verilen bağlantıların güçlülüğüne ve kalitesine bağlı olarak değişen bir değerdi. Google bu ismin kulanım hakkını almadı ve bir süre Stanford’a aylık ücret ödeyerek kullandı. 2005’te ise 336 milyon dolar ödeyerek satın aldı. Page ve Brin 1998 de Google’ı kurdular ve Google’ın değişik faktörleri baz alarak yaptığı aramalar ilgi görmeye başladı. Dolayısıyla, bu gelişmelerin ışığında eski SEO taktikleri de değişmiştir. Elbette bu PageRank algoritmasını da sömüren taraflar olmuştur. Yüzlerce site sırf karşılıklı bağlantı verebilmek, alıp satmak için kurulmuştur. Google da son zamanlarda bu gelişmelere karşılık vererek, sitenin içeriğinin düzgün tespiti ve popülerliği gibi bilinen alanlardan başka; bir de arama yapan kişinin yaşına, mesleğine, durumuna göre arama sonuçlarında iyileştirmeye gitmeye başlamıştır. Bugün en çok bilinen Google, Yahoo! ve MSN Live Seach arama motorları iki yüzden fazla şeye bakarak pagerank vermektedirler.

*Beyaz Şapka (White Hat) kullandığı metotlar tümüyle desteklenen ve sonuçları uzun süre içinde alınan yöntemlere başvuranlara verilen addır.

*Siyah Şapka (Black Hat) olarak bilinenler ise desteklenmeyen metotlara başvururlar. Etkileri kısa sürede gözükebilir ancak arama motorları tarafından yakalandıklarında ceza olarak bir daha sonuçlarda gösterilmezler.

Pagerank (Sayfa Değeri) Nedir?

İyileştirme metotlarına geçmeden önce PageRank (sayfa değeri) kavramını anlamamız önemlidir. Arama motorları, bir sayfaya verilen bağlantı miktarını ve önemini belirtmek için o sayfaya 0 ila 10 arasında bir değer, PageRank, atar. Sayfa değeri, internette gezinen herhangi bir insanın belirli bir sayfayı, bir sayfadan diğerine verilen bağlantıları takip ederek ziyaret etme olasılığını tahmin eder. Her bağlantı bir oy demektir. Diğer bir değişle PageRank diğer sitelerin bir site üzerinde oy kullanabilmelerini sağlayan bir pusula gibidir.

Tabi ki her sitenin verdiği bağlantı da eşit derecede önemli olmamaktadır. Bazı bağlantılar daha güçlüdür. Örneğin, bize bağlantı veren sayfa değeri yüksek bir sayfadan insanların bize ulaşma olasılığı yüksek olduğundan böyle bağlantılar bizim sayfamıza daha fazla puan getirir.

Dizinleme (İndeksleme) ve İyileştirme Nasıl Yapılır?

Bugün internette birçok arama motoruna rastlamak mümkün ama biz en sık kullanılan arama motoru, Google, üzerinden gidelim. Bir sayfayı arama sonuçlarında üst sıralarda göstermek için, internette arama motoru iyileştirme programları bulunmaktadır ve bunların birçoğu ücretsizdir. Ancak içlerinden çok azı bir sitenin arama motoru sonuçlarında yükselmesine yardımcı olabilir. Hatta Google’ın kendi deyimiyle:

Şaşırtıcı ama bizler de bu spam e-postalardan alıyoruz:



"Sevgili google.com,
Web sitenizi ziyaret ettim ve başlıca arama motorları ile dizinlerin çoğunda bulunmadığınızı fark ettim..."


"Gece yağ yakmaya" yönelik rejim hapları veya görevinden alınmış kişilerden fon aktarımına yardımcı olma talebind
e bulunma konusunda gösterdiğiniz şüpheciliğin aynısını arama motorlarına ilişkin istenmeyen e-postalar için de
gösterebilirsiniz.

Öncelikle şunu anlamalıyız. Kimse bir arama motorunda kısa sürede birincilik garantisi veremez ve eğer veriyorsa kısa süre yakalanma olasılığı yüksektir. Çünkü basit hilelere, siyah şapka SEO diye adlandırılan metotlara başvuranlar, Google’ın arama motorları tarafından tespit edilebilmektedir. Bir sitenin Google’ın arama sonuçlarında gösterilmesi ücretsizdir ve bunu yapabilmesini kolaylaştırmanın tek yolu Google Web Master Tool’u kullanarak sitemizi ve site haritasını eklemektir.

Google Nasıl Dizinler?

   Her sey siteniz icin

Google’ın dağınık ağlar üzerinde ve binlerce bilgisayar kullanarak çalışır. Bu sebeple çok hızlı bir şekilde paralel işlemleme yapabilir. Yani çok uzun sürecek hesaplamaları bu bilgisayarlar arasında paylaştırarak paralel olarak yapar ve hesaplama süresini kısaltır. Google üç dizinleme işlemini üç aşamada yapar.

Googlebot, Google’ın web sayfaları üzerinde gezinen robotudur. Aslında sayfaları teker teker gezinen bir “örümcek” varmış gibi hayal etsek de durum böyle değildir. Bu örümcek bir web tarayıcısı gibidir. Web sunucusuna telep gönderir, indirir ve indirdiği sayfaları Google dizinleyicisine teslim eder. Googlebot bir sayfayı alınca içindeki “yararlı” bağlantıları bulur ve daha sonra ilgilenmek üzere bir yerde depolar. Bu yöntemle kısa sürede çok geniş bir alana bağlantılar toplamış olur. Buna derin getirme (deep crawling) adı verilir. Bu yöntem Google’ın neredeyse tüm internet ağına ulaşmasını sağlar. Dizinleyici Googlebot’un sayfalardan elde ettiği tamamıyla metinden oluşan bilgileri işler. Her sayfa Google veritabanında bir dizin olarak saklanır. Bu veritabanı, dizin arama metinlerine göre alfabetik olarak sıralanmıştır. Her dizin, anahtar kelimelerin ve onların yerlerinin geçtiği bir belgeler listesi saklar. Böylece arama yapılınca Google sayfalara kısa sürede erişebilir.

Talep işleyici (query processor) ise iki yüzden fazla metotu göz önüne alarak hesaplanan sayfa değerlerine göre ve arama kutusundaki bizim verdiğimiz kelimelere, kelimelerin yapısına ve kelimelerin sıralanışına göre en uygun sonuçları getirmekle yükümlüdür.

Şimdi de bir siteyi geliştirmek için ne gibi teknikler uygulanabileceğini üç başlık altında inceleyelim:

Tasarım ve İçerik:

Teknik:

Kalite:

Bu yazımda sizlere sitemizi nasıl geliştirebileceğimizi ve Google’ın dizinleme yöntemini anlatmaya çalıştım. Görüldüğü gibi aslında bu metotların hiçbiri bir anda sonuç verecek kadar güçlü değildir. Ancak bu metotları uygulayan bir site, uzun dönemde arama sıralamasında eskisine oranla daha iyi durumda olacaktır ve daha çok ziyaretçi alacaktır. Ayrıca bir sitenin yapısı ve içeriğinin değiştirilmesi gerekebileceği için sitenin daha kurulum aşamasında yapısal ve içeriksel özellikleri arama motorlarının aramasını kolaylaştıracak şekilde düzenlenmesi çok daha iyi olur.

Gelecek ay PageRank Algoritması hakkında daha detaylı bilgi alabileceksiniz. Görüşmek dileğiyle…

Kaynaklar:




Işıl Özge Pekel
- 8 -