Merhaba e-bergi okuyucuları :) Gelişen bilişim dünyasıyla birlikte, İnternet ihtiyacımız olan bütün bilgiyi bünyesinde barındırıyor. Ancak bu bilgi okyanusunda istediğimizi nasıl bulduğumuz önem kazanıyor. Bu ayki yazımda da daha iyi arama için geliştirilen semantik aramadan (semantic search) anlatacağım. Peki semantic aramanın farkı nedir? Semantik arama isminden de anlaşılacağı gibi önemli olmasının yanında gelişmeye açık bir semantik web uygulaması. Geleneksel bilgi elde etme (Information Retrieval -IR) yöntemleri kullanan aramalar için anahtar kelimenin (kelimelerin) metinde geçmesi gerekir. Ancak semantik arama içinse kelimeler bire bir metinde bulunmak zorunda değil. Aranan kelime metin içinde geçmese bile daha önce etiketlendiği kelimelerin bulunmasını sağlar. Yani anahtar kelime olmasa bile anlam bütünlüğü sağlanmış şekilde arama gerçekleşir. Örnek vermek gerekirse "baş ağrısı ilaç" kelimelerini aradığımız zaman "Aspirin baş ağrısına iyi gelir." cümlesini bulabiliriz (Aspirin ilaç etiketini taşıdığı için ilaç kelimesi metin içinde geçmek zorunda değil). Kullanım alanlarını anlatmak gerekirse temel olarak iki arama çeşidi vardır:
- Seyirsel aramalar (navigational searches): Bu aramada kullanıcı belirli bir metin içindeki kelimenin bulunduğu konuma ulaşmak için kullanır. Bu kullanım için aranılan kelime eksiksiz yazılmalıdır ve semantik aramanın kullanım alanı dışındadır. (herhangi bi metinde bir kelimenin yerini bulamak için Ctrl+F ile yaptığımız aramalar)
- İnceleme aramaları (research searches): Bu aramada ise asıl bulunması istenen metnin ana teması anahtar kelime veya kelime gruplarıdır ve semantik aramanın asıl kullanım alanıdır (arama motorlarını kullanarak yaptığımız arama).
Semantik aramada anahtar kelimenin şekilsel yapısından
çok anlamı önemli olduğu için Google'ın PageRank uygulamasını temel olarak almamaktadır. Daha uygun sonuçlar sağlayabilmek amacıyla anahtar kelimenin ait olduğu dildeki anlamsal alakası olan kelimeler de göz önüne alınır. Böylece kullanıcının bir sorguda daha uygun ve spesifik sonuçlara ulaşması sağlanır.
Semantik aramanın kelimelere anlamlarına göre etiket verdiğinden söz ettik. Ama bu noktada bazı kelimelerde sorun yaşamamıza neden olabilir. Eş sesli kelimelerin birbirinden bağımsız birçok anlamı olabilir. Birbirinden bağımsız olan bu anlamlar farklı etiketleri gerektirir ve anlam karmaşasına (word sense disambiguation) neden olur ("yüz" kelimesinin "sayı", "spor(eylem)", "ayırmak", "kılıf" ve "surat" anlamları vardı).Bu gibi anahtar kelimenin birden fazla anlama karşılık geldiği durumlarda diğer anahtar kelimelerden yararlanarak hangi anlamın kullanıldığına karar verilir. Çözümünde de semantik ağdan (anlamsal ilişkiler üzerine kurulmuş ağ çeşidi) yaralanır. Synset olarak isimlendirilen semantik ağında bunun düğümler üç şekilde olabilir: kelimeler, bileşik kelimeler ve kelime grupları. Düğümler arasındaki bağlantılar sonucunda anlam karmaşası ortadan kaldırılır.
Son bir kaç yıldır adını duyduğumuz bu teknoloji nerelerde nasıl kullanılıyor? Geliştirilmekte olan bazı arama motorları semantik aramayı kullanıyorlar. En iyi beş semantik arama motoru ve özellikleri:
Hakia : Beta durumundaki arama motoru bazen kötü sonuçlar verse de çoğu zaman kullanıcıyı memnun eder. Arama sonucunda bütün sonuçlar, görseller, haberler... vb tablarda göstermesi arama motorunu daha da kullanışlı hale getirmiş. Ana sayfada her aramada farklı bir başlık ve başlık için önerilerin olması Hakia'yi eğlenceli hale getirmiş.
SenseBot : Alıştığımız arama motorlarından farklı olarak, bulduğu sonuçların özetini göstermenin yanında, anahtar kelimeyi ve kullandığı etiketleri arama sonucunun üstünde kutunun içinde gösterir. Hakia gibi beta olan SenseBot'un da eksiklerinin en kısa zamanda kapatılacağını düşünüyorum.
Powerset : Powerset normal bir arama motoru değil, aramaları sadece Wikipedia ile sınır. Kullanışlı olan bir özelliği ise birbiriyle alakasız olan sonuçlar bulduğunda farklı tablarda göstermesi. Üst tarafta bulunun sonuç hakkında genel bilgi sunuluyor.
Deepdvye : Bu arama motorunun geleneksel arama motorlarından farkı ise aramayı kendi indexinden değil İnternette yapması. Sorgu bir kelimeden 25000 karakter uzunluğunda kelime grupları olabilir. Sonuçları ise “beğendim”, “kaydet” şeklinde etiketleyebiliyoruz.
Cognition : 24 yıldır üstünde çalışılan İngilizce dil haritasıyla birlikte, firma bugün yaşayan İngilizceyi bu haritanın kapsadığını iddia ediyor. Cognition, bu dilde genel, sağlık ve Wikipedia'da mükemmelle yakın sonuç vermekte.
Semantik Web teriminin duymaya başlayalı çok olmasa da uygulamaları hayatımıza giriyor ve bu hızla geliştiği sürece web teknolojilerinde önemli bir yeri olacak.
Kaynaklar
- http://en.wikipedia.org/wiki/Semantic_search
- http://www2003.org/cdrom/papers/refereed/p779/ess.html
- http://semanticsearch.org/
- http://www.readwriteweb.com/archives/semantic_search_the_myth_and_reality.php
- http://hakia.com
- http://www.sensebot.net
- http://www.powerset.com/
- http://www.deepdyve.com
- http://www.cognition.com