Benchmark / Denektaşı[1] , herhangi bir yazılım ya da donanım üzerinde, performans değerlendirmesi yapma amacı ile kullanılan, “matematiksel hesaplama” temeline oturtulmuş yazılımların geneline verilen isimdir.[2] Bir başka deyişle Benchmark / denektaşı, sadece yazılım ya da sadece donanımdan oluşan bir ürünün ya da hem yazılım hem de donanımdan oluşan bir sistemin, aynı kategorideki diğer ürün ve sistemlere oranla nasıl performans sergilediğini anlamak ve ürünler arası kıyaslama yapabilmek için hem üretici firmaların hem de son kullanıcıların kullandıkları testlerdir.
Neden Matematik?
Bilgisayar üzerinde gerçekleştirilen her işlem, bir matematiksel işlemden ibarettir. Örneğin; modern bilgisayar oyunlarında yer alan tüm görsel materyaller, temel olarak, belirli matematiksel işlem ya da işlemler sonucunda elde edilmiş şekillerdir.
Şekil 1. Bilgisayarın gerçekleştirdiği her işlem, temel olarak, bir matematiksel işlemden ibarettir.
Crysis 3 oyunu bile, yukarıda basit olarak ifade edilmiş olan matematiksel işlemlere dayalı olarak programlanır.
Resim 1. Crysis 3 oyunundan alınmış olan görüntüde yer alan patlama da, temel olarak bir matematiksel işlemdir.
Resim 1. Crysis 3 oyunundan alınmış olan görüntüde yer alan patlama da, temel olarak bir matematiksel işlemdir.
Grafik 1. Patlama, yukarıdaki gibi bir matematiksel işlem sonucunda gerçekleştirilmiştir.
Patlamanın görsel kalitesinin arttırılması için hem oyuna ait olan programın kodları ile olabildiğince fazla ekran görüntüsü hesaplanmış olmalıdır, hem de ilgili programın yükünü çekebilecek kadar güçlü bir bilgisayar sisteminde oyun çalıştırılmalıdır. Aksi taktirde, her durumda performans ve kalite farkı ile karşılaşılacak, kayıplar yaşanacaktır. Örnek Windows Benchmark / Denektaşı Uygulaması: PassMark Performance Test[3] PassMark Performance Test programı, sistemin toplu değerlendirmesini gerçekleştirmek için geliştirilmiş bir uygulamadır. Eğer sistemde yer alan herhangi bir parça ile ilgili değerlendirme yapılmak isteniyorsa, o parça ile ilgili özelleştirilmiş olan uygulamaları kullanmak gerekebilir.
PassMark Performance Test programı açıldığında, bilgisayar sistemi üzerinde yer alan tüm donanımları tarayacak ve ilgili sonucu bir grafik yardımı ile son kullanıcıya sunacaktır.
Şekil 2. PassMark Performance Test, benim bilgisayarım üzerinde yer alan tanımlı donanımları listeliyor.
System sekmesinde, ilgili donanımlara ait ayrıntılar listelenmektedir. Temel olarak sistemim aşağıdaki gibidir.
Windows 10 Pro Edition x64
Intel Core i5 M 560 2.66 GHz (Turbo Boost ile 3.2 GHz)
8 GB 1066 MHz RAM
NVIDIA GeForce GT 425M 1 GB Paylaşımsız
256 GB Samsung SSD 850 Evo Sabit Disk
1900 x 1080 x 32 Bit 60 Hz Monitör
Summary / Özet sekmesinde, program sonunda elde edilmiş olan değerlerin PassMark Performance Test programının online veri tabanına eklenmiş başka bilgisayarlarda elde edilmiş olan değerler ile sistemin karşılaşmasının yapılabileceği değerler yer almaktadır. CPU Mark, 2D Graphics Mark, 3D Graphics Mark, Memory Mark ve Disk Mark sekmelerinde de ilgili donanımlar üzerinde gerçekleştirilen testlerin başka sistemlerle de karşılaştırılabilir haldeki ayrıntılı listesi yer almaktadır.
Run Benchmark’a tıklandığında program sistem üzerinde koşturulmaya başlanacaktır.[4] Tüm aşamalar sağlıklı gerçekleştirilecek olursa size şöyle bir sonuç verecektir.
Şekil 3. Gerçekleştirilen işlemler sonunda PassMark Performance Test programının bilgisayarım için verdiği sonuç.
PassMark Rating değerinin yüksek olması, ilgili sistemin toplam performans değerinin yüksek olduğu anlamına gelmektedir.
Şekil 4. Şayet “Upload my baseline” seçeneğini işaretlerseniz, ilgili sonuç PassMark Performance Test programının online veri tabanına eklenebilir.
Şekil 5. www.passmark.com adresinde bilgisayarıma ait test sonuçları yer almaktadır.
Genel olarak bilgisayarların ilgili Benchmark / denektaşı sonucunun yeniden tekrarlanması durumunda aynı sonucu verme olasılığı düşüktür. Kullanıcı tarafından yapılmış ayarlar aynı kalmak şartı ile bile program tekrar tekrar koşturulduğunda birbirlerinden farklı sonuçlar verebilir, ancak elde edilen sonuçlar arasında yüzde 3’ten büyük bir fark olmaz. Başka bir şekilde ifade edecek olursak, yüzde 1 düzeyinde gerçekleşen sapmalar önemsizdir, yüzde 3 düzeyine kadarkiler istatistiksel açıdan kabul edilebilir değerlerdir, yüzde 5 ve üzerinde gerçekleşen sapmalar ise performansı etkileyen etmenlerle ile ilgili bir değerlendirme yapılması gerektiğini düşündürür. Bu nedenle Benchmark / denektaşı uygulamalarının en az 3 kez tekrar tekrar koşturularak elde edilen değerlerin ortalamasının alınarak değerlendirilmesi gerekir. Ancak şu durum genel olarak göz önünde bulundurulmalıdır: Tüm elektronik sistemlerde yer alan metaller, zamanla, sürekli elektriksel iletim gerçekleştirdiklerinden dolayı korozyona uğrarlar ve bu da, yaşlı sistemlerdeki ilk çalıştırıldığı günkü ile aynı yük altında olduğunda fark edilecek olan performans kaybının nedeni olmaktadır.
Test Sonuçlarının Yorumu
Bilgisayar sistemlerini sadece teknolojik özellikleri ile kıyaslamak nesnel bir yaklaşım değildir. Bir başka ifade ile parçalarının sayısal değeri yüksek olan bilgisayar performansı yüksek olan bilgisayar değildir. Örneğin; Intel Xeon E5-2698 v3 @ 2.30GHz[5] işlemcisi Intel Xeon E5-2687W v2 @ 3.40GHz[6] işlemcisinden daha yüksek performans ile çalışıyor olmasına rağmen, saat frekans değeri olan 2.30 GHz, 3.40 GHz hızından nerede ise yüzde 40 küçüktür. İlgili işlemcilerin CPU Mark değerleri Intel Xeon E5-2698 v3 @ 2.30GHz işlemcisinin 22.197, Intel Xeon E5-2687W v2 @ 3.40GHz 16.670 olarak gerçekleşmiştir. Elbette iki işlemcinin performans değerleri hakkında bilgi edinmek için yalnızca kullanılmış bir programın dönmüş olduğu değere değil, birkaç programın bir arada kullanılması ile elde edilen sonuçları karşılaştırmak gerekir.[7]
64 bit bir bilgisayar sistemi üzerinde yine 64 bit bilgisayarlar için yazılmış olan programlar çalıştırılmadığı sürece, ne 64 bit kullanmanın avantajlarına kavuşulmuş olur ne de ilgili programın gerçek çalışma değeri değerlendirilmiş olur. Mantıksal açıdan durum şu şekilde ifade edilebilir: 64 şeritli bir bant ile üretme imkânı bulunan fabrikanızda, sadece 32 bant üzerinde üretim gerçekleştirirken geri kalan diğer 32 bant üzerinde hiçbir şekilde üretim gerçekleştirmiyor, boşa çalıştırıyorsunuz demektir. Hâl böyle iken, 64 bant ile üretim yapan diğer fabrikalar, sizden daha kısa sürede, sizden daha yüksek üretim miktarını gerçekleştirecektir.
Çok çekirdekli mimariler, tek çekirdekli işlemciler kadar uzun bir geçmişe sahip değillerdir. Bu nedenle, her ne kadar tek çekirdekli bilgisayarlarda çalışan uygulamalar çok çekirdekli sistemlerde çalıştırılabilseler bile, piyasada bulunan tüm programlar çok çekirdekli mimarileri desteklemez ya da kod optimizasyonları tam olarak gerçekleştirilememiştir. Örneğin; Intel Hyper Treading özelliğini desteklemeyen, “ilk giren ilk çıkar” kod mantığı ile yazılmış bir programın tek çekirdekli ya da çok çekirdekli sistemlerde çalıştırılmasında performans açısından bir fark yoktur.
Tüm özellikleri aynı olan bilgisayarlar değerlendirilirken, iki sistem de aynı ayarlarla donatılmış aynı programlara sahip olmalıdır. En temel hali ile bir bilgisayar sistemi değerlendirilmek istendiğinde, üzerinde yer alan tüm donanımların “diğer donanımlar ile uyumlu halde çalışabilen sürücüleri” yüklenmiş olmalıdır. Karşılaştırılacak sistemlerin üzerinde aynı sürüm numarasına sahip sürücü programı kurulu olması şartı ile sistemlerin güncellenmiş olması gerekmez. Çünkü aynı sistemler aynı programlar ile benzer yük altında birbirlerine yüzde 1 değerinden de yakın sonuçlar vereceklerdir. Yüzde 1’den yüksek bir değer ile karşılaşılması durumunda sistemlerin program ayarlarının birbirlerinden farklı olabileceği düşünülebilir. Özellikleri birbirlerinden farklı olan bilgisayarlar değerlendirilirken, işletim sistemlerinin aynı sürüm ve model olması gerekmektedir. Hangi durumda olursa olsun, farklı işletim sistemleri kullanılarak elde edilecek sonuçlar nesnel ve karşılaştırılabilir değildir. Bilgisayar sistemine yük getirecek tüm programlar kapatılmış ve sistemde yer alan tüm parçaların güncelleştirmesi gerçekleştirilmiş olan farklı donanımsal özelliklerle donatılmış sistemler birbirleri ile karşılaştırılabilirler. Aynı programın aynı sürümü kullanılmış olması şartı ile Benchmark / denektaşı sonucunda elde edilmiş değer, sistemlerde aynı komutlar işlenmiş olacağı için, hangisinde daha iyi ise o bilgisayar daha yüksek performanslı olacaktır. Sonuç olarak, önemli olan bir bilgisayar sisteminin sürekli yüksek performans ile çalışıyor olması değildir. Önemli olan, alınmış olan sistemin alınma amacına en iyi hizmet edecek düzeyde performans değerleri ile maliyet açısından en yüksek marjinal faydaya sahip olmasıdır.
KAYNAKÇA
[1] Türk Dil Kurumu tarafından Benchmark kelimesine karşılık Türkçe bir kelime önerilmediği ve Benchmark’ın Türkçe karşılığı olarak dilimize kazandırılmak istenen “denektaşı” sözcüğünün karşılığı olarak bir tanım yer almadığı için makale içinde Banchmark ve Denektaşı kelimelerinin aynı anda kullanılmıştır.
[2] Örnek yazılım performans değerlendirmesi yapmak için www.passmark.com/products adresinde yer alan, örnek donanım performans değerlendirmesi yapmak için http://www.passmark.com/products/hardware.htm adresinde yer alan programlar incelenebilir.
[3] www.passmark.com/products adresinden temin edinilebilir.
[4] Bu işlemin gerçekleştirilmesi süresi, sistem performansınıza bağlı olarak değişebilir. Sisteminiz yanıt vermeyi kesebilir veya yanıt vermiyormuş gibi davranabilir. Program açıldığı andan itibaren işlemlerin sağlıklı bir şekilde yerine getirilebilmesi için bilgisayarınıza zaman tanıyın.
[6] İşlemci hakkında ayrıntılı bilgi için www.cpubenchmark.net/cpu
[7] İlgili sonuçlar www.cpubenchmark.netadresindeki 1 Nisan 2016 tarihinde güncellenmiş olan En Yüksek İşlemciler listesinden alınmıştır. Son Erişim Tarihi: 2 Nisan 2016
İletişim için: serkan.mete@email.com