Her yeni RAM teknolojisinde DRAM (dynamic random access memory) kapasiteleri arttıkça ve yonga plakası litografisi (wafer lithography) daha yüksek hızlara ve daha iyi ölçek ile daha ekonomik üretime ulaşmak için daha az alana daha fazla transistör sığdırmak hedeflenir. Wafer alanı küçüldükçe, bit hatalarının da artması beklenmektedir .
On-die ECC, DDR5 RAM modüllerinde sunulan önemli bir özelliktir. Veriyi CPU (işlemci) birimine bus üzerinden göndermeden önce Ram modül üzerindeki her DRAM yongası içindeki bit hatalarını düzelterek ek koruma sağlar.
On-Die ECC Nedir? Geleneksel ECC ile aynı mıdır?
ECC (Error Correction Code), sıra dışı ısı, diğer donanımlardan kaynaklı EMC gibi sebeplerden kaynaklanan bit kayması (bit-flipping), kararsız bölge gibi bellek hatalarını gidererek bellek veri bütünlüğünü korumanın en yaygın yöntemlerinden biridir. ECC bellek, tipik olarak çift bit hatalarını tespit eder ve kontrolcü ve bellek arasında veri iletimi sırasında oluşabilecek tek bit hatalarını düzeltir.
On-die ECC, yüksek güvenilirlik sunan ve hata oranlarını azaltan bir işlevdir ancak geleneksel ECC özelliği ile aynı DEĞİLDİR.
On-Die ECC tüm DIMM – RAM modülünün güvenilirliğini sağlayan ECC yapısında değildir. Tek tek yongaların (chip) güvenilirliğini artırmak için tasarlanmıştır. Bu da on-die ECC işlevinin veri tutmadan çok veri güvenilirliği ile ilgili olduğu anlamına gelir. Bellek hücreleri, artan kapasiteler nedeniyle daha yoğun hale geldikçe bit kaymalarına (bit-flipping) karşı daha hassas hale gelirler. Bu da hücrelerin daha az elektrik yükü-şarj tutmalarına bunun sonucunda da kararsız bölgeye düşmelerine yol açar. On-die ECC, daha fazla hücrenin üretim aşamasında doğrulama yöntemlerinden geçmesi için bit kaymalarını (bit-flipping) yönetmenin bir yoludur. Bu sayede daha fazla bellek hücresinin JEDEC tarafından belirlenen özellikleri karşılaması sağlanır.
Kalıp (Die) üzerindeki veriler için koruma sunan on-die ECC işlevi, aktarım halindeki ya da bellek/RAM modülü ile işlemci/CPU ya da ekran kartı/GPU arasında taşınan veriler için koruma sağlamaz. Bellek modülü ve CPU içerisindeki bellek konrolcüsü ile yonga dışındaki birimlerde meydana gelen hatalara karşı koruma sunamaz. Sadece modül üzerindeki her bir DRAM çipi üzerindeki bit hatalarını düzeltmeye yarar.
DDR5 Belleklerde Neden On-Die ECC İşlevi Mevcuttur?
Bellek teknolojileri ile birlikte gelişen üretim teknolojileri sonucunda 2x süreç düğümü de (process node); 10 nanometre (nm) teknolojisinin 4. nesli olan daha gelişmiş 1-alpha’ya (1α) doğru geliştirildikçe wafer ve yonga boyutları küçülerek DDR5’in daha yüksek kapasite ve hız değerlerine sahip olmasını sağladı. Daha küçük süreç teknolojisi sonucunda DRAM bellek dizilerinden tek bitlik (single-bit) hata oluşma ihtimali çok artmıştır.
Küçülen litografi, paket boyutunun daha yoğun veri depolamasına olanak tanır. Bu aynı zamanda on-die ECC işlevi kullanımı için de kullanılabilir veri alanı olanağı sunar. DDR5 DRAM’lerde ECC işlevi için ek depolama alanı ayrılmıştır; her 128 bit veri için 8 bit ek ECC depolama alanı mevcuttur. Bu alan şu andaki ECC RAM modüllerde ek DRAM yongası ekleyerek elde edilir
Yazma işlemi sırasında, DRAM dahili olarak ECC’yi hesaplar ve ECC kodunu bu ek alan depolama alanında saklar. Okuma işlemi sırasında da DRAM hem etkin verileri Eğer bir tutarsızlık tespit edilirse tek bitlik (single-bit) hata düzeltilir. Böylece verilerin, bellek dizisi içinde oluşabilecek tek bitlik (single-bit) hatalardan korunma oranı artmış olur.
Yazma işlemi sırasında, DRAM dahili olarak ECC’yi hesaplar ve ECC kodunu bu ek alan depolama alanında saklar. Okuma işlemi sırasında da DRAM hem etkin verileri hem de ECC kodunu okur. Eğer bir tutarsızlık tespit edilirse maskeleme ile tek bitlik (single-bit) hata düzeltilir. Böylece verilerin, bellek dizisi içinde oluşabilecek tek bitlik (single-bit) hatalardan korunma oranı artmış olur.
On-Die ECC Faydaları Nelerdir?
Ölçek ekonomileri; Samsung, SKHynix, Bigboy ve Kingston gibi bellek üreticilerinin daha yüksek yoğunluklu bellekleri daha yüksek güvenilirlik ve daha düşük maliyetler ile üretebilmeleri için daha fazla ölçeklendirmeye imkan tanır. Tek bitlik hataları (single-bit errors) dahili olarak düzeltmeyi sağlayan on-die ECC, daha güvenilir teknoloji çözümü ölçeklendirmesine olanak tanır. Bu maliyetlerin düşürülmesi, hız ve kapasite artırımda büyük avantaj sağlamıştır . Aynı zamanda alan düşürülmesine karşın bit güvenliği artmıştır.
On-die ECC DRAM içindeki veri bütünlüğünü daha geliştirir. Okuma komutları sırasında ve DDR5’ten veri çıkmadan önce düzeltme yapılmasını sağlayarak sistemin hata düzeltme yükünü azaltır ve on-die veri, bellek dizisi içindeki tek bitlik hatalara karşı daha fazla korunur.
Hata Kontrolü ve Temizleme olarak ifade edilebileceğimiz ECS (error check and scrub) özelliği DDR5 belleğin dahili verileri okumasını ve bir hata oluştuğunda düzeltilmiş verileri geri yazmasını sağlar. Böylece özellikle yüksek kapasiteli RAM modüllerinde hata birikmesinin önüne geçer. DRAM hatalarının kaydını tutarak sisteme hata sayıları sağlayarak daha yüksek şeffaflık ve güvenilirlik sunar.
Hata Kontrolü ve Temizleme olarak ifade edilebileceğimiz ECS (error check and scrub) özelliği DDR5 belleğin dahili verileri okumasını ve bir hata oluştuğunda düzeltilmiş verileri geri yazmasını sağlar. Böylece özellikle yüksek kapasiteli RAM modüllerinde hata birikmesinin önüne geçer. DRAM hatalarının kaydını tutarak sisteme (sunucu/depolama/iş istasyonu)hatalı alanların düzeltilmesini sağlayarak daha yüksek şeffaflık ve güvenilirlik sunar.
Sonuç
Özetleyecek olursak, on-die ECC DDR5 tarafından sunulan önemli bir özelliktir. Ancak, tipik olarak ECC olarak bilinen özellikten farklıdır. Geleneksel ECC, verilerin taşınması sırasında bellek hatalarını denetleyerek veri bütünlüğü sağlarken, on-die ECC bellek yongası (DRAM) içindeki veriyi denetleyerek yüksek kapasiteli belleklerde daha yüksek güvenilirlik sağlar.
Günümüz gelişmiş bellek modüllerindeki daha küçük hala gelen yonga boyutları ve daha yüksek kapasiteler sonu ortaya çıkan yonga ve hücre başına düşen veri yoğunluğunu artırmış durumdadır. Giderek küçülen litografi bu yongaları bit kaymalarına (bit-flipping) karşı daha da savunmasız duruma getirmektedir. On-die ECC, daha fazla hücrenin üretim aşamasında doğrulama yöntemlerinden geçmesi için bit kaymalarını (bit-flipping) yönetmek için geliştirilmiştir.
Hakkında yorum “DDR5 On-Die ECC Özelliği Nedir?”