Her yeni jenerasyonda sürekli iyileştirmeler ve artımlı iyileştirmeler yapılmasına rağmen, işlemciler uzun süredir endüstrinin değişen gelişmeleri olmadı. Vakum tüplerinden transistörlere geçiş çok büyüktü. Bireysel bileşenlerden entegre devrelere geçiş çok büyüktü. Ancak bundan sonra bu ölçekte benzer paradigma değişimleri yaşanmadı.

Evet, transistörler küçüldü, cipsler daha hızlı ve performans yüz kat arttı, ancak azalan getirileri görmeye başlıyoruz ...

Bu, CPU tasarım serimizdeki dördüncü ve son taksittir ve size bilgisayar işlemci tasarımı ve üretimi hakkında genel bir bakış sunar. Yukarıdan aşağıya doğru başlayarak, bilgisayar kodunun montaj diline nasıl derlendiğine ve bunun CPU'nun yorumlayabileceği ikili talimatlara nasıl dönüştürüldüğüne baktık. İşlemcilerin nasıl tasarlandığını ve işlem talimatlarını inceledik. Sonra bir CPU oluşturan çeşitli yapılara baktık.

Biraz daha derine inerek, bu yapıların nasıl inşa edildiğini ve milyarlarca transistörün bir işlemci içinde birlikte nasıl çalıştığını gördük. İşlemcilerin fiziksel olarak ham silikondan nasıl yapıldığına baktık. Yarı iletkenlerin temellerini ve bir çipin içinin neye benzediğini öğrendik. Bunlardan herhangi birini kaçırdıysanız, serinin bir dizini:

Dördüncü bölüme geçiyoruz. Şirketler araştırmalarını veya mevcut teknolojilerinin ayrıntılarını paylaşmadığından, bilgisayarınızdaki CPU'da tam olarak ne olduğunu anlamak zor. Ancak yapabileceğimiz şu anki araştırmalara ve endüstrinin nereye gittiğine bakmak.

İşlemci endüstrisinin ünlü temsilcilerinden biri Moore Yasasıdır. Bu, bir çipteki transistör sayısının yaklaşık 18 ayda bir nasıl iki katına çıktığını açıklar. Bu çok uzun zamandır doğruydu, ama yavaşlamaya başlıyor. Transistörler o kadar küçülüyor ki fiziğin izin vereceği sınıra yaklaşıyoruz. Çığır açan yeni bir teknoloji olmadan, gelecekteki performans artışlarına ulaşmak için farklı yollar keşfetmemiz gerekecek.

120 Yıllık Moore Yasası

Bu dökümün doğrudan bir sonucu, şirketlerin performansı artırmak için frekans yerine çekirdek sayısını artırmaya başlamasıdır. Bu, sekiz çekirdekli işlemcilerin 10GHz çift çekirdekli yongalardan ziyade ana akım haline geldiğini görmemizin nedeni. Sadece daha fazla çekirdek eklemenin ötesinde, büyümek için çok fazla alan kalmadı.

Tamamen farklı bir notta, Kuantum hesaplama gelecekte büyüme için çok fazla alan vaat eden bir alandır. Ben bu konuda uzman değilim ve teknoloji hala yaratıldığından, zaten pek çok gerçek "uzman" yok. Herhangi bir efsaneyi ortadan kaldırmak için kuantum hesaplama, render veya benzeri bir gerçek hayatta 1.000 fps sağlayacak bir şey değildir. Şimdilik, kuantum bilgisayarların ana avantajı, daha önce mümkün olmayan daha gelişmiş algoritmalara izin vermesidir.

IBM'in Quantum Bilgisayar prototiplerinden biri

Geleneksel bir bilgisayarda, 0 veya 1'i temsil eden bir transistör açık veya kapalıdır. üstüne koyma mümkün, yani bit aynı anda hem 0 hem de 1 olabilir. Bu yeni yetenek ile bilgisayar bilimcileri yeni hesaplama yöntemleri geliştirebilir ve şu anda hesaplama yeteneklerine sahip olmadığımız sorunları çözebileceklerdir. Kuantum bilgisayarların daha hızlı olması o kadar da değil, farklı türdeki sorunları çözmemizi sağlayacak yeni bir hesaplama modeli olmaları.

Bunun teknolojisi hala ana akımdan on veya iki yıl uzakta, bu yüzden şu anda gerçek işlemcilerde görmeye başladığımız bazı eğilimler neler? Düzinelerce aktif araştırma alanı var ama bence en etkili olan birkaç alana değineceğim.

Etkilendiğimiz büyüyen trend heterojen hesaplama. Bu, tek bir sisteme birden fazla farklı bilgi işlem elemanını dahil etme yöntemidir. Çoğumuz bundan sistemlerimizde özel bir GPU şeklinde faydalanırız. CPU çok özelleştirilebilir ve makul bir hızda çok çeşitli hesaplamalar yapabilir. Bir GPU ise matris çarpımı gibi grafik hesaplamaları yapmak için özel olarak tasarlanmıştır. Bu gerçekten iyi ve bu tür talimatlarda CPU'dan daha hızlı büyüklük emirleri. Bazı grafik hesaplamaları CPU'dan GPU'ya yükleyerek iş yükünü hızlandırabiliriz. Herhangi bir programcının bir algoritmayı değiştirerek yazılımı optimize etmesi kolaydır, ancak donanımı optimize etmek çok daha zordur.

Ancak, hızlandırıcıların yaygınlaştığı tek alan GPU'lar değildir. Çoğu akıllı telefon, çok özel görevleri hızlandırmak için tasarlanmış düzinelerce donanım hızlandırıcıya sahiptir. Bu bilgi işlem stili, Hızlandırıcı Denizi ve örnekler arasında kriptografi işlemcileri, görüntü işlemcileri, makine öğrenimi hızlandırıcıları, video kodlayıcıları / kod çözücüleri, biyometrik işlemciler ve daha fazlası yer alır.

İş yükleri gittikçe daha fazla uzmanlaştıkça, donanım tasarımcıları yongalarına gittikçe daha fazla hızlandırıcı ekliyorlar. AWS gibi bulut sağlayıcıları, geliştiricilerin buluttaki iş yüklerini hızlandırmaları için FPGA kartları sağlamaya başladı. İşlemciler ve GPU'lar gibi geleneksel bilgi işlem öğeleri sabit bir iç mimariye sahipken, FPGA esnektir. Bilgisayar gereksinimlerinize göre yapılandırılabilen neredeyse programlanabilir donanım gibidir.

Görüntü tanıma yapmak istiyorsanız, bu algoritmaları donanıma uygulayabilirsiniz. Yeni bir donanım tasarımının nasıl performans göstereceğini simüle etmek istiyorsanız, onu gerçek anlamda oluşturmadan önce FPGA üzerinde test edebilirsiniz. Bir FPGA, GPU'lardan daha fazla performans ve güç verimliliği sunar, ancak yine de bir ASIC'den (uygulamaya özgü entegre devre) daha azdır. Google ve Nvidia gibi diğer şirketler, görüntü tanıma ve analizini hızlandırmak için özel makine öğrenimi ASIC'leri geliştiriyor.

Birkaç yaygın mobil işlemcinin yapısını gösteren kalıp çekimleri

Bazı oldukça yeni işlemcilerin kalıp çekimine baktığımızda, CPU alanının çoğunun aslında çekirdeğin kendisi olmadığını görebiliriz. Artan bir miktar, tüm farklı türlerdeki hızlandırıcılar tarafından ele geçirilmektedir. Bu, büyük güç tasarrufu avantajına ek olarak çok özel iş yüklerinin hızlanmasına yardımcı oldu.

Tarihsel olarak, bir sisteme video işleme eklemek istiyorsanız, bunu yapmak için sadece bir çip eklersiniz. Yine de bu oldukça verimsiz. Bir sinyalin fiziksel bir tel üzerindeki bir yongadan başka bir yongaya çıkması gerektiğinde, bit başına büyük miktarda enerji gerekir. Kendi başına, bir Joule'nin küçük bir kısmı çok fazla görünmeyebilir, ancak aynı çip içinde çipten ayrılmak yerine iletişim kurmak için 3-4 büyüklükte daha verimli olabilir. Bu hızlandırıcıların CPU'ların içine entegrasyonu sayesinde ultra düşük güç yongalarının büyümesini gördük.

Hızlandırıcılar mükemmel değil. Tasarımlarımıza daha fazlasını ekledikçe, talaşlar daha az esnek hale gelir ve belirli iş yüklerinde en yüksek performans için genel performansı feda etmeye başlar. Bir noktada, tüm çip sadece bir hızlandırıcı koleksiyonu haline geliyor ve artık kullanışlı bir CPU değil. Özel performans ile genel performans arasındaki denge her zaman hassas bir şekilde ayarlanmaktadır. Genelleştirilmiş donanım ve belirli iş yükleri arasındaki bu bağlantı kesme, uzmanlık açığı.

Bazıları bir GPU / Makine Öğrenimi balonunun zirvesinde olabileceğimizi düşünüyor olsa da, muhtemelen daha fazla hesaplamalarımızın özel hızlandırıcılara yüklenmesini bekleyebiliriz. Bulut ve yapay zeka büyümeye devam ettikçe, GPU'lar bugüne kadar ihtiyaç duyulan muazzam miktarda hesaplamaya ulaşmak için en iyi çözümümüz gibi görünüyor.

Tasarımcıların daha fazla performans aradığı bir başka alan da bellektir. Geleneksel olarak, okuma ve yazma değerleri işlemciler için en büyük darboğazlardan biri olmuştur. Hızlı, büyük önbellekler yardımcı olabilir, ancak RAM'den veya SSD'nizden okumak on binlerce saat döngüsü alabilir. Bu nedenle, mühendisler genellikle bellek erişimini gerçek hesaplamanın kendisinden daha pahalı olarak görürler. İşlemciniz iki sayı eklemek istiyorsa, öncelikle sayıların depolandığı bellek adreslerini hesaplaması, hangi düzeyde veri hiyerarşisinin verilere sahip olduğunu bulması, verileri kayıtlara okuması, hesaplamayı yapması, adresini hesaplaması gerekir. hedefini girin ve değeri gereken yere yazın. Tamamlanması yalnızca bir veya iki döngü alabilecek basit talimatlar için bu son derece verimsizdir.

Çok fazla araştırma gören yeni bir fikir, Yakın Bellek Hesaplama. Araştırmacılar, hesaplama için hızlı işlemciye getirmek üzere bellekten küçük veri parçaları almak yerine, bu fikri tersine çeviriyorlar. Doğrudan RAM veya SSD'nizdeki bellek denetleyicilerine küçük işlemciler inşa etmeyi deniyorlar. Hesaplamayı belleğe daha yakın hale getirerek, verilerin çok fazla aktarılması gerekmediği için büyük enerji ve zaman tasarrufu potansiyeli vardır. Hesaplama birimleri, bellekte oldukları için ihtiyaç duydukları verilere doğrudan erişebilir. Bu fikir hala başlangıç ​​aşamasındadır, ancak sonuçlar umut vericidir.

Belleğe yakın hesaplama ile aşılması gereken engellerden biri üretim süreci sınırlamalarıdır. Kapsanan Bölüm 3'tesilikon üretim süreci düzinelerce adımla çok karmaşıktır. Bu işlemler tipik olarak hızlı mantık elemanları veya yoğun depolama elemanları üretmek için uzmanlaşmıştır. Hesaplamaya göre optimize edilmiş bir imalat işlemi kullanarak bir bellek yongası oluşturmayı denediyseniz, yongada çok düşük bir yoğunluğa sahip olursunuz. Depolama üretim işlemini kullanarak bir işlemci oluşturmayı denediyseniz, performans ve zamanlama çok düşük olur.

Transistör katmanları arasındaki dikey bağlantıları gösteren 3B entegrasyon örneği.

Bu soruna potansiyel bir çözüm olarak bilinir 3D Entegrasyonu. Geleneksel işlemcilerin çok geniş bir transistör tabakası vardır, ancak bunun sınırlamaları vardır. Adından da anlaşılacağı gibi, 3D Entegrasyon, yoğunluğu artırmak ve gecikmeyi azaltmak için birkaç transistör katmanını üst üste istifleme işlemidir. Katmanlar arasında bağlantı kurmak için farklı üretim süreçleri üzerine inşa edilmiş dikey sütunlar kullanılabilir. Bu fikir uzun zaman önce önerildi, ancak uygulamadaki büyük zorluklar nedeniyle endüstri ilgisini kaybetti. Son zamanlarda, 3D NAND depolama teknolojisini ve bunun bir çalışma alanı olarak yeniden canlandığını gördük.

Fiziksel ve mimari değişikliklere ek olarak, tüm yarı iletken endüstrisini etkileyecek bir eğilim de güvenliğe daha fazla odaklanmaktır. Yakın zamana kadar, işlemcilerimizdeki güvenlik biraz sonradan düşünüldü. Bu, güvendiğimiz internet, e-posta ve diğer pek çok sistemin güvenlik açısından neredeyse hiç dikkate alınmadan nasıl tasarlandığına benzer. Bizi daha güvenli hissettirmek için şu an mevcut olan herhangi bir güvenlik açıldı. İşlemcilerle bu, özellikle Intel olmak üzere ısırık şirketlerine geri döndü.

Spectre ve Meltdown hataları, ilgili güvenlik risklerini tam olarak anlamamasına rağmen, bir işlemciyi büyük ölçüde hızlandıran özellikler ekleyen tasarımcıların belki de en ünlü örneğidir. Mevcut işlemci tasarımı, tasarımın önemli bir parçası olarak güvenliğe çok daha fazla önem vermektedir. Artan güvenlikle birlikte genellikle bir performans isabeti gelir, ancak bu büyük güvenlik hatalarının sahip olabileceği zarar göz önüne alındığında, performansa olduğu kadar güvenliğe odaklanmaktan daha iyi olduğumuzu söylemek güvenlidir.

Bu serinin önceki bölümlerinde, tasarımcıların tasarımlarını önce yüksek düzeyli bir programlama dilinde belirtmelerini sağlayan ve daha sonra bu işlevi gerçekleştirmek için en uygun donanım yapılandırmasını belirleyen gelişmiş algoritmalara sahip olan Yüksek Seviyeli Sentez gibi tekniklere değindik. Tasarım döngüleri her nesil çok daha pahalı hale geldikçe, mühendisler gelişimlerini hızlandırmaya yardımcı olacak yollar arıyorlar. Yazılım destekli donanım tasarımındaki bu eğilimin, yoldaki yeteneklerinde büyümeye devam etmesini bekleyin.

Geleceği tahmin etmek imkansız olsa da, burada bahsettiğimiz yenilikçi fikirler ve araştırma alanları, gelecekteki işlemci tasarımlarında bekleyebileceğimiz bir yol haritası olarak hizmet etmelidir. Kesin olarak söyleyebileceğimiz, düzenli üretim süreci iyileştirmelerinin sonuna yaklaştığımızdır. Her neslin performansını artırmaya devam etmek için, tasarımcıların daha da karmaşık çözümler bulmaları gerekecek.

Bu dört bölümlük dizinin işlemci tasarımı, üretimi, doğrulaması ve daha fazlasına olan ilginizi artırdığını umuyoruz. Hiç bitmeyen bir materyal var ve bu makalelerin her biri, hepsini ele almaya çalışırsak, üst düzey bir üniversite kursunu doldurabilir. İnşallah yeni bir şey öğrendiniz ve karmaşık bilgisayarların her seviyede nasıl olduğunu daha iyi anlamışsınızdır. Derinlemesine dalmamızı istediğiniz konular için önerileriniz varsa, her zaman önerilere açığız.

Masthead kredisi: Bilgisayar işlemcisi Dan74 soyut aydınlatma ile