Intel, oyuncular, profesyoneller ve sunucular için ayrı GPU'lar geliştiriyor ve hepsi bu yıl piyasaya sürülecek veya 2021'de piyasaya sunulacak. Intel'in kartları ya durgun bir pazarın uzun zamandır beklenen kurtarıcıları olacak ya da düşük performans ve flop yapacaklar sefil (baskı yok, bunu okuyan Intel PR personeli). Şahsen, her iki şekilde de mutluyum: iyi GPU'lar elde ediyoruz veya eğlenmek için iyi şeyler alıyoruz.

Bu bizim ikinci tur Xe ile ilgili soruşturma transpired son birkaç aydır. Hızlı bir şekilde özetlemek gerekirse, Intel'in Xe'nin gelişimi ile halka açıldıkları andan bu yana yaptığı önemli duyuruların zaman çizelgesi:

  • 8 Kasım 2017: Raja Koduri, AMD’nin GPU departmanını yöneten işinden ayrılıyor ve Intel'e katılıyor ve çekirdek ve görsel bilgi işlemin Kıdemli Başkan Yardımcısı oluyor. İlk eylemi AMD'nin saflarından yarım düzine eski arkadaşı kiralamak.
  • 12 Haziran 2018: Sonra CEO CEO'su Brain Krzanich, Intel’in yatırımcılarına Arktik Ses yıllardır ayrık GPU mimarisi ve 2020'de piyasaya sürmeyi planlıyorlar.
  • 8 Ocak 2019: İstemci bilgisayar kıdemli Kıdemli Başkan Yardımcısı Gregory Bryant, CES'de Intel’in ilk GPU turunun 10nm düğümüne ulaşacağını doğruladı.
  • 1 Mayıs 2019: Render ve görselleştirme ekibinin kıdemli prensip mühendisi ve yöneticisi Jim Jeffers, Xe’nin FMX19'daki ışın izleme kapasitesini duyurdu.
  • 17 Kasım 2019: Raja Koduri, Xe'nin üç çeşit, yüksek performanslı, düşük güçlü ve yüksek performanslı hesaplamada olacağını açıkladı. İkinci kategorideki ilk GPU'nun 2021'de 7nm düğümünde gelen Ponte Vecchio olacağını söyledi.
  • 9 Ocak 2019: Discrete Graphics One Yazılım Geliştirme Aracı'nın (DG1 SDV) ilk görüntüleri yayınlanarak geliştiricilerin yazılımlarını Xe mimarisi için optimize etmelerine yardımcı olan küçük bir RGB infüzyon kartı gösteriliyor.

Ve bunun gibi…

  • 17 Mart 2020: Kıdemli geliştirici ilişkileri mühendisi Antoine Cohade, Xe'nin GDC'deki “donanım mimarisine ayrıntılı bir tur” ve “performans sonuçları” sunacak.

Resmi anlatım, Intel'in işyerinde pek çok arzu edilen özelliğe sahip gizemli GPU'ları inşa etme hikayesini döndürüyor; daha iyi düğümler, ışın izleme, yeni paketleme teknikleri. Ama sen ve ben ikimiz de GPU yapan hile değil, beygir gücü ve para dahil olduğunu biliyoruz. Bu makalenin konusu bu.

Mimari

İyi bir mimari bir tuğla ile başlar ve GPU'lar da… Intel'ler hariç. AMD ve Nvidia’nın çekirdekleri saat başına bir işlem gerçekleştirir, ancak Intel’in yürütme birimleri (AB) sekiz performans sergiliyor. Ancak teknik yanlışlıklara rağmen, bir AB'yi karşılaştırma amacıyla sekiz çekirdeğe eşdeğer olarak tanımlayacağız.




Intel’in bir seferde sekiz tuğla ile inşa etme ihtiyacından ayrı olarak, inşaat teknikleri basittir. Birkaç tuğlayı bir araya getirip bir duvar yapabilirler. Birkaç duvar ve bir oda olsun, birlikte bunlardan birkaç chuck ve bir daire yapabilirsiniz.

Aracı adımları atlayarak, Xe’nin müstakil en büyük birimi (daire) dilim ve her biri sırasıyla yüksek performanslı ve düşük güçlü dilimler için 512 veya 768 çekirdek içerir. İhtiyacınız olan tek bir daire, bu nedenle düşük güçlü kartlar sadece bir dilim kullanıyor. Ancak oraya yerleşmek istemiyorsanız, Intel, birçok dilimden oluşan gökdelen tarzı meraklı GPU'lar yapıyor.




Neler olup bittiğini anlamak için Xe mimarisi hakkında bilmeniz gereken her şey budur, ancak bazı teknoloji ve benzeri numaralar konuşabiliyorsanız, bir sonraki biti atlamayın.

Gen11'de Intel’in entegre GPU'larında dilim sekizden yapılmış alt dilimleriki bu da sekiz tane vardı yürütme birimleri her biri. Gen12 (Xe’nin ilk nesil) için bunu biraz reddetti ve hesaplama birimleri (CU'lar) ve oluşturma arka ucundaki değişikliklerle birlikte.

Eylül ayında, kod yanlışlıkla GitHub'a yüklendi sızdırılmış DG1, Ponte Vecchio ve bir DG2 varyantının konfigürasyonları. Bu sızıntı güvenilirdir, çünkü Ponte Vecchio'nun iki dilime sahip olacağı sezgisel tahmininin doğru olduğu kanıtlanmıştır. DG1'in dilim başına altı alt dilime ve dolayısıyla 96 AB'ye sahip olacağı öngörüsü, bir veya daha fazla AET dosyalaması aynı sayıyı verir.

Sızıntı, tüm Gen12 modellerinde Intel'in alt dilim başına 16 AB'ye ve özellikle Ponte Vecchio'da dilim başına dört alt dilime sahip olduğunu ortaya koyuyor. Koduri sonra meydana çıkarmak Ponte Vecchio'nun iki dilim ve on altı CU'su var.

Ponte Vecchio'nun muhtemelen şu şekilde çalıştığını söylemek için yeterli bilgi: Sekiz AB, bir dilim (512 çekirdek / 512 AB) olan bir alt dilimle (128 çekirdek / 16 AB) eşleştirilen bir CU (64 çekirdek) halinde birleştirildi. / 64 AB). İki dilim ile Ponte Vecchio'nun 128 AB, 1024 çekirdeği olduğu anlamına gelir. İki dilimli yapılandırmanın yalnızca prototipler için olabileceğini unutmayın.

Ponte Vecchio’nun temel dilim yapılandırmasının yüksek performanslı ve düşük güçlü modellerde de kullanılması bekleniyor.

DG2: Yüksek Performans

Ayrık Grafik İki (DG2) olarak adlandırılan yüksek performanslı mikro mimari, orta sınıf ve meraklı GPU pazarlarını kapsamaktadır. Bu kartlar, ışın izleme ve RGB bling'e sahip olacak, ancak en heyecan verici şey, Intel'in Nvidia'nın $ 600 + serisindeki tuhaflığa meydan okuma potansiyeli.

“Xe HP… kolayca Hindistan'da tasarlanan en büyük silikon ve herhangi bir yerdeki en büyük silikon olacaktı.” - Raja Koduri

Geçen Temmuz ayında Intel yanlışlıkla bir sürücü (teşekkürler!) Üç DG2 kod adı içeren, iDG2HP128, iDG2HP256, ve iDG2HP512. Sondaki üç basamağın kartın AB sayısını gösterdiğini varsayarsak, sırasıyla 1024, 2048 ve 4096 çekirdeğe sahip olurlar. Bu iki, dört ve sekiz dilim.

Ancak çok kısa bir süre sonra, kanıt 1536 çekirdekli üç dilimli GPU da geliştirildi. Intel'in mevcut modellere benzer dördüncü bir kart geliştirmesinin mantıksız olduğu düşünüldüğünde, bunun bir dilim devre dışı bırakılmış bir iDG2HP256 olduğunu kabul etmek güvenlidir. Bu, Intel'in üç temel modeli aldığını ve dizilimine dördüncü, beşinci, altıncı veya yedinci modelleri eklemek için bir veya daha fazla dilimi devre dışı bıraktığına dair yaygın şüpheleri destekliyor.

Dilim Sayısı 1 2 3 4 5 6 7 8
Çekirdek Sayısı 768* 1024 1536 2048 2560 3072 3584 4096
Kod adı iDG1LPDEV iDG2HP128   iDG2HP256       iDG2HP512

DG2 ayrıca oyun GPU'larından daha fazlası olacak. Ponte Vecchio gibi bilimsel iş yüklerini kaldıramayacaklar, ancak piyasaya sürüldüklerinde iyi bir değere sahiplerse, kesinlikle Nvidia’n Quadro kartları gibi video düzenleme veya 3D modelleme donanımı olarak profesyonel sürücülerle yeniden pazarlanabilirler.

DG1: Düşük Güç

Düşük güç segmenti, 5W ila 50W arasındadır. Entegre GPU'lar için 5W - 20W ve ayrık olanlar için 20W - 50W.

Intel bizi LP ailesinin ilk üyesiyle tanıştırdı. DG1 SDV Destiny 2 ve Warframe'i RGB ve tümüyle çalıştıran CES 2020'de belirgin bir şekilde görüntülendi. Ama sadece bir oyun kartı gibi giyiniyor. DG1 SDV, yazılım ve sürücüleri Xe platformuna geçirmeye yardımcı olmak için tasarlanmış, yalnızca geliştiricidir.

Ancak bu, sonunda oldukça benzer bir şey satın alamayacağınız anlamına gelmez - Intel zaten bir dizüstü bilgisayarda çalıştığını gösterdi.

LP GPU'nun entegre formlarının 64 ila 768 çekirdeğe sahip olduğu bildirilirken, ayrık LP GPU'ların sadece 768 çekirdeğin tamamını kullandığı bildirilmektedir. Bu, AMD’nin en iyi entegre donanımı ve Nvidia’nın en alt düzey ayrı GPU'ları ile karşılaştırılabilir sayıda çekirdek. Ama Xe LP'nin onları gölgede bırakabileceği saat hızlarında.

Sızan Geekbench koşusu bir Rocket Lake mobil işlemcisinin 1.5 GHz hızında çalışan entegre 768 çekirdekli LP GPU'su var. Bu, GTX 1650 ile aynı miktarda performans. 1,5 GHz'in tam 20W TDP'yi kullandığı ve Intel'in piyasaya sürülmeden önce hızları 1 MHz daha bile zorlayamayacağı bile, bu etkileyici.

Bu işlemcinin ne kadar verimli olması gerektiğini hayal edin. GTX 1650, biraz daha az TFLOP'a ve 75W TDP'ye sahiptir: neredeyse dört kat daha fazla. 50W'ye kadar itilen bir LP GPU, saat hızlarını daha da artıracak ve GTX 1660 ile aynı performans desteğine girebilir.

Ama iyi şeyler burada bitmiyor. Linux çekirdeğinde yapılan güncellemeler göstermek Intel, entegre ve ayrık grafikleri aynı anda ve potansiyel olarak birlikte çalıştırmanın bir yolunu planlıyor. Bu durum ortaya çıkarsa, iGPU'nun tüm gücü, yerden tasarruf sağlayan ve uygun maliyetli bir 1536 çekirdekli birleşik GPU oluşturmak için ayrı GPU'nun gücü ile eşleştirilebilir. Aynı silikondan daha fazla performans elde etmek için mükemmel bir yoldur.

Ponte Vecchio: Veri Hesaplama

Giriş bölümünde bir GPU'nun sadece ham beygir gücünün önemli olduğunu söylediğimde, yalan söyledim giriş tıklaması onaylandı. Herhangi bir veri merkezi GPU'su için durum böyle değildir ve Eski köprü özellikle. Ponte Vecchio, verimliliği en üst düzeye çıkaran hileler ve tekniklerle ilgilidir.

Eğlenceli Gerçek:
Koduri Floransa'daki köprüden sonra Ponte Vecchio'yu seçti çünkü oradaki gelatoyu seviyor.

Ponte Vecchio özellikle Aurora süper bilgisayar bu durum size en uygun hale getirileceği iş yüklerinin türünü belirtmelidir.

Sana bir işaret vermediyse, bunu heceleyeceğim: çifte kesinlik. Temelde her veri merkezi GPU'su için listedeki ilk şey ve Koduri zamanının çoğunu açıklama sırasında tartıştı. Ne yazık ki, ona koyacağı tek sayı Ponte Vecchio’nun AB teorik FP64 performansı, yani Gen11’lerin ~ 40 katı.

Peçete matematiğinin bir kısmını yapmak, 1024 çekirdek kart başına FP64'te yaklaşık 20 TFLOP. Ancak bunu müjde olarak almayın, çünkü hesaplamada anlamlı sonuçlar elde etmek için yeterli anlamlı rakam yoktur.

Yüksek hassasiyetli iş yüklerinden ikinci, doğal olarak ultra düşük hassasiyetli iştir. Ponte Vecchio, AI sinir ağı işleme için INT8, BF16 ve olağan FP8 ve FP16'yı destekler. Her AB, matris işleme için standart bir AB'den 32 kat daha hızlı bir matris motoruyla (Nvidia Tensor çekirdeği gibi) donatılmıştır.

Ancak, bunların hiçbiri özellikle yeni değildir. Ponte Vecchio’nun gerçek gücü, GPU'nun sorunlarla yeni şekillerde başa çıkmasını sağlayan bellek alt sistemindedir.

Bunu yapmak için Ponte Vecchio, Intel’in önemli yeni bağlantı teknolojileri, Foveros ve EMIB'den (gömülü çoklu kalıp bağlantı köprüsü) yararlanır. Foveros, aktif aracı aracı kalıbının üstüne birden fazla yonga istiflemek için silikonlu yollardan yararlanır ve onlara yonga gibi hızlar, ancak yonga dışı bağlantı sağlar. Buna karşılık, EMIB, aktif olmayan bir kalıp kullanan ancak daha düşük maliyetle yüksek bant genişliği sunan iki yonga arasındaki 'aptal' bir bağlantıdır.

EMIB ve Foveros

EMIB, GPU'nun hesaplama donanımını doğrudan HBM'ye bağlamak için Ponte Vecchio'nun muhteşem bellek bant genişliğini netleştirmek için kullanılır. Foveros, bir alt dilimdeki iki CU'yu Intel’in yeni süper önbelleği olan bir RAMBO önbelleğine bağlamak için kullanılır. Foveros sayesinde RAMBO'nun kapasitesi veya kapladığı alan üzerinde herhangi bir sınırlaması yoktur ve HBM veya diğer alt dilimlerden veri gönderirken / alırken CU'ları atlayabilir.

Devasa bir önbelleğe sahip olmak - ve devasa demek istediğim, devasa, Intel’in diyagramları bir RAMBO yongasını bir CU ile aynı boyutta gösteriyor - açıkçası gerçekten pahalı, ancak bazı şık seçeneklerin kilidini açıyor. Sinir ağı işlemede, örneğin, RAMBO matrisleri diğer GPU önbelleklerinden daha büyük bir büyüklükte saklayabilir. Matrisler büyüdükçe ve hassasiyet seviyesi arttıkça diğer GPU'lar performansı kaybeder, ancak Ponte Vecchio en yüksek performansı sürdürebilir.

Eski köprü

RAMBO önbelleği, bir sunucu düğümündeki her GPU ve CPU'dan kaynak havuzları oluşturan bir bağlantı ve teknolojilerin örümcek ağı olan Xe Memory Fabric'e de güç sağlar. Her GPU’nun RAMBO önbelleği, her şeyin kullanabileceği tek bir bankada birleştirilirken, en yavaş bağlantı CPU'ların PCIe 5.0 üzerinden 63 GB / s hızında gerçekleşmesidir.

Son zamanlarda yıllık kazanç yatırımcı toplantısıIntel, Ponte Vecchio'nun 2021'in dördüncü çeyreğinde sevkiyata başlayacağını doğruladı. Bunun tam bir sürüm veya Aurora süper bilgisayarı için özel bir erken lansman anlamına gelip gelmediği belirsiz.

Yazılım

Donanım iyi ve hepsi, ancak yeterli yazılım desteği olmadan tamamen işe yaramaz. Ve eşik oldukça yüksek: oyunların% 1'i bile doğru şekilde desteklenmiyorsa, milyonlarca oyuncu yabancılaşıyor. İyi haber şu ki Intel ellerinden gelenin en iyisini yapıyor gibi görünüyor.

Intel yeniden tasarlama Modern yüksek performanslı uygulamalar için en düşük yazılım seviyesi olan komut seti mimarisi (ISA). “Gen12'nin, orijinal i965'ten bu yana Intel EU ISA'nın en derinlemesine çalışmalarından birini içermesi planlanıyor. Hemen hemen her komut alanının, donanım op kodunun ve kayıt türünün kodlamasının güncellenmesi gerekiyor. ”

Sürücü düzeyinde, Intel'in daha uzun bir yolu var ama ilerleme kaydediyor. Entegre GPU sürücüleri rakipleri kadar sık ​​güncellenmez, bu arada son on güncelleme Intel için 26 gün, Nvidia için 14 gün ve AMD için 12 gündür. Ancak 2019'da kararlılıkları ve destekleri çok gelişti ve Intel'in mimarisi için 275 yeni başlık optimize edildi.

Öte yandan, Intel’in müşteriye yönelik yazılımı mükemmel. Yakın zamanda piyasaya sürülen Grafik Komuta Merkezi, örneğin Nvidia’nın GeForce Experience ürününden önemli ölçüde daha fazla kontrol sağlıyor ve kullanımı daha kolay. GeForce Experience gibi, oyunları belirli donanım yapılandırmaları için optimize edebilir, ancak her bir ayarın ne yaptığını ve performans etkisinin ne kadar olacağını açıklar. Sürücü kontrolü hoş bir şekilde basittir.

Komut Merkezi, gelişmiş ekran kontrolleri sağlamada da benzersizdir. Ağrısız çoklu ekran kurulumu ve yenileme hızı ve döndürme senkronizasyonu ile renk stilini ayarlamak için kapsamlı seçenekler sunar. Nvidia donanımını çalıştırmasına rağmen kişisel olarak sistemimi kontrol etmek için kullanıyorum.

Bonus olarak Intel, değişken yenileme hızını da desteklediğinden, Xe ürünleri FreeSync ve G-Sync monitörleri destekleyecektir.

Serbest bırakmak

Intel, Mart ayında GDC'de neler yayınlayacakları konusunda biraz çekingen olsa da, tam bir açıklama yapma şansımız yüksek. Durum buysa, önümüzdeki aylarda tahliye edilmesini bekleyebiliriz. En muhtemel aday Haziran.

Geçtiğimiz Ekim ayında, Koduri çok ince olmayan bir tweet attı ipucu yeni plakasının bir görüntüsü şeklinde. “Think Xe” yazıyor ve Haziran 2020 tarihi var. Tarihin herhangi bir önemi olup olmadığı konusunda yorum yapmayı reddediyor, bu da muhtemelen olduğunu gösteriyor.

Bu şekilde bir tarihin sızdırılmasının bir avantajı, GPU'lar Temmuz ayında gelirse hayranların kızacağı için çok fazla heyecan yaratmadan topluma ne bekleyeceğini söylemesi. Bu yüzden bulanık bir hedef olarak düşünün; Intel muhtemelen bir Haziran sürümü (Computex için zaman içinde) hedefliyor, ancak işlerin nasıl gittiğine bağlı olarak biraz daha uzun sürebilir.

Intel bazı harika şeylere işaret ediyor ve grafik alanında üçüncü bir büyük oyuncuya sahip olmak konusunda umutluyuz. Fakat zaman gelene kadar ihtiyatlı iyimser olmaktan başka bir şey olamayız.

Alışveriş Kısayolları: