Evet! Bilim!: MIT'deki bilim adamları, net görüntüler üretmek için videonun hareketli bulanık çerçevelerinden ayrıntıları kurtarmanın bir yolunu buldular. “Görsel deprojeksiyon modeli” görüntüleri deşifre etmek için evrişimli bir sinir ağı (CNN) kullanır.

Araştırmacılar MIT'nin Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı'nda (CSAIL) CNN'i biri düşük kalitede diğeri bulanık resmin kaynağı (sinyali) olan binlerce çift görüntüyü (projeksiyon) tarayarak eğitti. Sinir ağı bu bilgileri, piksel modellerini ve bunları yaratan şeyleri öğrenerek bulanıklaştırma efektlerini tersine çevirmek için kullanır.

CNN'nin “varyasyonel otomatik kodlayıcı” adı verilen başka bir kısmı, çıktıyı analiz eder ve ağın sinyali ne kadar iyi eşleştirdiğini değerlendirir. Daha sonra AI'ya bir projeksiyondan olası tüm eşleşen kaynaklara nasıl gidileceğini anlatmak için bir “taslak” oluşturur. Yeni bir görüntü verildiğinde, CNN piksel desenlerini inceler ve bulanıklığı yaratabilecek her olası sinyali bulmak için planı kullanır. Oradan verileri birleştirerek “yüksek boyutlu” bir kopya oluşturur.

"X-ışınlarını CT taramasına dönüştürebilirsek, bu biraz oyun değiştirebilir."

Örneğin, hızlanan bir aracı gösteren bir videoda, arabanın kırmızı olduğunu söyleyebilir, ancak başka bir şey olmadığını söyleyebilirsiniz. Görsel deprojeksiyon modeli bu çekimi alabilir ve marka ve modeli tanımlayacak kadar net bir reprodüksiyon oluşturabilir.

CSAIL postdocu Guha Balakrishnan, “Bu ayrıntıyı kurtarabilmemiz neredeyse sihir gibi” dedi. kâğıt.

Örnek bir yana, araştırmacılar tıp alanında neler yapabileceği konusunda daha heyecanlı. Teknolojinin, X-ışınlarından gelen CT'lere benzer 3D taramalar oluşturmak için kullanılabileceğine inanıyorlar. MRI ve CT makineleri son derece pahalı olduğu için bu atılım maliyetleri önemli ölçüde azaltabilir. Yazılım, nispeten ucuz olan X-ışınları gibi düşük bilgi içeren bir görüntüden yüksek bilgi içeren bir görüntü oluşturabilir.

Balakrishnan, “X-ışınlarını BT taramalarına dönüştürebilirsek, bu biraz oyun değiştirebilir” dedi. “Sadece bir röntgen çekip algoritmamızdan geçebilir ve tüm kayıp bilgileri görebilirsiniz.”