Microsoft, OpenAI için dünyanın ilk Nvidia GB300 süper bilgisayarını kurdu

Microsoft, yapay zeka altyapısında yeni bir dönemi başlatacak önemli bir adım attı. Şirket, Opera’nın en yoğun yapay zeka çıkarım iş yükleri için özel olarak geliştirilen NDv6 GB300 VM serisini duyurdu. Bu yeni sistem, dünyanın ilk üretim ölçeğinde Nvidia GB300 NVL72 süper bilgisayar kümesi olma özelliğini taşıyor. Altyapının merkezinde 4.600’den fazla Nvidia Blackwell Ultra GPU yer alırken, tüm sistem Nvidia Quantum-X800 InfiniBand ağıyla birbirine bağlanıyor.

Microsoft, bu sistemle yalnızca işlem gücünü artırmakla kalmadı aynı zamanda bellek ve ağ mimarisini kökten yeniden tasarlayarak akıl yürütme modelleri ve ajan tabanlı yapay zeka sistemleri için gerekli devasa hesaplama kapasitesini mümkün hale getirdi.

OpenAI’a çok uzaklara gitme sinyali

Microsoft CEO’su Satya Nadella, yaptığı paylaşımda yeni sistemi birçoklarının ilki olarak nitelendirdi. Microsoft, bu tür sistemleri dünyanın dört bir yanındaki veri merkezlerinde yüz binlerce Blackwell Ultra GPU ile yaygınlaştırmayı hedefliyor. Sistemlerin boyutu oldukça etkileyici ve şirket, donanım meraklılarının incelemesi için teknik detayları da paylaştı.

O detaylara girmeden önce yapılan duyurunun zamanlamasının da manidar olduğunu söylemek gerek. OpenAI, 2025 yılında Nvidia ve AMD ile iki büyük veri merkezi anlaşması imzaladı ve CEO Sam Altman, daha fazla veri merkezi kurmayı planladıklarını açıkladı. Tahminlere göre OpenAI, bu yıl kendi veri merkezleri için 1 trilyon dolarlık yatırım taahhüdü oluşturmuş durumda.

Microsoft ise şu anda 34 ülkede 300’den fazla veri merkezine sahip olduğunu ve bu sistemlerin “yapay zeka taleplerini bugün karşılamada benzersiz bir konumda” olduğunu vurguluyor. Bu dev sistemler, yüzlerce trilyon parametreli bir sonraki nesil yapay zekâ modellerini çalıştırabilecek kapasitede tasarlanmış.

Kalbinde Blackwell Ultra var

Yeni NDv6 GB300 serisinin merkezinde sıvı soğutmalı, raf ölçeğinde Nvidia GB300 NVL72 sistemi bulunuyor. Her bir raf, 72 adet Nvidia Blackwell Ultra GPU ve 36 adet Nvidia Grace CPU’yu tek bir bütünleşik birim olarak barındırıyor. Her VM (sanal makine), 37 terabayt yüksek hızlı bellek ve FP4 Tensor Core üzerinden 1.44 exaflop işlem gücü sunuyor.

Blackwell Ultra platformu, NVFP4 adlı yeni veri biçimi ve Nvidia Dynamo derleyicisi gibi teknolojiler sayesinde eğitim ve çıkarım süreçlerinde daha fazla performans sunabiliyor. MLPerf Inference v5.1 testlerinde, GB300 NVL72 sistemleri 671 milyar parametreli DeepSeek-R1 akıl yürütme modeli üzerinde Hopper mimarisine göre GPU başına 5 kat daha yüksek işlem verimi sağladı.

Azure’un yeni kümesi, 4.600’den fazla Blackwell Ultra GPU’yu tek bir süper bilgisayar gibi çalıştırmak için iki katmanlı bir ağ mimarisi kullanıyor. Her GB300 NVL72 rafında, beşinci nesil Nvidia NVLink Switch yapısı, 72 GPU arasında 130 TB/s doğrudan bant genişliği sağlıyor.

Raflar arası bağlantı ise Nvidia Quantum-X800 InfiniBand platformu tarafından yönetiliyor. ConnectX-8 SuperNIC ağ kartları ve Quantum-X800 switch’ler ile donatılan sistem, GPU başına 800 Gb/s bant genişliği sunarak 4.608 GPU arasında kusursuz veri akışı sağlıyor.

Author: can tok

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir