Alibaba, rakiplerle rekabet için daha verimli Qwen3-Next yapay zeka modelini tanıttı
Investing.com — Alibaba Group Holding Ltd., hem eğitim hem de çıkarım süreçlerinde verimliliği önemli ölçüde artırmak için tasarlanmış Qwen3-Next adlı yeni bir yapay zeka modelini piyasaya sürdü.
Yeni model, hibrit dikkat mekanizması, oldukça seyrek bir Uzman Karışımı (MoE) yapısı, eğitim istikrarına uygun optimizasyonlar ve daha hızlı çıkarım için çoklu token tahmin mekanizması özellikleriyle donatıldı.
Alibaba’nın Qwen3-Next-80B-A3B-Base modeli 80 milyar parametre içeriyor ancak çıkarım sırasında sadece 3 milyar parametreyi etkinleştiriyor. Şirket, bu temel modelin, yoğun Qwen3-32B modeline eşdeğer veya biraz daha iyi performans gösterirken, GPU saati cinsinden eğitim maliyetinin %10’undan daha azını kullandığını iddia ediyor.
32.000 tokeni aşan bağlam uzunluklarında çıkarım için yeni model, önceki sürümlere kıyasla 10 kattan fazla daha yüksek verim sunuyor.
Alibaba ayrıca iki eğitim sonrası sürümü de piyasaya sürdü: Qwen3-Next-80B-A3B-Instruct ve Qwen3-Next-80B-A3B-Thinking. Şirket, hibrit dikkat ve yüksek seyreklikli MoE mimarisi nedeniyle pekiştirmeli öğrenme eğitiminde ortaya çıkan istikrar ve verimlilik sorunlarını çözdüğünü bildiriyor.
Instruct sürümü, Alibaba’nın amiral gemisi modeli Qwen3-235B-A22B-Instruct-2507 ile karşılaştırılabilir performans gösteriyor ve 256.000 tokene kadar ultra uzun bağlam gerektiren görevlerde avantajlar sunuyor. Thinking sürümü ise karmaşık akıl yürütme görevlerinde öne çıkıyor ve Qwen3-30B-A3B-Thinking-2507 ve Qwen3-32B-Thinking gibi daha yüksek maliyetli modellerden daha iyi performans gösterdiği bildiriliyor.
Alibaba, Qwen3-Next’i Hugging Face ve ModelScope platformlarında kullanıma sundu. Kullanıcılar Qwen3-Next hizmetine Alibaba Cloud Model Studio ve NVIDIA API Kataloğu üzerinden erişebilecek.
Bu makale yapay zekanın desteğiyle oluşturulmuş, çevrilmiş ve bir editör tarafından incelenmiştir. Daha fazla bilgi için Şart ve Koşullar bölümümüze bakın.








