Yapay Zekanın Yıkıcı Gücü: Büyük Dil Modelleri mi? Yıkım, yeniden inşayı beraberinde getirir mi?

Mehmet Tuğrul Kaya
3 min readJan 27, 2025

Bu hafta sonu birçok kişinin DeepSeek makalelerini okuduğunu tahmin ediyorum. Benim de DeepSeek ile ilgili düşüncelerim var ve paylaşmak istedim:

Yapay Zekâ (YZ), 21. yüzyılın en dönüştürücü teknolojilerinden biri olarak kendini kanıtladı. Gitgide daha sofistike hale gelen dil modelleri ve makine öğrenimi sistemleri sayesinde YZ’nin yetenekleri, basit görevleri otomatikleştirmekten insan benzeri yaratıcılık sergilemeye, karmaşık verileri analiz etmeye ve hatta tüm endüstrileri yeniden şekillendirmeye kadar genişledi.

Son dönemde yapay zeka alanında dikkat çeken gelişmeler yaşanıyor. Özellikle Çin merkezli girişim DeepSeek, piyasaya sürdüğü yeni modellerle büyük ilgi topluyor. Bu yazıda, DeepSeek’in en son modelleri olan DeepSeek V3 ve DeepSeek R1'i inceleyeceğiz.

DeepSeek R1, adeta bir AlphaZero anı yaratıyor. Model, temel bir yapay zeka modelinin zaten içsel bir akıl yürütme yeteneğine sahip olabileceğini, ancak bu yeteneğin ortaya çıkarılması için Reinforcement Learning (RL)kullanılabileceğini gösteriyor. Bu durum, geleneksel olarak insan emeğiyle oluşturulan büyük veri setlerine olan bağımlılığı azaltıyor ve yapay zekanın akıl yürütme kapasitesini daha verimli hale getiriyor.

SFT ve RL’nin Rolü

Makale, geleneksel olarak büyük modellerin Supervised Fine-Tuning (SFT) yöntemine bağımlı olduğunu, ancak DeepSeek R1'in RL sayesinde bu bağımlılığı ciddi ölçüde azalttığını ortaya koyuyor. Buna rağmen, güçlü bir temel model olmadan RL’nin tek başına yeterli olmadığını vurguluyor.

DeepSeek V3: Mühendislik Harikası

DeepSeek V3, önceki sürüm olan V2'nin üzerine inşa edilmiş etkileyici bir modeldir. Mixture-of-Experts (MoE) mimarisiyle tasarlanan bu model, toplamda 671 milyar parametreye sahip olup, her bir token için 37 milyar parametreyi etkinleştiriyor. Bu yapı, büyük bir MoE modelini eğitmek için gereken hesaplama maliyetini ciddi şekilde azaltıyor. Ayrıca, DeepSeek V3'ün, inference hızında önceki modellere göre önemli bir atılım gerçekleştirdiği belirtiliyor.

Link: DeepSeek

Link: arXiv

DeepSeek R1: Akıl Yürütmede Yeni Bir Dönem

DeepSeek R1, V3'ün “akıl yürütme güçlendirilmiş” versiyonu olarak tanımlanabilir. Bu model, akıl yürütme yeteneğini ortaya çıkarmak için Reinforcement Learning (RL) kullanıyor ve bu yaklaşım, insan emeğiyle oluşturulan akıl yürütme/CoT SFT verilerine olan bağımlılığı azaltıyor. Bu durum, yapay zeka modellerinin eğitiminde yeni bir dönemin habercisi olarak değerlendiriliyor.

Piyasaya Etkileri ve Gelecek Beklentileri

DeepSeek’in bu atılımları, küresel teknoloji piyasalarında da yankı buldu. Özellikle ABD merkezli yapay zeka devleri, DeepSeek’in rekabetçi modelleri karşısında pozisyonlarını yeniden değerlendirmek durumunda kaldı. Bu gelişmeler, yapay zeka alanındaki rekabetin daha da kızışacağını gösteriyor.

Sonuç olarak, DeepSeek’in V3 ve R1 modelleri, yapay zeka alanında önemli yenilikler sunuyor. Özellikle hesaplama verimliliği ve akıl yürütme yeteneklerindeki gelişmeler, gelecekte bu modellerin daha da ileriye taşınabileceğini gösteriyor. Topluluğun bir sonraki adımda neler yapacağını görmek için gerçekten sabırsızlanıyoruz!

Makalelerin tamamını okumak isteyenler için:

Siz bu gelişmeler hakkında ne düşünüyorsunuz? Gelecekte bizi nasıl bir yapay zeka dünyası bekliyor? Görüşlerinizi paylaşmayı unutmayın! 😊

Sign up to discover human stories that deepen your understanding of the world.

Free

Distraction-free reading. No ads.

Organize your knowledge with lists and highlights.

Tell your story. Find your audience.

Membership

Read member-only stories

Support writers you read most

Earn money for your writing

Listen to audio narrations

Read offline with the Medium app

--

--

Mehmet Tuğrul Kaya
Mehmet Tuğrul Kaya

No responses yet

Write a response