Büyük Dil Modellerinin (LLM) İnşası 103 Kod Bloğu ve 8 Uygulamalı Notebook ile - Caner Erden
Yapay zekânın en heyecan verici alanlarından biri olan büyük dil modellerini (LLM) hem kavramsal hem de uygulamalı yönleriyle ele alan bu kitap, LLM'lerin tarihsel gelişiminden temel çalışma prensiplerine kadar geniş bir yelpazeyi ayrıntılı bir şekilde açıklar. Dikkat mekanizmaları, sıfırdan GPT modeli oluşturma, performans değerlendirme, ince ayar (fine-tuning) ve komut mühendisliği gibi kritik konuları bütüncül bir çerçevede sunar.
Güçlü görsel anlatımı ve uygulama odaklı yapısıyla öne çıkan eser; 9 ana bölüm, 103 kod bloğu ve 8 uygulamalı notebook desteğiyle okuyucuya doğrudan uygulanabilir bir çalışma zemini sağlar. Yapay zekâ meraklılarından yazılım geliştiricilere kadar geniş bir kitleye hitap eden bu çalışma, büyük dil modellerini teoriden pratiğe taşıyan tam donanımlı bir rehber niteliğindedir.
Kitabın Konu Başlıkları
Büyük Dil Modellerinde Temel Kavramlar ve Uygulamalar
LLM'lerin Tarihsel Gelişimi
LLM'ler Nasıl Çalışır?
Dikkat Mekanizmaları
Sıfırdan GPT Modeli İnşası ve Metin Üretimi
LLM Performans Değerlendirmesi
LLM'lerin İnce Ayarlanması (Fine-Tuning)
Komut Mühendisliği (Prompt Engineering)
LLM'lerin Gelecek Perspektifi