2.2.1 Denetimli Öğrenme: “Etkili” Örneklerden Öğrenme

Şekil 2.5. Denetimli Öğrenme
Not. Dijital Eğitim Koordinatörlüğü. Creative Commons Lisansları (CC BY NC-ND

Denetimli öğrenme (Supervised Learning)

Yapay zekânın en yaygın ve en çok kullanılan öğrenme türlerinden biridir. Bu yöntemde makine öğrenmesi modelleri, girdilerin (özellikler) ve bunlara karşılık gelen doğru çıktılarının (etiketler) bilindiği, yani önceden insan tarafından etiketlenmiş veri kümeleri üzerinde eğitilir. Amaç, modelin bu etiketli veri setinden girdi ile çıktı arasındaki ilişkiyi öğrenmesini ve bu ilişkiyi kullanarak yeni, daha önce görülmemiş veriler için doğru tahminler veya sınıflandırmalar yapmasını sağlamaktır. Eğitim süreci, algoritmanın veri içindeki örüntüleri tespit ederek bir matematiksel model oluşturmasıdır; bu model, bir fonksiyon gibi girdiyi çıktıya eşleştirir.

Tanımı ve İşleyişi

Denetimli öğrenmede, model bir “öğretmen” tarafından denetlenir gibi çalışır. Öğretmen (insan etiketleyici), her girdi verisi için doğru çıktıyı (etiketi) sağlar. Model, tahminleri ile gerçek etiketler arasındaki farkı (hata) minimize etmeye çalışarak öğrenir. Bu süreç, bir öğrencinin doğru cevapları olan bir sınav kâğıdından öğrenmesine benzetilebilir. Öğrenci, her sorunun doğru cevabını görerek ve kendi yanlışlarını düzelterek bilgi edinir.

Denetimli Öğrenmenin Temel Görevleri
  1. Sınıflandırma (Classification)
    Veri noktalarını belirli kategorilere veya sınıflara ayırma görevidir. Çıktı, ayrık bir kategori değeridir (ör. “evet” veya “hayır”, “kırmızı”, “mavi”, “yeşil”).

Örnekler

  • Spam E-posta Tespiti: Bir e-posta mesajını “spam” veya “spam değil” olarak sınıflandırmak. Model, gönderici adresi, konu satırı ve metin içeriğindeki belirli kelimeler gibi girdilerle, gerçek “spam” veya “normal” e-posta etiketleriyle eğitilir.
  • Görüntü Sınıflandırma: Tıbbi görüntülemede, bir modeli röntgen veya MR görüntülerindeki lezyonları “tümörlü” veya “tümörsüz” olarak ayırt etmek üzere eğitmek. Model, etiketlenmiş birçok görüntüyle eğitilerek piksel özellikleri ve sonuç etiketleri arasındaki ilişkileri öğrenir.
  • Müşteri Kaybı (Churn) Tahmini: Bir telekomünikasyon veya abonelik hizmeti şirketinde, müşterinin aboneliğini iptal edip etmeyeceğini (Evet/Hayır) tahmin etmek. Model, müşterinin kullanım süresi, harcama alışkanlıkları, müşteri hizmetleri etkileşimleri gibi verilerle eğitilir.
  • Hastalık Teşhisi: Hasta verileri (semptomlar, test sonuçları, tıbbi geçmiş) kullanılarak belirli bir hastalığın (ör. diyabet, kalp hastalığı) varlığını veya tipini teşhis etmek.
  • Dolandırıcılık Tespiti: Banka işlemlerinin veya sigorta taleplerinin dolandırıcılık olup olmadığını sınıflandırmak. Sistem, işlem miktarı, coğrafi konum, işlem sıklığı gibi girdiler ve dolandırıcılık olup olmadığını belirten etiketlerle eğitilir.
  1. Regresyon (Regression)
    Sürekli bir çıktı değeri tahmin etme görevidir. Çıktı, ayrık bir kategori yerine sayısal bir değerdir (ör. fiyat, sıcaklık, yaş).

Örnekler

  • Ev Fiyatı Tahmini: Bir evin konumuna, büyüklüğüne, oda sayısına ve yaşına göre satış fiyatını tahmin etmek. Model, geçmiş ev satış verileriyle (özellikler ve gerçek satış fiyatları) eğitilir.
  • Hava Durumu Tahmini: Sıcaklık, nem, rüzgâr hızı gibi mevcut meteorolojik verilere dayanarak gelecek 24 saatin sıcaklığını tahmin etmek.
  • Satış Tahmini: Geçmiş satış verileri, promosyonlar ve mevsimsel faktörler gibi bilgilere dayanarak gelecek çeyrek için ürün satışlarını tahmin etmek.Avantajları ve Zorlukları

Avantajları
Denetimli öğrenme, öngörüsel görevler için son derece etkilidir ve yüksek doğruluk oranlarına ulaşabilir. İyi etiketlenmiş ve yeterli veri olduğunda güçlü ve güvenilir modeller oluşturulmasını sağlar.

Zorlukları
En büyük zorluk, önemli miktarda yüksek kaliteli etiketlenmiş veri gerekliliğidir. Etiketleme süreci, büyük veri setleri için maliyetli, zaman alıcı ve insan hatasına açık bir süreç olabilir. Ayrıca, etiketli veri elde etmek her zaman mümkün olmayabilir veya etik kaygılar taşıyabilir. Modelin “aşırı öğrenme” (overfitting) yapma riski de vardır; yani eğitim verisini ezberleyip yeni verilere genelleme yapamama durumu.

Denetimli öğrenme algoritmaları arasında Doğrusal Regresyon, Lojistik Regresyon, Karar Ağaçları, Destek Vektör Makineleri (SVM), Rastgele Ormanlar (Random Forests) ve Yapay Sinir Ağları (DNN) bulunur.

Lisans

 Creative Commons Atıf-Gayri Ticari-Türetilemez 4.0 Uluslararası Lisansı için ikon

Yapay Zekâ Eğitimi Copyright © by Boğaziçi Üniversitesi Dijital Eğitim Koordinatörlüğü is licensed under a Creative Commons Atıf-Gayri Ticari-Türetilemez 4.0 Uluslararası Lisansı, except where otherwise noted.

Bu Kitabı Paylaş