3.1.4. Özellik Mühendisliği (Feature Engineering)

Şekil 3.16. Özellik Mühendisliği.
Not. Dijital Eğitim Koordinatörlüğü. Creative Commons Lisansları (CC BY NC-ND)

Özellik Mühendisliği

Özellik mühendisliği, etkili yapay zekâ modelleri oluşturmanın önemli bir adımıdır. Bu süreç, ham verilerin, tahmin gücünü artıran ve modelin karmaşıklığını azaltan anlamlı girdilere dönüştürülmesini içerir. Özellik mühendisliği, alan uzmanlığı ile teknik bilgi birikiminin birleştiği noktadır ve yapay zekânın uygulanabilir, doğru ve ölçeklenebilir çözümler sunmasını sağlar.
Örnek
Elinizde bireylerin boy ve kilo verileri olduğunu varsayalım. Bu veri noktalarını vücut kitle endeksine (BMI) dönüştürmek bir özellik mühendisliği örneğidir. BMI, tıbbi uzmanlara (diğer özelliklerle birlikte) belirli hastalıkların, örneğin kalp hastalığı, yüksek tansiyon ve tip II diyabet gibi durumların olasılığını tahmin etmede yardımcı olur.

Özellik Mühendisliğinin Önemi
  • Tahmin gücünü artırır: En önemli değişkenlere odaklanarak modellerin daha iyi doğruluk seviyelerine ulaşmasını sağlar.
  • Model karmaşıklığını azaltır: İyi tasarlanmış özellikler, aşırı karmaşık modellere duyulan ihtiyacı azaltır.
  • Genelleştirme yeteneğini iyileştirir: İyi hazırlanmış girdiler, modellerin görülmemiş veriler üzerinde güvenilir performans göstermesine yardımcı olur.
    Örnek: Bir kredi onaylama modeli, kredi-gelir oranı gibi yeni bir özellikten (türetilmiş veri) faydalanabilir. Bu oran, ham gelir veya borç verilerinden daha doğrudan bir kredi değerliliği göstergesi sağlar.
Özellik Mühendisliğinde Temel Noktalar
  • Özellik çıkarımı (Feature Extraction)
    Ham verilerden yeni değişkenler oluşturarak anlamlı kalıplar yakalamayı içerir. Alan bilgisi kullanılarak yapılan bu çıkarım, modelin başarısını doğrudan etkiler.
  • Özellik seçimi (Feature Selection)
    Yalnızca modele en uygun değişkenlerin dâhil edilmesini sağlar. Bu da bilgi kirliliğini azaltır ve modeli daha verimli hâle getirir.
Özellik Mühendisliğinde Karşılaşılan Zorluklar

Şekil 3.17. Özellik Mühendisliğinde Karşılaşılan Zorluklar.
Not. Dijital Eğitim Koordinatörlüğü. Creative Commons Lisansları (CC BY NC-ND)

  • Basitlik ve Karmaşıklık Arasındaki Denge
    Aşırı tasarlanmış özellikler, modelin karmaşıklığını artırabilir fakat performansa ciddi katkı sağlamayabilir.
    Çözüm: Yeni özelliklerin etkisini değerlendirmek için çapraz doğrulama (cross-validation) gibi yöntemler kullanın.
  • Yüksek Boyutlu Veriyle Baş Etme
    Yüzlerce özelliğe sahip veri setleri, modelleme sürecini yavaşlatabilir ve anlaşılabilirliği azaltabilir.
    Çözüm: PCA gibi boyut indirgeme teknikleri uygulayın ya da önem sırasına göre değişken seçimi yapın.
  • Alan Uzmanlığı Gereksinimi
    Anlamlı özellikler geliştirmek genellikle alana dair derin bilgi gerektirir.
    Çözüm: Verideki temel örüntüleri ve ilişkileri belirlemek için alan uzmanlarıyla iş birliği yapın.
Uygulamalı Örnek: Bankacılıkta Kredi Onaylarını İyileştirme

Senaryo
Bir banka, kredi onaylama sürecini makine öğrenmesiyle daha etkili hâle getirmek istiyor.

1.Keşifsel veri analizi (EDA)

  • Geçmiş başvuru verilerini analiz edin (kredi puanı, gelir, temerrüt oranı vb.).
  • Çok yüksek gelir gibi anormal verileri tespit edin.
  • Kredi geri ödemede etkili belirleyicileri saptamak için korelasyon matrisleri kullanın.

2. Özellik mühendisliği

  • Tahmin gücünü artırmak için borç-gelir oranı gibi yeni bir özellik oluşturun.
  • Aylık ve yıllık gelir gibi gereksiz tekrar eden değişkenleri kaldırın.
Sonuç

Yeniden yapılandırılan veri seti sayesinde daha doğru tahminler elde edilir, temerrüt oranı düşer ve işlem verimliliği artar. Özellik mühendisliği, ham veriyi anlamlı girdilere dönüştürerek etkili yapay zekâ modellerinin temelini oluşturur. Bu sayede tahmin doğruluğu artar, model karmaşıklığı azalır ve işletmeler daha başarılı sonuçlara ulaşır.

Lisans

 Creative Commons Atıf-Gayri Ticari-Türetilemez 4.0 Uluslararası Lisansı için ikon

Yapay Zekâ Eğitimi Copyright © by Boğaziçi Üniversitesi Dijital Eğitim Koordinatörlüğü is licensed under a Creative Commons Atıf-Gayri Ticari-Türetilemez 4.0 Uluslararası Lisansı, except where otherwise noted.

Bu Kitabı Paylaş