Denetimsiz Öğrenme ve Veri Kümeleme
K-Means, hiyerarşik kümeleme ve diğer denetimsiz algoritmaları keşfedin. Etiketlenmemiş verilerde gizli yapıları ortaya çıkartın.
Denetimli öğrenmenin ne olduğunu, nasıl çalıştığını ve Python'da ilk modelinizi oluşturmayı öğrenin. Gerçek Türk veri setleriyle adım adım ilerleme yapın ve makine öğreniminde temeli sağlam bir şekilde atın.
Denetimli öğrenme, makine öğreniminin en yaygın ve pratik türüdür. Etiketlenmiş veriler üzerinde çalışarak bilgisayarların belirli görevleri yerine getirmesini öğretir. Yani her örnek veri için "doğru cevap" verilerek model eğitilir.
Gerçek dünya örnekleriyle düşünürseniz: bir e-posta filtresine "spam" ve "spam değil" etiketli binlerce e-posta gösterirseniz, model yeni e-postalar için kendi kararını verebilir. Ya da ev fiyatlarını tahmin etmek için eski satış verilerini kullanabilirsiniz.
Öncelikle probleminize uygun etiketlenmiş veri toplamanız gerekir. Örneğin, ev fiyat tahmini için 500-1000 ev örneği yeterli olabilir.
Lineer Regresyon, Karar Ağaçları, Random Forest gibi algoritmalardan birisini seçin. Başlangıç için Lineer Regresyon ideal başlangıç noktasıdır.
Seçtiğiniz algoritma, verilerinizi analiz ederek iç parametrelerini ayarlar. Bu süreç genellikle saniyeler ya da dakikalar içinde tamamlanır.
Test verileriyle modelin başarısını ölçün. Doğruluk düşükse hiperparametreleri ayarlayarak yeniden deneyin.
En basit başlangıç algoritması. Sayısal değerler tahmin etmek için kullanılır (fiyat, sıcaklık, vs.). Python'da 3-4 satır koduyla başlayabilirsiniz.
Evet/Hayır, Spam/Normal gibi ikili sınıflandırma için. Adı regresyon olsa da aslında sınıflandırma problemidir. Oldukça güvenilir sonuçlar verir.
İnsan gibi karar veren modeller. Görselleştirmesi kolay ve sonuçları anlamak basittir. Ancak fazla eğitim verilirse aşırı uyum (overfitting) riski vardır.
Birden fazla karar ağacını birleştiren güçlü bir yöntem. Çoğu zaman Karar Ağaçlarından daha iyi sonuç verir ve overfitting'e karşı daha dayanıklıdır.
Python'da scikit-learn kütüphanesiyle başlamak oldukça kolaydır. Aşağıdaki temel adımları izleyerek ilk modelinizi 10 dakika içinde çalıştırabilirsiniz:
Temel Python Örneği:
1. Gerekli kütüphaneleri yükleyin: pandas, numpy, scikit-learn
2. Veri setinizi yükleyin (CSV formatında)
3. Eğitim ve test verilerine ayırın (80/20 oranı)
4. Seçtiğiniz modeli tanımlayın ve eğitin
5. Test verisiyle doğruluğu ölçün
Türkiye'deki edtech platformları da bu konuda harika kaynaklar sunuyor. Coursera, Udacity ve local Türkçe platformlarında adım adım tutoriallar bulabilirsiniz. İlk modeliniz belki %70-80 doğrulukla çalışabilir ama bu gayet normal ve iyidir.
Denetimli öğrenmede başarısızlığın çoğu sebebi kötü veri değil, kötü veri hazırlığıdır. Eksik değerleri temizleyin, aykırı değerleri kontrol edin.
Sınıflandırma problemlerinde eğitim verisinde sınıflar dengesiz ise model yanılabilir. Eğer spam %5 ise model hepsi "normal" diyebilir.
Hiçbir zaman eğitim verisiyle modeli değerlendirmeyin. Ayrı bir test seti kullanın. Aksi halde aşırı uyum fark edemeyeceksiniz.
Lineer Regresyon veya Lojistik Regresyon ile başlayıp sonra daha karmaşık modellere geçin. Basit modeller daha anlaşılır ve hızlıdır.
Her algoritmanın ince ayarlanması gereken parametreleri vardır. Grid Search ya da Random Search kullanarak en iyi kombinasyonu bulun.
İstanbul, Ankara ve online topluluklarda hackathonlar ve çalışma grupları var. Diğer öğrenenlerle fikirlerinizi paylaşmak öğrenmeyi hızlandırır.
Binlerce hazır veri seti ücretsiz olarak mevcuttur. Türkiye'ye ait veri setleri arayarak gerçek dünya problemleriyle çalışabilirsiniz.
Ücretsiz cloud tabanlı Jupyter notebook ortamı. Kurulum gerektirmez, hemen kodlamaya başlayabilirsiniz.
Andrew Ng'nin Makine Öğrenimi kursunun Türkçe altyazısı mevcuttur. Temeli sağlam bir şekilde atmak için ideal.
Türk yazılımcılar tarafından paylaşılan açık kaynaklı projeler. Kodları inceleyerek gerçek uygulamaları görebilirsiniz.
Python'un en popüler makine öğrenimi kütüphanesinin detaylı rehberi. Her algoritma için örnek kod vardır.
İTÜ, Bilkent ve diğer üniversiteler makine öğrenimi derslerini YouTube'da yayınlıyor. Ücretsiz ve Türkçedir.
Denetimli öğrenme makine öğreniminin en erişilebilir ve uygulanabilir alanıdır. Temelleri anladıktan sonra siz de gerçek problemleri çözen modeller oluşturabilirsiniz. Türkiye'deki edtech platformları, hackathonlar ve online topluluklar sayesinde artık kimse yalnız değildir.
İlk adımınız çok basit olabilir. Google Colab'da bir Jupyter notebook açın, basit bir veri seti indirin ve Lineer Regresyon'u deneyin. 30 dakika içinde ilk modeliniz çalışıyor olacak. Gerisi pratik ve öğrenme meselesidir. Hata yapmaktan korkmayın — her başarılı veri bilimci binlerce hata yaptıktan sonra yetkinleşmiştir.
Denetimli öğrenmeye adım atmaya hazır mısınız?
Diğer Makine Öğrenimi Kılavuzlarını KeşfedinBu rehber eğitim amaçlıdır ve denetimli öğrenmenin temel kavramlarını anlamanıza yardımcı olmak için hazırlanmıştır. Burada sunulan örnekler ve yöntemler genel rehberlik niteliğindedir. Her makine öğrenimi projesi benzersiz gereksinimler ve zorluklar taşır. Üretim ortamında kullanılacak modeller için ek araştırma, test ve validasyon yapılması önerilir. Yazılım kütüphaneleri sürüm güncellemeleriyle değişebilir, bu nedenle resmi dokümantasyonları kontrol etmeyi unutmayın.