Supervised Learning

Supervised Learning, daha önce makineye gösterdiğimiz verileri inceleyerek, sonraki inputlar için tahminlerde bulunur. İnsanlar üzerinden örnek vermek gerekirse gördüğümüz cismin ne olduğunu anlayabiliyoruz çünkü daha önceden onun ne olduğunu öğrendik. Unsupervised Learningde ise durum biraz daha farklı, elimizde 3 tane elma, 4 tane portakal, 7 tane armut olduğunu düşünün. Bunların benzer özelliklerini kullanarak 3 farklı küme oluşturabiliriz. Elimizdeki 3 cismin ne olduğunu bilemeyiz fakat birbirine benzeyenleri aynı gruba alabiliriz. İlk bölümlerde supervised learning üzerine yoğunlaşacağız.

Supervised Learning regresyon(regression) ve kümeleme(classification) olmak üzere iki bölümde incelenecektir.

REGRESSION

Regresyon değişkenler arasındaki ilişkiyi incelemek için kullanılır, örnekler üzerinden gidersek y= mx + n doğrusunda, y değeri ile x değeri arasında bir ilişki vardır.Regresyona örnek olarak: Makinemize bir kişinin yaşını sorarsak, daha önce vermiş olduğumuz farklı kişilerin resimlerini ve yaşlarını inceleyerek tahminde bulunacaktır. İlerleyen konularda ne olduğu tam olarak anlaşılacaktır.

CLASSIFICATION

Classificationda ise tahimler ayrık olarak yapılmaktadır. Mesela  bir tümörü ele aldığımız zaman, tümör zararlı veya zararsızdır.

SUPERVISED LEARNING

MODEL REPRESENTATION

Elimizde bir data olduğunu düşünün, bunu training set olarak kullanacağız.

(Coursera-- Andrew Ng's resources)

Training setimizdeki verilere bir göz atalım:

m=Eğitim sayımız. (Her satırı eğitim olarak düşünebilirsiniz)

x: Input değişkeni/ Özellik (Evin boyutu bir özelliktir)

y:Output değeri (Evin boyutuna göre gelen fiyat bir çıktıdır)

(x,y)->1 eğitim örneği

X^(i),y^(i)=i. örnek (Burada kullanılan i üstel bir kavram değildir, indextir. Mesela X^(1)=2104 y^(1)=460)

SUPERVİSED ALGORİTMASI NASIL ÇALIŞIR?

TRAINING SET

   ↓

ÖĞRENME ALGORİTMASI

                                                                          ↓

HİPOTEZ(h)

Hipotez Fonksiyonu

Hipotez fonksiyonu h(x)=\theta_{{0}}+\theta_{{1}}x şeklinde gösterilebilir. Girdi olarak bir değer alıyor ve parametrelere göre bir çıktı üretiyor. Mesela evin boyutunu girdi olarak verdiğimizi düşünelim, hipotez fonksiyonu fiyatı tahmin etmeye çalışacak. Grafik üzerinden gidelim.

Grafikteki çarpı işaretleri girdi ve çıktı değerleridir. Mesela mx+n doğrusunda x değerlerine göre y değerlerini elde ediyorduk. Bunun grafiği şeklinde düşünenebilirsiniz. Biliyorsunuz x değerlerimiz evin boyutu, y değerlerimiz ise ev fiyaları(!!Şuan kullandığımız y değerleri grafik için evin gerçek fiyatıdır. Hipoyez fonksiyonunun sonucu olarak düşünmeyin.) Biz bu grafikte doğruyu öyle çizmeliyiz ki, oradaki çarpıların yoğunluklu olduğu bölgeden geçebilsin. Peki bunu nasıl sağlayacağız? Theta değerleri ile oynayarak doğruyu istediğimiz konuma getirebiliriz. Zaten amacımız theta değerlerini optimum seviyeye getirerek, en doğru doğru denklemini bulabilmek. Eğer theta değerlerimizin ilkini 0, diğerini 1 olarak seçmiş olsaydık o zaman doğrumuz y=1 doğrusu olacaktı. Bu şekilde olsaydı amacımıza ulaşamazdık çünkü grafikte işaretli olan çarpı değerlerinin üzerinden geçemezdik.

Yukarıdaki doğrumuz sürekli olduğu için buna regression problemi denir. Bir sonraki yazımda Cost Function ve Gradient Descent'ten bahsedeceğim.

 

 

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *