GÜREŞEN–KAYAKUTLU
72
KHO BİLİM DERGİSİ CİLT: 23 SAYI: 1 YIL: 2013
öğrenmenin olabilmesi için yapay sinir ağlarının yeni çıktı sinir hücreleri
ekleyebilmeleri gerekmektedir.
Bu çalışmada yapay sinir ağlarına sonradan çıktı sinir hücreleri
ekleyebilecek, veya yapay sinir ağı yapısı oluşturulurken çıktı sinir hücresi
sayısını en baştan sabit tutmak yerine, eğitim aşamaları sırasında yavaş yavaş
ekleyen bir algoritma sunulmuştur. Bu algoritma FA01V01 olarak
adlandırılmıştır.
FA01V01 algoritması mevcut eğitilmiş ve çalışır haldeki bir yapay sinir
ağına yeni çıktı sinir hücresi ekleyebilecek özelliktedir. Bu çalışmada çok
katmanlı algılayıcılar (Multi-Layer Perceptron) için geri yayılım algoritması
(backpropagation) kullanılarak gözetimli eğitim için FA01V01 algoritması
önerilmiştir.
a. Sözde Program (Pseudo Code) FA01V01 algoritmasının sözde
programı aşağıda görüldüğü gibidir.
Adımlar İşlem (Tablo
FA01V01 Algoritması Sözde Programı)
Adım 1
Öğrenmenin gerçekleşeceği bir yapay sinir ağı al/oluştur
Adım 2
Girdilerden
K’nın
L’li çapraz geçerlilik veri kümelerini oluştur
Adım 3
Algoritmanın durma koşullarını tanımla
Adım 4
Eğitim ve çapraz geçerlilik veri kümelerini hazırla
Adım 5
Eklenecek çıktı sinir hücreleri için aday havuzu hazırla
Adım 6
Eğitim adaylarının uygunluğunu
K’nın
L’li çapraz geçerliği için hesapla
Adım 7
En uygun adayı aday havuzu içinden seç ve mevcut yapay sinir ağı yapısına ekle
Adım 8
Yeni oluşan yapay sinir ağını eğit
Adım 9
Durma koşullarının sağlanıp sağlanmadığını kontrol et
Adım 10 Durma koşulları sağlanmıyorsa Adım 4’e git
Adım 11 Oluşan yapay sinir ağını sonuç olarak ver
GÜREŞEN–KAYAKUTLU
73
KHO BİLİM DERGİSİ CİLT: 23 SAYI: 1 YIL: 2013
b. Girdilerden veri kümelerinin oluşturulması
K’nın
L’li çapraz geçerliliğinde, ayrılan
L adet kümenin her birinin tüm veri
kümesini tam olarak temsil edebilecek yeterlilikte bir örneklem olduğu,
dolayısıyla her L kümesinde ayrı ayrı iyileştirme sağlayan işlemin yapay sinir
ağının genelleştirme özelliğini destekleyen bir ilerleme olacağı varsayımına
dayanır.
K’nın L’li çapraz geçerliliğinin geliştirilmesindeki temel amaç aday eleman
havuzundan hangi elemanın seçilip yapay sinir ağının yapısına katılacağına
karar vermektir. Öncelikle eklendiği taktirde en fazla sayıda çapraz geçerlilik
kümesinde
i
V
hata azalması sağlayan aday yapay sinir ağının genelleme
özelliğini arttırıyordur. En fazla sayıda çapraz geçerlilik kümesinde hata
azalmasını sağlayan birden fazla aday varsa ortalama hata karelerini (OHK) en
fazla azaltan aday seçilir.
c. Aday Havuzu Oluşturma Yöntemleri (Candidate Pool)
Yeni eklenecek çıktı sinir hücresinin tespiti için adayların oluşturulması
gerekmektedir. Bu adayların önceki edinilmiş bilgilerden de faydalanabileceği
şekilde adaylar oluşturulmalıdır. Bu amaçla bu çalışmada aşağıda belirtilen
yöntemler kullanılarak yeni çıktı sinir hücresi adayları oluşturulmuştur.
Oluşturulan yeni çıktı sinir hücresinin transfer fonksiyonu çıktı katmanındaki
diğer çıktı sinir hücreleri ile aynıdır.
(1) Rassal Ağırlıklı Yeni Çıktı Sinir Hücresi
Çıktı katmanına bağlantısı olan i ’inci gizli sinir hücresini ile yeni
oluşturulan ÇSH arasındaki bağlantının ağırlığı
i
v
şöyle tanımlanabilir:
GÜREŞEN–KAYAKUTLU
74
KHO BİLİM DERGİSİ CİLT: 23 SAYI: 1 YIL: 2013
( )
1
1
1
2
0 diğer
i
i
v
f v
ì
- < <
ï
= í
ïî
(1)
{
}
( )
1
1
1
1
i
i
i
P
v
f v dv
-
- < < =
ò
(2)
(2) Ters Ağırlıklı Yeni Çıktı Sinir Hücresi
Çıktı katmanına bağlantısı olan i ’inci gizli sinir hücresini ile seçilen
çıktı sinir hücresi arasındaki bağlantının ağırlığı
o
i
v
, yeni oluşturulan hücre ile
bağlantısının ağırlığını
n
i
v
göstermek üzere yeni çıktı sinir hücresinin ağırlığı
şöyle ifade edilerbilir:
n
o
i
i
v
v
= -
(3)
(3) Mevcut Bir Çıktı Sinir Hücresinin, Birleşimleri Kendisini
Verecek Şekilde İki Çıktı Sinir Hücresine Bölünmesi
Mevcut durumda çıktı katmanına bağlantısı olan
i ’inci gizli sinir hücresini
ile seçilen çıktı sinir hücresi arasındaki bağlantının ağırlığı
o
i
v , yeni eklenen
j
’inci çıktı sinir hücresi arasındaki bağlantının ağırlığı ise
n
ij
v
olsun.Ağırlık
ikililerinin olasılık kütle fonksiyonu g,
( )
0,1
p
Î
için şöyledir:
(
)
1
2
1
2
1
2
,
1
n
o
n
i
i
i
n
n
i
i
n
n
o
i
i
i
p
v
v
v
c
g v v
p v
c v
v
ì
=
Ù
=
ï
= í
-
= Ù
=
ïî
(4)
0
c
e
= +
(5)
burada
c
sabit bir sayı,
e
ise yeterince küçük bir sayıdır.