Toshkent axborot texnologiyalari universiteti “sun’iy intellekt” kafedrasi



Yüklə 46,48 Kb.
səhifə4/4
tarix22.03.2024
ölçüsü46,48 Kb.
#181738
1   2   3   4
YOLO Model oilasi
YOLO modeli birinchi marta Jozef Redmon tomonidan 2015-yilda “Siz faqat bir marta qaraysiz: birlashtirilgan, real vaqtda ob'ektni aniqlash” [3] nomli maqolada tasvirlangan. E’tiborlisi, R-CNN ishlab chiqaruvchisi Ross Girshik ham ushbu ishning muallifi va hissasi boʻlgan, keyin esa Facebook AI Research kompaniyasida faoliyat koʻrsatgan.


Yondashuv kiruvchi qism sifatida suratga oladigan va toʻgʻridan-toʻgʻri har bir cheklovchi ramka uchun chegaralovchi ramkalar va sinf yorliqlarini bashorat qiladigan boshidan-oxirigacha oʻqitilgan yagona neyron tarmogʻini oʻz ichiga oladi. Texnika prognozlashning past aniqligini (masalan, koʻproq mahalliylashtirish xatolarini) taklif qiladi, garchi modelning tezlikni optimallashtirilgan versiyasi uchun soniyasiga 45 kvadratdan 155 kvadratgacha ishlaydi.
“Bizning yagona arxitekturamiz juda tezkordir. Bizning asosiy YOLO modelimiz tasvirlarni real vaqtda soniyasiga 45 kadr tezlikda qayta ishlaydi. Tarmoqning kichikroq versiyasi Fast YOLO sekundiga hayratlanarli - 155 kadrni qayta ishlay oladi...” - deyiladi matbuot anjumanida.
Model avval kiritilgan tasvirni katakchalar tarmog‘iga bo‘lish orqali ishlaydi, bunda har bir hujayra chegaralovchi ramkaning markazi hujayra ichiga tushsa, chegaralovchi ramkani bashorat qilish uchun javobgardir. Har bir katakcha x, y koordinatalari, kenglik, balandlik va ishonchni oʻz ichiga olgan chegaralovchi ramkani bashorat qiladi. Sinf bashorati ham har bir hujayraga asoslanadi. Misol uchun, tasvir 7×7 oʻlchamdagi katakchaga boʻlinishi mumkin va har bir katak 2 ta cheklovchi ramkani bashorat qilishi mumkin, natijada 94 ta taklif qilingan chegaraviy ramka bashorati paydo boʻladi. Sinf ehtimollik xaritasi va ishonchli chegaralangan ramkalar soʻngra chegaralovchi ramkalar va sinf yorliqlarining yakuniy toʻplamiga birlashtiriladi (5-rasm).


5-rasm. YOLO modeli tomonidan qilingan bashoratlarning qisqacha mazmuni
Xulosa.
Ushbu ishda ob'ektni tanib olish masalasiga kirish va uni hal qilish uchun moʻljallangan zamonaviy oʻrganish modellari haqida ma’lumotlar keltirildi. Ob'ektni tanib olish raqamli fotosuratlardagi ob'ektlarni aniqlash uchun tegishli vazifalar toʻplamini anglatadi. Hududga asoslangan konvolyutsion neyron tarmoqlari yoki R-CNN - bu model ishlashi uchun moʻljallangan ob'ektni lokalizatsiya qilish va tanib olish vazifalarini hal qilish uchun texnikalar oilasi hisoblanadi. YOLO esa - bu tezlik va real vaqt rejimida foydalanish uchun moʻljallangan ob'ektni aniqlash texnikalarining ikkinchi oilasi.


Foydalanilgan adabiyotlar ro‘yxati:

  1. ImageNet Large Scale Visual Recognition Challenge, 2015.

  2. Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition, 2014

  3. You Only Look Once: Unified, Real-Time Object Detection, 2015.

Yüklə 46,48 Kb.

Dostları ilə paylaş:
1   2   3   4




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©www.genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə