Bu projede, arabam.com sitesindeki araç ilanlarını analiz
ederek, ilanların marka ve modelini tahmin eden bir doğal dil
işleme modeli geliştirdim.
Web scraping ile yaklaşık 4.000 ilan toplandı ve Decision Tree
modeli kullanılarak eğitildi. Model, araç ilanlarının
metinlerini analiz edip, doğru markayı tahmin edebiliyor.
📊 Veri Toplama (Web Scraping): arabam.com
sitesinden BeautifulSoup kütüphanesi ile yaklaşık 4000 araç
ilanı çekilmiştir. Her ilanın açıklama metni ve markası kayıt
altına alınmıştır.
🧹 Veri Temizleme ve Hazırlama: İlan
metinlerinden emoji, noktalama, link, stop words gibi gereksiz
ifadeler temizlenmiştir. Ayrıca lemmatization işlemi uygulanarak
kelimeler kök forma indirgenmiştir.
🏷️ Etiketleme (Label Encoding): 91 farklı
marka, makinenin anlayabileceği şekilde sayısal olarak
etiketlenmiştir.
Bu proje, makine öğrenmesi ve doğal dil işleme alanlarında pratik kazanmamı sağladı. Web scraping ile elde edilen ilan verileriyle model eğiterek, gerçek dünyaya yönelik bir sınıflandırma sistemi geliştirdim. Model seçimi, veri temizliği ve etiketleme gibi süreçlerin başarı üzerindeki etkisini gözlemleme fırsatı buldum.