Marka Tahmini ile Araç İlanı Sınıflandırma Projesi

31.12.2023
Python

Bu projede, arabam.com sitesindeki araç ilanlarını analiz ederek, ilanların marka ve modelini tahmin eden bir doğal dil işleme modeli geliştirdim.

Web scraping ile yaklaşık 4.000 ilan toplandı ve Decision Tree modeli kullanılarak eğitildi. Model, araç ilanlarının metinlerini analiz edip, doğru markayı tahmin edebiliyor.

Teknik Özellikler

📊 Veri Toplama (Web Scraping): arabam.com sitesinden BeautifulSoup kütüphanesi ile yaklaşık 4000 araç ilanı çekilmiştir. Her ilanın açıklama metni ve markası kayıt altına alınmıştır.
🧹 Veri Temizleme ve Hazırlama: İlan metinlerinden emoji, noktalama, link, stop words gibi gereksiz ifadeler temizlenmiştir. Ayrıca lemmatization işlemi uygulanarak kelimeler kök forma indirgenmiştir.
🏷️ Etiketleme (Label Encoding): 91 farklı marka, makinenin anlayabileceği şekilde sayısal olarak etiketlenmiştir.

Sonuç

Bu proje, makine öğrenmesi ve doğal dil işleme alanlarında pratik kazanmamı sağladı. Web scraping ile elde edilen ilan verileriyle model eğiterek, gerçek dünyaya yönelik bir sınıflandırma sistemi geliştirdim. Model seçimi, veri temizliği ve etiketleme gibi süreçlerin başarı üzerindeki etkisini gözlemleme fırsatı buldum.