Read this in other languages: English, Turkish.
Bu kod bloğu Reuters-21578 veri kümesi üzerinde bir NLP projesi gerçekleştirir. Projenin amacı haber makalelerinin belirli konulara göre (örneğin tahıl para birimi kazanç vb.) sınıflandırılmasıdır. Kodlar pandas numpy re os ve sklearn gibi çeşitli Python kütüphanelerini kullanmaktadır. Proje verilerin yüklenmesi önişleme adımları ve sınıflandırıcı modelinin eğitimi için farklı yöntemler ve fonksiyonlar kullanır. Önişleme adımları verilerin temizlenmesi işlenmesi ve sayısallaştırılması için çeşitli adımları içerir. Eğitim verileri üzerinde Naive Bayes sınıflandırıcısı kullanılarak sınıflandırma modeli eğitilir. Daha sonra test verileri üzerinde eğitilmiş modeli kullanarak tahminler yapılır ve sonuçlar farklı performans metrikleri (confusion matrix accuracy_score vb.) kullanılarak değerlendirilir. Bu kod bloğu NLP projeleri için kullanılabilir ve farklı veri setleri üzerinde uygulandığında farklı sonuçlar üretebilir.
Technologies used in the project:
- Python
- BERT
- Jupyter Notebook
- Anaconda
- NLP