Telekomünikasyon sektöründe çalışan kaybı tahmini için makine öğrenmesi modeli seçimi

Uzak, Büşra

Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız: http://hdl.handle.net/11452/28371

Başlık:	Telekomünikasyon sektöründe çalışan kaybı tahmini için makine öğrenmesi modeli seçimi
Diğer Başlıklar:	Choosing machine learning model for predicting employee churn in the telecommunication industry
Yazarlar:	Yağmahan, Betül Uzak, Büşra Bursa Uludağ Üniversitesi/Fen Bilimleri Enstitüsü/Endüstri Mühendisliği Anabilim Dalı. 0000-0003-0797-5364 0000-0003-1744-3062
Anahtar kelimeler:	Makine öğrenmesi Sınıflandırma Çalışan kaybı Tahminleme Doğruluk değeri Machine learning Classification Employee churn Prediction Accuracy
Yayın Tarihi:	19-Tem-2022
Yayıncı:	Bursa Uludağ Üniversitesi
Atıf:	Uzak, B. (2022).Telekomünikasyon sektöründe çalışan kaybı tahmini için makine öğrenmesi modeli seçimi. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.
Özet:	Günümüzde işletmelerin en büyük problemlerinden biri yetiştirdikleri çalışanları kaybetmeleridir. Çalışan kaybının şirketlere birçok maliyeti vardır. Bu nedenle çalışan kaybının tahmin edilmesi ve önlem alınması oldukça önem taşımaktadır. Bu kadar önemli bir konuda yapılan tahminlerin doğruluğu da alınacak aksiyonların hatalı olmaması ve çalışan kaybının azaltılması için oldukça önemlidir. Birçok tahmin yöntemi bulunmaktadır ancak bu çalışmada makine öğrenmesi yöntemlerinden olan sınıflandırma yöntemi kullanılarak telekomünikasyon sektörüne ait bir çalışan veri seti analiz edilmiştir. Çalışmanın amacı sekiz adet sınıflandırma modeli ile veri setinin analiz edilerek bu problem için en uygun sınıflandırma modelinin önerilmesidir. Bu uygulamaya ait modeller Python dili ile kodlanmıştır. Veri kümesinin %70’i modelin eğitilmesinde ve doğrulanmasında, %30’u ise modelin test edilmesinde kullanılmıştır. Uygulanan modeller doğruluk, çapraz doğrulama skoru, kesinlik, duyarlılık, 𝑓𝑓1 skoru ve Eğri Altında Kalan Alan (EAKA) metriklerine göre değerlendirilmiştir. Kullanılan modeller arasında en iyi sınıflandırma modeli %92,2 doğruluk değeri ile rastgele orman modeli olarak bulunmuştur. İkinci en iyi model ise %91,4 doğruluk değeri ile gradyan artırma makineleri modeli olarak bulunmuştur. Bu veri setini uygulanan modeller arasında %89,1 doğruluk oranı ile en kötü sınıflandıran model ise k-en yakın komşu olmuştur. Problem özelinde gelecekte yapılacak sınıflandırma çalışmaları için bu çalışmada uygulanan modeller değerlendirildiğinde en iyi metrik değerlerine ulaşılan yani en iyi sınıflandıran rastgele orman modeli önerilmektedir. One of the biggest problems of businesses today is losing their employees. Employee churn has many costs to companies. For this reason, it is very important to predict the loss of employees and take precautions. The accuracy of the estimates made on such an important issue is also very important to ensure that the actions to be taken are not erroneous and to reduce the churn of employees. There are many estimation methods, but in this study, an employee data set belonging to the telecommunications sector was analyzed by using the classification method, which is one of the machine learning methods. The aim of the study is to analyze the data set with eight classification models and to propose the most suitable classification model for this problem. These models are coded with Python language. 70% of the dataset was used in training and validation the model and 30% in testing the model. The applied models were evaluated according to accuracy, cross validation score, precision, sensitivity, 𝑓𝑓1 score and Area Under the Curve (AUC) metrics. Among the models used, the best classification model was found to be the random forest model with an accuracy of 92.2%. The second best model was found to be the gradient increasing machines model with an accuracy value of 91.4%. k nearest neighbor is the worst classifying model among the applied models with an accuracy rate of 89.1%. When the models applied in this study are evaluated for the classification studies to be carried out in the future, the random forest model, which has the best metric values, that is, which classifies the best, is recommended.
URI:	http://hdl.handle.net/11452/28371
Koleksiyonlarda Görünür:	Fen Bilimleri Yüksek Lisans Tezleri / Master Degree

Bu öğenin dosyaları:

Dosya	Açıklama	Boyut	Biçim
Büşra_Uzak.pdf		1.2 MB	Adobe PDF	Göster/Aç

Tüm Öğe Kaydını Göster İstatistikler

Bu öğe kapsamında lisanslı Creative Commons License

Bursa Uludağ Üniversitesi Açık Erişim Sistemi

Bursa Uludağ Üniversitesinin araştırma çıktılarının yer aldığı açık erişim sistemidir.