Please use this identifier to cite or link to this item: http://hdl.handle.net/11452/28371
Title: Telekomünikasyon sektöründe çalışan kaybı tahmini için makine öğrenmesi modeli seçimi
Other Titles: Choosing machine learning model for predicting employee churn in the telecommunication industry
Authors: Yağmahan, Betül
Uzak, Büşra
Bursa Uludağ Üniversitesi/Fen Bilimleri Enstitüsü/Endüstri Mühendisliği Anabilim Dalı.
0000-0003-0797-5364
0000-0003-1744-3062
Keywords: Makine öğrenmesi
Sınıflandırma
Çalışan kaybı
Tahminleme
Doğruluk değeri
Machine learning
Classification
Employee churn
Prediction
Accuracy
Issue Date: 19-Jul-2022
Publisher: Bursa Uludağ Üniversitesi
Citation: Uzak, B. (2022).Telekomünikasyon sektöründe çalışan kaybı tahmini için makine öğrenmesi modeli seçimi. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.
Abstract: Günümüzde işletmelerin en büyük problemlerinden biri yetiştirdikleri çalışanları kaybetmeleridir. Çalışan kaybının şirketlere birçok maliyeti vardır. Bu nedenle çalışan kaybının tahmin edilmesi ve önlem alınması oldukça önem taşımaktadır. Bu kadar önemli bir konuda yapılan tahminlerin doğruluğu da alınacak aksiyonların hatalı olmaması ve çalışan kaybının azaltılması için oldukça önemlidir. Birçok tahmin yöntemi bulunmaktadır ancak bu çalışmada makine öğrenmesi yöntemlerinden olan sınıflandırma yöntemi kullanılarak telekomünikasyon sektörüne ait bir çalışan veri seti analiz edilmiştir. Çalışmanın amacı sekiz adet sınıflandırma modeli ile veri setinin analiz edilerek bu problem için en uygun sınıflandırma modelinin önerilmesidir. Bu uygulamaya ait modeller Python dili ile kodlanmıştır. Veri kümesinin %70’i modelin eğitilmesinde ve doğrulanmasında, %30’u ise modelin test edilmesinde kullanılmıştır. Uygulanan modeller doğruluk, çapraz doğrulama skoru, kesinlik, duyarlılık, 𝑓𝑓1 skoru ve Eğri Altında Kalan Alan (EAKA) metriklerine göre değerlendirilmiştir. Kullanılan modeller arasında en iyi sınıflandırma modeli %92,2 doğruluk değeri ile rastgele orman modeli olarak bulunmuştur. İkinci en iyi model ise %91,4 doğruluk değeri ile gradyan artırma makineleri modeli olarak bulunmuştur. Bu veri setini uygulanan modeller arasında %89,1 doğruluk oranı ile en kötü sınıflandıran model ise k-en yakın komşu olmuştur. Problem özelinde gelecekte yapılacak sınıflandırma çalışmaları için bu çalışmada uygulanan modeller değerlendirildiğinde en iyi metrik değerlerine ulaşılan yani en iyi sınıflandıran rastgele orman modeli önerilmektedir.
One of the biggest problems of businesses today is losing their employees. Employee churn has many costs to companies. For this reason, it is very important to predict the loss of employees and take precautions. The accuracy of the estimates made on such an important issue is also very important to ensure that the actions to be taken are not erroneous and to reduce the churn of employees. There are many estimation methods, but in this study, an employee data set belonging to the telecommunications sector was analyzed by using the classification method, which is one of the machine learning methods. The aim of the study is to analyze the data set with eight classification models and to propose the most suitable classification model for this problem. These models are coded with Python language. 70% of the dataset was used in training and validation the model and 30% in testing the model. The applied models were evaluated according to accuracy, cross validation score, precision, sensitivity, 𝑓𝑓1 score and Area Under the Curve (AUC) metrics. Among the models used, the best classification model was found to be the random forest model with an accuracy of 92.2%. The second best model was found to be the gradient increasing machines model with an accuracy value of 91.4%. k nearest neighbor is the worst classifying model among the applied models with an accuracy rate of 89.1%. When the models applied in this study are evaluated for the classification studies to be carried out in the future, the random forest model, which has the best metric values, that is, which classifies the best, is recommended.
URI: http://hdl.handle.net/11452/28371
Appears in Collections:Fen Bilimleri Yüksek Lisans Tezleri / Master Degree

Files in This Item:
File Description SizeFormat 
Büşra_Uzak.pdf1.2 MBAdobe PDFThumbnail
View/Open


This item is licensed under a Creative Commons License Creative Commons