PyCaret Kütüphanesi ile ML Modellerini Daha Hızlı Oluşturabilirsiniz !!!

Burcu Koca
2 min readApr 3, 2021

--

PyCaret, makine öğrenimi uygulamalarında sınıflandırma ve regresyon veri kümesindeki standart işleri gerçekleştirmeyi kolaylaştırmak için tasarlanmış R’daki Caret paketinin bir Python sürümüdür.

PyCaret; standart modelleri karşılaştırma, model hiperparametrelerini ayarlama ve gerçekleştirilecek veri dönüşümlerini sağlama özellikleri ile temelde çok az sayıda manuel yapılandırma ile istenilen çalışmayı elde edebilmenizi sağlamaktadır.

Geçmiş yıllarda hepimizin duyduğu AUTOML teknolojileri şirketlerin dikkatini çekmişti. Sektörlerdeki projeleri bu aşamada 2 farklı sınıfta ele alabiliriz. Bazı projeler vardır ki çok karmaşıktır ileri analitik çalışması gerektirir, bazı projeler ise standart makine öğrenimi algoritmaları ile öngörü getirebileceğiniz çalışmaları içerir.

Bu yazım ile sizlerle birlikte PyCaret’e giriş yapmak istiyorum.

PyCaret kütüphanesi, API’yi kullanmak için zengin bir dökümantasyona sahiptir; sizler de merak ederseniz buradan başlayabilirsiniz.

Şimdi hepimizin tanıdığı ünlü veri seti örneklerimizden birini kullanarak kodlamaya başlayalım 😊

Sonar Dataset

Adım 1: Veri seti yüklenir ve veri özellikleri incelenir.

from pandas import read_csv
url = 'sonar.csv'
df = read_csv(url, header=None)
n_cols = df.shape[1]
df.columns = [str(i) for i in range(n_cols)]
df.head()

Adım 2: PyCaret kütüphanesi indirilir, sette hedef değişken belirlenir. Setup () fonksiyonu ile veri seti sınıflandırma algoritması için hazırlanır.

from pycaret.classification import *
from pycaret.classification import compare_models
grid = setup(data=df, target=df.columns[-1], html=False, silent=True, verbose=False)

Adım 3: Compare_ models () fonksiyonu ile makine öğrenimi modelleri x10 çaprazlama ile değerlendirilir ve doğruluk oranına göre en iyi tek modeli döndürür.

best = compare_models()
print(best)

Adım 4: Tune_model () işlevi kullanılarak model hiperparametreleri ayarlanır.

best = tune_model(ExtraTreesClassifier(), n_iter=200, choose_better=True)print(best)

Adım 5: Extra Trees Classifier modelinin sonuçları görselleştirilir.

plot_model(best, plot = ‘confusion_matrix’)

Bu yazımla;

PyCaret nedir ve standart makine öğrenimi modellerinde nasıl kullanılır sorularına cevap aramış olduk.

Daha derine inmek isterseniz yazının başında paylaşmış olduğum siteden dökümanlara ulaşabilirsiniz.

--

--