Ada modul yang namanya Sikit-Learn apa itu ?
Scikit-learn adalah sebuah library Machine Learning sumber terbuka untuk Python yang dibangun di atas NumPy, SciPy, dan matplotlib. Library ini menyediakan alat yang sederhana dan efisien untuk penambangan data dan analisis data, dan banyak digunakan dalam industri dan akademia. Scikit-learn mencakup berbagai algoritma untuk klasifikasi, regresi, pengelompokan, reduksi dimensi, dan pemilihan model, serta utilitas untuk preprocessing, ekstraksi fitur, dan evaluasi model.
Contoh:
Anda memiliki sebuah file spreadsheet CSV yang berisi data tentang harga rumah dan fitur lain seperti luas tanah, jumlah kamar, jarak dari pusat kota,. Anda ingin memprediksi harga rumah berdasarkan fitur-fitur tersebut menggunakan algoritma regresi.
Berapa prediksi harga rumah dengan jumlah kamar 4, luas tanah 1200 dan jarak dari puat kota 40 .
Untuk melakukan ini, Anda bisa mengimpor file spreadsheet ke Python menggunakan library seperti pandas, dan menggunakan scikit-learn untuk membangun model regresi.
contoh data spreadshet pada file datarumah.csv
luas,kamar,jarak,harga
1000,3,5,300000
1200,4,10,400000
900,2,15,250000
1100,3,12,350000
1300,4,8,450000
1000,3,5,400000
1200,4,10,400000
900,2,15,250000
1000,3,12,300000
1300,4,8,450000
1000,3,5,300000
1200,4,10,400000
900,2,15,250000
1100,3,12,350000
1300,4,8,450000
1000,3,5,300000
1200,4,10,400000
900,2,15,250000
1100,3,12,350000
1300,4,8,450000
1000,3,5,300000
1200,4,10,400000
900,2,15,250000
1100,3,12,350000
1300,4,8,450000
1000,3,5,300000
1200,4,10,400000
900,2,15,250000
1100,3,12,350000
1300,4,8,450000
1000,3,5,300000
1200,4,10,400000
900,2,15,250000
1100,3,12,350000
1300,4,8,450000
Berikut ini adalah scrypt python yang dapat digunakan untuk menghitung prediksi harga sebauh rumah dengan contoh diatas
Prosesnya adalah :
Install terlebh dahulu scikit-learn dengan perintah
pip install scikit-learn
selanjutnya buat file datarumah.csv dengan menggunakan data diatas, selanjutnya buat file main.py dengan isi script berikut ini
import pandas as pd import numpy as np from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split # Memanggila file datarumah.csv kedalam proses panda df = pd.read_csv("housing_data.csv") # Split data menjadi (X) dan terget (y) X = df[['luas', 'kamar', 'jarak']] X.columns = ['luas', 'kamar', 'jarak'] # add column names y = df['harga'] # Split data kedala training dan menentukan nilai testing X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0) # Train model dengan training data reg = LinearRegression() reg.fit(X_train, y_train) #Pergunakan model untuk prediksi dengan data testing y_pred = reg.predict(X_test) # Print hasil prediksi print("Hasil Tes Prediksi", y_pred) # angka data untuk memprediksi harga inputs = np.array([[5, 2000, 10]]) # luas, kamar, jarak # Gunakan model untuk prediksi price_prediction = reg.predict(inputs) # Print prediksi print("Predicted price:", price_prediction[0])
selanjutya sila jalankan main.py dengan perintah :
python3 main.py
anda akan melihat hasil prediksi harga dari Ruang sebanyak 5 , luas 2000 dan jarak 10
Copyright PythonesiaORG 2023
Komentar (0)