Membuat Klasifikasi Bunga Iris Dengan Python (1)

Machine learning adalah salah satu topik yang tengah naik daun. Teknologi ini memungkinkan komputer untuk mempelajari suatu objek layaknya manusia. Jika kamu ingin membuat project machine learning, python mungkin akan jadi bahasa pemrograman yang tepat untuk kamu. Bahasa ini memiliki banyak dukungan library dan packages yang akan memudahkan kamu untuk membuat project machine learning. Pada artikel ini, TASOfficial akan mengajak kamu Membuat Klasifikasi Bunga Iris Dengan Python. Tutorial ini terbagi dalam 2 bagian. Pada artikel Membuat Klasifikasi Bunga Iris Dengan Python (1), kamu akan belajar mengenai dataset, melihat dataset, dan memvisualisasikannya dalam bentuk grafik.

Dataset Iris

Project ini bertujuan untuk membuat klasifikasi bunga iris. Klasifikasi iris adalah salah satu dataset yang sering digunakan sebagai project pertama dalam memulai perjalanan machine learning developer. Tenang saja, kamu tidak perlu menyiapkan dataset sendiri karena dataset iris telah tersedia secara bebas dan gratis. Kamu bisa mengunduh dataset iris.csv melalui link ini.

Dataset Iris Download
Sumber : arisbudianto.net

Dataset ini berisi data observasi 3 spesies anggrek dengan jumlah observasi tiap spesiesnya sebanyak 50 observasi. Setiap data memiliki 4 komponen yakni Sepal.Length, Sepal.Width, Petal.Length, Petal.Width, dan spesies.

Instalasi Packages

Hal pertama yang harus kamu lakukan untuk membuat program klasifikasi bunga iris adalah melakukan instalasi pandas. Pandas adalah packages yang menyediakan banyak fitur dalam pengolahan dan analisa data. Pandas dapat mengelola data baik dalam bentuk Series  (1-dimensional) and  DataFrame  (2-dimensional).Selain memerlukan pacakages pandas, kamu juga memerlukan packages numpy. Numpy berguna untuk operasi vektor dan matriks. Numpy merupakan salah satu library yang digunakan oleh library lain seperti Scikit-Learn untuk keperluan analisis data. Pada bagian akhir, kamu akan melakukan visualisasi data. Oleh karena itu kamu juga akan memerlukan seaborn

Untuk melakukan instalasi packages ini, buka command prompt. Tuliskan perintah berikut

pip install pandas
pip install numpy
pip install sklearn
pip install seabon

Setelah instalasi pacakages selesai, buat python new file. Pada header program, import library-library yang telah terdownload pada program kamu

import pandas    
import numpy    
import seaborn    
import sklearn    

Melihat Isi Dataset

Setelah mengunduh dataset iris, letakkan file .csv pada folder yang sama dengan project. Selanjutnya, gunakan read_csv untuk membaca data pada dataset ini

iris=pd.read_csv('Iris.csv')  

Kamu juga dapat melihat isi data pada file csv. Misal, kamu ingin melihat isi 15 baris pertama pada file iris.csv, ketikkan perintah berikut

print(iris.head(15))

Pandas juga memberikan fasilitas untuk melihat summary data, mulai dari count, min, mean, max, dan percentiles.

print(iris.describe())   

Untuk melihat jumlah data iris tiap kelasnya, gunakan perintah groupby.size

print(iris.groupby('iris').size())   

Menampilkan Dataset Dalam Bentuk Grafik

Kamu dapat menampilkan BoxPlot maupun PairPlot. Jika kamu ingin menampilkan dataset iris berdasarkan distribusi datanya, termasuk data mean, median, dan deviasi, gunakan BoxPlot. Perintah untuk menampilkan dataset dalam grafik Boxplot adalah sebagai berikut

plt.figure(figsize=(15,10))    
plt.subplot(2,2,1)    
sns.boxplot(x='iris',y='sepallength',data=iris)    
plt.subplot(2,2,2)    
sns.boxplot(x='iris',y='sepalwidth',data=iris)    
plt.subplot(2,2,3)    
sns.boxplot(x='iris',y='petallength',data=iris)    
plt.subplot(2,2,4)    
sns.boxplot(x='iris',y='petalwidth',data=iris) 

Sementara itu, pairplot dapat kamu pilih jika kamu ingin merepresentasikan setiap kelasnya dalam warna yang berbeda. Tampilan grafik ini direpresentasikan dalam single graph. Tampilan data overlap dapat kamu lihat dengan jelas dengan pairplot ini

sns.pairplot(iris, hue='iris', size=3, diag_kind="kde")    
sns.pairplot(iris,hue='iris')   

Nah, itulh Membuat Klasifikasi Bunga Iris Dengan Python (1). Pada Membuat Klasifikasi Bunga Iris Dengan Python (2), kamu akan belajar bagaimana cara melakukan training dan validating data.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *