Machine learning adalah salah satu topik yang tengah naik daun. Teknologi ini memungkinkan komputer untuk mempelajari suatu objek layaknya manusia. Jika kamu ingin membuat project machine learning, python mungkin akan jadi bahasa pemrograman yang tepat untuk kamu. Bahasa ini memiliki banyak dukungan library dan packages yang akan memudahkan kamu untuk membuat project machine learning. Pada artikel ini, TASOfficial akan mengajak kamu Membuat Klasifikasi Bunga Iris Dengan Python. Tutorial ini terbagi dalam 2 bagian. Pada artikel Membuat Klasifikasi Bunga Iris Dengan Python (1), kamu akan belajar mengenai dataset, melihat dataset, dan memvisualisasikannya dalam bentuk grafik.
Dataset Iris
Project ini bertujuan untuk membuat klasifikasi bunga iris. Klasifikasi iris adalah salah satu dataset yang sering digunakan sebagai project pertama dalam memulai perjalanan machine learning developer. Tenang saja, kamu tidak perlu menyiapkan dataset sendiri karena dataset iris telah tersedia secara bebas dan gratis. Kamu bisa mengunduh dataset iris.csv melalui link ini.

Dataset ini berisi data observasi 3 spesies anggrek dengan jumlah observasi tiap spesiesnya sebanyak 50 observasi. Setiap data memiliki 4 komponen yakni Sepal.Length, Sepal.Width, Petal.Length, Petal.Width, dan spesies.
Instalasi Packages
Hal pertama yang harus kamu lakukan untuk membuat program klasifikasi bunga iris adalah melakukan instalasi pandas. Pandas adalah packages yang menyediakan banyak fitur dalam pengolahan dan analisa data. Pandas dapat mengelola data baik dalam bentuk Series
(1-dimensional) and DataFrame
(2-dimensional).Selain memerlukan pacakages pandas, kamu juga memerlukan packages numpy. Numpy berguna untuk operasi vektor dan matriks. Numpy merupakan salah satu library yang digunakan oleh library lain seperti Scikit-Learn untuk keperluan analisis data. Pada bagian akhir, kamu akan melakukan visualisasi data. Oleh karena itu kamu juga akan memerlukan seaborn
Untuk melakukan instalasi packages ini, buka command prompt. Tuliskan perintah berikut
pip install pandas pip install numpy pip install sklearn pip install seabon
Setelah instalasi pacakages selesai, buat python new file. Pada header program, import library-library yang telah terdownload pada program kamu
import pandas import numpy import seaborn import sklearn
Melihat Isi Dataset
Setelah mengunduh dataset iris, letakkan file .csv pada folder yang sama dengan project. Selanjutnya, gunakan read_csv untuk membaca data pada dataset ini
iris=pd.read_csv('Iris.csv')
Kamu juga dapat melihat isi data pada file csv. Misal, kamu ingin melihat isi 15 baris pertama pada file iris.csv, ketikkan perintah berikut
print(iris.head(15))
Pandas juga memberikan fasilitas untuk melihat summary data, mulai dari count, min, mean, max, dan percentiles.
print(iris.describe())
Untuk melihat jumlah data iris tiap kelasnya, gunakan perintah groupby.size
print(iris.groupby('iris').size())
Menampilkan Dataset Dalam Bentuk Grafik
Kamu dapat menampilkan BoxPlot maupun PairPlot. Jika kamu ingin menampilkan dataset iris berdasarkan distribusi datanya, termasuk data mean, median, dan deviasi, gunakan BoxPlot. Perintah untuk menampilkan dataset dalam grafik Boxplot adalah sebagai berikut
plt.figure(figsize=(15,10)) plt.subplot(2,2,1) sns.boxplot(x='iris',y='sepallength',data=iris) plt.subplot(2,2,2) sns.boxplot(x='iris',y='sepalwidth',data=iris) plt.subplot(2,2,3) sns.boxplot(x='iris',y='petallength',data=iris) plt.subplot(2,2,4) sns.boxplot(x='iris',y='petalwidth',data=iris)

Sementara itu, pairplot dapat kamu pilih jika kamu ingin merepresentasikan setiap kelasnya dalam warna yang berbeda. Tampilan grafik ini direpresentasikan dalam single graph. Tampilan data overlap dapat kamu lihat dengan jelas dengan pairplot ini
sns.pairplot(iris, hue='iris', size=3, diag_kind="kde")
sns.pairplot(iris,hue='iris')


Nah, itulah Membuat Klasifikasi Bunga Iris Dengan Python (1). Pada Membuat Klasifikasi Bunga Iris Dengan Python (2), kamu akan belajar bagaimana cara melakukan training dan validating data.