• Home
  • About
  • Terms of Service
  • Daftar Isi
  • Kebijakan Privasi
  • Hubungi Kami

Belajar Teknologi

Belajar dan Sharing Ilmu Teknologi

Sample Dataset pada Scikit-Learn | Belajar Machine Learning Dasar

03/01/2024 by ramzilhuda

Sample Dataset pada Scikit-Learn

Adapun yang harus kita persiapkan dalam pembelajaran sample dataset pada scikit-learn adalah :

  • Memiliki akun Gmail, kemudian login ke dalam akun Gmail.
  • Buka google colab untuk menjalankan script dari scikit-learn.
  • Buat project baru

buat projek baru machine learning

  • Untuk kasus kali ini kita memakai iris dataset, ketikan kedalam script kode script berikut
from sklearn.datasets import load_iris
iris = load_iris()
iris

Penjelasan dari script di atas adalah pertama kita harus install dulu sklearn.datasets kemudian kita import function load_iris. untuk memanggil iris dataset dengan load_iris() kemudian kita tampung dalam satu variabel dengan nama iris, kemudian untuk menampilkan kita ketik variabel iris.

Untuk menjalankan program tersebut cukup dengan mengklik tombol play pada menu di samping program. hasilnya seperti gambar di bawah ini :

Kita akan mendata keys apa saja yang dimiliki oleh iris dataset, dengan mengetikan kode pada baris baru:

iris.keys()

kemudian jalankan, maka hasilnya seperti gambar di bawah ini :

Adapun Keys() yang tersedia dari iris dataset adalah : ‘data’, ‘target’, ‘frame’, ‘target_names’, ‘DESCR’, ‘feature_names’, ‘filename’, ‘data_module’.

Untuk data keys akan berkaitan dengan data features, sedangkan target berkaitan nanti dengan data – data target. Frame untuk menanandakan apakah data format yang ada pada iris dataset data frame atau bukan data frame. Target_names dan Features names akan berkolerasi dengan nama atau label untuk setiap target dan featuresnya. DESCR merupakan kependekan dari deskripsi . filename akan berkolerasi dengan lokasi filename projek ini dan yang terakhir data_module adalah modul yang diakses pada sklearn yaitu sklearn.datasets.data.

Deskripsi Dari Sample Dataset

Sample dataset yang kita gunakan dapat teman – teman gali infromasinya melalui link wikipedia. untuk mengakses metadata dari iris dataset adalah dengan cara mengetikan script di bawah ini :

print(iris.DESCR)

hasilnya dapat kita lihat di bawah ini

Dari gambar di atas dapat kita ambil informasi tentang judul dataset, dengan judul Iris plants dataset, number of instances jumlah baris 150 baris terdapat 3 class ( Iris-Setosa, Iris-Versicolour, Iris-Virginica ) di dalam1 class terdapat 50 baris. Number of attributes ada 4 atributes : sepal lenght, sepal width, petal length dan petal widht dengan format ukuran centimeter ( cm ).

Filed Under: Machine Learning, Tutorial Tagged With: google colab, machine learning, sample data, sckit-learn

Categories

  • Beasiswa
  • Bedtime Tales
  • Berita Teknologi
  • Berita Terkini
  • Dunia Islam
  • Flutter
  • Laravel
  • Machine Learning
  • Manfaat Buah
  • Mata Kuliah
  • Matematika Diskrit
  • Memori Kolektif
  • Metode Numerik
  • Mobile Computing
  • Teori Peluang
  • Tutorial

Recent Posts

  • Photonics Summer Camp 2025: Program Riset Optik Gratis di KAUST
  • Program Riset Microelectronics Winter Camp 2026 di KAUST Resmi Dibuka
  • TikTok Menghilang di AS: Peristiwa Besar dalam Regulasi Media Sosial
  • TikTok Graveyard: Kenali Data Aktivitas Anda Sebelum Aplikasi Ditutup
  • Update Terbaru Pencairan PKH 2025: Cek Dana dan Penerima dengan NIK Anda

Archives

  • April 2025
  • January 2025
  • March 2024
  • January 2024
  • December 2023
  • May 2023
  • September 2022
  • July 2022
  • June 2022
  • May 2022
  • April 2022
  • February 2022
  • December 2021
  • November 2021
  • June 2021
  • May 2021
  • March 2021
  • February 2021
  • November 2020
  • April 2020
  • March 2020
  • November 2019
  • October 2019
  • September 2019

Recent Comments

    Copyright © 2025 · Magazine Pro Theme on Genesis Framework · WordPress · Log in