Cari Tahu Mengenai Machine Learning, dari Pengertian hingga Penerapannya!
Machine learning adalah bidang kecerdasan buatan yang memungkinkan sistem untuk belajar dan berkembang dari pengalaman tanpa harus diprogram secara eksplisit. Ini telah menjadi topik yang semakin populer dalam beberapa tahun terakhir karena banyaknya aplikasi praktis yang dimilikinya di berbagai industri.
Saat kita menjelajah lebih jauh ke bidang machine learning, kita juga harus menjawab pertanyaan-pertanyaan penting mengenai etika dan kemasyarakatan. Bagaimana kita memastikan bahwa teknologi ini digunakan untuk kepentingan semua orang dan tidak memperburuk kesenjangan yang ada? Bagaimana kita melindungi privasi di dunia di mana data adalah sumber kehidupan algoritma machine learning? Tantangan-tantangan ini memerlukan pertimbangan yang matang dan pengembangan yang bertanggung jawab.
Dalam artikel ini, kita akan menjelajahi dunia machine learning. Kita akan mengeksplorasi tentang pengertian, cara kerja, jenis-jenis, kelebihan dan kekurangan, serta penerapan machine learning ini.
Apa Itu Machine Learning?
Maching learning memungkinkan komputer beroperasi secara mandiri tanpa pemrograman eksplisit. Aplikasi machine learning diumpankan dengan data baru, dan mereka dapat secara mandiri belajar, tumbuh, berkembang, dan beradaptasi.
Machine learning mendapatkan informasi yang mendalam dari volume data yang besar dengan memanfaatkan algoritma untuk mengidentifikasi pola dan belajar dalam proses berulang. Algoritma machine learning menggunakan metode komputasi untuk belajar secara langsung dari data, bukan mengandalkan persamaan yang telah ditentukan sebelumnya yang dapat digunakan sebagai model.
Performa algoritma machine learning meningkat secara adaptif dengan bertambahnya jumlah sampel yang tersedia selama proses ‘pembelajaran’. Sebagai contoh, deep learning adalah sub-domain dari machine learning yang melatih komputer untuk meniru sifat alami manusia seperti belajar dari contoh. Ini menawarkan parameter kinerja yang lebih baik daripada algoritma machine learning konvensional.
Machine learning bukanlah konsep baru dan sudah ada sejak Perang Dunia II. Ketika Mesin Enigma digunakan untuk menerapkan perhitungan matematis yang rumit secara otomatis pada volume dan jenis data yang tersedia merupakan perkembangan yang relatif baru.
Saat ini, dengan munculnya big data, Internet of Things (IoT), dan komputasi yang ada di mana-mana, machine learning menjadi penting untuk memecahkan masalah di berbagai bidang, seperti:
- Keuangan komputasi (penilaian kredit, perdagangan algoritmik).
- Computer vision (pengenalan wajah, pelacakan gerakan, deteksi objek).
- Biologi komputasi (pengurutan DNA, deteksi tumor otak, penemuan obat).
- Otomotif, kedirgantaraan, dan manufaktur (pemeliharaan prediktif).
- Pemrosesan bahasa alami (pengenalan suara).
Machine Learning vs. Deep Learning vs. Neural Networks
Karena deep learning dan machine learning cenderung digunakan secara bergantian, ada baiknya untuk memperhatikan perbedaan di antara keduanya. Machine learning, deep learning, dan neural network adalah sub-bidang dari kecerdasan buatan. Namun, neural network sebenarnya adalah sub-bidang dari machine learning, dan deep learning adalah sub-bidang dari neural network atau jaringan syaraf.
Perbedaan antara deep learning dan machine learning terletak pada cara masing-masing algoritma belajar. “Machine learning” dapat menggunakan dataset berlabel untuk menginformasikan algoritmanya, tetapi tidak selalu membutuhkan dataset berlabel. Deep learning dapat mencerna data yang tidak terstruktur dalam bentuk mentah (misalnya, teks atau gambar), dan secara otomatis dapat menentukan serangkaian fitur yang membedakan kategori data yang berbeda satu sama lain. Hal ini menghilangkan beberapa campur tangan manusia yang diperlukan dan memungkinkan penggunaan kumpulan data yang lebih besar.
Machine learning yang klasik, atau “tidak mendalam”, lebih bergantung pada campur tangan manusia untuk belajar. Pakar manusia menentukan serangkaian fitur untuk memahami perbedaan antara input data, biasanya membutuhkan data yang lebih terstruktur untuk dipelajari.
Neural network, atau jaringan syaraf tiruan (JST), terdiri dari lapisan-lapisan node, yang terdiri dari lapisan input, satu atau lebih lapisan tersembunyi, dan lapisan output. Setiap node, atau neuron buatan, terhubung ke node lainnya dan memiliki bobot dan ambang batas yang terkait. Jika output dari setiap node berada di atas nilai ambang batas yang ditentukan, maka node tersebut akan diaktifkan, dan mengirimkan data ke lapisan jaringan berikutnya. Jika tidak, tidak ada data yang diteruskan ke lapisan jaringan berikutnya oleh node tersebut.
Kata “deep” dalam deep learning hanya mengacu pada jumlah lapisan dalam neural network. Sebuah neural network yang terdiri dari lebih dari tiga lapisan yang akan mencakup input dan output dapat dianggap sebagai algoritma pembelajaran mendalam atau jaringan saraf dalam. Jaringan saraf yang hanya memiliki tiga lapisan hanyalah jaringan saraf dasar.
Deep learning dan jaringan saraf dikreditkan dengan mempercepat kemajuan di bidang-bidang seperti computer vision, pemrosesan bahasa alami, dan pengenalan suara.
Bagaimana Cara Kerja Machine Learning?
Tiga blok bangunan utama dari sebuah sistem adalah model, parameter, dan pelajar.
- Model adalah sistem yang membuat prediksi.
- Parameter adalah faktor-faktor yang dipertimbangkan oleh model untuk membuat prediksi.
- Pelajar membuat penyesuaian dalam parameter dan model untuk menyelaraskan prediksi dengan hasil yang sebenarnya.
Mari kita gunakan contoh bir dan wine di atas untuk memahami cara kerja machine learning. Model pembelajaran mesin di sini harus memprediksi apakah minuman tersebut bir atau wine. Parameter yang dipilih adalah warna minuman dan persentase alkohol. Langkah pertama adalah:
1. Belajar dari Kumpulan Data Pelatihan
Hal ini melibatkan pengambilan set data sampel dari beberapa minuman yang telah ditentukan warna dan persentase alkoholnya. Sekarang, kita harus mendefinisikan deskripsi dari setiap klasifikasi, yaitu wine dan bir, dalam hal nilai parameter untuk setiap jenis. Model dapat menggunakan deskripsi tersebut untuk memutuskan apakah minuman baru adalah wine atau bir.
Anda dapat merepresentasikan nilai parameter, ‘warna’ dan ‘persentase alkohol’ masing-masing sebagai ‘x’ dan ‘y’. Kemudian (x,y) mendefinisikan parameter setiap minuman dalam data pelatihan. Kumpulan data ini disebut set pelatihan. Nilai-nilai ini, ketika diplot pada grafik, menyajikan hipotesis dalam bentuk garis, persegi panjang, atau polinomial yang paling sesuai dengan hasil yang diinginkan.
2. Mengukur Kesalahan
Setelah model dilatih pada set pelatihan yang ditentukan, model perlu diperiksa untuk mengetahui perbedaan dan kesalahan. Maka dari itu, digunakan satu set data baru untuk menyelesaikan tugas ini. Hasil dari pengujian ini adalah salah satu dari empat hal berikut:
- True Positive (TP): Ketika model memprediksi kondisi yang ada saat ini.
- True Negative (TN): Ketika model tidak memprediksi kondisi ketika kondisi tersebut tidak ada.
- False Positive (FP): Ketika model memprediksi suatu kondisi ketika kondisi tersebut tidak ada.
- False Negative (FN): Ketika model tidak memprediksi suatu kondisi ketika kondisi tersebut ada.
Jumlah FP dan FN adalah total kesalahan dalam model.
3. Mengelola Kebisingan
Dua parameter yang dipertimbangkan untuk mendekati masalah machine learning ini, yaitu warna dan persentase alkohol. Namun pada kenyataannya, Anda harus mempertimbangkan ratusan parameter dan kumpulan data pembelajaran yang luas untuk memecahkan masalah machine learning.
Hipotesis yang dibuat kemudian akan memiliki lebih banyak kesalahan karena adanya noise. Noise adalah anomali yang tidak diinginkan yang menyamarkan hubungan yang mendasari kumpulan data dan melemahkan proses pembelajaran. Berbagai alasan terjadinya noise ini adalah:
- Kumpulan data pelatihan yang besar.
- Kesalahan pada input data.
- Kesalahan pelabelan data .
- Atribut yang tidak dapat diamati yang mungkin memengaruhi klasifikasi tetapi tidak dipertimbangkan dalam set pelatihan karena kurangnya data.
Anda dapat menerima tingkat kesalahan pelatihan tertentu karena noise untuk menjaga agar hipotesis tetap sesederhana mungkin.
4. Pengujian dan Generalisasi
Meskipun mungkin saja sebuah algoritma atau hipotesis cocok dengan set pelatihan, algoritma atau hipotesis tersebut bisa saja gagal saat diterapkan pada set data lain di luar set pelatihan. Oleh karena itu, sangat penting untuk mengetahui apakah algoritma cocok untuk data baru. Mengujinya dengan sekumpulan data baru adalah cara untuk menilai hal ini. Selain itu, generalisasi mengacu pada seberapa baik model memprediksi hasil untuk serangkaian data baru.
Ketika kita menyesuaikan algoritma hipotesis untuk kesederhanaan semaksimal mungkin, algoritma tersebut mungkin memiliki lebih sedikit kesalahan untuk data pelatihan, tetapi mungkin memiliki lebih banyak kesalahan yang signifikan saat memproses data baru. Ini disebut sebagai underfitting. Di sisi lain, jika hipotesis terlalu rumit untuk mengakomodasi kecocokan terbaik dengan hasil pelatihan, maka hipotesis tersebut mungkin tidak dapat digeneralisasi dengan baik. Ini adalah kasus over-fitting. Dalam kedua kasus tersebut, hasilnya akan diumpan balik untuk melatih model lebih lanjut.
Jenis-jenis Machine Learning
Algoritma machine learning dapat dilatih dengan berbagai cara, dengan masing-masing metode memiliki kelebihan dan kekurangan. Berdasarkan metode dan cara belajar ini, machine learning secara umum dikategorikan ke dalam empat jenis utama:
1. Supervised Learning
Jenis ini melibatkan pengawasan, di mana mesin dilatih pada set data berlabel dan diaktifkan untuk memprediksi output berdasarkan pelatihan yang diberikan. Dataset berlabel menetapkan bahwa beberapa parameter input dan output sudah dipetakan. Oleh karena itu, mesin dilatih dengan input dan output yang sesuai. Perangkat dibuat untuk memprediksi hasil menggunakan dataset uji pada fase berikutnya.
Sebagai contoh, pertimbangkan dataset masukan berupa gambar burung beo dan gagak. Awalnya, mesin dilatih untuk memahami gambar-gambar tersebut, termasuk warna, mata, bentuk, dan ukuran burung beo dan gagak. Setelah pelatihan, gambar masukan berupa gambar burung beo diberikan, dan mesin diharapkan dapat mengidentifikasi objek dan memprediksi keluarannya. Mesin yang terlatih akan memeriksa berbagai fitur objek, seperti warna, mata, bentuk, dan lain-lain, pada gambar input, untuk membuat prediksi akhir. Ini adalah proses identifikasi objek dalam supervised learning.
Tujuan utama dari teknik supervised learning adalah untuk memetakan variabel input (a) dengan variabel output (b). Supervised learning selanjutnya diklasifikasikan ke dalam dua kategori besar:
- Klasifikasi: Ini mengacu pada algoritma yang menangani masalah klasifikasi di mana variabel keluarannya bersifat kategorikal misalnya, ya atau tidak, benar atau salah, pria atau wanita, dll. Aplikasi dunia nyata dari kategori ini terlihat jelas dalam deteksi spam dan penyaringan e-mail.
Beberapa algoritma klasifikasi yang dikenal termasuk Algoritma Random Forest, Algoritma Pohon Keputusan, Algoritma Regresi Logistik, dan Algoritma Support Vector Machine.
- Regresi: Algoritma regresi menangani masalah regresi di mana variabel input dan output memiliki hubungan linier. Algoritma ini dikenal untuk memprediksi variabel output yang berkelanjutan. Contohnya termasuk prediksi cuaca, analisis tren pasar, dll.
Algoritma regresi yang populer termasuk Algoritma Regresi Linier Sederhana, Algoritma Regresi Multivariat, Algoritma Pohon Keputusan, dan Regresi Lasso.
2. Unsupervised Learning
Di sini, mesin dilatih menggunakan dataset yang tidak berlabel dan diaktifkan untuk memprediksi output tanpa pengawasan apa pun. Algoritma unsupervised learning bertujuan untuk mengelompokkan set data yang tidak diurutkan berdasarkan kesamaan, perbedaan, dan pola input.
Sebagai contoh, pertimbangkan dataset input berupa gambar wadah berisi buah. Di sini, gambar-gambar tersebut tidak dikenal oleh model machine learning. Ketika kita memasukkan dataset ke dalam model machine learning, tugas model adalah mengidentifikasi pola objek, seperti warna, bentuk, atau perbedaan yang terlihat pada gambar input dan mengkategorikannya. Setelah melakukan kategorisasi, mesin kemudian memprediksi output yang akan diuji dengan dataset uji.
Unsupervised learning diklasifikasikan lebih lanjut menjadi dua jenis:
- Pengelompokan: Teknik pengelompokan mengacu pada pengelompokan objek ke dalam kelompok-kelompok berdasarkan parameter seperti kesamaan atau perbedaan antar objek. Misalnya, mengelompokkan pelanggan berdasarkan produk yang mereka beli.
Beberapa algoritma clustering yang dikenal termasuk K-Means Clustering Algorithm, Mean-Shift Algorithm, DBSCAN Algorithm, Principal Component Analysis, dan Independent Component Analysis.
- Asosiasi: Pembelajaran asosiasi mengacu pada identifikasi hubungan yang khas di antara variabel-variabel dalam kumpulan data yang besar. Pembelajaran ini menentukan ketergantungan berbagai item data dan memetakan variabel-variabel yang terkait. Aplikasi yang umum digunakan adalah penambangan penggunaan web dan analisis data pasar.
Algoritma populer yang mematuhi aturan asosiasi termasuk Apriori Algorithm, Eclat Algorithm, dan FP-Growth Algorithm.
3. Semi Supervised Learning
Pembelajaran semi-supervised learning terdiri dari karakteristik machine learning yang diawasi dan tidak diawasi. Pembelajaran ini menggunakan kombinasi dataset berlabel dan tidak berlabel untuk melatih algoritmanya. Dengan menggunakan kedua jenis dataset tersebut, pembelajaran semi-supervised mengatasi kekurangan dari opsi-opsi yang disebutkan di atas.
Pertimbangkan contoh seorang karyawan. Seorang karyawan yang mempelajari sebuah konsep di bawah pengawasan trainer di perusahaan disebut sebagai supervised learning. Dalam unsupervised learning, seorang karyawan mempelajari sendiri konsep yang sama di kantor tanpa bimbingan trainer. Sementara itu, seorang karyawan yang merevisi konsep setelah belajar di bawah arahan trainer di perusahaan adalah bentuk pembelajaran semi-supervised.
4. Pembelajaran Penguatan (Reinforcement)
Pembelajaran penguatan adalah proses berbasis umpan balik. Di sini, komponen AI secara otomatis mengamati lingkungannya dengan metode hit and trial, mengambil tindakan, belajar dari pengalaman, dan meningkatkan kinerja. Komponen ini diberi penghargaan untuk setiap tindakan yang baik dan dihukum untuk setiap gerakan yang salah. Dengan demikian, komponen pembelajaran penguatan bertujuan untuk memaksimalkan imbalan dengan melakukan tindakan yang baik.
Tidak seperti supervised learning, pembelajaran penguatan tidak memiliki data berlabel, dan agen hanya belajar melalui pengalaman. Pertimbangkan video game. Di sini, permainan menentukan lingkungan, dan setiap gerakan agen penguatan mendefinisikan keadaannya. Agen berhak menerima umpan balik melalui hukuman dan penghargaan, sehingga mempengaruhi skor permainan secara keseluruhan. Tujuan akhir dari agen adalah untuk mencapai skor yang tinggi.
Pembelajaran penguatan diterapkan di berbagai bidang seperti teori permainan, teori informasi, dan sistem multi-agen. Pembelajaran penguatan dibagi lagi menjadi dua jenis metode atau algoritma:
- Pembelajaran penguatan positif: Ini mengacu pada penambahan stimulus penguat setelah perilaku tertentu dari agen, yang membuatnya lebih mungkin bahwa perilaku tersebut dapat terjadi lagi di masa depan, misalnya, menambahkan hadiah setelah perilaku.
- Pembelajaran penguatan negatif: Pembelajaran penguatan negatif mengacu pada penguatan perilaku tertentu yang menghindari hasil negatif.
Kelebihan dan Kekurangan
Segala sesuatu memiliki kelebihan dan kekurangan. Pada bagian ini, mari kita bahas beberapa keuntungan dan kerugian dasar dari machine learning.
Kelebihan
- Dapat digunakan untuk deteksi pola.
- Dapat digunakan untuk membuat prediksi tentang data di masa depan.
- Dapat digunakan untuk menghasilkan fitur baru dari data secara otomatis.
- Dapat digunakan untuk mengelompokkan data secara otomatis.
- Dapat digunakan untuk mendeteksi pencilan dalam data secara otomatis.
Kekurangan
Beberapa kelemahan termasuk potensi data yang bias, data yang terlalu pas, dan kurangnya penjelasan.
Penerapan Machine Leaning
Algoritma ini membantu dalam membangun sistem cerdas yang dapat belajar dari pengalaman masa lalu dan data historis untuk memberikan hasil yang akurat. Banyak industri yang menerapkan solusi machine learning untuk mengatasi masalah bisnis mereka, atau untuk menciptakan produk dan layanan yang lebih baik. Layanan kesehatan, pertahanan, layanan keuangan, pemasaran, dan keamanan, antara lain, memanfaatkan machine learning.
1. Pengenalan wajah/Pengenalan gambar
Aplikasi yang paling umum adalah pengenalan wajah, dan contoh paling sederhana dari aplikasi ini adalah iPhone. Ada banyak kasus penggunaan pengenalan wajah, sebagian besar untuk tujuan keamanan seperti mengidentifikasi penjahat, mencari orang yang hilang, membantu penyelidikan forensik, dll. Pemasaran cerdas, mendiagnosis penyakit merupakan beberapa kegunaan lainnya.
2. Pengenalan Ucapan Otomatis (Automatic Speech Recognition)
Automatic Speech Recognition disingkat ASR, pengenalan ucapan otomatis digunakan untuk mengubah ucapan menjadi teks digital. Aplikasinya terletak pada autentikasi pengguna berdasarkan suara mereka dan melakukan tugas berdasarkan input suara manusia. Pola ucapan dan kosakata dimasukkan ke dalam sistem untuk melatih model. Saat ini sistem ASR menemukan berbagai macam aplikasi dalam domain berikut:
- Bantuan medis.
- Robotika industri.
- Forensik dan penegakan hukum.
- Pertahanan dan penerbangan.
- Industri telekomunikasi.
- Otomasi rumah dan kontrol akses keamanan.
- Teknologi informasi dan elektronik konsumen.
3. Layanan Keuangan
Pembelajaran mesin memiliki banyak kasus penggunaan dalam layanan keuangan. Algoritma machine learning terbukti sangat baik dalam mendeteksi penipuan dengan memantau aktivitas setiap pengguna dan menilai apakah aktivitas yang dicoba adalah tipikal pengguna tersebut atau tidak. Pemantauan keuangan untuk mendeteksi aktivitas pencucian uang juga merupakan kasus penggunaan keamanan yang penting.
Hal ini juga membantu dalam membuat keputusan perdagangan yang lebih baik dengan bantuan algoritma yang dapat menganalisis ribuan sumber data secara bersamaan. Penilaian kredit dan penjaminan emisi adalah beberapa aplikasi lainnya. Aplikasi yang paling umum digunakan dalam kegiatan sehari-hari adalah asisten pribadi virtual seperti Siri dan Alexa.
4. Pemasaran dan Penjualan
Meningkatkan algoritma penilaian prospek dengan memasukkan berbagai parameter seperti kunjungan situs web, e-mail yang dibuka, unduhan, dan klik untuk menilai setiap prospek. Hal ini juga membantu bisnis untuk meningkatkan model penetapan harga dinamis mereka dengan menggunakan teknik regresi untuk membuat prediksi.
Analisis sentimen adalah penerapan penting lainnya untuk mengukur respons konsumen terhadap produk tertentu atau inisiatif pemasaran. Machine learning untuk computer vision membantu merek mengidentifikasi produk mereka dalam gambar dan video online. Merek-merek ini juga menggunakan computer vision untuk mengukur penyebutan yang melewatkan teks yang relevan. Chatbots juga menjadi lebih responsif dan cerdas.
5. Kesehatan
Aplikasi yang sangat penting adalah dalam diagnosis penyakit dan penyakit, yang jika tidak, akan sulit didiagnosis. Radioterapi juga menjadi lebih baik.
Penemuan obat tahap awal adalah penerapan penting yang melibatkan teknologi seperti obat presisi dan pengurutan generasi berikutnya. Uji klinis menghabiskan banyak waktu dan uang untuk menyelesaikan dan memberikan hasil. Menerapkan analitik prediktif berbasis machine learning dapat meningkatkan faktor-faktor ini dan memberikan hasil yang lebih baik.
Teknologi ini juga penting untuk membuat prediksi wabah. Para ilmuwan di seluruh dunia menggunakan teknologi machine learning untuk memprediksi wabah epidemi.
6. Sistem Rekomendasi
Banyak bisnis saat ini menggunakan sistem rekomendasi untuk berkomunikasi secara efektif dengan pengguna di situs mereka. Sistem ini dapat merekomendasikan produk, film, serial web, lagu, dan banyak lagi yang relevan. Kasus penggunaan sistem rekomendasi yang paling menonjol adalah situs e-commerce seperti Amazon, Flipkart, dan banyak lainnya, bersama dengan Spotify, Netflix, dan saluran web streaming lainnya.
Kesimpulan
Di dunia kita yang terus berkembang, machine learning merupakan titik penting di mana kecerdasan manusia bertemu dengan kecerdasan buatan. Teknologi ini memiliki kekuatan untuk meningkatkan kemampuan kita, mengatasi tantangan yang rumit, dan mengubah industri. Namun, dalam perjalanan kita menuju masa depan ini, sangat penting untuk diingat bahwa machine learning adalah sebuah alat, bukan obat mujarab.
Tanggung jawab ada pada kita, para pencipta dan pengelola teknologi ini, untuk memastikan penggunaan yang etis, inklusivitas, dan kemajuan yang berkelanjutan. Dengan panduan yang bijaksana, machine learning dapat menjadi kekuatan untuk perubahan positif, mendorong inovasi, pemahaman, dan dunia yang lebih terhubung. Pikiran terakhir adalah ketika kita membuka potensi machine learning, mari kita selalu mengutamakan kepentingan terbaik umat manusia, menggunakan alat yang kuat ini untuk meningkatkan kemampuan kita dan menjadikan dunia tempat yang lebih baik bagi semua.
Untuk membaca artikel lain pada Look Media blog, klik pada tautan berikut. Look Media Blog.