Penerapan Database MongoDB dengan Jupyter Notebook

1. Apa itu MongoDB?
MongoDB adalah sebuah database NoSQL (Not Only SQL) yang bersifat dokumen, artinya data disimpan dalam format BSON (Binary JSON) yang terstruktur. MongoDB dirancang untuk menyimpan dan mengelola data yang bersifat semi-struktural atau tidak terstruktur, dan cocok untuk aplikasi yang memerlukan skalabilitas horizontal dan fleksibilitas skema.

2. Mengapa MongoDB?
MongoDB menggunakan model data dokumen yang memungkinkan fleksibilitas skema. Setiap dokumen dalam koleksi dapat memiliki struktur yang berbeda, memungkinkan perubahan skema tanpa perlu memodifikasi seluruh dataset. Sebagai basis data NoSQL, MongoDB dapat menangani data semi-struktural atau tidak terstruktur dengan baik. Ini memungkinkan penyimpanan data yang berbeda-beda dan dapat berkembang seiring waktu tanpa batasan skema yang ketat.

3. Apa itu Jupyter Notebook?
Jupyter Notebook adalah suatu lingkungan komputasi interaktif yang memungkinkan pengguna untuk membuat dan berbagi dokumen yang mengandung teks, kode, gambar, visualisasi, dan hasil analisis data secara terintegrasi. Dikembangkan oleh proyek Jupyter, namanya diambil dari tiga bahasa pemrograman utama yang didukung: Julia, Python, dan R.

4. Penerapan
Sebelum melakukan praktek penerapan database, tentunya kita membutuhkan data yang akan diolah nantinya. Kita dapat mencari data dilaman web kaggle.com


Import Data dari File CSV ke MongoDB Menggunakan Python

a. Membaca data dari file CSV, mengonversinya ke format yang sesuai, dan menyimpannya ke dalam MongoDB.

Kita akan menggunakan pymongo untuk menghubungkan Python dengan MongoDB. Pertama import library yang diperlukan, termasuk pandas untuk manipulasi data, matplotlib untuk visualisasi, dan pymongo untuk berinteraksi dengan MongoDB. Selanjutnya, dilakukan koneksi ke server MongoDB yang berjalan lokal dengan port 27017, dan ganti nama database dan collection, contoh database 'covid-19' beserta collection'user'. Data COVID-19 Indonesia dibaca dari file CSV ke dalam DataFrame menggunakan pandas. DataFrame tersebut kemudian dikonversi menjadi format yang sesuai untuk penyimpanan di MongoDB. Terakhir, data disisipkan ke dalam koleksi 'user' pada database 'covid-19' di MongoDB.


Membangun Aplikasi MongoDB dengan Fungsionalitas CRUD dan Visualisasi Data Menggunakan Python

a. CRUD 
Pendefinisian fungsi CRUD ini mencakup pembuatan dokumen baru (Create), membaca dokumen (Read), memperbarui dokumen (Update), serta menghapus dokumen (Delete).

    1. Create
    Kita akan menambahkan data baru ke dalam database covid-19. Seperti contoh berikut:

Dengan output sebagai berikut:


    2. Read
    Untuk membaca data dari database 'covid-19', kita akan menggunakan fungsi collection.find()

    3. Update dan Delete
    Update
Kita akan memperbarui data 1/12/2019 dengan mengubah New Recovered nya. Pada contoh ini, kita akan menaikkan jumlah New Recovered menjadi 37.

    Delete
Kita akan menghapus data 1/12/2019 dari koleksi.

b. Visualisasi Data
Kita akan membuat fungsi untuk menampilkan visualisasi data histogram, line chart, dan pie chart.







Komentar

Postingan Populer