1. Apa itu
“Big Data” ??
Big Data adalah istilah umum untuk segala
kumpulan himpunan data dalam jumlah yang sangat besar dan kompleks sehingga
menjadikannya sulit untuk ditangani atau di proses jika hanya menggunakan
manajemen basis data biasa atau aplikasi pemroses data tradisional.
Big
Data menjamin pemrosesan solusi data dengan varian baru maupun yang sudah ada
untuk memberikan manfaat nyata bagi bisnis. Namun pengolahan data dengan ukuran
dan kompleksitas besar tetap sekedar solusi teknologi kecuali jika dikaitkan
dengan tujuan bisnis.
Hal
terpenting dari Big Data bukanlah sekedar kemampuan teknis untuk mengolah data
melainkan manfaat yang dapat disadari oleh perusahaan dengan menggunakan Big
Data Analytics Terminologi Big Data diyakini berasal dari perusahaan pencarian
web yang mengolah data dengana gregasi yang terdistribusi sangat besar dan
tidak terstruktur.
2. Sejarah dan perkembangannya
Sekitar tahun 2005, orang mulai
menyadari bahwa ada banyak data yang dihasilkan pengguna melalui Facebook,
YouTube, dan layanan online lainnya. Hadoop, sebuah open-source software untuk
mengumpulkan dan menganalisa data dikembangkan pada tahun yang sama. NoSQL juga
mulai mendapatkan popularitas selama ini.
Pengembangan software
open-source untuk data, seperti Hadoop (dan yang lebih baru, Spark) memiliki
peran penting dalam pertumbuhan big data karena mereka membuat data besar lebih
mudah digunakan dan lebih murah untuk disimpan. Pada tahun-tahun sejak saat
itu, volume big data terus meningkat. Pengguna masih menghasilkan data dalam
jumlah besar — tetapi itu bukan hanya manusia yang melakukannya.
Dengan munculnya Internet of
Things (IoT), lebih banyak objek dan perangkat terhubung ke
internet. Produsen pun melakukan pengumpulan data tentang pola penggunaan
pelanggan dan kinerja produk. Munculnya machine learning juga telah
menghasilkan lebih banyak data.
3. Tantangan dalam Big Data
Meskipun big data memberi banyak
kemudahan, bukan berarti tidak ada tantangan dalam menggunakannya. Salah satu
kesalahan yang sering terjadi adalah perusahaan atau organisasi hanya
menggunakan data tanpa melibatkan manusia. Padahal untuk bisa menggunakan data
tersebut dengan baik dan benar, perlu campur tangan manusia untuk
mempelajarinya.
Yang pertama perlu diingat, big
data memiliki jumlah yang besar. Meskipun sudah ada tools yang bisa membantu
Anda untuk menyimpan data-data ini, volume data terus meningkat setiap tahunnya.
Masih banyak organisasi yang kesulitan menampung data-datanya.
Tidak hanya untuk ditampung,
data-data ini juga perlu diolah. Untuk mengolah data agar data-data yang Anda
miliki sudah bersih atau sesuai dengan kebutuhan klien dan organisasi
membutuhkan banyak pekerjaan. Data scientist menghabiskan 50-80% waktu mereka
untuk menganalisa dan mempersiapkan data agar bisa digunakan.
Akhirnya, teknologi big data
terus berubah dengan sangat cepat. Beberapa tahun yang lalu, Apache Hadoop
adalah teknologi populer yang digunakan untuk menangani data besar. Kemudian
Apache Spark diperkenalkan pada tahun 2014. Saat ini, kombinasi dari dua
software ini tampaknya merupakan pendekatan terbaik. Mengikuti teknologi big
data masih menjadi suatu tantangan berkelanjutan baik untuk individual maupun
organisasi.
4. Pendidikan dengan Big Data
Big Data bisa menjadi sangat
bermanfaat bagi dunia pendidikan, sudah banyak sekolah dan lembaga pendidikan
di berbagai negara maju menggunakannya untuk mengolah data-data dan informasi
mengenai siswa dengan cepat. Selain itu, big data dapat membantu pendidik
menemukan hal-hal seperti seberapa baik siswa belajar, serta laporan kehadiran
siswa.
Setiap tahun, sekolah membuka
pendaftaran baru bagi siswa maupun guru baru yang ingin mendaftar, menjadi guru
baru memiliki tantangan tersendiri, tantangan utama yang dihadapi para guru
adalah menyesuaikan pengajaran mereka terhadap siswa-siswa yang berbeda
karakternya, yang masing-masing belajar dengan pemahaman mereka dan metode yang
mereka pahami sendiri.
Di sini, Big Data bisa membantu
menempatkan sistem untuk pembelajaran adaptif, selain itu big data juga dapat
membantu guru menyesuaikan kecepatan instruksi yang diberikan berdasarkan minat
dan kemampuan masing-masing siswa
Big data juga berperan dalam
pembuatan laporan spesifik bagi siswa maupun orang tua siswa. Laporan spesifik
yang dimaksud di sini adalah laporan yang menunjukan di bidang seorang siswa
lebih unggul. Dengan adanya big data, sekolah dapat mengumpulkan data-data
terkait kemudian mengolahnya dengan sangat mudah dan cepat.
Selain itu, jika orang tua ingin
mengetahui perkembangan anak mereka, mereka akan memperoleh gambaran yang lebih
jelas dan lengkap tentang perkembangannya, semua itu bisa diperoleh dengan
waktu yang relatif cepat.
Setiap sekolah sangat
membutuhkan informasi-informasi di atas untuk mengevaluasi cara
belajar-mengajar, pemberian tugas, kegiatan di luar kelas dan lain lain.
Seorang guru terkadang merasa sulit untuk menentukan hal apa yang harus
diberikan perhatian ekstra atau apa yang perlu dilakukan ketika seorang siswa
baru bergabung ke dalam kelas. Dengan adanya analitik big data, guru-guru akan
dengan mudah memfasilitasi pertukaran data antar sekolah dan memecahkan masalah
tersebut.
Setiap sekolah memiliki jalur
berbeda untuk siswa berbakat. Berbakat atau tidaknya siswa dilihat dari apakah
siswa mampu mempelajari atau mengerjakan soal yang lebih menantang atau di atas
kemampuannya. Dengan ini big data dapat membantu mengidentifikasi siswa
berbakat dan siswa yang kurang berbakat, yang siap untuk pindah ke tingkat
selanjutnya atau pindah ke tingkat yang lebih tinggi.
5. Karakteristik Big Data
Sebelum melangkah pada System
Integrasi, kita perlu mengenal kerakteristik Big Data. Big Data memiliki 5
karakteristik penting yang harus dipahami. Berikut karakteristik Big Data:
1. Data Lebih Banyak
Random sampling pada Small Data
sebenarnya adalah alternatif dari mengumpulkan dan menganalisis dataset penuh,
karena keterbatasan teknologi dan kapasitas penyimpanan. Kelemahannya adalah
sampling membutuhkan perencanaan dan eksekusi yang hati-hati serta bekerja
dalam subset membantu perusahaan meadapat apa yang dicari lebih cepat dan murah
tetapi melewatkan pertanyaan yang tidak terpikirkan sebelumnya.
Big Data sebagai meruapakan
keseluruhan informasi, namun ukurannya data sendiri tidak melulu besar.
Contahnya saat terngukapnya kecurangan pertandingan sumo di Jepang. Data yang
digunakan bukan sampel, tapi N=all. Setelah mengumpulkan data 64.000
pertandingan selama 11 tahun terakhir, ternyata data tersebut hanya berukura
sama dengan file foto digital. Dengan prisip N=all diperoleh suatu pola yang
menunjukan baha pesumo yang lebih membutuhkan kemenangan memiliki peluang 25%
lebih besar untuk menang.
2. Berantakan (Messy)
Big data meciptakan dataset yang
lebih berantakan, namun mampu memberikan gamberab yang lebih menyeluruh,
meskipun tidak terstruktur. Contohnya Google Translate, perusahaan yang
bermarkas di Mountain View, California, AS ini mengumpulkan seluruh dokumen dengan
terjemahan yang mereka bisa kumpulkan dengan kualitas yang berbeda-beda. Data
yang dikumpulkan memang berantakan namun terjemahan yang dihasilkan lebih
akurat daripada sistem yang lebih berdasarkan alogaritma, dan jauh lebih kaya
(meliputi 60 bahasa).
3. Korelasi
Big Data sering memprediksi
berdasarkan korelasi, ketimbang hungungan sebeb akibat. Contoh, pada awalnya
Amazon.com mengandalkan review dari suatu tim ahli “The Amazon Voice”. Kemudian
mereka menggunakan rekomendasi yang dihasilkan dari personalisasi penjualan
produk (pelangga yang memberi produk A cenderung membeli produk B maka juka
pelanggan lain membeli produk A, Amazon akan merekomendasikan produk B). Kini
sepertiga penjualan Amazon diperoleh dari penawaran produk ke user dari hasil
rekomendasi berdasarkan personalisasi.
4. Datafikasi
Mendatafikasi suatu fenomena
adalah menyimpannya dalam format yang terkuantifikasi agar bisa ditabulasi dan
dianalisis serta menangkap informasi dan menyimpannya dalam format data yang
memudahkannya untuk digunakan kembali. Memindahkan data ke bentuk digital belum
tentu mendatafikasi.
5. Value
Mengumpulkan data adalah hal
yang krusial namun tidak cukup karena kebanyakan nilai dari data terletak pada
penggunaan, bukan kepemilikan. Dalam era Big Data, seluruh data akan dianggap
berharga, bahkan data paling menda dan sepele. Tidak seperti sumber daya lain,
nilai data tidak berkurang setelah digunakan. Biaya petimpanan digital telah
berkurang setengahnya setiap dua tahun, sementara storage density meningkat 50
juta kali dalam 50 tahun terakhir.(**)
SUMBER :
Tidak ada komentar:
Posting Komentar