Senin, 03 Desember 2018

Artikel yang membahas Big Data



1. Apa itu “Big Data” ??

Big Data  adalah istilah umum untuk segala kumpulan himpunan data dalam jumlah yang sangat besar dan kompleks sehingga menjadikannya sulit untuk ditangani atau di proses jika hanya menggunakan manajemen basis data biasa atau aplikasi pemroses data tradisional.

Big Data menjamin pemrosesan solusi data dengan varian baru maupun yang sudah ada untuk memberikan manfaat nyata bagi bisnis. Namun pengolahan data dengan ukuran dan kompleksitas besar tetap sekedar solusi teknologi kecuali jika dikaitkan dengan tujuan bisnis.

Hal terpenting dari Big Data bukanlah sekedar kemampuan teknis untuk mengolah data melainkan manfaat yang dapat disadari oleh perusahaan dengan menggunakan Big Data Analytics Terminologi Big Data diyakini berasal dari perusahaan pencarian web yang mengolah data dengana gregasi yang terdistribusi sangat besar dan tidak terstruktur.
  

2. Sejarah dan perkembangannya

Sekitar tahun 2005, orang mulai menyadari bahwa ada banyak data yang dihasilkan pengguna melalui Facebook, YouTube, dan layanan online lainnya. Hadoop, sebuah open-source software untuk mengumpulkan dan menganalisa data dikembangkan pada tahun yang sama. NoSQL juga mulai mendapatkan popularitas selama ini.

Pengembangan software open-source untuk data, seperti Hadoop (dan yang lebih baru, Spark) memiliki peran penting dalam pertumbuhan big data karena mereka membuat data besar lebih mudah digunakan dan lebih murah untuk disimpan. Pada tahun-tahun sejak saat itu, volume big data terus meningkat. Pengguna masih menghasilkan data dalam jumlah besar — ​​tetapi itu bukan hanya manusia yang melakukannya.

Dengan munculnya Internet of Things (IoT), lebih banyak objek dan perangkat terhubung ke internet. Produsen pun melakukan pengumpulan data tentang pola penggunaan pelanggan dan kinerja produk. Munculnya machine learning juga telah menghasilkan lebih banyak data.


3. Tantangan dalam Big Data

Meskipun big data memberi banyak kemudahan, bukan berarti tidak ada tantangan dalam menggunakannya. Salah satu kesalahan yang sering terjadi adalah perusahaan atau organisasi hanya menggunakan data tanpa melibatkan manusia. Padahal untuk bisa menggunakan data tersebut dengan baik dan benar, perlu campur tangan manusia untuk mempelajarinya.
Yang pertama perlu diingat, big data memiliki jumlah yang besar. Meskipun sudah ada tools yang bisa membantu Anda untuk menyimpan data-data ini, volume data terus meningkat setiap tahunnya. Masih banyak organisasi yang kesulitan menampung data-datanya.

Tidak hanya untuk ditampung, data-data ini juga perlu diolah. Untuk mengolah data agar data-data yang Anda miliki sudah bersih atau sesuai dengan kebutuhan klien dan organisasi membutuhkan banyak pekerjaan. Data scientist menghabiskan 50-80% waktu mereka untuk menganalisa dan mempersiapkan data agar bisa digunakan.

Akhirnya, teknologi big data terus berubah dengan sangat cepat. Beberapa tahun yang lalu, Apache Hadoop adalah teknologi populer yang digunakan untuk menangani data besar. Kemudian Apache Spark diperkenalkan pada tahun 2014. Saat ini, kombinasi dari dua software ini tampaknya merupakan pendekatan terbaik. Mengikuti teknologi big data masih menjadi suatu tantangan berkelanjutan baik untuk individual maupun organisasi.


4. Pendidikan dengan Big Data

Big Data bisa menjadi sangat bermanfaat bagi dunia pendidikan, sudah banyak sekolah dan lembaga pendidikan di berbagai negara maju menggunakannya untuk mengolah data-data dan informasi mengenai siswa dengan cepat. Selain itu, big data dapat membantu pendidik menemukan hal-hal seperti seberapa baik siswa belajar, serta laporan kehadiran siswa. 

Setiap tahun, sekolah membuka pendaftaran baru bagi siswa maupun guru baru yang ingin mendaftar, menjadi guru baru memiliki tantangan tersendiri, tantangan utama yang dihadapi para guru adalah menyesuaikan pengajaran mereka terhadap siswa-siswa yang berbeda karakternya, yang masing-masing belajar dengan pemahaman mereka dan metode yang mereka pahami sendiri. 

Di sini, Big Data bisa membantu menempatkan sistem untuk pembelajaran adaptif, selain itu big data juga dapat membantu guru menyesuaikan kecepatan instruksi yang diberikan berdasarkan minat dan kemampuan masing-masing siswa

Big data juga berperan dalam pembuatan laporan spesifik bagi siswa maupun orang tua siswa. Laporan spesifik yang dimaksud di sini adalah laporan yang menunjukan di bidang seorang siswa lebih unggul. Dengan adanya big data, sekolah dapat mengumpulkan data-data terkait kemudian mengolahnya dengan sangat mudah dan cepat. 

Selain itu, jika orang tua ingin mengetahui perkembangan anak mereka, mereka akan memperoleh gambaran yang lebih jelas dan lengkap tentang perkembangannya, semua itu bisa diperoleh dengan waktu yang relatif cepat.

Setiap sekolah sangat membutuhkan informasi-informasi di atas untuk mengevaluasi cara belajar-mengajar, pemberian tugas, kegiatan di luar kelas dan lain lain. Seorang guru terkadang merasa sulit untuk menentukan hal apa yang harus diberikan perhatian ekstra atau apa yang perlu dilakukan ketika seorang siswa baru bergabung ke dalam kelas. Dengan adanya analitik big data, guru-guru akan dengan mudah memfasilitasi pertukaran data antar sekolah dan memecahkan masalah tersebut.

Setiap sekolah memiliki jalur berbeda untuk siswa berbakat. Berbakat atau tidaknya siswa dilihat dari apakah siswa mampu mempelajari atau mengerjakan soal yang lebih menantang atau di atas kemampuannya. Dengan ini big data dapat membantu mengidentifikasi siswa berbakat dan siswa yang kurang berbakat, yang siap untuk pindah ke tingkat selanjutnya atau pindah ke tingkat yang lebih tinggi.


5. Karakteristik Big Data

Sebelum melangkah pada System Integrasi, kita perlu mengenal kerakteristik Big Data. Big Data memiliki 5 karakteristik penting yang harus dipahami. Berikut karakteristik Big Data:

1. Data Lebih Banyak
Random sampling pada Small Data sebenarnya adalah alternatif dari mengumpulkan dan menganalisis dataset penuh, karena keterbatasan teknologi dan kapasitas penyimpanan. Kelemahannya adalah sampling membutuhkan perencanaan dan eksekusi yang hati-hati serta bekerja dalam subset membantu perusahaan meadapat apa yang dicari lebih cepat dan murah tetapi melewatkan pertanyaan yang tidak terpikirkan sebelumnya.

Big Data sebagai meruapakan keseluruhan informasi, namun ukurannya data sendiri tidak melulu besar. Contahnya saat terngukapnya kecurangan pertandingan sumo di Jepang. Data yang digunakan bukan sampel, tapi N=all. Setelah mengumpulkan data 64.000 pertandingan selama 11 tahun terakhir, ternyata data tersebut hanya berukura sama dengan file foto digital. Dengan prisip N=all diperoleh suatu pola yang menunjukan baha pesumo yang lebih membutuhkan kemenangan memiliki peluang 25% lebih besar untuk menang.

2. Berantakan (Messy)
Big data meciptakan dataset yang lebih berantakan, namun mampu memberikan gamberab yang lebih menyeluruh, meskipun tidak terstruktur. Contohnya Google Translate, perusahaan yang bermarkas di Mountain View, California, AS ini mengumpulkan seluruh dokumen dengan terjemahan yang mereka bisa kumpulkan dengan kualitas yang berbeda-beda. Data yang dikumpulkan memang berantakan namun terjemahan yang dihasilkan lebih akurat daripada sistem yang lebih berdasarkan alogaritma, dan jauh lebih kaya (meliputi 60 bahasa).

3. Korelasi
Big Data sering memprediksi berdasarkan korelasi, ketimbang hungungan sebeb akibat. Contoh, pada awalnya Amazon.com mengandalkan review dari suatu tim ahli “The Amazon Voice”. Kemudian mereka menggunakan rekomendasi yang dihasilkan dari personalisasi penjualan produk (pelangga yang memberi produk A cenderung membeli produk B maka juka pelanggan lain membeli produk A, Amazon akan merekomendasikan produk B). Kini sepertiga penjualan Amazon diperoleh dari penawaran produk ke user dari hasil rekomendasi berdasarkan personalisasi.

4. Datafikasi
Mendatafikasi suatu fenomena adalah menyimpannya dalam format yang terkuantifikasi agar bisa ditabulasi dan dianalisis serta menangkap informasi dan menyimpannya dalam format data yang memudahkannya untuk digunakan kembali. Memindahkan data ke bentuk digital belum tentu mendatafikasi.

5. Value
Mengumpulkan data adalah hal yang krusial namun tidak cukup karena kebanyakan nilai dari data terletak pada penggunaan, bukan kepemilikan. Dalam era Big Data, seluruh data akan dianggap berharga, bahkan data paling menda dan sepele. Tidak seperti sumber daya lain, nilai data tidak berkurang setelah digunakan. Biaya petimpanan digital telah berkurang setengahnya setiap dua tahun, sementara storage density meningkat 50 juta kali dalam 50 tahun terakhir.(**)
 

 
 

 



SUMBER :

Tidak ada komentar:

Posting Komentar

SEARCHING 2

BINERY SERCHING A. Pengertian Searching Searching adalah mencari data yang dibutuhkan. Searching dalam pemrograman bisa d...