What/Apa itu Big Data?
Big data adalah data berukuran besar yang volumenya akan terus bertambah, terdiri dari
berbagai jenis atau varietas data, terbentuk secara terus menerus dengan kecepatan ertentu dan harus diproses dengan kecepatan tertentu pula.
Big data dapat juga idefinisikan data yang sudah sangat sulit untuk dikoleksi, disimpan dan dikelola maupun dianalisa dengan menggunakan system database yang biasa karena volumenya yang terus berlipat.
Dari segi teknologi, akan bermunculan akan pentingnya kemampuan untuk memproses big data. Semenjak itu, teknik akses dan penyimpanan data KVS (Key-Value Store) dan teknik komputasi parallel yang disebut MapReduce.
berbagai jenis atau varietas data, terbentuk secara terus menerus dengan kecepatan ertentu dan harus diproses dengan kecepatan tertentu pula.
Big data dapat juga idefinisikan data yang sudah sangat sulit untuk dikoleksi, disimpan dan dikelola maupun dianalisa dengan menggunakan system database yang biasa karena volumenya yang terus berlipat.
Dari segi teknologi, akan bermunculan akan pentingnya kemampuan untuk memproses big data. Semenjak itu, teknik akses dan penyimpanan data KVS (Key-Value Store) dan teknik komputasi parallel yang disebut MapReduce.
Where/Dimana Big Data digunakan ?
Di saat kebutuhan data yang semakin bertambah para perusahaan yang ingin memiliki informasi yang melebihi dari kebutuhan yang dia punya. para penyedia layanan penyimpanan data dapat menjadi solusi bagi perusahaan tersebut.
When/Kapan membutuhkan Big Data?
Di era yang semakin berkembang dalam penggunaan data, dengan kebutuhan kapasitas yang semakin besar. Data ini berasal dari mana-mana, sensor digunakan untuk mengumpulkan informasi iklim, posting ke situs media sosial, gambar digital dan video, catatan transaksi pembelian, dan sinyal ponsel GPS untuk beberapa nama. Data ini adalah big data.
Why/Kenapa menggunakan Big Data?
Dalam usaha penggunaan Big Data dapat terdapat banyak hambatan dan tantangan, beberapa hal diantaranya berhubungan dengan data dimana melibatkan acquisition, sharing dan privasi data, serta dalam analisis dan pengolahan data
- Privasi
Privasi merupakan isu yang paling sensitif, dengan konseptual, hukum, dan teknologi, Privasi dapat dipahami dalam arti luas sebagai usaha perusahaan untuk melindungi daya saing dan konsumen mereka. Data-data yang digunakan / disimpan sebagai big data
- Access dan sharing
Akses terhadap data, baik data lama maupun data baru dapat menjadi hambatan dalam mendapatkan data untuk big data, terlebih pada data lama dimana data- data tersimpan dalam bentuk – bentuk yang berbeda-beda dan beragam ataupun dalam bentuk fisik, akses terhadap data baru juga membutuhkan usaha yang lebih kerana diperlukannya izin dan lisensi untuk mengakses data-data non-public secara legal.
- Analisis
Bekerja dengan sumber data baru membawa sejumlah tantangan analitis. relevansi dan tingkat keparahan tantangan akan bervariasi tergantung pada jenis analisis sedang dilakukan, dan pada jenis keputusan yang akhirnya akan bisa diinformasikan oleh data.
Tergantung dari jenis data terdapat 3 kategori dalam analisis data
o Penentuan gambaran yang benar
Masalah ini biasanya ditemukan dalam penanganan unstructured user-generated text-based data dimana data yang didapatkan belum tentu benar karena data atau sumber yang salah.
o Interpreting Data
Kesalahan –kesalahan seperti Sampling selection bias merupakan hal yang sering ditemukan dimana data yang ada tidak dapat digunakan untuk mepresentasikan semua populasi yang ada, dan apophenia, melihat adanya pola walaupun tidak benar-benar ada dikarenakan jumlah data yang besar, dan kesalahan dalam menginterpreasikan hubungan dalam data.
o Defining and detecting anomalies
tantangan sensitivitas terhadap spesifisitas pemantauansistem. Sensitivitas mengacu pada kemampuan sistem pemantauan untuk mendeteksi semua kasus sudah diatur untuk mendeteksi sementara spesifisitas mengacu pada kemampuannya untuk mendeteksi hanya kasus-kasus yang relevan. kegagalan untukmencapai hasil yang terakhir "Tipe I kesalahan keputusan", juga dikenal sebagai "positif palsu"; kegagalanuntuk mencapai mantan "Type II error", atau "negatif palsu." Kedua kesalahan yang tidak diinginkan ketika mencoba untuk mendeteksi malfungsi atau anomali, bagaimanapun didefinisikan, untuk berbagai alasan. Positif palsu merusak kredibilitas sistem sementara negatif palsu dilemparkan ragu pada relevansinya. Tapi apakah negatif palsu lebih atau kurang bermasalah daripada positif palsu tergantung pada apa yang sedang dipantau, dan mengapa itu sedang dipantau.
Tergantung dari jenis data terdapat 3 kategori dalam analisis data
o Penentuan gambaran yang benar
Masalah ini biasanya ditemukan dalam penanganan unstructured user-generated text-based data dimana data yang didapatkan belum tentu benar karena data atau sumber yang salah.
o Interpreting Data
Kesalahan –kesalahan seperti Sampling selection bias merupakan hal yang sering ditemukan dimana data yang ada tidak dapat digunakan untuk mepresentasikan semua populasi yang ada, dan apophenia, melihat adanya pola walaupun tidak benar-benar ada dikarenakan jumlah data yang besar, dan kesalahan dalam menginterpreasikan hubungan dalam data.
o Defining and detecting anomalies
tantangan sensitivitas terhadap spesifisitas pemantauansistem. Sensitivitas mengacu pada kemampuan sistem pemantauan untuk mendeteksi semua kasus sudah diatur untuk mendeteksi sementara spesifisitas mengacu pada kemampuannya untuk mendeteksi hanya kasus-kasus yang relevan. kegagalan untukmencapai hasil yang terakhir "Tipe I kesalahan keputusan", juga dikenal sebagai "positif palsu"; kegagalanuntuk mencapai mantan "Type II error", atau "negatif palsu." Kedua kesalahan yang tidak diinginkan ketika mencoba untuk mendeteksi malfungsi atau anomali, bagaimanapun didefinisikan, untuk berbagai alasan. Positif palsu merusak kredibilitas sistem sementara negatif palsu dilemparkan ragu pada relevansinya. Tapi apakah negatif palsu lebih atau kurang bermasalah daripada positif palsu tergantung pada apa yang sedang dipantau, dan mengapa itu sedang dipantau.
Who/Siapa Pengguna Big Data?
Big Data dalam penggunaan perusahaan
- IT logs Analytics
Log jangka panjang, digunakan untuk analisa proses sistem yang sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem, mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti yang dapat digunakan sebagai solusi masalah sistem.
- Fraud Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat, Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk mendeteksi fraud ketika transaksi sedang berlangsung
- The Social Media Pattern
Pengunaan Big data untuk analisa media social dan sentiment pelangan, memberikan kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas, mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap pemasaran yang dilakukan.
- The Call centere Mantra
Penyimpanan hasil perbincangan atau laporan customer dalam bentuk text yang kemudian digunakan sebagai data untuk analisa masalah yang dihadapai customer, memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat maupun secara langsung terhadap masalah yang dihadapi customer, serta kemampuan unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan ketidakpuasaan.
How/Bagaimana membangun Big Data ?
Seperti data pergudangan, toko web atau platform TI, infrastruktur untuk data yang besar memiliki kebutuhan yang unik. Dalam mempertimbangkan semua komponen platform data yang besar, penting untuk diingat bahwa tujuan akhir adalah untuk dengan mudah mengintegrasikan data yang besar dengan data perusahaan Anda untuk memungkinkan Anda untuk melakukan analisis mendalam pada set data gabungan.
Infrastructure Requirements
Requirement dalam big data infrastruktur :
· data acquisition,
· data organization
di bawah ini Tips dari IBM untuk membangun Big Data yang aman
Anggota Kelompok :
Topan Alfarisi http://topanalfa.blogspot.com/
Angga Pradipta http://www.inigayague.com/
Bayu Dwi S http://bayudwisahputra.blogspot.com/
Gustian Maulana http://gustianmaul.blogspot.com/
Show Konversi KodeHide Konversi Kode Show EmoticonHide Emoticon