081296718180 mastrie90@gmail.com

Data analytics merupakan ilmu untuk menganalisis data mentah menjadi informasi yang digunakan untuk membuat keputusan, yang meliputi prosedur sebagai berikut : busines question, get data, explore data, prepare data, analize data, present finding

Secara umum jenis data dibedakan menjadi 4, yaitu :

  • Descriptive analytics, untuk mengambarkan apa yang sedang terjadi
  • Diagnostic analytics, untuk mengambarkan penyebab kejadian
  • Predictive analytics, untuk mengambarkan kejadian yang akan terjadi
  • Perspective analytics, untuk mengambarkan apa yang harus dilakukan

Adapun type data dibedakan menjadi 2, yaitu :

  • Quantitative : menggambarkan kuantitas atau jumlah suatu variabel yang bersifat numerik, terdiri dari : data diskrit dan data kontiyu berupa interval dan rasio
  • Qualitative : menggambarkan kualitas atau atribut suatu variabel yang bersifat deskriptif, terdiri dari : data nominal dan data ordinal

Database adalah kumpulan data yang terstruktur dan terorganisir dengan baik, yang disimpan di dalam komputer atau sistem informasi untuk tujuan penyimpanan, pengelolaan, dan pengambilan informasi, adapun komponennya meliputi :

  • Tabel: merupakan bagian dasar dari sebuah database yang menyimpan data dalam bentuk baris dan kolom. Setiap kolom mewakili atribut atau field, sedangkan setiap baris mewakili catatan atau data.
  • Kunci Primer (Primary Key): merupakan kolom unik dalam sebuah tabel yang digunakan untuk mengidentifikasi setiap catatan secara unik. Kunci ini penting untuk menjaga integritas data dalam database.
  • Hubungan (Relationships): mengacu pada cara tabel dalam database terhubung satu sama lain. Hubungan ini bisa berupa relasi satu-ke-satu, satu-ke-banyak, atau banyak-ke-banyak.
  • Query: merupakan pernyataan atau perintah yang digunakan untuk mengambil, menyisipkan, mengubah, atau menghapus data dari database. Query digunakan untuk mengambil informasi yang dibutuhkan dari database.
  • Manajemen Data: melibatkan pemeliharaan, pengamanan, backup, dan pemulihan data dalam database. Ini termasuk juga pemantauan performa database untuk memastikan kinerjanya optimal.
Database Management System (DBMS) merupakan perangkat lunak atau sistem perangkat keras yang digunakan untuk mengelola dan mengatur database untuk menyimpan, mengakses, mengelola, dan memanipulasi data dalam database dengan cara yang efisien, aman, dan terstruktur. Adapun jenisnya, antara lain :
  1. Sistem Manajemen Basis Data Relasional (RDBMS):
    • Contoh: MySQL, PostgreSQL, Oracle Database, Microsoft SQL Server.
    • Model data: Data disimpan dalam tabel dengan hubungan relasional antar tabel.
    • Bahasa query: SQL (Structured Query Language) digunakan untuk mengambil dan memanipulasi data.
  2. Sistem Manajemen Basis Data NoSQL (Non-Relational DBMS):
    • Contoh: MongoDB, Cassandra, Redis.
    • Model data: Tidak mengikuti model relasional, dapat berupa basis data dokumen, basis data kolom, basis data grafik, atau basis data key-value.
    • Cocok untuk aplikasi yang memerlukan skema dinamis atau struktur data yang sangat besar.
  3. Sistem Manajemen Basis Data Berorientasi Objek (OODBMS):
    • Contoh: db4o, ObjectDB.
    • Model data: Menggabungkan konsep basis data dengan paradigma berorientasi objek, di mana data disimpan dalam bentuk objek yang dapat berinteraksi dengan metode.
    • Cocok untuk aplikasi yang menggunakan pemrograman berorientasi objek.
  4. Sistem Manajemen Basis Data Terdistribusi (Distributed DBMS):
    • Contoh: Apache Cassandra, Amazon DynamoDB.
    • Data disimpan secara terdistribusi di beberapa node atau server.
    • Cocok untuk aplikasi yang memerlukan skala horizontal dan ketahanan terhadap kegagalan.
  5. Sistem Manajemen Basis Data In-Memory (In-Memory DBMS):
    • Contoh: SAP HANA, Redis.
    • Data disimpan dalam memori utama komputer, yang memungkinkan akses data yang sangat cepat.
    • Cocok untuk aplikasi yang memerlukan kinerja tinggi dan waktu respons rendah.
  6. Sistem Manajemen Basis Data Berorientasi Teks (Text DBMS):
    • Contoh: Apache Lucene, Elasticsearch.
    • Dirancang khusus untuk mencari, mengindeks, dan menganalisis teks atau data berbasis teks.
  7. Sistem Manajemen Basis Data Temporal (Temporal DBMS):
    • Didesain untuk menyimpan data yang berkaitan dengan waktu atau histori.
    • Memungkinkan penelusuran dan analisis data berdasarkan sejarah waktu.
Sedangkan tahapan dalam data analytics, terdiri dari : Discovery Data, Data Preparation, Model Planning, Model Building, Communicating Results, Operationalize. Dan untuk Big Data harus mengandung 5V, yaitu Velocity (kecepatan perekaman data),Volume (data dalam jumlah yang besar), Variety (tipe data yang beragam), Variability, dan Veracity (kualitas data)
Untuk membantu dalam menganalisis data dibutuhkan alat bantu atau tools, ada beberapa hal yang harus diperhatikan dalam memilih tool analisis data, antara lain : jenis data, besar data, visualisasi data, biaya, masalah. Berikut ini tools yang sering digunakan, antara lain :
  • Excel, merupakan tools data analytics yang membantu membuat grafik/bagan dengan cepat dan mudah
  • Tableau, merupakan tool untuk membuat grafik dengan visual menarik dan dashboard interaktif tanpa memerlukan coding
  • Polymer Search, merupakan tool AI (Artificial Intelligence) tanpa code yang dirancang untuk menganalisis data penjualan dan pemasaran
  • Akkio, merupakan tool AI-powered yang memungkinkan menjadi data scientist tanpa pengalaman coding
  • SQL, merupakan bahasa pemrograman yang digunakan untuk query dan manipulasi data
  • R, merupakan tool untuk menangani big data dalam prosedur analisis statistik, terutama exploratory data analysis (EDA)
  • SPSS,  merupakan tool point-and--click untuk berbagai tes dan jenis regresi
  • Python, merupakan bahasa pemrograman high-level yang ditulis secara internal dalam bahasa C
  • Power BI, memiliki kemampuan visualisasi data lebih komprehensif dengan memiliki fitur manipulasi dan pembersihan data menggunakan bahasa DAX

Ada beberapa kompetensi yang harus dikuasai untuk menjadi seorang data analitik, antara lain :

  • Pemecahan Masalah & Pemikiran Analitis
  • Matematika & Statistik (bekerja dengan data/angka)
  • Keahlian Basis Data & Pemrograman (R, Python, SQL)
  • Kemampuan berkomunikasi

Pengetahuan statistik sangat diperlukan dalam analisis data, terutama dalam memastikan kualitas data, yang meliputi :

  • Measures of Frequensy, meliputi : Count, Persent, Frequensy
  • Measures of Central Tendency, meliputi : Mean, Median, Mode
  • Measures of Dispersion, meliputi : Range, Min, Max, Standar Deviasi
  • Measures of Positition, meliputi : Percentile, Quartil
  • Distribusi Normal dan Uji Hipotetis
  • Analisa Korelasi
  • Analisa Kluster
  • Analisis Data Eksploratif atau Exploratory Data Analysis (EDA), pembuatan grafik, histogram, box plot, scatter plot, serta perhitungan statistik deskriptif seperti mean, median, modus, deviasi standar, dan kuartil

HAL YANG HARUS DIPERHATIKAN DALAM DATA ANALITIK ADALAH MEMBERSIHKAN DATA DARI DATA SAMPAH, KARENA DATA YANG SALAH AKAN MENGHASILKAN ANALISA DATA YANG SALAH – GARBAGE IN GARBAGE OUT –