Ada fakta lawas yang sebenarnya tidak terlalu mengejutkan tentang dunia wirausaha di Amerika Serikat. Dalam lima tahun pengumpulan data sampai dengan tahun 2018, sebanyak 70% sampai dengan 90% perusahaan startup yang didirikan oleh Entrepreneur muda di negara tersebut gagal, baik berujung likuidasi atau sekadar berhenti beroperasi. 

Mengapa demikian? Apakah kurang ide, kurang investor, atau belum adanya teknologi yang tersedia? Ternyata jawabannya adalah kekurangan konsumen yang berlanjut ke hilangnya kontinuitas pendapatan. 

Ya, kurangnya konsumen berarti startup ini tidak berhasil sepenuhnya mengatasi permasalahan yang ada dalam masyarakat. Dengan kata lain, para founders telah salah bertanya kepada konsumen tentang produk apa yang sebenarnya mereka butuh.

Fakta di atas mempertegas bahwa mengajukan pertanyaan yang tepat kepada konsumen adalah hal krusial dan harus dipahami oleh para petinggi perusahaan. Lalu bagaimana kaitannya dengan pemerintahan? 

Pada dasarnya pemerintahan dan perusahaan adalah struktur organisasi yang mirip. Oleh karena itu, pengambil keputusan di pemerintahan juga harus didahului oleh pengajuan pertanyaan yang tepat kepada rakyat sebagai konstituen. 

Kebijakan yang sama juga seharusnya berlaku dalam keputusan pemerintah untuk membangun infrastruktur fisik. Sebuah topik hangat yang tampaknya dapat digoyang demi kepentingan politis.

Pertanyaan yang Tepat kepada Data

Indonesia adalah negara yang sangat beragam. Kontur alamnya yang terbentang dari barat ke timur dengan panjang mirip benua Eropa menimbulkan konsekuensi perbedaan budaya dan kebutuhan antardaerah. Bahkan, di dalam satu provinsi pun, tiap daerah mempunyai kebutuhan infrastruktur yang berbeda. Salah satu kunci memahami perbedaan kebutuhan ini adalah dengan menganalisis data sebaik mungkin. 

Dengan analisis data yang tepat, keputusan yang dihasilkan dijamin akan lebih akurat. Makin lengkap suatu data, berarti makin banyak variabel yang dimanfaatkan menjadi bahan pertimbangan keputusan. 

Di permukaan, tampaknya pendekatan mengumpulkan data sebanyak-banyaknya adalah pendekatan yang benar. Akan tetapi, ada yang lebih penting, yaitu mengajukan pertanyaan yang tepat terhadap data. 

Dengan pertanyaan yang tepat, data dapat dikumpulkan dengan singkat, dan keputusan yang diambil lebih berkualitas. Seperti telah dipaparkan sebelumnya, pertanyaan-pertanyaan seputar data seharusnya berselaras dengan permasalahan konsumen. 

Namun, ada satu masalah yang mengganjal, data-data yang luar biasa banyak yang telah dikumpulkan pemerintah adalah data reaktif dan statis, seperti data demografis, geografis, dan keuangan, sedangkan untuk data yang sifatnya proaktif seperti statistik wawancara, masih kurang diperhatikan. 

Padahal, dengan mengetahui keinginan masyarakat seutuhnya, penentu kebijakan di pemerintahan dapat mengalokasikan sumber daya yang tepat guna dalam pembangunan infrastruktur. Permasalahan inilah yang akan kita cari solusinya.

Seorang ahli geografi dan sejarah berkebangsaan Amerika Serikat bernama Jared Mason Diamond pernah mendeskripsikan dengan jelas pentingnya mengatur sumber daya yang dimiliki agar kehidupan suatu bangsa tetap terjamin. 

Di dalam bukunya, Collapse: How Societies Choose to Fail or Succeed, yang diterbitkan tahun 2005, Diamond berargumen bahwa menurunnya jumlah penduduk suatu bangsa atau pengaruh budayanya terhadap bangsa sekitar diakibatkan oleh faktor lingkungan dan masalahnya, serta respons bangsa itu sendiri dalam menyikapi permasalahan. 

Profesor Ilmu Sosial dari University of California (UCLA) itu menambahkan bahwa masalah lingkungan adalah akar permasalahan yang sebenarnya berawal dari ketidakmampuan suatu bangsa mengalokasikan sumber daya yang dimiliki dalam skala prioritas. Pemikiran tersebut lahir dari observasi Diamond kepada banyak bangsa yang sekarang punah atau sedang dalam masa kepunahan. 

Sebagai contoh, daerah Montana Amerika Serikat yang gagal mengendalikan limbah beracun dari industri sehingga berkurangnya lahan pertanian. Semua ini berawal dari budaya masyarakat Montana yang kurang cakap mengatur sumber daya yang dimilikinya.

Berangkat dari pemikiran tersebut, penulis berupaya mencari benang merah dari tiga aspek penting pembangunan infrastruktur: riset pokok masalah, manajemen data, dan alokasi sumber daya. Tujuan final dari metode ini agar data yang luar biasa banyak dapat dikombinasikan dengan pokok masalah yang dihadapi penduduk untuk dicek kembali realitasnya di lapangan. 

Langkah berikutnya, menyusun skala prioritas berdasarkan hasil tersebut dan mengatur pemanfaatan sumber daya untuk pembangunan infrastruktur. Konsep check and re-check ini akan lebih mudah dipahami dengan contoh ­spesifik.

Contoh sederhana nyata adalah distribusi barang antara Kota Palembang sebagai pusat ekonomi di timur dan Kota Lubuk Linggau di ujung barat, yang keduanya berada di Provinsi Sumatra Selatan. Sudah menjadi bahasa umum bahwa letak kota Lubuk Linggau yang jauh dari ibu kota provinsi, Palembang, banyak memengaruhi level distribusi yang belum lancar.

Pertanyaan yang kerap terbentuk di level pemutus adalah apakah perlu dan mendesak untuk memperbaiki jalan penghubung antardua kota? 

Untuk mencari penyelesaian hal tersebut, lembaga yang berwenang dapat mulai dengan mengumpulkan data statis, seperti seberapa baiknya infrastruktur jalan, lalu lintas kendaraan pengangkut barang dan orang antarkota per hari, jenis barang kebutuhan pokok yang biasa diangkut, potensi pertambahan penduduk usia produktif, dan lain-lain. 

Data demografis ini ditambahkan dengan data potensi ekonomi yang diekstrak dari data perbankan, seperti mutasi rekening antardaerah dan tingkat likuiditas uang tunai. Sampai di sini, pengambil kebijakan pun belum dapat dikatakan tuntas melakukan tugasnya. 

Perlu ada upaya crosscheck dengan realitas lapangan dengan metode terobosan baru yang efisien sebelum masuk ke tahap berikutnya. Metode yang baru inilah yang penulis usulkan untuk memakai big data dari media sosial.

Big Data dan Akurasi Keputusan

Mengapa data media sosial yang dipilih? Bukankah galat data dikhawatirkan terlalu lebar? Dengan metode apa suatu pendapat di media sosial dapat dibuktikan? Pertanyaan – pertanyaan ini yang mungkin muncul apabila kita mendengar ide gathering data from social media. Pendekatan yang out of the box memang berisiko, tetapi bukan berarti belum terbukti. 

Adalah perusahaan riset marketing yang telah lebih terbiasa memanen data konsumen dari media sosial dan internet untuk menganalisis tren pasar terhadap suatu produk. Internet marketing yang selama ini hanya untuk kepentingan konsumtif dapat diberdayakan untuk hal-hal yang lebih luas, contohnya menentukan arah kebijakan pemerintah. 

Perusahaan mesin pencari terbesar di dunia, Google, menggunakan keyword index untuk mengukur perilaku seseorang dan menebak keinginan mereka berikutnya. Boleh jadi pada suatu kali seorang user mengetikkan kalimat “kursus bahasa Inggris terdekat” di Google, dan dalam sekejap di laman media sosial Facebook muncul iklan tempat kursus bahasa Inggris. 

Atau contoh lain, ketika seseorang sering belanja kebutuhan bayi di situs e-commerce Amazon, dan tak lama diberikan sugesti produk-produk susu formula, bahkan sebelum orang tersebut mengetikkan lafal produk susu. 

Hal-hal menarik itu dilakukan secara otomatis oleh mesin, dan prediksi yang muncul makin baik seiring berjalannya waktu dan bertambahnya data. Dari sini lahirnya istilah Big Data dan Machine Learning. Keduanya adalah bagian dari Predictive Analytics.

Kunci dari tepatnya sebuah prediksi adalah garansi bahwa respons dari pengguna dilakukan dalam lingkungan yang terkontrol. Google, Facebook, dan Amazon serta media-media sosial lainnya mampu mengontrol platformnya dengan baik. 

Konten-konten SARA, pornography, dan berita-berita bohong dapat sebagian besar dieliminasi oleh machine learning. Jangan lupakan peran serta pengguna yang turut memantau dan melaporkan konten-konten yang kurang bermanfaat. Ruang gerak yang bebas tetapi terkontrol ini menjamin kualitas dari prediksi dari data media sosial. 

Tak heran jika pendapatan Google, Facebook, dan Amazon bahkan lebih besar dari pendapatan suatu negara berdaulat. Hal ini disebabkan pengguna layanan puas dengan tepatnya prediksi marketing yang dihasilkan sehingga mereka berani membayar mahal demi data yang akurat. 

Ini semua menegaskan bahwa sebenarnya tidak ada keraguan dari memanen data lewat media sosial seperti yang disangsikan sebelumnya.

Panen Opini Lewat Data Media Sosial

Kembali ke contoh Kota Palembang dan Lubuk Linggau. Data-data reaktif yang sebelumnya didapatkan sangat berguna untuk membangun asumsi. Data reaktif seperti data demografis dan data ekonomi dapat menentukan hipotesis awal apakah perlu memperbaiki jalur distribusi di antara kedua daerah atau malah sumber daya yang ada dapat dialihkan ke daerah lain yang secara prioritas lebih membutuhkan.

Demi kesederhanaan pembahasan, penulis mendapatkan data dari Biro Pusat Statistik (BPS) Kota Lubuk Linggau bahwa tingkat konsumsi masyarakat tergolong tinggi terhadap bahan bangunan untuk perumahan, bahan bakar, baik untuk transportasi/konsumsi listrik, dan produk jadi seperti pakaian dan minuman. 

Sumber yang sama juga menyatakan bahwa ketergantungan masyarakat terhadap bahan makanan pokok dan hasil pertanian tidak terlalu besar sehingga penduduk mempunyai cadangan yang dapat dijual ke daerah lain. 

Sebagai tambahan, data perbankan dari bank-bank regional menunjukkan adanya transfer dana yang signifikan antara kota Palembang dan Lubuk Linggau, terutama di akhir minggu, dan likuiditas dana yang stabil. Kombinasi data demografis dan ekonomi ini berkesimpulan bahwa terdapat potensi yang besar akan distribusi barang antar-kedua daerah.

Kenyataan infrastruktur di lapangan mengindikasikan bahwa tidak ada jalan lebar yang menghubungkan barat ke timur di Provinsi Sumatra Selatan. Yang ada hanya jalan Lintas Sumatra dari Selatan (Provinsi Lampung) ke Utara (Bengkulu). Dan melalui jalan ini pula masyarakat kota Lubuk Linggau memenuhi kebutuhannya. 

Lalu apakah perlu membangun infrastruktur jalan lintas dari barat ke timur seperti yang disugestikan oleh data statis? Mari kita gunakan media sosial untuk menjawabnya.

Langkah pertama, pemerintah harus membuat lingkungan terkendali di media sosial. Caranya dengan membuka akun resmi di laman media sosial populer seperti Facebook dan Instagram di mana masyarakat asli kota Lubuk Linggau dan Palembang dapat memberikan opini. 

Opini yang akan diterima akan sangat banyak, maka cara menyiasatinya adalah dengan close questions. Pertanyaan-pertanyaan yang diajukan harus dapat diukur secara akumulasi dan tidak boleh ambigu serta harus disesuaikan dengan variabel-variabel data yang nantinya diperlukan dalam mengambil keputusan.

Contoh sederhana, seorang partisipan diminta menjawab pertanyaan frekuensi bepergian yang dilakukannya antara dua kota dalam satu bulan, jenis barang yang dibawa, mode transportasi yang digunakan, dan rute yang dilalui. 

Pertanyaan ini lalu dikembangkan dengan kabupaten-kabupaten apa saja yang dilalui ketika bepergian, termasuk menyebutkan kota-kota kecil yang disinggahi. Hal ini sangat penting karena membuktikan efektivitas dari infrastruktur yang dibangun sekarang sekaligus mencari tahu efek pelimpahan ekonomi di sepanjang jalan infrastruktur tersebut.

Langkah kedua adalah verifikasi responden untuk menjamin validitas data. 

Sebelum memberikan opini, responden diminta untuk memasukkan data diri yang dimiliki seperti umur, gender, pekerjaan, dan alamat singkat. Pengguna juga diharuskan memberikan nomor identitas seperti KTP dan NPWP untuk memastikan bahwa pemberi opini adalah masyarakat yang akan menikmati hasil dan bukan penyusup yang bisa mendistorsi data.

Validitas data sangat bergantung pada langkah ini karena responden adalah orang yang benar menjadi subjek penderita dalam kegiatan distribusi barang antar-kedua wilayah. Langkah kedua ini juga bertujuan mengidentifikasi data outlier dan mengurangi variability (standar deviasi) yang mungkin terjadi dari tidak terkontrolnya subjek responden.

Langkah ketiga adalah responden memberikan bukti yang dapat diunggah di media sosial. Contoh konkretnya, unggahan foto yang ber-tag koordinat GPS. Pada bagian sebelumnya, terdapat ide untuk menjabarkan kota-kota yang disinggahi oleh orang yang melakukan perjalanan di antara dua kota. 

Fungsi lain dari unggahan foto ini adalah memberikan lokasi yang sangat spesifik untuk pengembangan usaha, contohnya membuka rumah makan, bengkel, atau pasar tradisional. Data berupa koordinat GPS ini kemudian diolah dan menjadi justifikasi untuk pengembangan infrastruktur atau hanya perbaikan jalan biasa. 

Diharapkan tidak ada lagi efek samping pembangunan jalan yang justru mematikan ekonomi masyarakat sekitar. Justru dengan dibangunnya infrastruktur jalan, ekonomi masyarakat akan makin terpacu.

Langkah keempat adalah kontinuitas aliran data. Data yang dikumpulkan melalui metode media sosial pada awalnya kecil. Namun, dengan promosi yang tepat, masyarakat akan dapat dimotivasi untuk berpartisipasi aktif dalam wadah media sosial. Tidak hanya sekali, namun secara berkelanjutan. 

Hal ini penting agar big data yang dimiliki dapat diteruskan menjadi prediction model. Model yang dibangun oleh data yang terus-menerus berevolusi dapat menambah akurasi keputusan. Hal ini sejalan dengan konsep machine learning yang mana setiap prediksi yang dihasilkan akan lebih baik karena dapat mengenali pola-pola tingkah laku dari responden.

Sebagai kesimpulan, metode memanen data dari media sosial yang sifatnya proaktif bertujuan sebagai sarana cross check setiap perencanaan yang dibangun dari data reaktif. Hal ini bertujuan untuk mengetes respons masyarakat atas kondisi infrastruktur yang telah ada sekarang dan apa keinginan mereka untuk perbaikannya ke depan. 

Tiga komponen kegiatan yang disebutkan dalam tulisan ini, yaitu riset pokok masalah, manajemen data, dan alokasi sumber daya, yang kesemuanya mengandung argumen bahwa data mempunyai peran yang strategis dalam penentuan kebijakan. Dengan demikian, konflik antara kepentingan jangka pendek penguasa dengan kepentingan jangka panjang masyarakat dalam tarik ulur pembangunan infrastruktur diharapkan tidak terjadi lagi.