Tinggal Klik, Ringkasan Dokumen pun Jadi

TEMPO Interaktif, Jakarta – Nurhasanah kian sibuk hari-hari ini. Editor sebuah penerbitan buku di Bandung ini kebanjiran naskah yang dikirim para penulis lewat surat elektronik. Setiap pekan, sedikitnya empat naskah harus diperiksanya. Karya sastra yang datang mayoritas berbentuk novel. Ada juga karya otobiografi, biografi, dan memoar tokoh ternama. Banjir naskah ini jelas menambah beban kerjanya.

Wanita 29 tahun ini mengaku tak sempat membaca setiap naskah tuntas satu per satu. Bayangkan, kata dia, untuk membaca novel setebal ratusan halaman dibutuhkan waktu minimal setengah hari. Padahal pekerjaannya tidak semata membaca dan memelototi naskah-naskah yang belum tentu mendapat persetujuan terbit itu. “Mengikhtisarkan atau membaca cepat adalah salah satu solusinya,” katanya Senin pekan lalu. Masalah utamanya bukan kemalasan, melainkan keterbatasan waktu membaca seluruh naskah.

Kini editor seperti Nurhasanah mestinya tidak perlu kerepotan lagi menghadapi banjir naskah. Badan Pengkajian dan Penerapan Teknologi (BPPT) telah mengembangkan peranti lunak bernama Sidobi, yang mampu meringkas berlembar-lembar dokumen menjadi suatu ikhtisar dalam tempo singkat.

Sidobi atau Sistem Ikhtisar Dokumen untuk Bahasa Indonesia adalah perangkat lunak berbasis web pertama di Indonesia untuk membuat ringkasan secara otomatis (automatic summarization). Aplikasi ini dinobatkan sebagai salah satu inovasi Indonesia buatan anak bangsa yang paling prospektif pada 2009. “Tinggal klik, ikhtisar jadi dalam sekejap,” kata pembuat Sidobi dari BPPT, Bowo Prasetyo.

Bowo menjelaskan, Sidobi bekerja dengan mengambil sumber informasi suatu dokumen, mengekstrak isinya, kemudian menampilkan ikhtisar dokumen sesuai dengan keinginan pengguna. Pengguna bisa mengatur panjang-pendeknya ringkasan sesuai dengan kebutuhan. Hasilnya bisa berupa satu lembar naskah, beberapa kalimat, atau persentase dari total dokumen. “Bisa juga dalam beberapa kata saja,” kata Bowo.

Selain meringkas naskah dalam bentuk teks atau dokumen, Sidobi bisa mengikhtisarkan alamat situs (uniform resource locator/URL) berbentuk dokumen di Internet. Syaratnya, dokumen yang bisa diikhtisarkan maksimal 10 megabita.

Pekan lalu, Tempo menjajal aplikasi ini di situs http://202.46.5.125/sidobi. Caranya memang mudah. Teks dokumen sepanjang 10 halaman yang telah dipilih langsung disalin-tempel ke dalam sebuah boks yang tersedia. Kita tinggal menetapkan persentase maksimal ikhtisar yang diinginkan dari total teks, misalnya 10 persen. Dalam sekejap, ringkasan sepanjang satu halaman pun langsung jadi. Dokumen berbentuk (portable document format (PDF) sepanjang ratusan halaman pun dengan cepat dan mudah akan diubah oleh Sidobi menjadi sebuah ringkasan sebanyak yang kita inginkan.

Cara kerja Sidobi ini tak jauh berbeda dengan sistem manual yang meringkas naskah dengan menggunakan kaidah baku. Seperti pada sistem manual, peringkas harus membaca seluruh isi cerita sebelum memotong dan memangkas dokumen tertentu. Peringkas pun terlebih dulu mencatat gagasan utama atau gagasan yang penting dalam cerita. Selanjutnya gaya bahasa, ilustrasi, dan penjelasan yang terperinci dihilangkan.

Dalam soal akurasi, Sidobi tergolong bagus. Aplikasi ini mampu merangkum poin-poin penting. Namun harus dilakukan penyuntingan kembali agar hubungan antara satu kalimat dan kalimat lain menjadi lebih sinkron.

Bowo menjelaskan, akurasi peringkasan Sidobi sangat relatif. Ia memberikan contoh, jika lima orang ditugasi melakukan ikhtisar dokumen secara bersamaan, bisa dipastikan hasilnya akan berbeda. Yang diutamakan oleh peringkas adalah esensi dari ikhtisar tersebut. “Tapi maksudnya sama,” katanya.

Menurut Bowo, perangkat lunak utama yang digunakan dalam pengembangan Sidobi adalah MEAD, perkakas bersumber terbuka untuk membuat ikhtisar secara otomatis. Perkakas ini dipasang di alamat http://sourgeforge.net/projects/sidobi.

Awalnya, pengembang membuat kamus inverse document frequency (IDF) dalam bahasa Indonesia yang diperlukan oleh MEAD untuk membuat ikhtisar. “Kami masukkan 2,5 juta kata dan kalimat penting dalam bahasa Indonesia,” katanya. Setiap kalimat yang terekam dalam MEAD sebelumnya diperingkatkan berdasarkan tingkat kepentingannya masing-masing. Setiap kalimat yang tersedia akan terseleksi secara otomatis. Kalimat yang memiliki nilai terendah mendapat prioritas untuk dihilangkan dari artikel atau cerita.

Pada saat pengguna menentukan ikhtisar yang diinginkan, sistem dalam Sidobi akan menyusun prioritas kalimat yang paling penting sesuai dengan yang termuat dalam kamus IDF sampai terpenuhi panjang ikhtisar yang diminta oleh pengguna. Lantaran Sidobi berbasis sumber terbuka, pengembang lain bisa menyempurnakannya. Sidobi dapat berjalan di atas sembarang server web yang mendukung bahasa PHP dengan sistem operasi yang mendukung bahasa Perl. “Jika mau, bisa dikembangkan dalam bahasa daerah mana pun,” katanya.

Ide pembuatan Sidobi dimulai pada 2006. Menurut Koordinator Pusat Sumber Daya Sumber Terbuka BPPT Oscar Riandi, peranti ini merupakan pengembangan dari LiSan (Linux dengan Lisan). LiSan merupakan pengembangan IGOS Linux Voice Command dengan memanfaatkan free/open source software (FOSS). Fungsinya adalah sebagai pengenal wicara (speech recognition) berbahasa Indonesia pertama yang digunakan untuk mengoperasikan komputer dan penulisan dokumen. “Awalnya untuk membantu masyarakat yang memiliki keterbatasan tertentu,” katanya.

Pada 2007, Bowo Prasetyo kembali ke Tanah Air setelah menyelesaikan pendidikan magister di Tokyo University. Kolaborasi keduanya sepakat melahirkan peranti ikhtisar otomatis. Alasannya, fenomena kelebihan data kian hari menjadi ciri khas utama masyarakat modern. Sistem ikhtisar bisa menjadi alat yang vital. “Kalau bisa singkat, mengapa harus panjang?” kata Oscar.

Setahun kemudian, lahirlah Sidobi. Program ini juga digunakan sebagai peranti terakhir dalam teknologi perisalah. Perisalah adalah teknologi yang bisa mencatat setiap perkataan yang diucapkan seseorang secara otomatis yang langsung tertulis di layar komputer, runut sesuai dengan waktu bicara dari jam hingga detik. Perisalah biasa digunakan untuk menulis percakapan dalam rapat secara seketika (real time).

Oscar mengakui Sidobi masih dalam penyempurnaan. BPPT terus mengembangkan peranti ini agar bisa meringkas sesuai dengan pembobotan yang diinginkan pengguna. “Ke depan, ikhtisar bisa difokuskan pada tema tertentu secara spesifik,” ujarnya. Pengembangan lainnya, kata Oscar, Sidobi bisa digunakan untuk membuat ikhtisar dokumen berganda.

Rudy Prasetyo

sumber www.yahoo.com

Iklan

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s