Digitalisasi Konten/Laporan

Dari Wikimedia Indonesia
Loncat ke navigasi Loncat ke pencarian


Contoh halaman buku yang telah didigitalisasi

Proyek Digitalisasi Konten merupakan sebuah proyek yang dirintis pada tahun 2012 untuk mendigitalisasi koleksi sumber bacaan berupa buku dan majalah menjadi bentuk digital. Tujuan proyek ini adalah untuk menyediakan sumber bacaan dan referensi bagi pengguna tidak memiliki akses langsung ke sumber bacaan. Melihat kurangnya ketersediaan akses ke sumber bacaan cetak, diharapkan sumber bacaan yang telah didigitalisasi ini dapat digunakan sebagai referensi untuk menulis di Wikipedia.

Upaya awal

Untuk melaksanakan proses digitalisasi, Wikimedia Indonesia membeli sebuah mesin pemindai buku do-it-yourself dari Latvia pada awal tahun 2013. Mesin tersebut kemudian dibawa oleh mitra Wikimedia Indonesia di Wikimedia Estonia ke Hong Kong. Dari Hong Kong, mesin tersebut dibawa ke Indonesia oleh Sekretaris Jenderal Wikimedia Indonesia, Ivonne Kristiani, pada bulan Agustus 2013.

Karena mesin pemindai tersebut membutuhkan perakitan kembali, proses perakitan ini dilakukan bersama-sama di Jakarta oleh staf Wikimedia Indonesia. Proses perakitan mesin ini berlangsung cepat, dan pemasangan perangkat lunak bersumber terbuka dilakukan oleh John Vandenberg, seorang ahli pemrograman perangkat lunak asal Australia.

Pada bulan September 2014, pengguna Wikipèdia bahsa Acèh dan pemenang lomba uji-baca Kamus bahasa Sunda-Inggris pada tahun 2012, Rachmat Wahidi, diundang ke Jakarta untuk mengoperasikan mesin pemindai tersebut. Setelah mencoba dan belajar selama satu bulan serta memperbaiki kamera yang belum tersambung dengan perangkat lunak, mesin pemindai tersebut dapat dioperasikan sepenuhnya pada akhir bulan Oktober 2014.

Alur digitalisasi buku.png

Upaya awal pemindaian ini dapat mendigitalisasikan ~600 halaman dalam rentang waktu 1 s.d. 2 jam. Lalu, hasil digitalisasi tersebut diedit selama ~8 jam untuk membuang sisi pinggir halaman yang tidak dibutuhkan. Setelah gambar tersebut selesai diedit dan dirapikan dengan menggunakan perangkat lunak khusus, seluruh gambar tersebut digabungkan menjadi satu berkas bertipe .djvu selama dua jam. Setelah menjadi satu berkas .djvu, berkas tersebut akan diunggah ke Perpustakaan Digital Wikimedia Indonesia atau Wikimedia Commons.

Perangkat

Perangkat keras

Selama berjalan proyek Digitalisasi Konten, Wikimedia Indonesia telah membuat replika mesin pemindai buku menjadi enam unit. Proses pereplikasian tersebut dilakukan di Bandung selama lebih dari 3 bulan dan menghabiskan anggaran sebanyak Rp26.250.000. Saat ini, mesin replika ini disimpan di Wikimedia Indonesia bersama-sama dengan mesin pemindai asli yang didatangkan dari Latvia. Nantinya, mesin yang direplikasi tersebut akan ditujukan untuk instansi-instansi yang bekerja sama dengan Wikimedia Indonesia dalam proyek digitalisasi, dengan tujuan untuk memudahkan proses digitalisasi buku dan majalah.

Selain itu, kamera yang digunakan dengan mesin pemindai telah mengalami beberapa kali penggantian. Hal ini dikarenakan saat perangkat lunak pemindai dimutakhirkan agar pekerjaan pemindaian menjadi lebih efisien, perangkat lunak pemindai tidak menjadi tidak sesuai dengan perangkat lunak kamera. Pertama kali, Wikimedia Indonesia menggunakan Canon Powershot A810 sebagai kamera bawaan dari mesin pemindai aslinya. Kemudian, dengan dimutakhirkannya perangkat lunak pemindai, kamera tersebut diganti menjadi Canon IXUS 160 keluaran terbaru. Selain merupakan kamera model terbaru, Canon IXUS 160 seharga Rp1.100.000 mampu menghasilkan gambar sebesar 20 megapiksel dan pembesaran optikal hingga 8x sehingga dapat menghasilkan kualitas gambar yang lebih baik dari Canon Powershot A810.

Pada pertengahan 2016, Wikimedia Indonesia sudah menggunakan Raspberry Pi 3 untuk proses digitalisasi. Raspberry Pi ini telah menggunakan perangkat lunak terbaru, Pi Scan 1.0, yang lebih memudahkan operator dalam mendigitalisasikan naskah. Kemudahan itu antara lain: (1) lebih hemat tempat dan mudah dipindahkan, (2) ada kemungkinan untuk menggunakan monitor layar sentuh, dan (3) tidak menggunakan sambungan LAN sehingga digitalisasi tidak lagi tergantung pada adanya sambungan LAN.

Perangkat lunak

Pada awal-awal proyek Digitalisasi Konten, Wikimedia Indonesia menggunakan seperangkat laptop dengan sistem operasi Linux dan perangkat lunak SpreadPi untuk melakukan digitalisasi. SpreadPi menggunakan SSH sehingga memerlukan router jaringan agar dapat bekerja dengan baik. Sering kali, bila sambungan jaringan tidak bagus, SpreadPi tidak dapat digunakan untuk proses digitalisasi dan harus menunggu beberapa saat hingga sambungan bagus kembali. Menggunakan SpreadPi juga memerlukan kemampuan teknis dalam menggunakan console Linux karena sebagian besar penggunaannya adalah melalui Terminal Linux, bukan menggunakan GUI. Akan tetapi, karena menggunakan sambungan LAN, operator dapat melakukan pengunduhan hasil pemindaian dari jarak jauh (dalam sambungan jaringan yang sama) setelah digitalisasi berakhir.

Ketika digitalisasi menggunakan Raspberry Pi, Wikimedia Indonesia mengganti perangkat lunak pemindaian SpreadPi menjadi Pi Scan 1.0 yang kompatibel untuk Raspberry Pi. Pi Scan 1.0 memiliki beberapa keunggulan dibandingkan SpreadPi, di antaranya: (1) sudah menggunakan tampilan antarmuka pengguna (GUI), (2) dapat beroperasi dengan monitor layar sentuh, dan (3) mudah untuk dimutakhirkan ke versi terbaru (bila ada). Walaupun demikian, SpreadPi dan Pi Scan sama-sama bersumber terbuka dan dapat dikembangkan dan disesuaikan oleh masing-masing penggunanya.

Untuk ke depannya, seluruh mesin digitalisasi yang telah diperbanyak ini akan menggunakan Raspberry Pi dan Pi Scan dalam pengoperasiannya.

Pertemuan dan kerja sama

Sejak proyek Digitalisasi Konten dimulai, terdapat beberapa pertemuan yang bertujuan untuk menjalin kerja sama dalam bidang digitalisasi, seperti:

Kerja sama dengan Aliansi Jurnalis Independen

Pertemuan dengan Aliansi Jurnalis Independen

Pada tanggal 16 April 2015, Wikimedia Indonesia dan Aliansi Jurnalis Independen (AJI) melakukan pertemuan di Kantor Bersama Wikimedia Indonesia untuk membahas kerja sama. AJI memiliki ratusan majalah dan buku, di mana sebagian dari koleksi tersebut hancur dalam kebakaran di ruang redaksi beberapa tahun yang lalu. Mereka berinisiatif untuk mendigitalisasi koleksi yang masih ada untuk disimpan dalam bentuk digital sebagai cadangan di saat koleksi tersebut hilang.

Sebagai ganti upaya digitalisasi tersebut, sebanyak 42 buku yang berhasil didigitalisasi disimpan dalam bentuk PDF dan diunggah ke Wikimedia Commons agar dapat diakses oleh semua orang. Seluruh buku tersebut tersimpan di bawah kategori Digitalisasi koleksi Aliansi Jurnalis Independen.

Kerja sama dengan Museum Tamansiswa Dewantara Kirti Griya, Yogyakarta

Pembukaan dan penandatanganan nota kesepahaman sebelum memulai proyek
Halaman utama proyek ini dapat dilihat di sini.

Wikimedia Indonesia bekerja sama dengan Museum Tamansiswa Dewantara Kirti Griya, Yogyakarta, menyelenggarakan proyek digitalisasi 75 teks cetak Jawa dengan durasi proyek Mei hingga Juli 2015. Museum tersebut mempunyai 800 teks berbahasa Jawa dan 328 teks berbahasa Melayu; sebagian besar buku ini merupakan warisan dari pendiri Taman Siswa, Ki Hadjar Dewantara. Teks-teks dalam koleksi Museum Tamansiswa Dewantara Kirti Griya sering digunakan oleh mahasiswa dan dosen di Yogyakarta untuk meneliti karya Jawa dan Melayu lama. Namun, pembacaan teks oleh pengunjung dapat merusak teks yang sudah tua, dan sosialisasi keberadaan teks tersebut belum maksimal, sehingga masyarakat umum belum dapat mengakses teks dalam koleksi Museum. Oleh sebab itu, koleksi tersebut perlu dilakukan untuk melindungi koleksi yang sudah tua tersebut.

Kerja sama dengan Redaksi Majalah Horison

Foto bersama setelah pertemuan di kantor Majalah Horison

Redaksi Majalah Horison mengundang Wikimedia Indonesia ke kantor redaksi pada tanggal 3 Februari 2016. Pertemuan ini membahas digitalisasi Majalah Horison yang terbit pada awal-awal Majalah Horison berdiri untuk membuat cadangan dalam bentuk digital sehingga mudah untuk didistribusikan secara daring dan luring dan dapat menjadi cadangan data ketika koleksi aslinya hilang.

Pertemuan ini menghasilkan kesimpulan, yaitu majalah yang terbit pada awal percetakan (tahun 1966) akan diprioritaskan terlebih dahulu sehingga kemungkinan bentuk digital dapat disimpan di Wikimedia Commons (dengan seizin Redaksi Majalah Horison).

Pada tanggal 8 Maret 2016, Wikimedia Indonesia telah memulai digitalisasi koleksi majalah edisi tahun 1966–1968.

Penandatanganan surat izin untuk mengunggah majalah tersebut di Commons

Hingga September 2016, Wikimedia Indonesia telah menyelesaikan proses digitalisasi koleksi majalah ini dari edisi tahun 1966 sampai edisi tahun 1990. Sebanyak 278 edisi majalah (lebih dari 11.100 halaman) tersebut telah tersedia dalam bentuk PDF di Wikimedia Commons dalam kategori Majalah Horison. Seluruh majalah versi digital itu dilisensikan ke dalam Creative Commons Atribusi-BerbagiSerupa 4.0 Internasional.

Pertemuan dengan perwakilan UNESCO Indonesia

Pertemuan dengan UNESCO, Pusat Dokumentasi Arsitektur, dan Heuken Institute

Wikimedia Indonesia kedatangan tamu dari UNESCO, Budi Lim Architect, Pusat Dokumentasi Arsitektur, dan Heuken Institute pada hari Selasa, 23 Februari 2016. Pihak UNESCO Indonesia mengusulkan digitalisasi buku-buku karangan Adolf Heuken, di mana beliau sendiri ingin karyanya didigitalisasi agar karyanya dapat digunakan pula oleh orang lain. Untuk merealisasikannya, lisensi karya tersebut perlu dimigrasikan ke lisensi bebas Creative Commons. Untuk hal ini, UNESCO mendapat sebuah buku terjemahan bahasa Indonesia Creative Commons sebagai panduan memilih-milih lisensi Creative Commons.

Koleksi di Perpustakaan Digital Wikimedia Indonesia

Tampilan halaman utama Perpustakaan Digital Wikimedia Indonesia

Hingga bulan Februari, Perpustakaan Digital Wikimedia Indonesia telah menyimpan 239 buku, termasuk ensiklopedia, kamus, buku sejarah, sastra, dan cerita bergambar. Pengguna yang ingin menggunakan koleksi di perpustakaan digital ini diwajibkan mendaftar terlebih dahulu dan mendapatkan akun untuk mengaksesnya.

Halaman yang telah selesai diuji-baca oleh penguji-baca telah mencapai ~10.839 halaman pada bulan Februari 2016.