Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Judul
Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan Bahasa
Korea-Indonesia Menggunakan Optical Character Recognition Berbasis Android
2. Bidang Ilmu
Bidang ilmu pada penelitian penulis adalah mobile computing dan image
proccesing
3. Latar Belakang
Bahasa adalah kapasitas khusus yang ada pada manusia untuk memperoleh
dan menggunakan sistem komunikasi yang kompleks. Perkiraan jumlah bahasa di
dunia mencapai 6000-7000 bahasa. Bahasa yang berbeda-beda di tiap daerah
membuat ditetapkannya bahasa internasional yaitu bahasa Inggris. Namun ada hal lain
yang menjadi masalah, pada charter bahasa inggris yaitu a-z sama seperti karakter
bahasa indonesia tapi terdapat beberapa bahasa yang memiliki karakter yang berbeda
seperti China, Jepang, Korea , dan yang lainnya.(wkipeda)
Negara Korea Selatan atau biasa disingkat Korse merupakan sebuah negara
yang cukup terkenal dengan penghasil produk elektronik. Samsung dan LG
merupakan perusahan ternama yang bermarkas di korsel. Beberapa tahun belakangan
ini negara korea sangat terkenal setelah hadirnya istilah K-pop atau Korean pop yang
mendunia. Banyak group K-pop yang berhasil mendunia dan terkenal. Menurut Korea
Tourism Organization, Korsel saat ini merupakan negara kelas satu di bidang
teknologi medis, berbagai alat medis diyakini mampu menyembuhkan berbagai
macam penyakit. Ditambah dengan wabah K-Pop di mana menampilkan kecantikan
dan keindahan kulit bintang K-Pop membuat Korsel berpotensi menjadi negara tujuan
wisata medis, baik untuk menyembuhkan penyakit ataupun ingin melakukan
perawatan kulit layaknya bintang K-Pop(Republika.com, 2012). Bisa dianggap bahwa
Korean Wave menjadi bentuk soft power atau pun diplomasi budaya yang dimiliki
Korea Selatan sebagai penguat pengaruhnya di dunia internasional. Masalah umum
sebuah pariwisata biasanya adalah bahasa, Korsel yang mempunyai bahasa resmi
hanguel dengan karakter yang berbeda seperti karakter bahasa inggris membuat agak
banyak vendor yang memilih android sebagai OS nya seperti Samsung, Sony, Lenovo,
Oppo.
Dari penjelasan diatas maka penulis berkeinginan untuk melakukan penelitian
yang berjudul Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan
Bahasa Korea-Indonesia Menggunakan Optical Character Recognition (OCR)
Berbasis Android
4. Perumusan Masalah
Berdasarkan latar belakang masalah tersebut maka rumusan masalah dari
penelitian ini adalah:
1. Bagaimana membangun sebuah aplikasi translation korea-indonesia berbasis
android.
2. Bagaimana tingkat keakuratan optical character recognoition dalam mendeteksi
karakter korea.
3. Bagaimana kinerja penerjemahan bahasa korea-indonesia.
5. Batasan Masalah
1. Aplikasi transaltion Korea-Indonesia berbasis android sehingga hanya
diperuntukkan untuk smartphone dengan sistem operasi Android.
2. Aplikasi ini dirancang menggunakan bahasa pemrograman java dengan plaform
Android
3. Karakter Korea Selatan yang digunakaan adalah karakter bahasa Korea Selatan
yang resmi yaitu hangeul
4. Penerjemahan bahasa Korea-Indonesia dilakukan secara real time sehingga
memerlukan kamera.
5. Pengenalan karakter menggunakan OCR tasseract engine
6. Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah merancang dan
membangun Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan
Bahasa Korea-Indonesia Menggunakan Optical Character Recognition (OCR)
Berbasis Android yang memiliki fungsi utama sebagai berikut :
1. Membangun sebuah aplikasi penerjemah bahasa korea-indonesia secara
real-time pada smartphone android.
di bangku perkuliahan.
Bagi pengguna perangkat lunak, Membantu menerjemahkan koreaindonesia secara real time
8. Metode Penelitian
8.1 Metode Pengembangan Sistem
Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan
Bahasa Korea-Indonesia Menggunakan Optical Character Recognition (OCR)
Berbasis Android dalam Tugas Akhir ini menggunakan model waterfall.
Adapun langkah-langkah yang dilakukan dalam pengembangan sistem ini
secara garisbesar adalah sebagai berikut:
1. Pemodelan
Dalam Tugas Akhir ini penulis menggunakan UML dalam
memodelkan sistem.
2. Implementasi Program (Coding)
Implementasi
program
dalam
Tugas
Akhir
ini
penulis
4) Pemeliharaan
Tahap akhir dimana suatu aplikasi yang sudah selesai dapat mengalami
perubahan-perubahan atau penambahan sesuai dengan permintaan pengguna.
8.2 Metode Pengumpulan Data
1) Studi Pustaka
Studi Pustaka dilakukan dengan cara mempelajari teori-teori literatur dan
buku-buku yang berhubungan dengan aplikasi yang akan dibangun dalam
tugas akhir ini.
2) Studi Lapangan
Studi lapangan dilakukan dengan cara memperhatikan sistem ujian yang
berlaku di sekolah-sekolah.
3) Studi Analisis
Melakukan analisis terhadap masalah yang dikaji, mendefinisikan batasanbatasan dalam masalah tersebut, serta mencari solusinya.
9. Tinjauan Pustaka
9.1 Pengolahan citra
Citra (image) adalah salah satu komponen multimedia memegang peranan
sangat penting sebagai bentuk informasi visual. Citra mempunyai karakteristik
yang tidak dimiliki oleh data teks, yaitu citra kaya dengan informasi.(Rinaldi
Munir, 2004).
Citra sebagai output dari suatu sistem perekaman data dapat bersifat :
1. Optik, berupa foto.
2. Analog berupa sinyal video, seperti gambar pada monitor
televisi.
3. Digital yang dapat langsung disimpan pada suatu pita
magnetik.
Citra dapat dikelompokkan menjadi dua bagian yaitu citra diam (still
image) adalah citra tunggal yang tidak bergerak dan citra bergerak (moving
image) yaitu rangkaian citra diam yang ditampilkan secara beruntun
(sekuensial), sehingga memberi kesan pada mata sebagai gambar yang
bergerak. Setiap citra didalam rangkaian itu disebut frame. Gambar-gambar
yang tampak pada film layar lebar atau televisi yaitu terdiri dari ratusan
sampai ribuan frame. Di dalam bidang komputer, sebenarnya ada tiga bidang
studi yang berkaitan dengan data citra, namun tujuan ketiganya berbeda, yaitu:
1. Grafika Komputer (computer graphics).
2. Pengolahan Citra (image processing).
3. Pengenalan Pola (pattern recognition/image interpretation).
9.2 Optical character recognition
Pengenalan karakter optis (bahasa Inggris: optical character recognition, yang
biasa disingkat OCR) adalah alat mekanis atau elektronik yang digunakan untuk
menerjemahkan tulisan tangan ataupun naskah ketikan (biasanya dipindai
menggunakan pemindai) menjadi teks yang dapat disunting dengan suatu aplikasi
komputer.(wikipedia)
Bidang ilmu yang diterapkan pada OCR yakni pengenalan pola, computer
vision, dan kecerdasan buatan. Teknologi pengenalan teks merupakan teknologi
yang mampu mengenali teks pada citra digital dan mengalihkannya pada
dokumen digital. Aplikasi dari teknologi pengenalan teks ini dikenal dengan nama
Optical Character Recognition (OCR). OCR sendiri digunakan untuk mengenali
teks hasil cetakan mesin (Machine- Printed Text). OCR dipatenkan pada tahun
1929 di Jerman oleh Gustav Tauschek. Pada saat itu, diterapkan pada mesin yang
menggunakan alat optik (sekarang ini umumnya kita menggunakan alat optik
berupa scanner). Saat ini konsep dasar dari OCR banyak digunakan di beberapa
aplikasi pengenalan teks.( Ngarap Im Manik, 2010).
Secara umum proses ocr dapat dilihat pada gambar 9.1
Preprocessing
Preprocessing adalah tahap pertama yang harus dilakukan pada proses
OCR. Tahap ini sangat penting untuk menentukan keberhasilan suatu proses
pengenalan pola. Beberapa proses yang dapat dilakukan pada tahap
preprocessing antara lain, proses binerisasi, segmentasi, dan normalisasi.
(surya hartono et all, 2012)
Proses pertama dalam preprocessing adalah memperbaiki citra sebelum
tahapan selanjutnya. Proses ini sangat menentukan tingkat keberhasilan dalam,
sebelum dirubah kedalam bentuk biner terlebih dahulu gambar dirubah
kedalam bentuk grayscale color image
Algorithm to convert color image to gray scale image
Sebuah gambar digital dengan M lebar (baris) dan N tinggi (kolom)
adalah direpresentasikan sebagai fungsi diskrit f (x, y) sebagai:
f(x,y)=(xi,xj) dimana i=0, i<N, j=0,j<M
Berikut pasangan (xi, yj) dikenal sebagai piksel. Pasangan (0,0) adalah
piksel dan pasangan pertama (M-1, N-1) adalah piksel terakhir di gambar.
Setiap piksel memiliki nilai warna RGB sendiri. Jika piksel memiliki Nilai
RGB yang sama maka jatuh ke dalam keluarga warna abu-abu (hitam putih).
Jadi berdasarkan pengamatan ini algoritma untuk mengkonversi gambar warna
menjadi abu-abu skala dikembangkan, yang ditampilkan di bawa
Di sini r, g dan b adalah warna merah, warna hijau, nilai warna biru
piksel (x, y) masing-masing. Rentang r, g dan b disebutkan dalam (2) dan
nis nilai rata-rata dari piksel ini yang selalu kurang dari 256. Jadi nilai
di antara 0 sampai 255, yangditugaskan untuk piksel merah, hijau dan biru
piksel (x, y). Ini Proses digambarkan dalam (3), (4) dan (5).
Binerisasi
Dokumen Gambar Binerisasi mengkonversi gambar ke dalam bentuk
Global thresholding
Setiap piksel di dalam citra dipetakan ke dua nilai, 1 atau 0 dengan
fungsi pengambangan:
yang dalam hal ini, fg(i, j) adalah citra hitam-putih, fB(i, j) adalah citra biner,
dan T adalah nilai ambang yang dispesifikasikan. Dengan operasi
pengambangan tersebut, objek dibuat berwarna gelap (1 atau hitam)
sedangkan latar belakang berwarna terang (0 atau putih). Jika nilai intensitas
objek diketahui dalam selang [T1, T2], maka kita dapat menggunakan fungsi
pengambangan:
10
11