Judul: Proccesing

1.
Judul
Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan Bahasa
Korea-Indonesia Menggunakan Optical Character Recognition Berbasis Android
2. Bidang Ilmu
Bidang ilmu pada penelitian penulis adalah mobile computing dan image
proccesing
3. Latar Belakang
Bahasa adalah kapasitas khusus yang ada pada manusia untuk memperoleh
dan menggunakan sistem komunikasi yang kompleks. Perkiraan jumlah bahasa di
dunia mencapai 6000-7000 bahasa. Bahasa yang berbeda-beda di tiap daerah
membuat ditetapkannya bahasa internasional yaitu bahasa Inggris. Namun ada hal lain
yang menjadi masalah, pada charter bahasa inggris yaitu a-z sama seperti karakter
bahasa indonesia tapi terdapat beberapa bahasa yang memiliki karakter yang berbeda
seperti China, Jepang, Korea , dan yang lainnya.(wkipeda)
Negara Korea Selatan atau biasa disingkat Korse merupakan sebuah negara
yang cukup terkenal dengan penghasil produk elektronik. Samsung dan LG
merupakan perusahan ternama yang bermarkas di korsel. Beberapa tahun belakangan
ini negara korea sangat terkenal setelah hadirnya istilah K-pop atau Korean pop yang
mendunia. Banyak group K-pop yang berhasil mendunia dan terkenal. Menurut Korea
Tourism Organization, Korsel saat ini merupakan negara kelas satu di bidang
teknologi medis, berbagai alat medis diyakini mampu menyembuhkan berbagai
macam penyakit. Ditambah dengan wabah K-Pop di mana menampilkan kecantikan
dan keindahan kulit bintang K-Pop membuat Korsel berpotensi menjadi negara tujuan
wisata medis, baik untuk menyembuhkan penyakit ataupun ingin melakukan
perawatan kulit layaknya bintang K-Pop(Republika.com, 2012). Bisa dianggap bahwa
Korean Wave menjadi bentuk soft power atau pun diplomasi budaya yang dimiliki
Korea Selatan sebagai penguat pengaruhnya di dunia internasional. Masalah umum
sebuah pariwisata biasanya adalah bahasa, Korsel yang mempunyai bahasa resmi
hanguel dengan karakter yang berbeda seperti karakter bahasa inggris membuat agak
susah dimengerti. Untuk menerjemahkannya pun susah karena harus mempelajari

karakter tulisannya terlebih dahulu. Contohnya ketika kita ingin makan di restoran
yang mempunyai menu dengan bahasa korea, ketika kita ingin menerjemahkannya
dengan penerjemahan yang umum saat ini adalah Google Translate kita harus
mengginputkan bahasa korsel yang tidak kita mengerti.
Optical Character Recognition atau OCR adalah suatu teknologi yang
digunakan untuk mengubah teks non-digital ke teks digital sehingga dapat dikenali
oleh komputer. Sudah banyak teknologi atau aplikasi yang memanfaatkan OCR
contohnya saja alat pemindai atau scanner yang dulunya hanya berfungsi memindai
dokumen cetak menjadi gambar. Sekarang scanner juga dapat menidentifikasi
karakter yang ada dalam dokumen.
Perkembangan teknologi saat ini sangat cepat, teknologi sekarang beralih ke
perangkat bergerak. Bermunculannya ponsel pintar atau lebih sering disebut
smartphone membuat persaingan ketat atar vendor ponsel seperti Blackberry ,
Samsung, Apple, Sony, HTC, Xiaomi, Nokia. Menurut beberapa sumber smartphone
yang menggunakan sistem operasi android sangat di sukai karena bersifat open source
sehingga mudah untuk dikembangkan. Dibandingkan dengan Blackberry yang
menggunakan RIM, Apple yang menggunakan IOS atau pun Nokia yang di beli
microsoft menggunakan sistem windows phone. Walaupun penjualan Samsung pada
tahun 2014 ini memang menurun namun masih menjadi ponsel teratas. Huawei,
lenovo, xiaomi masih berada dibawahnya, hanya apple dengan IOS nya yang mampu
menyaingi vendor smartphone dengan android. Smartphone android sangat
digandrungi karena mempunyai harga yang murah tetapi menawarkan spesifikasi
yang lumayan.(okezone.com)
Perkembangan android bergerak sangat, pertam kali dirilis tahun 2007 dengan
versi 1.0(Astro) hingga 2014 dengan android versi 5.0(Lolipop). Posel yang merilis
sistem operasi android adalah HTC dengan android versi 1.0. namun sekarang sudah
2
banyak vendor yang memilih android sebagai OS nya seperti Samsung, Sony, Lenovo,
Oppo.
Dari penjelasan diatas maka penulis berkeinginan untuk melakukan penelitian
yang berjudul Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan
Bahasa Korea-Indonesia Menggunakan Optical Character Recognition (OCR)
Berbasis Android
4. Perumusan Masalah
Berdasarkan latar belakang masalah tersebut maka rumusan masalah dari
penelitian ini adalah:
1. Bagaimana membangun sebuah aplikasi translation korea-indonesia berbasis
android.
2. Bagaimana tingkat keakuratan optical character recognoition dalam mendeteksi
karakter korea.
3. Bagaimana kinerja penerjemahan bahasa korea-indonesia.
5. Batasan Masalah
1. Aplikasi transaltion Korea-Indonesia berbasis android sehingga hanya
diperuntukkan untuk smartphone dengan sistem operasi Android.
2. Aplikasi ini dirancang menggunakan bahasa pemrograman java dengan plaform
Android
3. Karakter Korea Selatan yang digunakaan adalah karakter bahasa Korea Selatan
yang resmi yaitu hangeul
4. Penerjemahan bahasa Korea-Indonesia dilakukan secara real time sehingga
memerlukan kamera.
5. Pengenalan karakter menggunakan OCR tasseract engine
6. Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah merancang dan
membangun Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan
Berbasis Android yang memiliki fungsi utama sebagai berikut :
1. Membangun sebuah aplikasi penerjemah bahasa korea-indonesia secara
real-time pada smartphone android.
2. Mengetahui tingkat keberhasilan pengenalan karakter korea pada OCR

3. Dapat membantu menerjemahkan bahasa Korea-Indonesia.
4. bagaimana penerapan teknologi OCR tasseract engine dalam mengenal
karakter korea.
7. Manfaat Penelitian
Manfaat dari penelitian ini adalah:
Bagi penulis, dapat mengimplementasikan ilmu yang diperoleh selama
di bangku perkuliahan.
Bagi pengguna perangkat lunak, Membantu menerjemahkan koreaindonesia secara real time
8. Metode Penelitian
8.1 Metode Pengembangan Sistem
Racang Bangun Aplikasi Real-Time Translation Untuk Penerjemahkan
Berbasis Android dalam Tugas Akhir ini menggunakan model waterfall.
Adapun langkah-langkah yang dilakukan dalam pengembangan sistem ini
secara garisbesar adalah sebagai berikut:
1. Pemodelan
Dalam Tugas Akhir ini penulis menggunakan UML dalam
memodelkan sistem.
2. Implementasi Program (Coding)
Implementasi
program
dalam
Tugas
Akhir
ini
penulis
mengimplementasikan desain ke dalam bentuk bahasa pemrograman. Bahasa

pemprograman yang digunakan adalah bahasa pemprograman java pada
platform Anroid dengan menggnakan eclipse IDE.
3 Pengujian (Testing)
4
Pengujian yang dilakukan pada Tugas Akhir ini dilakukan dengan

melakukan pengujian fungsional dan teknis pada aplikasi yang dibangun,
apakah sesuai dengan tujuan dari Tugas Akhir ini. yakni apakah perangkat
lunak yang dibangun berjalan dengan baik dan benar sehingga dapat
melakukan Penerjemahan Korea-Indonesia secara real-time. Seberapa akurat
pendeteksian karakter bahasa Korea hangul dengan OCR tasseract engine
4) Pemeliharaan
Tahap akhir dimana suatu aplikasi yang sudah selesai dapat mengalami
perubahan-perubahan atau penambahan sesuai dengan permintaan pengguna.
8.2 Metode Pengumpulan Data
1) Studi Pustaka
Studi Pustaka dilakukan dengan cara mempelajari teori-teori literatur dan
buku-buku yang berhubungan dengan aplikasi yang akan dibangun dalam
tugas akhir ini.
2) Studi Lapangan
Studi lapangan dilakukan dengan cara memperhatikan sistem ujian yang
berlaku di sekolah-sekolah.
3) Studi Analisis
Melakukan analisis terhadap masalah yang dikaji, mendefinisikan batasanbatasan dalam masalah tersebut, serta mencari solusinya.
9. Tinjauan Pustaka
9.1 Pengolahan citra
Citra (image) adalah salah satu komponen multimedia memegang peranan
sangat penting sebagai bentuk informasi visual. Citra mempunyai karakteristik
yang tidak dimiliki oleh data teks, yaitu citra kaya dengan informasi.(Rinaldi
Munir, 2004).
Citra sebagai output dari suatu sistem perekaman data dapat bersifat :
1. Optik, berupa foto.
2. Analog berupa sinyal video, seperti gambar pada monitor
televisi.
3. Digital yang dapat langsung disimpan pada suatu pita
magnetik.
Citra dapat dikelompokkan menjadi dua bagian yaitu citra diam (still
image) adalah citra tunggal yang tidak bergerak dan citra bergerak (moving
image) yaitu rangkaian citra diam yang ditampilkan secara beruntun
(sekuensial), sehingga memberi kesan pada mata sebagai gambar yang
bergerak. Setiap citra didalam rangkaian itu disebut frame. Gambar-gambar
yang tampak pada film layar lebar atau televisi yaitu terdiri dari ratusan
sampai ribuan frame. Di dalam bidang komputer, sebenarnya ada tiga bidang
studi yang berkaitan dengan data citra, namun tujuan ketiganya berbeda, yaitu:
1. Grafika Komputer (computer graphics).
2. Pengolahan Citra (image processing).
3. Pengenalan Pola (pattern recognition/image interpretation).
9.2 Optical character recognition
Pengenalan karakter optis (bahasa Inggris: optical character recognition, yang
biasa disingkat OCR) adalah alat mekanis atau elektronik yang digunakan untuk
menerjemahkan tulisan tangan ataupun naskah ketikan (biasanya dipindai
menggunakan pemindai) menjadi teks yang dapat disunting dengan suatu aplikasi
komputer.(wikipedia)
Bidang ilmu yang diterapkan pada OCR yakni pengenalan pola, computer
vision, dan kecerdasan buatan. Teknologi pengenalan teks merupakan teknologi
yang mampu mengenali teks pada citra digital dan mengalihkannya pada
dokumen digital. Aplikasi dari teknologi pengenalan teks ini dikenal dengan nama
Optical Character Recognition (OCR). OCR sendiri digunakan untuk mengenali
teks hasil cetakan mesin (Machine- Printed Text). OCR dipatenkan pada tahun
1929 di Jerman oleh Gustav Tauschek. Pada saat itu, diterapkan pada mesin yang
menggunakan alat optik (sekarang ini umumnya kita menggunakan alat optik
berupa scanner). Saat ini konsep dasar dari OCR banyak digunakan di beberapa
aplikasi pengenalan teks.( Ngarap Im Manik, 2010).
Secara umum proses ocr dapat dilihat pada gambar 9.1
Gambar 9.1 gambaran OCR secara umum

(sumber surya hartono et all)
a) File Input
File input berupa file citra digital dengan format *.bmp atau *.jpg.
b) Preprocessing
Preprocessing merupakan suatu proses untuk menghilangkan bagianbagian yang tidak diperlukan pada gambar input untuk proses selanjutnya
c) Segmentasi
Segmentasi adalah proses memisahkan area pengamatan (region) pada tiap
karakter yang dideteksi.
d) Normalisasi
Normalisasi adalah proses merubah dimensi region tiap karakter dan
ketebalan karakter.
e) Ekstraksi ciri
Ekstraksi ciri adalah proses untuk mengambil ciri-ciri tertentu dari karakter
yang diamati
f) Recognition
Recognition merupakan proses untuk mengenali karakter yang diamati

dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri
karakter yang ada pada basis data
(surya hartono et al, 2012)
9.2.1
Preprocessing
Preprocessing adalah tahap pertama yang harus dilakukan pada proses
OCR. Tahap ini sangat penting untuk menentukan keberhasilan suatu proses
pengenalan pola. Beberapa proses yang dapat dilakukan pada tahap
preprocessing antara lain, proses binerisasi, segmentasi, dan normalisasi.
(surya hartono et all, 2012)
Proses pertama dalam preprocessing adalah memperbaiki citra sebelum
tahapan selanjutnya. Proses ini sangat menentukan tingkat keberhasilan dalam,
sebelum dirubah kedalam bentuk biner terlebih dahulu gambar dirubah
kedalam bentuk grayscale color image
Algorithm to convert color image to gray scale image
Sebuah gambar digital dengan M lebar (baris) dan N tinggi (kolom)
adalah direpresentasikan sebagai fungsi diskrit f (x, y) sebagai:
f(x,y)=(xi,xj) dimana i=0, i<N, j=0,j<M
Berikut pasangan (xi, yj) dikenal sebagai piksel. Pasangan (0,0) adalah
piksel dan pasangan pertama (M-1, N-1) adalah piksel terakhir di gambar.
Setiap piksel memiliki nilai warna RGB sendiri. Jika piksel memiliki Nilai
RGB yang sama maka jatuh ke dalam keluarga warna abu-abu (hitam putih).
Jadi berdasarkan pengamatan ini algoritma untuk mengkonversi gambar warna
menjadi abu-abu skala dikembangkan, yang ditampilkan di bawa
Di sini r, g dan b adalah warna merah, warna hijau, nilai warna biru
piksel (x, y) masing-masing. Rentang r, g dan b disebutkan dalam (2) dan
nis nilai rata-rata dari piksel ini yang selalu kurang dari 256. Jadi nilai
di antara 0 sampai 255, yangditugaskan untuk piksel merah, hijau dan biru
piksel (x, y). Ini Proses digambarkan dalam (3), (4) dan (5).
Jadi setelah menerapkan algoritma di atas pada gambar warna menjadi

gambar skala abu-abu.(Klaivani et al, 2014)
9.2.2
Binerisasi
Dokumen Gambar Binerisasi mengkonversi gambar ke dalam bentuk
bi-level sedemikian rupa sehingga foreground Informasi diwakili oleh piksel

hitam dan background dengan teknik Preprocessing piksel putih diterapkan
hanya pada gambar abu-abu atau biner, gambar abu-abu adalah satu di mana
nilai kerapatan piksel di antara 0 dan 255 dan citra biner adalah satu di mana
kepadatan piksel Nilai adalah dalam bentuk 0 dan 1 di mana 0 mewakili dari
putih yaitu latar belakang gambar dan 1 mewakili yaitu hitam latar depan
gambar. Proses konversi abu-abu gambar diperkecil menjadi citra biner
dikenal sebagai binerisasi dan metode yang digunakan untuk binerisasi dikenal
sebagai Threshold. Dalam thresholding skala atau warna gambar abu-abu
9
direpresentasikan sebagai gambar biner dengan memilih nilai thresholding.

(Grauv kumar et al 2013)
9.2.3.1
Global thresholding
Setiap piksel di dalam citra dipetakan ke dua nilai, 1 atau 0 dengan
fungsi pengambangan:
yang dalam hal ini, fg(i, j) adalah citra hitam-putih, fB(i, j) adalah citra biner,
dan T adalah nilai ambang yang dispesifikasikan. Dengan operasi
pengambangan tersebut, objek dibuat berwarna gelap (1 atau hitam)
sedangkan latar belakang berwarna terang (0 atau putih). Jika nilai intensitas
objek diketahui dalam selang [T1, T2], maka kita dapat menggunakan fungsi
pengambangan:
(Rinaldi Munir, 2004)

9.2.3.2
Local adaptive thresholding

Pengambangan secara global tidak selalu tepat untuk seluruh macam
gambar. Beberapa informasi penting di dalam gambar mungkin hilang karena
pengambangan global ini. Pengambangan secara lokal dilakukan terhadap
daerah-daerah di dalam citra. Dalam hal ini citra dipecah menjadi bagianbagian kecil, kemudian proses pengambangan dilakukan secara lokal. Nilai
ambang untuk setiap bagian belum tentu sama dengan bagian lain. Dengan
10
pengambangan secara lokal adaptif, secara subjektif citra biner yang

dihasilkan terlihat lebih menyenangkan dan sedikit informasi yang hilang.
11

Judul: Proccesing

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Judul: Proccesing

Cargado por

Copyright:

Formatos disponibles

1.

susah dimengerti. Untuk menerjemahkannya pun susah karena harus mempelajari

2. Mengetahui tingkat keberhasilan pengenalan karakter korea pada OCR

mengimplementasikan desain ke dalam bentuk bahasa pemrograman. Bahasa

Pengujian yang dilakukan pada Tugas Akhir ini dilakukan dengan

Gambar 9.1 gambaran OCR secara umum

Recognition merupakan proses untuk mengenali karakter yang diamati

Jadi setelah menerapkan algoritma di atas pada gambar warna menjadi

bi-level sedemikian rupa sehingga foreground Informasi diwakili oleh piksel

direpresentasikan sebagai gambar biner dengan memilih nilai thresholding.

(Rinaldi Munir, 2004)

Local adaptive thresholding

pengambangan secara lokal adaptif, secara subjektif citra biner yang

También podría gustarte