Interface Telematika


1. HUD (Head-Up Display) System
Head-up display, atau disingkat HUD, adalah setiap tampilan yang transparan menyajikan data tanpa memerlukan pengguna untuk melihat diri dari sudut pandang atau yang biasa. Asal usul nama berasal dari pengguna bisa melihat informasi dengan kepala “naik” (terangkat) dan melihat ke depan, bukan memandang miring ke instrumen yang lebih rendah.
1.1 Sejarah HUD
HUD pertama kali diperkenalkan pada tahun 1950-an, dengan adanya teknologi reflektif gunsight pada perang dunia ke dua. Saat itu, suatu tembakan dihasilkan dari sumber listrik yang diproyeksikan ke sebuah kaca. Pemasangan proyek itu biasanya dilakukan pada bagian dilakukan pada bagian atas panel instrumen di tengah daerah pandang pilot, antara kaca depan dan pilit sendiri .

Dengan menggunakan reflektif gunshight pada pertempuran udara, pilot harus “mengkalibrasi” pandangannya secara manual. Hal ini dilakukan dengan memasukkan lebar sayap target pada sebuah penyetelan roda yang diikuti dengan penyesuaian mata, sehingga target yang bergerak dapat disesuaikan dengan bingkai yang diarahkan kepadanya. Dengan melakukan hal tersebut, maka hasilnya akan terjadi kompensasi terhadap kecepatan, penembakan peluru, G-load, dll.
Pada tahun 1950-an, gambar dari efletif gunsight diproyeksikan ke sebuah CRT (Cathode Ray Tube) yang dikendalikan oleh komputer yang terdapat pada pesawat. Hal inilah yang menandai kelahiran teknologi HUD modern. Komputer mampu mengkompensasi akurasi dan menyesuaikan tujuan dari kursor secara otomatis terhadap faktor, seperti range, daya percepatan, tembakan peluru, pendekatan target, G-load, dll. Penambahan data penerbangan terhadap tanda bidikan, memberikan perananan kepada HUD sebagai pembantu pilot dalam melakukan pendaratan, serta membantu pilot di dalam pertempuran udara. Pada tahun 1960-an, HUD digunakan secara ekstensif dalam melakukan pendaratan. HUD menyediakan data-data penerbangan penting kepada pilot, sehingga pilot tidak perlu melihat peralatan pada bagian dalam dari panel.

Penerbangan komersial HUD pertama kali diluncurkan pada tahun 1980-an. HUD pertama kali digunakan oleh Air Inter pada pesawat MD-80. Namun, masih tergantung pada FD pesawat untuk bimbingan dan hanya bekerja sebagai repeater informasi yang ada. Pada tahun 1984, penerbangan dinamika Rockwell Collins sudah berkembang dan mendapatkan sertifikasi HUD “standalone” yang pertama sebagai pesawat komersial, yang disebut HGS (Head Up Guidance System). Sistem “stand alone” ini mendatangkan kesempatan untuk mengurangi waktu lepas landas dan pendaratan minimum. Pada tahun 1984, FAA menyetujui pendaratan CAT IIIA tanpa menyediakan pemasangan sistem autoland atau autothrottle pada pesawat yang dilengkapi dengan HGS.
Sampai beberapa tahun yang lalu, Embraer 190 dan Boeing 737 New Generation Aircraft (737-600,700,800, dan 900 series) adalah satu-satunya pesawat penumpang komersial untuk datang dengan HUD opsional. Namun, kini teknologi ini sudah menjadi lebih umum untuk pesawat seperti Canadair RJ, Airbus A318 dan beberapa jet bisnis. HUD telah menjadi peralatan standar Boeing 787. Dan lebih jauh lagi, Airbus A320, A330, A340 dan A380 keluarga yang sedang menjalani proses sertifikasi untuk HUD. Selain pada pesawat komersial, HUD juga sudah mulai digunakan pada mobil dan aplikasi lainnya. BMW merupakan pabrikan otomotif pertama yang meluncurkan produk massal dengan teknologi HUD pada kaca depannya. Teknologi ini tak hanya memberi kenyamanan bagi pengemudi, melainkan juga keselamatan berkendara.
HUD terbagi menjadi 3 generasi yang mencerminkan teknologi yang digunakan untuk menghasilkan gambar, yaitu:
 Generasi Pertama – Gunakan CRT untuk menghasilkan sebuah gambar pada layar fosfor, memiliki kelemahan dari degradasi dari waktu ke waktu dari lapisan layar fosfor. Mayoritas HUDs beroperasi saat ini adalah dari jenis ini.
 Generasi Kedua – Gunakan sumber cahaya padat, misalnya LED, yang dimodulasi oleh sebuah layar LCD untuk menampilkan gambar. Ini menghilangkan memudar dengan waktu dan juga tegangan tinggi yang dibutuhkan untuk sistem generasi pertama. Sistem ini pada pesawat komersial.
 Generasi Ketiga – Gunakan waveguides optik untuk menghasilkan gambar secara langsung dalam Combiner daripada menggunakan sistem proyeksi.
Penggunaan HUD dapat dibagi menjadi 2 jenis. Jenis pertama adalah HUD yang terikat pada badan pesawat atau kendaraan chasis. Sistem penentuan gambar yang ingin disajikan semata-mata tergantung pada orientasi kendaraan. Jenis yang kedua adalah HMD, helm dipasang yang menampilkan HUD dimana elemen akan ditampilkan tergantung pada orientasi dari kepala pengguna.

1.2 Teknologi HUD
 CRT (Cathode Ray Tube)
Hal yang sama untuk semua HUD adalah sumber dari gambar yang ditampilkan, CRT, yang dikemudikan oleh generator. Tanda generator mengirimkan informasi ke CRT berbentuk koordinat x dan y. Hal itu merupakan tugas dari CRT untuk menggambarkan koordinat senagai piksel, yaitu grafik. CRT membuat piksel dengan menciptakan suatu sinar elektonil, yang menyerang permukaan tabung (tube).
 Refractive HUD
Dari CRT, sinar diproduksi secara paralel dengan sebuah lensa collimating. Sinar paralel tersebut diproyeksikan ke kaca semitrasnparan (kaca gabungan) dan memantul ke mata pilot. Salah satu keuntungan dari reaktif HUD adalah kemampuan pilot untuk menggerakkan kepalanya dan sekaligus melihat gambar yang ditampilkan pada kaca gabungan.
 Reflective HUD
Kerugian dari HUD reflektif adalah akibatnya pada besarnya tingkat kompleksitas yang terlibat dalam meproduksi penggabungan lekungan dari segi materi dan rekayasa. Keuntungan besarnya adalah kemampuan pada peningkatan tanda brightness (terang), meminimalisir redaman cahaya dari pemandangan visual eksternal dan adanya kemungkinan untuk menghemat ruang di kokpit, karena lensa collimating yang tidak diperlukan.
 System Architecture
HUD komputer mengumpulkan informasi dari sumber – sumber seperti IRS (Inertial Reference System), ADC (Air Data Computer), radio altimeter, gyros, radio navigasi dan kontrol kokpit. Diterjemahkan ke dalam koordinat x dan y, komputer HUD selanjutnya akan menyediakan informasi yang dibutuhkan untuk hal apa yang akan ditampilkan pada HUD ke generator simbol. Berdasarkan informasi ini, generator simbol menghasilkan koordinat yang diperlukan pada grafik, yang akan dikirmkan ke unit display (CRT) dan ditampilkan sebagai simbol grafik pada permukaan tabung. Kebanyakan HUD militer mudah memberikan atau melewatkan isyarat kemudi FD melalui generator simbol. HUD memperhitungkan isyarat kemudi pada komputer HUD dan hal tersebut membuatnya sebagai sistem ‘standalone’. Sipil HUD merupakan fail-passive dan mencakup pemeriksaan internal yang besar mulai dari data sampai pada simbol generator. Kebanyakan perselisihan perhitungan dirancang untuk mencegah data palsu tampil.
 Display Clutter
Salah satu perhatian penting dengan simbologi HUD adalah kecenderungan perancang untuk memasukkan data terlalu banyak, sehingga menghasilkan kekacauan tampilan. Kekacauan tampilan ini jauh dari eksklusif untuk HUD, tetapi hal ini sangat kritis pada saat melihat ke arah tampilan. Setiap simbologi yang tampil pada sebuah HUD harus melayani atau memiliki sebuah tujuan dan mengarahkan peningkatan performa. Kenyataannya, bukan piksel tunggal yang dapat menerangi kecuali dia secara langsung mengarahkan pada penigkatan. Prinsip yang diterapkan pada perancangan HUD adalah ‘ketika dalam keraguan, tinggalkan saja.
1.3 Faktor Perancangan HUD
Ada beberapa faktor yang harus dipertimbangkan ketika merancang sebuah HUD, yaitu:
 Bidang penglihatan – Karena mata seseorang berada di dua titik berbeda, mereka melihat dua gambar yang berbeda. Untuk mencegah mata seseorang dari keharusan untuk mengubah fokus antara dunia luar dan layar HUD, layar adalah “Collimated” (difokuskan pada tak terhingga). Dalam tampilan mobil umumnya terfokus di sekitar jarak ke bemper.
 Eyebox – menampilkan hanya dapat dilihat sementara mata pemirsa dalam 3-dimensi suatu daerah yang disebut Kepala Motion Kotak atau “Eyebox”. HUD Eyeboxes modern biasanya sekitar 5 dengan 3 dari 6 inci. Hal ini memungkinkan pemirsa beberapa kebebasan gerakan kepala. Hal ini juga memungkinkan pilot kemampuan untuk melihat seluruh tampilan selama salah satu mata adalah di dalam Eyebox.
 Terang / kontras – harus menampilkan pencahayaan yang diatur dalam dan kontras untuk memperhitungkan pencahayaan sekitarnya, yang dapat sangat bervariasi (misalnya, dari cahaya terang awan malam tak berbulan pendekatan minimal bidang menyala).
 Menampilkan akurasi – HUD komponen pesawat harus sangat tepat sesuai dengan pesawat tiga sumbu – sebuah proses yang disebut boresighting – sehingga data yang ditampilkan sesuai dengan kenyataan biasanya dengan akurasi ± 7,0 milliradians.
 Instalasi – instalasi dari komponen HUD harus kompatibel dengan avionik lain, menampilkan, dll

2. Tangibel User Interface
2.1 Pengenalan TUI ( Tangibel User Interface )
Pada sebuah pantai, ada tanah dan lautan, kita menghadapi suatu tantangan untuk mempertemukan kedua tempat tinggal kita antara dunia fisik dan dunia digital. Informasi digital merendam organ visual dan indera perasa kita, tetapi tubuh kita tetap merasakan atau berada di dunia fisik. Jendela unuk ruang digital terbatas pada layar datar persegi dan piksel atau “painted bits”. Sayangnya, orang tidak dapat merasakan keberadaan informasi digital melalui tangan dan tubuhnya.
Bayangkan sebuah gunug es, sejumlah massa es yang mengambang di lautan. Hal tersebut merupakan metafora dari TUI (Tangible User Interface). TUI memberikan bentuk fisik ke informasi digital dan komputasi, menyelamatkan bit dari bagian bawah air, pengaturan pengapungan, dan membuatnya langsung bisa dikendalikan dengan tangan manusia. TUI dibangun atas dasar ketrampilan dan penemapatan informasi fisik yang berwujud digital di dalam ruang fisik. Tantangan rancangannya adlah ekstensi mulus dari affordance fisik dari objek ke dalam domain digital (Ishii dan Ullmer, 1997).

Ada terdapat 4 buah karakteristik dari TUI, yaitu:
1. Representasi fisik digabungkan untuk mendasari komputasi informasi digital.
2. Representasi fisik mewujudkan mekanisme kontrol interaktif.
3. Representasi fisik perseptual digabungkan untuk secara aktif ditengahi representasi digital.
4. Keadaan fisik terlihat “mewujudkan aspek kunci dari negara digital dari sebuah sistem.
2.2 Dasar Model Dari TUI
Antarmuka antara manusia dan informasi membutuhkan dua komponen utama, yaitu input dan output, atau kontrol dan representasi. Kontrol memungkinkan pengguna untuk memanipulasi informasi, sedangkan representasi eksternal dianggap sebagai indera manusia. TUI menggunakan representasi nyata dari informasi yang juga berfungsi sebagai mekanisme kontrol secara langsung pada informasi digital. Dengan merepresentasikan informasi pada kedua bentuk tangible dan intangible, pengguna dapat lebih secara langsung menekankan representasi digital dengan menggunakan tangan mereka.
– Representasi Tangible Sebagai Kontrol
gambar 2.1 menggambarkan ide utama dari TUI untuk memberikan representasi (physical dan graspable) nyata eksternal ke informasi digital. Represenntasi tangible membantu jemabatan batas antara fisik dan dunia fisik. Representasi tangible juga adalah komputasi digabungkan dengan kontrol terhadap dasar informasi digital dan model komputasi.

Fungsi dari representasi tangible adalah sebagai pengendali fisik interaktif. Upaya TUI untuk mewujudkan informasi digital dalam bentuk fisik, memaksimalkan kelangsungan informasi dengan manipulasi sambungan ke dasar perhitungan. Melalui pemanipulasian fisik dari representasi tangible, representasi digital diubah.
– Representasi Intangible
Representasi tangible (berwujud) memungkinkan perwujudan fisik secara langsung digabungkan ke informasi digita. Namun, ia memiliki kemampuan terbatas.untuk mewakili perubahan banyak materi atau properti (sifat) fisik. Tidak seperti penempaan pixel pada komputer, untuk mengubah suatu objek fisik dalam bentuk, posisi, atau properti dalam real-time sangat sulit. Dalam perbandingan dengan “bit”, “atom” sangat kaku, mengambil massa dan ruang.
Ada beberapa jenis TUI yang telah digerakkan dari representasi berwujud (benda fisik) sebagai pusat dari umpan balik. Contohnya adalah inTouch ((Brave, et al., 1998), curlybot (Frei, et al., 2000a), dan topobo (Undian, et al, 2004). Jenis kekuatan umpan balik TUI ini tidak tergantung pada representasi berwujud, sejak umpan balik aktif melalui representasi berwujud sebagai saluran tampilan utama.
2.3 Genre Aplikasi TUI
TUI memiliki berbagai macam aplikasi domain. Ada terdpat 7 genre untuk aplikasi yang menjanjikan,, yaitu:
• Tangible Telepresence
Genre ini merupakan komunikasi antar-pribadi yang mengambil keuntungan dari interasiksi haptic yang diggunakan untuk menengahi representasi tangible dan kontrol.Genre ini bergantung pda pemetaan reprensentasi input haptic jarak jauh. Tangible telepresence, dasar mekanismenya dalah sinkronisasi objek terdistribusi dan gestural simulasi kehadiran artefak, sepertu gerakan atau getaran, yang memungkunka peserta jarak jauh untuk menyampaikan manipulasi hapticmereka dari pendistribusian objek fisik. Contohnya: inTouch (Berani dan Dahley, 1997), HandJive (Fogg, et al, 1998), dan ComTouch (Chang, et al . 2002).
• Tangible With Kinetic Memory
Penggunaan gerak kinestetik dan gerakan untuk meningkarkan pembelajaran konsep lain merupakan domain lain yang menjanjikan. Mainan pendidikan untuk mewujudkan catatan dan konsep bermain sudah dieksplorasi dengan menggunakan teknologi aktuasi dan mengambil keuntungan dari i/o kebetulan dari TUI. Gerak dalam ruang fisik menerangi hubungan matematika simetris di alam, dan gerakan kinetik dapat digunakan untuk mengajarkan kepada anak-anak konsep yang relevan dengan program dan geometri diferensial serta bercerita. Contoh dari genre ini adalah Curlybot (Frei, et, al, 2000) dan topobo (undian, et al, 2004) merupakan mainan yan menyaring ide-ide yang berkaitan dengan gerak tubuh dan bentuk pergerakan dinamis, fisik dan bercerita (strory telling).
• Constructive Assembly
Domain lainnya adalah pendekatan peraktian konstruktif yang menarik inspirasi dari LEGO TM dan blok bangunana, pembangunan pada interkoneksi unsur fisik modular. Domain ini terutama berkaitan dengan kesesuain fisik antara obyek dan hubungan kinetik antara potongan-potongan yang memungkinkan konstruksi yang lebih besar dan pergerakan varietas. Contoh domain ini adalah perakitan konstruksi yang dipelopori oleh Aish dan Frazer di akhir tahun 1970-an. Aish membangun BBS untuk analisis kinerja panas (thermal), dan Frazer membangun serangkaian pemodelan alat cerdas sperti Universal Constructor untuk pemodelan san simulasi. Contoh terbaru adalah AlgoBlock (Suzuki dan Kato, 1993), ActiveCube (Kitamura, et al, 2001), Blok System (Zuckerman dan resnick 2004), dll.
• Tokens and Constraints
Token dan kendala (constraint) adalaah pendekatan lain TUI untuk mengoperasikan informasi digital abstrak menggunakan mekanisme kendala (Ullmer, et al, 2005). Token adalah diskrit, benda fisik spasial reconfigurable yang mewakili digital informasi atau operasi. Kendal membatasi daerah dimana tanda dapat ditempatkan. Kendala yang dipetakan ke operasi digital atau properti yang diterapkan pada penempatan token dengan batasan-batasan.Kendala yang sering diwujudkan sebagai struktur fisik yang mekanisme salurannya menetukan bagaimana token dapat dimanipulasi, padahal sering membatasi pergerakannya pada dimensi fisik. Contohnya adalah media Blocks (Ullmer, et al, 1998), LogJam(Cohen, et al, 1999(, Tangible Query Interface (Ullmer, et al, 2003), dll
• Interactive Surfaces – table top TUI
Interaktif permukaan lain adalah pendekatan yang menjanjikan untuk mendukung kolaborasi desain dan simulasi yang telah dieksplorasi oleh banyak peneliti dalam tahun terakhir untuk mendukung berbagai aplikasi spasial. Digital Desk (Wallner, et al, 1993) adlah karya perintis dalam genre ini, dan berbegai TUI meja dikembangkan menggunakan beberapa artefak berwujud dalam bingkai umum dari permukaan kerja horizontal. Contohnya adalah metaDesk (Ulmer dan Ishi, 1997), AudioPad(Patten, et all, 2002), Desain Jaringan IP Workbeach (Kobayashi, et al, 2003), dll.
• Continuous Plastic TUI
Keterbatasan dari TUI sebelumnya adalah kurangnya kemampuan untuk mengubah bentuk representasi berwujud selama berinteraksi. Pengguna harus menggunakan standar himpunan objek fixed-form, hanya mengubah hubungan spasial diantara mereka, tetapi tidak bentuk individual objek itu sendiri. Alih-alih menggunakan benda diskrit dengan bentuk tetap, jenis baru dari sistem TUI memanfaatkan bahan tangible secara berlanjut, seperti tanah liat dan pasir yang dikembangkan untuk memberikan bentuk cepat dan patung untuk desain landscape. Contohnya adalah illumniating Clay (Piper, et al, 2002), dan SandSpcape (Ishii, et al, 2004).
• Augmented Everyday Objects
Peningkatan benda-benada yang familiar setiap harinya adalah pendekatan desain penting dari TUI untuk memperpendek lantai dan membuatnya mudah untuk memahami konsep-konsep dasar. Contohnya adalah Notebook Audio(Stifelman, 1996), LumiTouch(Chang, et al, 2001), I/O Brush (Ryokai, et al, 2004), dll.

3. Computer Vision
3.1 Pengenalan Computer Vision
Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision) yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki kemmpuan tingkat tinggi sebagaiman human visual. Kemampuan itu diantaranya adalah:
• Object detection → Apakah sebuah objek ada pada scene? Jika begiru, dimana batasan-batasannya..?
• Recognation → Menempatkan label pada objek.
• Description → Menugaskan properti kepada objek.
• 3D Inference → Menafsirkan adegan 3D dari 2D yang dilihat.
• Interpreting motion → Menafsirkan gerakan.
Computer Vision sering didefinisikan sebagai salah satu cabang ilmu pengetahuan yang mempelajari bagaimana komputer dapat mengenali obyek yang diamati/ diobservasi. Cabang ilmu ini bersama intelijensia semu (Artificial Intelligence) akan mampu menghasilkan sistem intelijen visual (Visual Intelligence System). Computer Vision adalah kombinasi antara Pengolahan Citra dan Pengenalan Pola yang hubungan antara ketiganya dapat dilihat pada gambar 1. Pengolahan citra merupakan proses awal dari computer vision, sedangkan pengenalan pola merupakan proses menginterpretasikan citra.

Pengolahan Citra (Image Processing) merupakan bidang yang berhubungan dengan proses transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra yang lebih baik. Sedangkan Pengenalan Pola (Pattern Recognition) berhubungan dengan proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.
Untuk mendukung tugas dari computer vision, aka ada beberapa fungsi pendukung yang ditambahkan ke dalam sistemini, yaitu:
• Proses penangkapan citra/gamabr (image acquisition)
• Proses pengolahan citra (image processing)
• Analisa data citra (image analysis)
• Proses pemahaman data citra (image understanding)
3.2 Proses dan Hirarki Pada Computer Vision
Ada terdapat 3 proses yang terjadi dalam computer vision, yaitu:
• Memperoleh atau mengakuisisi citra digital.
• Operasi pengolahan citra.
• Menganalisis dan menginterpretasi citra dan menggunakan hasil pemrosesan untuk tujuan tertentu, misal memandu robot, mengontrol peralatan, dll.

Hirarki pada computer vision ada 3 tahap, yaitu:
• Pengolahan Tingkat Rendah (Image to image) → Menghilangkan noise, dan peningkatan gambar (enchament image).
• Pengolahan Tingkat Menengah (Image to dimbolic) → Kumpulan garis / vektor yang merepresentasikan batas sebuah obyek PADA citra.
• Pengolah Tingkat Tinggi (Simbolic to simbolic) → Representasi simbolik batas- batas obyek menghasilkan nama obyek tersebut.
Sebelum membuat aplikasi computer vision, maka perlu dibuat pertimbangan dan perancangannya. Pertimbangan dan perancangan tersebut dapat dilakukan dalam 3 tahap, yaitu:
 Informasi apa yang ingin diperoleh dan bagaimana informasi tersebut dimanifestasikan ke dalam citra.
 Pengetahuan apa yang diperlukan untuk memperoleh informasi.
 Untuk menentukan hubungan antara intensitas piksel dan sifat-sifat citra diperlukan suatu model, misalnya adalah:
• Scene model: jenis features, textures, smoothness.
• Illumination model: posisi dan karakteristik sumber cahaya serta sifat-sifat reflektansi permukaan obyek .
• Sensor model: posisi dan kinerja optik dari kamera yang digunakan, noise dan distorsi pada proses dijitasi .
 Kecepatan pemrosesan dan representasi pengetahuan.

3.3 Aplikasi Computer Vision
Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer. Aplikasi pada visi komputer mencakup berbagai macam sistem, yaitu:
1. Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
2. Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
3. Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar urutan).
4. Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar medis / topografis).
5. Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia komputer).
6. Sub-domain visi komputer meliputi adegan rekonstruksi, acara deteksi, pelacakan video, pengenalan obyek, belajar, pengindeksan, gerak estimasi, dan gambar restorasi.

4. Browsing Audio Data
Browsing merupakan aktivitas menjelajahi dunia maya (Internet) untuk mencari informasi yang terkini tanpa batas dan tanpa birokrasi atau dikenal juga dengan istilah surfing internet (berselancar di dunia maya), software yang digunakan dikenal dengan nama web browser. Beberapa contoh web browser adalah Mozilla Firefox, Internet aexplorer, Opera, Chrome, dll.
Dalam beberapa tahun terakhir, perkembangan Internet telah didefinisikan kembali berbagai bidang hiburan, khususnya, yaitu musik. Hari ini, real-time Internet Real audio streaming musik dan MP3 secara teratur dinikmati oleh jutaan pendengar. Makalah ini menyajikan multimedia yang berpusat manusia audio (audio informasi) sistem pencarian melalui jaringan komputer.
Karya ini juga telah diurus memainkan audio yang terus-menerus tanpa ada data yang mengganggu dengan menerapkan mekanisme streaming dan buffering. Arsitektur sistem client-server berikut model. Database digunakan untuk menyimpan informasi metadata audio. Server audio yang bertanggung jawab untuk mengambil informasi dari database untuk memenuhi permintaan klien. Klien menyediakan antarmuka komputer manusia untuk pengguna melalui antarmuka pengguna grafis untuk browsing, mencari dan memainkan audio yang menarik melalui jaringan. Berdasarkan masukan klien permintaan pengguna ke server untuk mendapatkan informasi audio (seperti daftar film-film bahasa tertentu, daftar lagu-lagu film tertentu dan daftar lagu berdasarkan pencocokan pengguna memasukkan teks lirik). Audio pengambilan informasi dari basis data akan dilakukan oleh server berbasis teks menggunakan metode pencarian.
Browsing Audio Data merupakan metode browsing jaringan yang digunakan untuk browsing video / audio data yang ditangkap oleh sebuah IP kamera. Sebuah komputer lokal digabungkan ke LAN (local area network) untuk mendeteksi IP kamera. Jaringan video / audio metode browsing mencakupi langkah-langkah sebagai berikut :
 Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP.
 Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi.
 Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi compile ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditangkap oleh kamera IP, dimana server layanan menangkap video / audio data melalui Internet.
Browsing audio data tidak semudah browsing dokumen cetak, karena adanya sifat temporal suara. Ketika melakukan browsing terhadap dokumen, kita dapat dengan cepat mengalihkan fokus perhatian dengan membaca sepintas isi dari dokumen tersebut. Kita dapat mengetahui ukuran dan struktur dokumen, dan menggunakan memori spasial visual untuk mengingat dan mencari spesifik topik. Namun, ketika browsing suatu rekaman audio, kita harus berulang kali memainkan dan melompati bagian tertentu, tanpa memainkannya, kita tidak bisa menyadari suara atau isinya. Kita harus mendengarkan semua stream audio untuk dapat menangkap semua isinya.
Beberapa bentuk informasi yang dapat dicari (browsed) melalui internet, yaitu: informasi berupa teks (text/plain, text/html), image (image/gif, image/jpeg, image/png), video (video/mpeg, video/quicktime), audio (audio/basic, audio/wav) dan application (application/msword, application/octet-stream).

5. speech recognition
5.1 Pengenalan Speech Recognation
Speech recognation (ASR) adalah suatu pengembangan teknik dan sistem yang memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu perangkat.
Pengenalan ucapan (speech recognation) dalam perkembangan teknologinya merupakan bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi menjadi du kategori, yaitu:
• Piranti pengenalan kata (word recognation) yang mampu merespon ucapan-ucapan secara indovidu atau perintah-perintah yang menggunakan teknik yang dikenal sebagai speaker verification. Pertama kali sistem akan membangkitkan suatu template untuk mengenali suara user.
• Piranti pengenalan kalimat (speech recognation) yang mampu mengenali hubungan antar kata terucap di dalam kalimat atau frase. Teknik – teknik statistik dipakai dalam hal pola perekaman suara yang akan dicocokkan dengan kata-kata terucap.
5.2 Jenis-Jenis Pengenalan Ucapan
Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu :
 Kata-kata yang terisolasi : Proses pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata
 Kata-kata yang berhubungan : Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat
 Kata-kata yang berkelanjutan : Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural
 Kata-kata spontan: Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata
 Verifikasi atau identifikasi suara: Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara
5.3 Prinsip Dasar Speech Recognation
Semua metode dasar proses pengenalan suara terdiri dari dua fase operasi, yaitu:
• Proses training. Pada proses ini sistem belajar dari referensi pola yang berupa perbedaan pola sinyal suara misal frase, kata, fonem yang akan mengisi vocabulari dari sistem. Setiap referensi di pelajari dari kata yang dikatakan yang kemudian disimpan dalam template dan telah mengalami metode untuk merata-rata dan karakteristik statistik dan parameter statistik.
• Proses recognation. Pada proses ini sistem akan diberikan inputan yang belum diketahui dan akan di identifikasi berdasarkan pola template yang telah didapatkan pada proses training.
Pada umumnya, suatu sistem pengenalan suara terdiri dari beberapa modul utama, yaitu:
 Signal processign frontend digunakan untuk mengkonversi sinyal suara kedalam bentuk sequence feature vector yang akan digunakan pada saat klasifikasi.
 Accoustic modelling digunakan untuk memodelkan secara statistik hasil training yang telah dilakukan kedalam sebuah template.
 Language modelling digunakan untuk memodelkan bentuk kata baik berupa kata, fonem, ataupun kalimat.

5.4 Alat Pengenal Suara (Speech Recognizer)
Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar alat pengenal ucapan sifatnya masih tergantung kepada pengeras suara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi ini yang sifatnya tidak tergantung pada pengeras suara. Alat ini sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata.
Aplikasi dari alat pengenal suara dapata ditemukan dalam berbagai bidang, diantaranya adalah:
 Bidang komunikasi
– Komando Suara
Komando Suara adalah suatu program pada komputer yang melakukan perintah berdasarkan komando suara dari pengguna. Contohnya pada aplikasi Microsoft Voice yang berbasis bahasa Inggris. Ketika pengguna mengatakan “Mulai kalkulator” dengan intonasi dan tata bahasa yang sesuai, komputer akan segera membuka aplikasi kalkulator. Jika komando suara yang diberikan sesuai dengan daftar perintah yang tersedia, aplikasi akan memastikan komando suara dengan menampilkan tulisan “Apakah Anda meminta saya untuk ‘mulai kalkulator’?”. Untuk melakukan verifikasi, pengguna cukup mengatakan “Lakukan” dan komputer akan langsung beroperasi.
– Pendiktean
Pendiktean adalah sebuah proses mendikte yang sekarang ini banyak dimanfaatkan dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi Microsoft Dictation yang merupakan aplikasi yang dapat menuliskan apa yang diucapkan oleh pengguna secara otomatis.
– Telepon
Pada telepon, teknologi pengenal ucapan digunakan pada proses penekanan tombol otomatis yang dapat menelpon nomor tujuan dengan komando suara.
 Bidang kesehatan
Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna atau Voice User Interface (VUI) yang menggunakan teknologi pengenal ucapan dimana pengendalian saklar lampu misalnya, tidak perlu dilakukan secara manual dengan menggerakkan saklar tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan sebagai saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini tidak hanya untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi kontrol yang lain.

 Bidang militer
– Pelatihan Penerbangan
Aplikasi alat pengenal ucapan dalam bidang militer adalah pada pengatur lalu-lintas udara atau yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai oleh para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai pengganti operator yang memberikan informasi kepada pilot dengan cara berdialog.
– Helikopter
Aplikasi alat pengenal ucapan pada helikopter digunakan untuk berkomunikasi lewat radio dan menyesuaikan sistem navigasi. Alat ini sangat diperlukan pada helikopter karena ketika terbang, sangat banyak gangguan yang akan menyulitkan pilot bila harus berkomunikasi dan menyesuaikan navigasi dengan terlebih dahulu memencet tombol tertentu.
5.5 Kekurangan dan Kelebihan Alat Pengenal Suara (Speech Recognizer)
Kelebihan dari peralatan yang menggunakan teknologi ini adalah:
1. Cepat. Teknologi ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut. Contohnya pada komando suara. Hanya dalam selang waktu sekitar satu atau dua detik setelah kita mengkomandokan perintah melalui suara, komputer sudah memberi umpan balik atas komando kita.
2. Mudah digunakan. Kemudahan teknologi ini juga dapat dilihat dalam aplikasi komando suara. Komando yang biasanya kita masukkan ke dalam komputer dengan menggunakan tetikus atau papan ketik kini dapat dengan mudahnya kita lakukan tanpa perangkat keras, yakni dengan komando suara.
Sedangkan kekurangan dari peralatan menggunakan teknologi ini adalah:
1. Rawan terhadap ganguan. Hal ini disebabkan oleh proses sinyal suara yang masih berbasis frekuensi. Ketika sebuah informasi dalam sinyal suara mempunyai komponen frekuensi yang sama banyaknya dengan komponen frekuensi gangguannya, akan sulit untuk memisahkan gangguan dari sinyal suara
2. Jumlah kata yang dapat dikenal terbatas. Hal ini disebabkan pengenal ucapan bekerja dengan cara mencari kemiripan dengan basis data yang dimiliki.

6. Speech Synthesis
6.1 Pengertian Speech Synthesis
Speech synthesis adalah transformasi dari teks ke arah suara (speech). Transformasi ini mengkonversi teks ke pemadu suara (speech synthesis) yang sebisa mungkin dibuat menyerupai suara nyata, disesuaikan dengan aturan – aturan pengucapan bahasa.TTS (text to speech) dimaksudkan untuk membaca teks elektronik dalam bentuk buku, dan juga untuk menyuarakan teks dengan menggunakan pemaduan suara. Sistem ini dapat digunakan sebagai sistem komunikasi, pada sistem informasi referral, dapat diterapkan untuk membantu orang-orang yang kehilangan kemampuan melihat dan membaca.
Ada beberapa masalah yang terdapat pada pemaduan suara, yaitu:
 User sangat sensitif terhadap variasi dan informasi suara. Oleh sebab itu, mereka tidak dapat memberikan toleransi atas ketidaksempurnaan pemadu suara.
 Output dalam bentuk suara tidak dapat diulang atau dicari dengan mudah.
 Meningkatkan keberisikan pada lingkungan kantor atau jika menggunakan handphone, maka akan meningkatkan biaya pengeluaran.
Lingkungan dari aplikasi pemadu suara adalah:
• Bagi tunanetra, pemadu suara menawarkan media komunkasi dimana mereka dapat memiliki akses yang tidak terbatas.
• Lingkungan dimana visual dan haptic skill user berfokus pada hal lain. Contohnya: sinyal bahaya pada kokpit pesawat udara.
6.2 Sejarah Speech Synthesis
Upaya yang paling awal untuk menghasilkan lahirnya pemandu suara, pada abad XVIII. Terlepas dari kenyataan bahwa upaya pertama adalah bentuk mesin mekanis, kita dapat mengatakan hari ini bahwa synthesizer sudah berkualitas tinggi. Pada tahun 1779 di St Petersburg, Rusia Profesor Kratzenshtein Kristen fisiologis menjelaskan perbedaan antara lima vokal panjang (/ A /, / e /, / i /, / o /, dan / u /) dan membuat alat untuk menghasilkan mereka artifisial. Tahun 1791 di Wina, Wolfgang von Kempelen memperkenalkan nya “Akustik-Mekanik Mesin Speech”. Dalam sekitar pertengahan 1800-an Charles Wheatstone dibangun terkenal versi mesin berbicara von Kempelen’s.
Generasi dari sistem pemaduan suara ini dapat dibagi ke dalam 3 masa, yaitu:
 Generasi pertama (1962-1977). Format sintesis dari fonem adalah teknologi dominan. Teknologi ini memanfaatkan aturan berdasarkan penguraian fonetik pada kalimat untuk kontur frekuensi forman. Beberapa sintesis masih miskin atau kurang dalam kejelasan dan kealamiannya.
 Generasi kedua (1977-1992). Metode pemadu suara adalah diphone diwakilkan dengan parameter LPC. Hal tersebut menunujukkan bahwa kejelasan yang baik pada pemadu suara dapat diperoleh dengan andal dari input teks dengan menggabungkan diphone yang sesuai dengan unit. Kejelasan meningkat selama sintesis forman, tetapi kealamian dari pemadu suara masih tetap rendah.
 Generasi ketiga (1992-sekarang). Generasi ini ditandai dengan metode ‘ sintesis pemilihan unit’ yang diperkenalkan dan disempurnakan oelh Sagisaka di Labs ATR Kyoto. Hasil dari pemandu suara pada periode ini sangat mendekati human-generated speech pada bagian kejelasan dan kealamian,
Teknologi pemadu suara modern melibatkan metode dan algoritma yang canggih dan rumit. alat pemadu suara dari keluarga “Infovox” mungkin mejadi salah satu multi bahasa TTS yang paling dikenal saat ini. Versi komersial pertamanya, Infovox-SA 101, dikembangkan pada tahun 1982 di Institute Teknologi Royal, Swedia dan didasarkan pada sintesis forman. AT & T Bell Laboratories (Lucent Technologies) juga memiliki tradisi yang sangat panjang tentang pemandu suara (speech synthesis). TTS lengkap yang pertama didemostrasikan di Boston pada tahun 1972 dan diliris pada tahun 1973. Hal ini didasarkan pada model artikulatoris yang sikembangkan oleh Ceceil Coker (Klatt 1987). Pengembangan proses dari sistem penggabungan sintesis ini dimulai oleh Joseph Olive pada pertengahan tahun 1970-an (Bell Labs 1997). Sistem ini sekarang sudah tersedia untuk bahasa Inggris, Perancis, Spanyol, Italia, Jerman, Rusia, Rumania, Cina, dan Jepang (Mcbius et al 1996).

DAFTAR PUSTAKA
[1] Edy Winarno, Pengolahan Citra,fti-unisbank-smg, 2009
[2] Hiroshi Ishii, Tangible User Interfaces, MIT Media Laboratory
[3] http://en.wikipedia.org/wiki/Head-up_display
[4] http://joanmathilda.wordpress.com/2009/11/29/computer-vision/
[5] http://pjj-vedca.depdiknas.go.id/literasi/modul/Browsing_Internet.pdf
[6] http://en.wikipedia.org/wiki/Speech_recognition
[7] http://student.eepis-its.edu/syafur/IES/Syafur/bukuta/hmmbuku1.doc
[8] http://student.eepis-its.edu/syafur/IES/Syafur/buku_ta/hmmbuku1.doc
[9] http://tony911.files.wordpress.com/2010/03/bukuajarimk.pdf

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: