Last Updated on October 27, 2021 by
Artikel seri tutorial HTML/CSS sebelumnya telah membahas tentang formatting teks pada HTML. Kali ini kami akan membahas tentang Encoding HTML. URL Encoding mengubah karakter menjadi format yang dapat ditransmisikan melalui Internet.
URL hanya dapat dikirim melalui Internet menggunakan set karakter dari ASCII. Karena sering berisi karakter di luar dari set karakter ASCII, URL harus diubah menjadi format ASCII yang valid.
Encoding URL menggantikan karakter ASCII yang tidak aman dengan “%” diikuti oleh dua digit heksadesimal. URL tidak boleh berisi spasi. Pengkodean atau encoding URL biasanya menggantikan spasi dengan tanda tambah atau plus (+) atau dengan %20. Berikut adalah penjelasan lengkap tentang Encoding URL HTML.
Table of Contents
Memahami Encoding HTML
Kebutuhan akan pengkodean karakter muncul dari banyaknya pilihan karakter yang tersedia. Selain huruf Latin dan angka Arab yang biasa Anda gunakan, ada juga huruf asing, simbol matematika, dan karakter khusus lainnya. Namun, dokumen yang memiliki definisi encoding HTML berbeda dapat menampilkannya secara berbeda.
Teks yang ditafsirkan secara salah menyebabkan berbagai masalah:
- Pengguna tidak dapat membaca teks dengan benar
- Mesin pencari tidak dapat menemukan data
- Mesin tidak dapat memproses informasi
Semua karakter yang tersedia dikelompokkan ke dalam set tertentu disebut juga sebagai rangkaian karakter atau charsets for short. Dengan mendefinisikan pengkodean HTML, Anda membiarkan browser mengakses set tertentu dan menampilkan karakternya dengan benar.
Sebagai contoh, orang Jepang bahkan memiliki istilah khusus untuk sekelompok karakter yang ditafsirkan dengan buruk – mojibake (文字化け).
ASCII: Charset Dasar
Encoding karakter HTML pertama dan paling sederhana disebut ASCII. Sebagian besar rangkaian karakter modern menggunakannya sebagai basis standar. American Standard Code for Information Interchange yang merupakan kepanjangan dari ASCII. ASCII telah dikembangkan dari kode telegraf pada awal 1960-an dan berisi 128 karakter, 95 di antaranya dapat dicetak:
- Lowercase Latin Letters (Huruf latin kecil)
- Uppercase Latin Letters (Huruf latin besar)
- Punctuation Symbol (Simbol tanda baca)
- Angka dari 0 hingga 9
Ada 33 karakter yang tidak dapat dicetak juga disebut karakter kontrol. Hal tersebut adalah simbol transparan misalnya, yang memungkinkan pemisahan kata atau paragraf. Namun, saat ini popularitas ASCII turun karena Internet tumbuh semakin internasional. Hanya mendukung karakter Latin dengan cepat menjadi tidak cukup.
UTF-8 Opsi Terbaik Anda
Unicode adalah standar industri yang digunakan untuk konsistensi pengkodean karakter. Hal tersebut diterbitkan pada awal 1990-an dan memiliki beberapa rangkaian karakter, seperti UTF-8, UTF-16, dan UTF-32.
UTF-8 adalah singkatan dari Unicode Transformation Format 8-bit dan telah memegang gelar pengkodean karakter HTML paling populer sejak 2008. Pada 2019, lebih dari 90 persen dari semua situs web menggunakan UTF-8. Hal ini juga direkomendasikan untuk digunakan sebagai pengkodean karakter HTML default oleh World Web Consortium.
Ada beberapa alasan Anda harus menggunakan UTF-8:
- UTF-8 mendukung banyak bahasa.
- UTF-8 pun sepenuhnya kompatibel dengan ASCII.
- UTF-8 secara asli digunakan oleh XML.
- UTF-8 menggunakan lebih sedikit ruang daripada pengkodean Unicode lainnya.
Untuk mendeklarasikan UTF-8 sebagai pengkodean karakter HTML pilihan Anda, Anda harus menggunakan tag <meta> dengan atribut charset dan UTF-8 sebagai nilainya:
<meta charset=”UTF-8″>
Encoding HTML Alternatif
Anda dapat menemukan banyak pengkodean alternatif di Encoding Living Standard yang dibuat oleh Web Hypertext Application Technology Working Group (WHATWG). Namun, kami sangat menyarankan Anda untuk tetap menggunakan UTF-8, karena rangkaian karakter lain berisi pilihan karakter yang lebih sedikit, dan itu dapat menyebabkan masalah dalam menampilkan situs web Anda.
Demikianlah penjelasan tentang Encoding HTML yang harus Anda ketahui. Kami membagikan beberapa tips untuk Anda yang saat bekerja dengan Encoding HTML.
- Tampilan yang tepat dari karakter Anda tidak hanya bergantung pada rangkaian karakter tetapi juga font yang dipilih: tidak semuanya memiliki versi untuk setiap karakter.
- Jika font yang Anda pilih tidak memiliki simbol yang Anda butuhkan, font tersebut akan mencari kecocokan di font lain atau menampilkan karakter lain (misalnya, tanda tanya).
- Jangan lupa bahwa Anda juga perlu menentukan pengkodean HTML saat menyimpan dokumen Anda.
Jika Anda ingin belajar tentang HTML/CSS, kunjungi seri artikel tutorial HTML/CSS di situs Codekey. Codekey menyediakan berbagai artikel tutorial, materi, pembahasan, tips, dan trik untuk Anda belajar HTML/CSS.
Tidak hanya HTML/CSS, Codekey juga menyediakan bahasa pemrograman lainnya. Jangan lupa untuk dapatkan update terbaru dari Codekey.
Jasa Pembuatan Aplikasi, Website dan Internet Marketing | PT APPKEY
PT APPKEY adalah perusahaan IT yang khusus membuat aplikasi Android, iOS dan mengembangkan sistem website. Kami juga memiliki pengetahuan dan wawasan dalam menjalankan pemasaran online sehingga diharapkan dapat membantu menyelesaikan permasalahan Anda.