Last Updated on September 24, 2022 by
Halo pembaca setia Codekey.id! Siap untuk belajar Python kembali? Sebagai seorang yang menekuni bahasa pemrograman, pastinya Anda mengetahui bahwa dalam membuat sebuah projek kita tidak bisa hanya menggunakan satu bahasa pemrograman saja. Kita perlu menggunakan bahasa lainnya untuk membantu dan menyempurnakan projek yang kita buat.
XML adalah salah satu bahasa pemrograman open source yang sering digunakan dalam pembuatan projek sebab bahasa satu ini memungkinkan user melakukan XML parsing. Dengan melakukan XML parsing maka coding yang Anda buat dapat dibaca oleh aplikasi atau bahasa pemrograman lainnya, termasuk Python terlepas dari sistem operasi dan atau bahasa pengembangan yang digunakan.
Nah, kali ini kami akan menjelaskan tentang XML parsing khusus untuk Anda. Berikut ini bahasan-bahasan yang akan kita pelajari:
- Mengenal Apa itu XML
- Arsitektur dan API pada XML Parser
- Menguraikan XML dengan SAX API
- Mengurai XML dengan DOM API
Table of Contents
Mengenal Apa itu XML
Hal pertama yang harus dipahami dalam pembahasan kali ini tentu saja pengertian XML itu sendiri. Anda tentunya sudah sering mendengar bahkan mengetahui apa itu XML. Secara singkatnya XML atau Extensible Markup Language adalah bahasa markup seperti HTML atau SGML. Bahasa pemrograman satu ini direkomendasikan oleh World Wide Web Consortium dan tersedia sebagai salah satu bahasa open source.
XML sangat berguna untuk melacak data dalam jumlah kecil hingga pada tahap menengah tanpa memerlukan backbone berbasis SQL. Oleh karena itu XML merupakan salah satu bahasa pemrograman yang sangat terkenal dan banyak digunakan dalam dunia pemrograman.
Arsitektur dan API pada XML Parser
Library standar Python menyediakan serangkaian antarmuka yang minimal namun sangat berguna untuk bekerja dengan XML sehingga sangat mudah bagi Anda untuk Python parse XML.
Dua jenis API yang paling dasar dan banyak digunakan untuk data XML adalah SAX dan DOM interfaces. Di mana penjelasan tentang API SAX dan DOM dapat Anda lihat pada dua poin di bawah ini:
- Simple API for XML (SAX), dengan menggunakan SAX Anda mendaftarkan callback untuk event yang menarik dan kemudian membiarkan parser melanjutkan dokumen. Penggunaan interface satu ini berguna ketika dokumen Anda berukuran besar atau Anda memiliki keterbatasan memori. Dengan mengunakannya maka pada saat XML parsing membaca file dari disk, seluruh file tidak pernah disimpan dalam memori.
- Document Object Model (DOM), jenis API satu ini adalah rekomendasi World Wide Web Consortium di mana seluruh file dibaca ke dalam memori yang kemudian disimpan dalam bentuk hierarkis (berbasis pohon) untuk mewakili semua fitur dokumen XML.
Dari penjelasan di atas, dipahami bahwa SAX jelas tidak dapat memproses informasi secepat DOM ketika bekerja dengan file yang berukuran besar. Namun di sisi lain, dengan bekerja menggunakan DOM secara eksklusif dapat benar-benar mematikan sumber daya Anda, terutama jika penerapannya digunakan pada banyak file yang berukuran kecil.
SAX memiliki sifat read-only, sedangkan DOM yang memungkinkan Anda untuk melakukan editing atau perubahan pada file XML. Karena kedua API yang memiliki karakter berbeda ini benar-benar saling melengkapi, tidak ada alasan mengapa Anda tidak dapat menggunakan keduanya untuk proyek besar secara bersamaan.
Pada contoh coding yang akan kita terapkan nantinya, untuk semua contoh code XML, kami akan menggunakan file XML sederhana movie.xml sebagai inputan. Berikut contoh penerapannya:
<collection shelf="Daftar Siswa"> <siswa nama="Andi"> <kelas>4</kelas> <usia>10</usia> <hobi>Berenang</hobi> </siswa> <siswa nama="Budi"> <kelas>3</kelas> <usia>9</usia> <hobi>Menggambar</hobi> </siswa> <siswa title="Tono"> <kelas>4</kelas> <usia>11</usia> <hobi>Membaca</hobi> </siswa> </collection>
Menguraikan XML dengan SAX API
SAX adalah interface atau antarmuka standar yang digunakan untuk melakukan XML parsing yang dipicu oleh suatu peristiwa, singkatnya dapat kita sbeut event-driven. Melakukan XML parsing dengan menggunakan SAX umumnya mengharuskan Anda untuk membuat ContentHandler Anda sendiri dengan mensubklasifikasikan xml.sax.ContentHandler.
ContentHandler Anda akan menangani tag dan atribut tertentu dari flavor(s) XML yang Anda miliki. Objek ContentHandler sendiri, menyediakan metode untuk menangani berbagai event yang akan diuraikan atau diparshing. XML Parser yang dimiliki akan memanggil metode ContentHandler saat melakukan file XML parsing.
Metode startDocument dan endDocument yang digunakan akan dipanggil pada bagian awal dan akhir file XML. Pada metode characters(text) akan melewatkan data karakter dari file XML melalui parameter teks.
Sementara itu untuk ContentHandler juga akan dipanggil di awal dan akhir setiap elemen yang ada. Jika XML parser tidak ada dalam mode namespace, metode startElement(tag, atribut) dan endElement(tag) akan dipanggil. Namun jika tidak dipanggil, metode yang sesuai startElementNS dan endElementNS lah yang akan dipanggil. Dalam kondisi ini, tag adalah tag elemen, dan atribut adalah objek Atribut.
Berikut ini merupakan beberapa metode penting lainnya yang harus Anda pahami sebelum melanjutkan materi Pyton Parse XML berikutnya.
Metode make_parser_
Dalam penggunaan SAX pada XML Parsing juga terdapat metode yang disebut dengan make_parser_ . Metode ini berfungsi untuk membuat objek parser baru dan kemudian mengembalikannya. Objek parser yang dibuat menggunakan mekae_parser_ akan menjadi tipe parser pertama yang ditemukan sistem. Berikut code pembuatannya:
xml.sax.parse( xmlfile, contenthandler[, errorhandler])
Di mana detail paramter di atas dapat dilihat pada penjelasan di bawah ini:
- xmlfile– merupakan parameter yang menunjukkan nama file XML untuk dibaca.
- Contenthandler—Merupakan paramter yang harus berupa objek ContentHandler.
- Errorhandler—merupakan parameter yang jika ditentukan, errorhandler harus menjadi objek SAX ErrorHandler.
Metode parseString_
Metode lainnya yang dapat diterapkan pada Python parse XML dengan metode SAX, yaitu parseString_ yang dapat membantu untuk mengurai string XML yang telah ditentukan. DI mana code pembuatannya ialah sebagai berikut:
xml.sax.parseString(xmlstring, contenthandler[, errorhandler])
Detail dari parameter di atas ialah sebagai berikut:
- xmlstring– Merupakan parameter yang menunjukkan nama string XML untuk dibaca.
- contenthandlermerupakan paramter yang harus berupa objek ContentHandler.
- errorhandlerParameter satu ini adalah parameter yang jika ditentukan, errorhandler harus menjadi objek SAX ErrorHandler.
Contoh penerapan metode SAX ialah sebagai berikut:
#!/usr/bin/python import xml.sax class SiswaHandler( xml.sax.ContentHandler ): def __init__(self): self.CurrentData = "" self.kelas = "" self.usia = "" self.hobi = "" # Call when an element starts def startElement(self, tag, attributes): self.CurrentData = tag if tag == "siswa": print "*****Siswa*****" nama = attributes["nama"] print "Nama:", nama # Call when an elements ends def endElement(self, tag): if self.CurrentData == "kelas": print "Kelas:", self.kelas elif self.CurrentData == "usia": print "Usia:", self.usia elif self.CurrentData == "hobi": print "Hobi:", self.hobi self.CurrentData = "" # Call when a character is read def characters(self, content): if self.CurrentData == "kelas": self.kelas = content elif self.CurrentData == "usia": self.usia = content elif self.CurrentData == "hobi": self.hobi = content if ( __name__ == "__main__"): # create an XMLReader parser = xml.sax.make_parser() # turn off namepsaces parser.setFeature(xml.sax.handler.feature_namespaces, 0) # override the default ContextHandler Handler = SiswaHandler() parser.setContentHandler( Handler ) parser.parse("siswa.xml")
Jika penulisan coding benar, maka output yang ditunjukkan ialah sebagai berikut:
*****Siswa*****
Nama: Andi
Kelas: 4
Usia: 10
Hobi: Berenang
*****Siswa*****
Nama: Budi
Kelas: 3
Usia: 9
Hobi: Menggambar
*****Siswa*****
Nama: Tono
Kelas: 4
Usia: 11
Hobi: Membaca
Mengurai XML dengan DOM API
Document Object Model atau yang disingkat dengan DOM adalah API lintas bahasa dari World Wide Web Consortium (W3C) yang biasa digunakan untuk mengakses dan memodifikasi dokumen XML.
Salah satu fungsi DOM yang sangat berguna ialah untuk mengakses aplikasi secara acak. Pada SAX hanya memungkinkan Anda melihat satu bit dokumen pada satu waktu. Jika Anda melihat satu elemen SAX, Anda tidak akan dapat memiliki akses ke elemen lainnya.
Di bawah ini kami uraikan bagaimana cara termudah untuk memuat dokumen XML dengan cepat dan membuat objek minidom menggunakan modul xml.dom. Objek minidom ini sendiri menyediakan metode parser sederhana yang dengan cepat membuat pohon DOM dari file XML yang ada.
Pada contoh frase di bawah ini ditunjukkan cara untuk memanggil fungsi parse( file [,parser] ) dari objek minidom untuk mengurai file XML yang ditunjuk oleh file ke dalam objek pohon DOM.
#!/usr/bin/python from xml.dom.minidom import parse import xml.dom.minidom # Open XML document using minidom parser DOMTree = xml.dom.minidom.parse("siswa.xml") collection = DOMTree.documentElement if collection.hasAttribute("shelf"): print "Root element : %s" % collection.getAttribute("shelf") # Get all the movies in the collection siswas = collection.getElementsByTagName("siswa") # Print detail of each movie. for siswa in siswas: print "*****Siswa*****" if siswa.hasAttribute("nama"): print "Nama: %s" % siswa.getAttribute("nama") kelas = siswa.getElementsByTagName('kelas')[0] print "Kelas: %s" % kelas.childNodes[0].data usia = siswa.getElementsByTagName('usia')[0] print "Usia: %s" % usia.childNodes[0].data hobi = siswa.getElementsByTagName('hobi')[0] print "Hobi: %s" % hobi.childNodes[0].data
Jika coding sudah benar dan tidak ditemukan error, maka Anda akan mendapatkan output sebagai berikut:
Root element : Daftar Siswa
*****Siswa*****
Nama: Andi
Kelas: 4
Usia: 10
Hobi: Berenang
*****Siswa*****
Nama: Budi
Kelas: 3
Usia: 9
Hobi: Menggambar
*****Siswa*****
Nama: Tono
Kelas: 4
Usia: 11
Hobi: Membaca
Apakah coding Anda sudah benar dan berhasil melakukan XML parsing? Jika sudah, kini Anda dapat menghubungkan Python dengan XML. Anda siap melanjutkan projek besar Anda.
Sampai di sini pembahasan tentang Pyton parse XML kali ini. Ikuti terus berbagai tutorial bahasa pemrograman lainnya hanya di codekey.id
Sampai jumpa kembali, semoga bermanfaat!
Jasa Pembuatan Aplikasi, Website dan Internet Marketing | PT APPKEY
PT APPKEY adalah perusahaan IT yang khusus membuat aplikasi Android, iOS dan mengembangkan sistem website. Kami juga memiliki pengetahuan dan wawasan dalam menjalankan pemasaran online sehingga diharapkan dapat membantu menyelesaikan permasalahan Anda.