Media Belajar Bahasa Pemrograman | by APPKEY

PythonTutorial Python 37 : Cara Melakukan XML Parsing pada...

Tutorial Python 37 : Cara Melakukan XML Parsing pada Python

-

Last Updated on September 24, 2022 by

Halo pembaca setia Codekey.id! Siap untuk belajar Python kembali? Sebagai seorang yang menekuni bahasa pemrograman, pastinya Anda mengetahui bahwa dalam membuat sebuah projek kita tidak bisa hanya menggunakan satu bahasa pemrograman saja. Kita perlu menggunakan bahasa lainnya untuk membantu dan menyempurnakan projek yang kita buat.

XML adalah salah satu bahasa pemrograman open source yang sering digunakan dalam pembuatan projek sebab bahasa satu ini memungkinkan user melakukan XML parsing. Dengan melakukan XML parsing maka coding yang Anda buat dapat dibaca oleh aplikasi atau bahasa pemrograman lainnya, termasuk Python terlepas dari sistem operasi dan atau bahasa pengembangan yang digunakan.

Nah, kali ini kami akan menjelaskan tentang XML parsing khusus untuk Anda. Berikut ini bahasan-bahasan yang akan kita pelajari:

  • Mengenal Apa itu XML
  • Arsitektur dan API pada XML Parser
  • Menguraikan XML dengan SAX API
  • Mengurai XML dengan DOM API

Mengenal Apa itu XML

Hal pertama yang harus dipahami dalam pembahasan kali ini tentu saja pengertian XML itu sendiri. Anda tentunya sudah sering mendengar bahkan mengetahui apa itu XML. Secara singkatnya XML atau Extensible Markup Language adalah bahasa markup seperti HTML atau SGML. Bahasa pemrograman satu ini direkomendasikan oleh World Wide Web Consortium dan tersedia sebagai salah satu bahasa open source.

XML sangat berguna untuk melacak data dalam jumlah kecil hingga pada tahap menengah tanpa memerlukan backbone berbasis SQL. Oleh karena itu XML merupakan salah satu bahasa pemrograman yang sangat terkenal dan banyak digunakan dalam dunia pemrograman.

Arsitektur dan API pada XML Parser

Library standar Python menyediakan serangkaian antarmuka yang minimal namun sangat berguna untuk bekerja dengan XML sehingga sangat mudah bagi Anda untuk Python parse XML.

Dua jenis API yang paling dasar dan banyak digunakan untuk data XML adalah SAX dan DOM interfaces. Di mana penjelasan tentang API SAX dan DOM dapat Anda lihat pada dua poin di bawah ini:

  • Simple API for XML (SAX), dengan menggunakan SAX Anda mendaftarkan callback untuk event yang menarik dan kemudian membiarkan parser melanjutkan dokumen. Penggunaan interface satu ini berguna ketika dokumen Anda berukuran besar atau Anda memiliki keterbatasan memori. Dengan mengunakannya maka pada saat XML parsing membaca file dari disk, seluruh file tidak pernah disimpan dalam memori.
  • Document Object Model (DOM), jenis API satu ini adalah rekomendasi World Wide Web Consortium di mana seluruh file dibaca ke dalam memori yang kemudian disimpan dalam bentuk hierarkis (berbasis pohon) untuk mewakili semua fitur dokumen XML.

Dari penjelasan di atas, dipahami bahwa SAX jelas tidak dapat memproses informasi secepat DOM ketika bekerja dengan file yang berukuran besar. Namun di sisi lain, dengan bekerja menggunakan DOM secara eksklusif dapat benar-benar mematikan sumber daya Anda, terutama jika penerapannya digunakan pada banyak file yang berukuran kecil.

SAX memiliki sifat read-only, sedangkan DOM yang memungkinkan Anda untuk melakukan editing atau perubahan pada file XML. Karena kedua API yang memiliki karakter berbeda ini benar-benar saling melengkapi, tidak ada alasan mengapa Anda tidak dapat menggunakan keduanya untuk proyek besar secara bersamaan.

Pada contoh coding yang akan kita terapkan nantinya, untuk semua contoh code XML, kami akan menggunakan file XML sederhana movie.xml sebagai inputan. Berikut contoh penerapannya:

<collection shelf="Daftar Siswa">
<siswa nama="Andi">
   <kelas>4</kelas>
   <usia>10</usia>
   <hobi>Berenang</hobi>
</siswa>
<siswa nama="Budi">
   <kelas>3</kelas>
   <usia>9</usia>
   <hobi>Menggambar</hobi>
</siswa>
<siswa title="Tono">
   <kelas>4</kelas>
   <usia>11</usia>
   <hobi>Membaca</hobi>
</siswa>
</collection>

Menguraikan XML dengan SAX API

SAX adalah interface atau antarmuka standar yang digunakan untuk melakukan XML parsing yang dipicu oleh suatu peristiwa, singkatnya dapat kita sbeut event-driven. Melakukan XML parsing dengan menggunakan SAX umumnya mengharuskan Anda untuk membuat ContentHandler Anda sendiri dengan mensubklasifikasikan xml.sax.ContentHandler.

ContentHandler Anda akan menangani tag dan atribut tertentu dari flavor(s) XML yang Anda miliki. Objek ContentHandler sendiri, menyediakan metode untuk menangani berbagai event yang akan diuraikan atau diparshing. XML Parser yang dimiliki akan memanggil metode ContentHandler saat melakukan file XML parsing.

Metode startDocument dan endDocument yang digunakan akan dipanggil pada bagian awal dan akhir file XML. Pada metode characters(text) akan melewatkan data karakter dari file XML melalui parameter teks.

Sementara itu untuk ContentHandler juga akan dipanggil di awal dan akhir setiap elemen yang ada. Jika XML parser tidak ada dalam mode namespace, metode startElement(tag, atribut) dan endElement(tag) akan dipanggil. Namun  jika tidak dipanggil, metode yang sesuai startElementNS dan endElementNS lah yang akan dipanggil. Dalam kondisi ini, tag adalah tag elemen, dan atribut adalah objek Atribut.

Berikut ini merupakan beberapa metode penting lainnya yang harus Anda pahami sebelum melanjutkan materi Pyton Parse XML berikutnya.

Metode make_parser_

Dalam penggunaan SAX pada XML Parsing juga terdapat metode yang disebut dengan make_parser_ . Metode ini berfungsi untuk membuat objek parser baru dan kemudian mengembalikannya. Objek parser yang dibuat menggunakan mekae_parser_ akan menjadi tipe parser pertama yang ditemukan sistem. Berikut code pembuatannya:

xml.sax.parse( xmlfile, contenthandler[, errorhandler])

Di mana detail paramter di atas dapat dilihat pada penjelasan di bawah ini:

  • xmlfile– merupakan parameter yang menunjukkan nama file XML untuk dibaca.
  • Contenthandler—Merupakan paramter yang harus berupa objek ContentHandler.
  • Errorhandler—merupakan parameter yang jika ditentukan, errorhandler harus menjadi objek SAX ErrorHandler.

Metode parseString_

Metode lainnya yang dapat diterapkan pada Python parse XML dengan metode SAX, yaitu parseString_ yang dapat membantu untuk mengurai string XML yang telah ditentukan. DI mana code pembuatannya ialah sebagai berikut:

xml.sax.parseString(xmlstring, contenthandler[, errorhandler])

Detail dari parameter di atas ialah sebagai berikut:

  • xmlstring– Merupakan parameter yang menunjukkan nama string XML untuk dibaca.
  • contenthandlermerupakan paramter yang harus berupa objek ContentHandler.
  • errorhandlerParameter satu ini adalah parameter yang jika ditentukan, errorhandler harus menjadi objek SAX ErrorHandler.

Contoh penerapan metode SAX ialah sebagai berikut:

#!/usr/bin/python

import xml.sax

class SiswaHandler( xml.sax.ContentHandler ):
   def __init__(self):
      self.CurrentData = ""
      self.kelas = ""
      self.usia = ""
      self.hobi = ""

   # Call when an element starts
   def startElement(self, tag, attributes):
      self.CurrentData = tag
      if tag == "siswa":
         print "*****Siswa*****"
         nama = attributes["nama"]
         print "Nama:", nama

  # Call when an elements ends
   def endElement(self, tag):
      if self.CurrentData == "kelas":
         print "Kelas:", self.kelas
      elif self.CurrentData == "usia":
         print "Usia:", self.usia
      elif self.CurrentData == "hobi":
         print "Hobi:", self.hobi
      self.CurrentData = ""

   # Call when a character is read
   def characters(self, content):
      if self.CurrentData == "kelas":
         self.kelas = content
      elif self.CurrentData == "usia":
         self.usia = content
      elif self.CurrentData == "hobi":
         self.hobi = content
  
if ( __name__ == "__main__"):
   
   # create an XMLReader
   parser = xml.sax.make_parser()

   # turn off namepsaces
   parser.setFeature(xml.sax.handler.feature_namespaces, 0)

   # override the default ContextHandler
   Handler = SiswaHandler()
   parser.setContentHandler( Handler )
   
   parser.parse("siswa.xml")

Jika penulisan coding benar, maka output yang ditunjukkan ialah sebagai berikut:

*****Siswa*****

Nama: Andi

Kelas: 4

Usia: 10

Hobi: Berenang

*****Siswa*****

Nama: Budi

Kelas: 3

Usia: 9

Hobi: Menggambar

*****Siswa*****

Nama: Tono

Kelas: 4

Usia: 11

Hobi: Membaca

Artikel Terkait  Tutorial Python 23 : Cara Substring sebuah String di Python

Mengurai XML dengan DOM API

Document Object Model atau yang disingkat dengan DOM adalah API lintas bahasa dari World Wide Web Consortium (W3C) yang biasa digunakan untuk mengakses dan memodifikasi dokumen XML.

Salah satu fungsi DOM yang sangat berguna ialah untuk mengakses aplikasi secara acak. Pada SAX hanya memungkinkan Anda melihat satu bit dokumen pada satu waktu. Jika Anda melihat satu elemen SAX, Anda tidak akan dapat memiliki akses ke elemen lainnya.

Di bawah ini kami uraikan bagaimana cara termudah untuk memuat dokumen XML dengan cepat dan membuat objek minidom menggunakan modul xml.dom. Objek minidom ini sendiri menyediakan metode parser sederhana yang dengan cepat membuat pohon DOM dari file XML yang ada.

Pada contoh frase di bawah ini ditunjukkan cara untuk memanggil fungsi parse( file [,parser] ) dari objek minidom untuk mengurai file XML yang ditunjuk oleh file ke dalam objek pohon DOM.

#!/usr/bin/python

from xml.dom.minidom import parse
import xml.dom.minidom

# Open XML document using minidom parser
DOMTree = xml.dom.minidom.parse("siswa.xml")
collection = DOMTree.documentElement
if collection.hasAttribute("shelf"):
   print "Root element : %s" % collection.getAttribute("shelf")

# Get all the movies in the collection
siswas = collection.getElementsByTagName("siswa")

# Print detail of each movie.
for siswa in siswas:
   print "*****Siswa*****"
   if siswa.hasAttribute("nama"):
      print "Nama: %s" % siswa.getAttribute("nama")

      kelas = siswa.getElementsByTagName('kelas')[0]
      print "Kelas: %s" % kelas.childNodes[0].data

      usia = siswa.getElementsByTagName('usia')[0]
      print "Usia: %s" % usia.childNodes[0].data

      hobi = siswa.getElementsByTagName('hobi')[0]
      print "Hobi: %s" % hobi.childNodes[0].data

Jika coding sudah benar dan tidak ditemukan error, maka Anda akan mendapatkan output sebagai berikut:

Root element : Daftar Siswa

*****Siswa*****

Nama: Andi

Kelas: 4

Usia: 10

Hobi: Berenang

*****Siswa*****

Nama: Budi

Kelas: 3

Usia: 9

Hobi: Menggambar

*****Siswa*****

Nama: Tono

Kelas: 4

Usia: 11

Hobi: Membaca

 

Apakah coding Anda sudah benar dan berhasil melakukan XML parsing? Jika sudah, kini Anda dapat menghubungkan Python dengan XML. Anda siap melanjutkan projek besar Anda.

Sampai di sini pembahasan tentang Pyton parse XML kali ini. Ikuti terus berbagai tutorial bahasa pemrograman lainnya hanya di codekey.id

Sampai jumpa kembali, semoga bermanfaat!


Jasa Pembuatan Aplikasi, Website dan Internet Marketing | PT APPKEY
PT APPKEY adalah perusahaan IT yang khusus membuat aplikasi Android, iOS dan mengembangkan sistem website. Kami juga memiliki pengetahuan dan wawasan dalam menjalankan pemasaran online sehingga diharapkan dapat membantu menyelesaikan permasalahan Anda.

Jasa Pembuatan Aplikasi

Jasa Pembuatan Website

Jasa Pembuatan Paket Aplikasi

Jasa Pembuatan Internet Marketing

Tutorial

Subscribe Sekarang

Dapatkan beragam informasi menarik tentang bahasa pemrograman langsung melalui email Anda. Subscribe sekarang dan terus belajar bersama kami!

Blog Post Ranking 10

Tutorial PHP 22 : Cara Membuat Redirect PHP dengan Cepat dan Mudah

Jika Anda melakukan browsing di browser kesayangan Anda, mungkin Anda pernah melihat link yang berisikan “php redirect” atau yang...

Tutorial PHP 23 : Cara Membuat Messages Alert PHP

Alert box atau alert messages digunakan di situs web untuk menampilkan pesan peringatan kepada pengguna bahwa mereka telah memasukkan...

Tutorial PHP 2 : Cara Install PHP, Langkah Awal Belajar PHP

PHP adalah bahasa pemrograman gratis dan open source. Secara teknis tidak perlu menginstal PHP: sebagian besar host web dan...

Tutorial Python 9 : Cara Membuat Looping Python

Pada artikel sebelumnya, Codekey telah menjelaskan tentang Operasi Kondisional Python yang di dalamnya menyinggung tentang percabangan dan perulangan. Belajar...

Tutorial HTML/CSS 23 : Cara Membuat Form Sederhana dengan HTML

Form memiliki peran yang sangat krusial bagi website atau aplikasi untuk menjaga sistem keamanannya. Form HTML digunakan untuk mengumpulkan...

Tutorial SQL 8 : Constraint SQL, Bagaimana Fungsi dan Penggunaannya?

Pada artikel sebelumnya Anda telah mempelajari tentang wildcard SQL, pada artikel kali ini kami akan menjelaskan tentang constraint SQL. Jika...

Tutorial Javascript 8 : Array Javascript, Panduan Lengkap Cara Membuatnya

Seperti bahasa pemrograman yang berorientasi objek lainnya, dalam JavaScript juga terdapat array. Jika Anda memiliki banyak objek yang ingin...

Tutorial SQL 20 : Mari Pelajari Cara Menggunakan Fungsi GROUP by SQL

Pada pembahasan seri Tutorial SQL ke- 20 ini, Codekey akan membahas tentang GROUP BY yang merupakan statement di dalam...

Tutorial Python 7 : Python String Format dan Cara Mudahnya

Anda ingin belajar Python dan ingin menjadi ahli dalam bahasa pemrograman Python? Mari belajar bersama Codekey! Pada pembahasan kali...

Tutorial Python 8 : Langkah Mudah Membuat Operasi Kondisional pada Python

Pada pembahasan sebelumnya, Codekey telah menjelaskan kepada Anda tentang pengoperasian string pada Python mulai dari menggabungkan hingga memanipulasi string...

Bisnis

Online Service

Peluang Bisnis

Model Bisnis

Entrepreneurship

Uang

Ketrampilan

Outsourcing

Monetize

Pemasaran

SEO

Internet Marketing

Dasar Pemasaran

Strategi Pemasaran

Situs Web Analitik

Iklan

Teknologi

Teknologi Terbaru

AI

Komputer

Jaringan

Paling Sering dibaca
Mungkin Anda Menyukainya