Cara Mudah Mengimpor Nomor Ijazah dari Web e-Ijazah(Nomor, Nama, NISN, dll)
File ijazah hasil unduhan dari website e-Ijazah Kemdikbud https://ijazah.data.kemdikbud.go.id/ biasanya berbentuk PDF, satu file isi banyak halaman, satu halaman satu siswa. Isinya: Nomor Ijazah, Nama Siswa, NISN, TTL, dan info lainnya yang kita butuhkan buat pelengkap data sekolah.
Daripada ngetik ulang atau buka satu-satu halamannya, kita akan pisahkan semuanya secara otomatis pakai Google Colab + Python. Hasil akhirnya? File Excel yang isinya rapi per baris siswa. Bisa langsung kamu pakai buat arsip, pengisian dapodik, atau gabung ke data absensi siswa, juga buat cetak di aplikasi erapot 2025.1.
Apa Saja yang Dibutuhkan?
-
File PDF hasil unduhan dari e-Ijazah (misalnya
ijazah_SMPN_2_MARGAASIH.pdf) -
Akses internet (buat buka Google Colab)
-
5 menit waktu santai
-
Sedikit keberanian melawan teks PDF :)
Langkah-langkah Step-by-Step
1. Buka Google Colab dan Buat Notebook Baru
-
Kunjungi: https://colab.research.google.com
-
Klik File → New Notebook
-
Kita akan buat script sederhana buat membaca isi PDF
2. Install Library Python Pendukung
Salin kode ini di sel pertama dan jalankan:
!pip install PyPDF2 pandas openpyxl
3. Upload File PDF Ijazah
from google.colab import files
print("Silakan upload file PDF hasil unduhan dari e-Ijazah...")
uploaded = files.upload()
Setelah itu, pilih file PDF kamu (contoh: ijazah_SMPN_2_MARGAASIH.pdf)
4. Ekstrak Teks PDF dan Pisahkan Data
import PyPDF2
import pandas as pd
import re
pdf_file_path = next(iter(uploaded))
extracted_data = []
with open(pdf_file_path, 'rb') as file:
reader = PyPDF2.PdfReader(file)
for i, page in enumerate(reader.pages):
text = page.extract_text()
no_ijazah = re.search(r'No\.?\s*Ijazah\s*:\s*(\d+)', text)
nama = re.search(r'menyatakan bahwa:\s*\n\s*(.*?)\n', text, re.DOTALL)
ttl = re.search(r'tempat, tanggal lahir\s*:\s*(.*?)\n', text, re.IGNORECASE)
nisn = re.search(r'Nomor Induk Siswa Nasional\s*:\s*(\d+)', text)
extracted_data.append({
'Halaman': i+1,
'No. Ijazah': no_ijazah.group(1) if no_ijazah else '',
'Nama Siswa': nama.group(1).strip() if nama else '',
'Tempat, Tanggal Lahir': ttl.group(1) if ttl else '',
'NISN': nisn.group(1) if nisn else '',
})
df = pd.DataFrame(extracted_data)
df.head()
5. Simpan ke File Excel
output_file = 'data_ijazah.xlsx'
df.to_excel(output_file, index=False)
from google.colab import files
files.download(output_file)
Setelah ini, kamu tinggal klik tombol download yang muncul di bawah sel → file Excel akan terunduh otomatis.
Hasil Akhir:
File data_ijazah.xlsx siap digunakan untuk:
-
Digabung ke absensi siswa per kelas
-
Disimpan sebagai arsip digital sekolah
-
Dibagikan ke panitia ijazah atau wali kelas
Dengan cara ini, kamu bisa mengubah tumpukan ijazah PDF menjadi data Excel rapi dalam hitungan menit. Tanpa ngetik ulang, tanpa bolak-balik ALT+TAB, dan tanpa perih mata jam 1 pagi.
Best Regards
GELAR AULIA
OPS DAPO MENOLAK TUNDUH
