21 Juni 2025

 



File ijazah hasil unduhan dari website e-Ijazah Kemdikbud https://ijazah.data.kemdikbud.go.id/ biasanya berbentuk PDF, satu file isi banyak halaman, satu halaman satu siswa. Isinya: Nomor Ijazah, Nama Siswa, NISN, TTL, dan info lainnya yang kita butuhkan buat pelengkap data sekolah.

Daripada ngetik ulang atau buka satu-satu halamannya, kita akan pisahkan semuanya secara otomatis pakai Google Colab + Python. Hasil akhirnya? File Excel yang isinya rapi per baris siswa. Bisa langsung kamu pakai buat arsip, pengisian dapodik, atau gabung ke data absensi siswa, juga buat cetak di aplikasi erapot 2025.1.

Apa Saja yang Dibutuhkan?

  • File PDF hasil unduhan dari e-Ijazah (misalnya ijazah_SMPN_2_MARGAASIH.pdf)

  • Akses internet (buat buka Google Colab)

  • 5 menit waktu santai

  • Sedikit keberanian melawan teks PDF :)

Langkah-langkah Step-by-Step

1. Buka Google Colab dan Buat Notebook Baru

  1. Kunjungi: https://colab.research.google.com

  2. Klik File → New Notebook

  3. Kita akan buat script sederhana buat membaca isi PDF

2. Install Library Python Pendukung

Salin kode ini di sel pertama dan jalankan:

!pip install PyPDF2 pandas openpyxl

3. Upload File PDF Ijazah

from google.colab import files

print("Silakan upload file PDF hasil unduhan dari e-Ijazah...")
uploaded = files.upload()

Setelah itu, pilih file PDF kamu (contoh: ijazah_SMPN_2_MARGAASIH.pdf)

4. Ekstrak Teks PDF dan Pisahkan Data

import PyPDF2
import pandas as pd
import re

pdf_file_path = next(iter(uploaded))
extracted_data = []

with open(pdf_file_path, 'rb') as file:
    reader = PyPDF2.PdfReader(file)
    for i, page in enumerate(reader.pages):
        text = page.extract_text()

        no_ijazah = re.search(r'No\.?\s*Ijazah\s*:\s*(\d+)', text)
        nama = re.search(r'menyatakan bahwa:\s*\n\s*(.*?)\n', text, re.DOTALL)
        ttl = re.search(r'tempat, tanggal lahir\s*:\s*(.*?)\n', text, re.IGNORECASE)
        nisn = re.search(r'Nomor Induk Siswa Nasional\s*:\s*(\d+)', text)

        extracted_data.append({
            'Halaman': i+1,
            'No. Ijazah': no_ijazah.group(1) if no_ijazah else '',
            'Nama Siswa': nama.group(1).strip() if nama else '',
            'Tempat, Tanggal Lahir': ttl.group(1) if ttl else '',
            'NISN': nisn.group(1) if nisn else '',
        })

df = pd.DataFrame(extracted_data)
df.head()

5. Simpan ke File Excel

output_file = 'data_ijazah.xlsx'
df.to_excel(output_file, index=False)

from google.colab import files
files.download(output_file)

Setelah ini, kamu tinggal klik tombol download yang muncul di bawah sel → file Excel akan terunduh otomatis.

Hasil Akhir:

File data_ijazah.xlsx siap digunakan untuk:

  • Digabung ke absensi siswa per kelas

  • Disimpan sebagai arsip digital sekolah

  • Dibagikan ke panitia ijazah atau wali kelas


Dengan cara ini, kamu bisa mengubah tumpukan ijazah PDF menjadi data Excel rapi dalam hitungan menit. Tanpa ngetik ulang, tanpa bolak-balik ALT+TAB, dan tanpa perih mata jam 1 pagi.


Best Regards 
GELAR AULIA

OPS DAPO MENOLAK TUNDUH