hhmx.de

Föderation DE Di 29.04.2025 09:01:09

PDF parsen

Manchmal muss man PDF-Dateien auslesen. Dieser Artikel zeigt, wie man das mit einem Python-Skript macht.

gnulinux.ch/pdf-parsen

Föderation DE Di 29.04.2025 09:39:56

@gnulinux Danke! Ich muss meine Python-Kenntnisse wieder auffrischen. Ich stehe tatsächlich auch öfters vor dem Problem, strukturierte Daten aus PDF "rauszuholen".

Föderation DE Di 29.04.2025 20:37:47

@gisiger Gerne. Ich kann ein wenig Python-knowhow nur empfehlen. Ein paar einfache Python-Skripte haben mir schon viel Arbeit abgenommen. /Ralf

Föderation DE Di 29.04.2025 12:54:50

@gnulinux deine PDFs beinhalten den Text aber schon direkt, OCR ist nicht notwendig, oder?

Föderation DE Di 29.04.2025 20:33:10

@Kernic Ja, sie enthalten den Text. Mit OCR wäre es noch schwieriger. /Ralf