Redaktion
Autoren
Drei Personen stehen hinter pdftxt.de: Mateusz pflegt die PDF.js- und Tesseract-Engine, Jan-Tristan recherchiert die PDF-Standard-Historie von Adobe 1993 bis ISO 32000-2, Eike-Christian verantwortet UrhG und DSGVO. Korrekturen bitte an info@akara-solutions.de.

Mateusz Viola
Betreiber · PDF.js-Engine, Tesseract.js-OCR & Encoding-Mathematik
Mateusz Viola betreibt pdftxt.de als Tool-Projekt der AKARA Solutions GmbH aus Pinneberg. Er hat die client-seitige PDF-zu-TXT-Pipeline aufgesetzt: PDF.js (Mozilla) für eingebetteten PDF-Text, Tesseract.js als WebAssembly-Port für OCR bei gescannten Dokumenten, Encoding-Mathematik für UTF-8 und Legacy-Codepages.

Jan-Tristan Rudat
Redakteur · PDF-Format-Historie & ISO-32000-Standards
Jan-Tristan Rudat schreibt für pdftxt.de zur Historie des PDF-Formats: Adobe 1993 (John Warnock, Camelot-Projekt), Acrobat 1.0, die Open-Standardisierung als ISO 32000-1:2008 und ISO 32000-2:2020, das PostScript-Erbe, sowie der Vergleich zu DOCX (Office Open XML) und Markdown (CommonMark).

Eike-Christian Ramcke
Geschäftsführer · UrhG & DSGVO Art. 6 lit. f
Eike-Christian Ramcke ist Geschäftsführer der AKARA Solutions GmbH und nach § 18 Abs. 2 MStV inhaltlich verantwortlich für pdftxt.de. Er sichert den rechtlichen Rahmen einer rein client-seitigen PDF-Extraktion: § 16 UrhG bei lokaler Vervielfältigung, § 53 UrhG Privatkopie, DSGVO Art. 6 Abs. 1 lit. f für den Webseiten-Betrieb ohne Server-Verarbeitung.