ParlaData-Monitor
Die exorbyte GmbH ist spezialisiert auf fehlertolerantes Suchen, strukturiertes Matching und intelligente Datenverarbeitung. Mit unserer eigenen Technologie matchmaker stellen wir seit vielen Jahren eine hochperformante, energieeffiziente Lösung bereit, die sich insbesondere in datenintensiven Szenarien bewährt hat. Ergänzend dazu nutzen wir KNIME als leistungsfähige Plattform für Datenintegration und ETL-Prozesse, um heterogene Datenquellen effizient zu verbinden. Für die semantische Anreicherung und inhaltliche Erschließung setzen wir AI-Methoden ein, etwa zur Klassifikation, Schlagwortgenerierung oder Erstellung von Zusammenfassungen. Diese Kombination aus erklärbarer Logik (matchmaker), flexibler Datenintegration (KNIME) und semantischer Tiefe (AI) ist unser Alleinstellungsmerkmal – komplexe Datenbestände transparent, zuverlässig und bürgernah nutzbar zu machen.
Lösungsvorschlag – Webanwendung zur Übersicht parlamentarischer Anfragen
1. Technische Lösung
Wir schlagen eine Datenbank-Webanwendung vor, die auf einem modularen, zukunftssicheren Technologie-Stack basiert. Die Architektur kombiniert KNIME, AI und matchmaker und vereint so das Beste aus zwei Welten:
AI für die intelligente Verarbeitung unstrukturierter Daten (Extraktion, Klassifikation, Summarization).
matchmaker für die performante, fehlertolerante und erklärbare Suche in strukturierten Daten.
Datenaggregation (KNIME)
Adapter für die 17 Parlamentsportale (Scraping, RSS, API).
Vereinheitlichung von Metadaten (Titel, Drucksachennummer, Datum, Institution, Link).
Ablage in PostgreSQL (Metadaten) und Objekt-Store (PDF/HTML).
AI-gestützte Verarbeitung
Filterung irrelevanter Dokumente.
Klassifikation nach Energieträger (Wind, Solar, Hybrid).
Named Entity Recognition (NER) für Ministerien, Abgeordnete, Parteien, Regionen.
Schlagwortgenerierung und Themenvorschläge.
Summaries für bürgerfreundliche Abstracts.
Indexierung und Suche (matchmaker)
In-Memory-Index mit gewichteten Feldern (Titel, Keywords, Volltext, Abstract).
Fehlertolerante Suche (Tippfehler, Synonyme, Abkürzungen).
Facettierte Filter (Datum, Land, Institution, Energiequelle, Thema).
Explainability: Nutzer:innen sehen, warum ein Dokument erscheint.
Green Tech: Hohe Effizienz, niedriger Ressourcenverbrauch.
Frontend und Redaktion
Web-App (React, responsive): intuitive Suche, Filterung, Ergebnislisten, Detailansichten mit Metadaten und Originalquelle.
Redaktionsmodul mit Rechte- und Rollenverwaltung: Redakteur:innen prüfen AI-Vorschläge, ergänzen Schlagworte und geben Datensätze frei.
Hosting
DSGVO-konform z. B. in der STACKIT Cloud (Deutschland).
Skalierbar auf weitere Themenfelder und Dokumentarten.
2. + 3. Siehe geschützte Angaben
4. Besondere technische und organisatorische Herausforderungen
Heterogenität der Datenquellen
Unterschiedliche Strukturen, Formate und Suchlogiken in 17 Parlamentsportalen.
Lösung: modulare Adapterarchitektur mit KNIME, flexible Wartung bei Portaländerungen.
Qualität der AI-Ergebnisse
Automatisierte Klassifikation und Schlagwortgenerierung sind nicht fehlerfrei.
Lösung: Human-in-the-Loop – Redakteur:innen prüfen AI-Vorschläge und sichern die Qualität.
Langfristige Skalierbarkeit
Erweiterung auf weitere Politikfelder oder zusätzliche Datenquellen muss einfach möglich sein.
Lösung: modulare Architektur (Datenquellen + AI + matchmaker).
Datenschutz und Hosting
DSGVO-konformes Hosting ist zwingend.
Lösung: Betrieb z. B. in der STACKIT Cloud (deutsches Rechenzentrum, souveräne Infrastruktur).
Zusammenfassung
Die vorgeschlagene Lösung kombiniert AI und matchmaker als komplementäre Technologien:
AI: Intelligente Extraktion, Klassifikation, Schlagwortgenerierung, Summarization.
matchmaker: Fehlertolerante, performante und erklärbare Suche in strukturierten Daten.
Damit entsteht eine innovative, energieeffiziente und bürgerfreundliche Plattform, die Transparenz stärkt, demokratische Kontrolle erleichtert und langfristig erweiterbar ist.


