Interne Dokumente sicher mit KI erschließen: On-Premises KI-RAG-Plattform für „Chat mit Dokumenten“
Beschreibung
Die Jülicher Entsorgungsgesellschaft für Nuklearanlagen (JEN) bündelt die über fünf Jahrzehnte am Standort Jülich aufgebaute Kompetenz in der Stilllegung, im Rückbau und in der Entsorgung kerntechnischer Anlagen. Sie entstand 2015 durch die Zusammenführung der Nuklearbereiche des Forschungszentrums Jülich und der AVR GmbH und vereint seither rund 400 Mitarbeitende.
Als Kompetenzzentrum der öffentlichen Hand fokussiert sich die JEN auf Strahlenschutz, Rückbau, Dekontamination und Zwischenlagerung. Kernaufgabe ist die sichere Beseitigung nuklearer Altlasten aus Forschung und Entwicklung in Jülich. Darüber hinaus steht die JEN auch externen Partnern als Ansprechpartnerin für Fragestellungen im nukleartechnischen Umfeld zur Verfügung.
Die JEN möchte interne Wissensbestände künftig deutlich schneller, sicherer und nachvollziehbarer nutzbar machen. Relevante Informationen liegen heute verteilt in mehreren Quellsystemen vor, darunter SharePoint Online, Fileshares, DMS-Systeme, Intranet-/Wiki-Strukturen sowie relationale Datenbanken. Die Recherche ist dadurch zeitaufwendig, stark von Einzelwissen abhängig und in der täglichen Nutzung nur eingeschränkt skalierbar.
Gesucht wird ein Lösungsansatz für einen sicheren „Chat mit Dokumenten“, der in einer geschützten Unternehmensumgebung betrieben werden kann und Antworten mit klarem Quellenbezug liefert. Im Fokus stehen eine zuverlässige Recherche, belastbare Zusammenfassungen und nachvollziehbare, quellenbasierte Auskünfte unter Berücksichtigung vorhandener Rollen- und Berechtigungsstrukturen.
Ziel ist ausdrücklich keine umfassende Einführung in einem einzigen Schritt, sondern eine realistisch einführbare Lösung mit klarer Produkt- und Umsetzungsperspektive. Von besonderem Interesse sind daher standardnahe, modulare Lösungen, die einen pragmatischen Einstieg über einen Pilotbetrieb ermöglichen und anschließend stufenweise ausgebaut werden können.
Von Interesse sind Lösungsansätze, die insbesondere folgende Anforderungen adressieren:
lokaler Betrieb aller Verarbeitungsstufen einer RAG-Lösung
Nutzung ausschließlich lokal betriebener Modelle bzw. lokaler Inferenzkomponenten
rollen- und berechtigungsbasierter Zugriff auf Basis vorhandener, AD-gestützter Strukturen
Anbindung o. g. bestehender Dokumenten- und Datenquellen
semantische und klassische Suche
quellenbasierte, nachvollziehbare Antworten mit Referenzierung relevanter Fundstellen
transparente Reaktion bei fehlender oder unzureichender Quellenlage
Verarbeitung unterschiedlicher Dokumenttypen, insbesondere textbasierter und gescannter PDFs, Office-Dokumente, Tabellen, Bilder und vergleichbarer Unterlagen
Umgang mit Versionen, Dubletten und inkrementellen Aktualisierungsläufen über die Datenquellsysteme
nachvollziehbare Protokollierung, Monitoring sowie Fehler- und Statusinformationen
praktikable Administrierbarkeit für den laufenden Betrieb durch Eigenpersonal
Besonderer Wert wird auf Zukunftsfähigkeit und -Sicherheit gelegt. Gesucht werden daher Lösungen, die möglichst viele der folgenden Eigenschaften unterstützen:
modulare Architektur mit klar abgegrenzten Komponenten
Austausch oder Upgrade einzelner Bestandteile, insbesondere Modelle (z. B. LLM, Embedding), OCR-/Extraktionskomponenten, Vektor- oder Suchkomponenten und Konnektoren
gute Erweiterbarkeit um weitere Datenquellen, Nutzergruppen und Anwendungsfälle
tragfähige Skalierbarkeit für wachsende Datenmengen und Lasten
nachvollziehbare Produkt- und Release-Roadmap
offene, dokumentierte Schnittstellen und exportierbare Konfigurationen
Bitte gehen Sie in Ihrer Einreichung insbesondere auf folgende Punkte ein:
1. Lösungsansatz und Reifegrad
Welcher marktverfügbare oder standardnahe Lösungsansatz wird vorgeschlagen?
Welche Bestandteile sind im Standard verfügbar, welche erfordern erweiterte Konfiguration und welche ergänzende Integrationsleistungen?
Wie reif ist die Lösung für den produktiven Einsatz in einer geschützten Unternehmensumgebung?
2. Architektur und On-Premises-Betrieb
Wie wird der lokale Betrieb der wesentlichen Komponenten umgesetzt?
3. Datenquellen und Berechtigungen
Wie werden SharePoint Online, SMB-Fileshares, DMS, Intranet-/Wiki-Inhalte und relationale Datenquellen typischerweise angebunden?
Wie wird die Berücksichtigung von Berechtigungen technisch und organisatorisch umgesetzt?
Welche Voraussetzungen oder Einschränkungen bestehen bei heterogenen Datenquellen?
4. Dokumentenverarbeitung und Antwortqualität
Wie geht die Lösung mit gescannten Dokumenten, OCR, Tabellen, Bildern, Grafiken, Zeichnungen und sehr großen Dokumenten um?
Wie werden Versionen, Dubletten und inkrementelle Aktualisierungen des Datenbestandes behandelt?
Wie werden quellenbasierte Antworten, Referenzen und der transparente Umgang mit unzureichender Quellenlage sichergestellt?
5. Sicherheit, Betrieb und Administrierbarkeit
Wie wird Sicherheit, Betrieb und Governance grundsätzlich adressiert?
Zum Beispiel hinsichtlich: Logging, Auditierbarkeit, Monitoring, Backup Restore, unkontrolliertem Datenabfluss, unerwünschter externer Telemetrie, Prompt Injection, unberechtigter Ausgabe sensibler Inhalte etc.
6. Pilotierung und Einführung
Wie kann eine typische Pilotierung aussehen?
Zum Beispiel hinsichtlich: Leistungserfordernissen für eine Pilotphase von 8 bis 12 Wochen, personeller und organisatorischer Mitwirkungsaufwände des Auftraggebers etc.
7. Zukunftssicherheit und Wirtschaftlichkeit
Welche Aussagen können zur langfristigen Skalierbarkeit, Weiterentwicklungsfähigkeit und technologischen Offenheit der Lösung getroffen werden?
Zum Beispiel hinsichtlich: Austauschbarkeit von Komponenten, Erweiterbarkeit, Lock-in-Risiken, Support, Roadmap, langfristiger Wirtschaftlichkeit etc.
Erbeten wird eine kompakte, strukturierte Rückmeldung mit möglichst folgenden Inhalten:
Kurzvorstellung des Unternehmens und der angebotenen Lösung
Beschreibung des Lösungsansatzes und des Reifegrads
Einordnung der Eignung für den beschriebenen Einsatzfall
Darstellung der im Standard abgedeckten Anforderungen sowie offener Punkte und realistischer Ausbaupfade
Hinweise zu Integrationsaufwand, Pilotvorgehen und Betriebsmodell
grobe Einschätzung zu Infrastruktur- und Sizing-Annahmen
Aussage zu Erfahrungen in vergleichbaren Referenzprojekten oder ähnlich gelagerten Einsatzszenarien
Einschätzung zur langfristigen Weiterentwicklungsfähigkeit und Zukunftssicherheit der Lösung
Eine formale Preisangabe ist in dieser Phase nicht erforderlich. Falls möglich, freuen wir uns ergänzend über eine unverbindliche grobe Einordnung von Kosten für Pilot und späteren Regelbetrieb.
Die Lösung soll perspektivisch für einen Nutzerkreis von ca. 350 Personen ausgelegt sein. Langfristig wird von ca. 30 gleichzeitigen interaktiven Anfragen ausgegangen. Für die Einführung ist zunächst eine Pilotphase von 8 bis 12 Wochen mit einem kleinen Test- und Expertenteam vorgesehen.
Der relevante Datenraum umfasst langfristig ca. 50 TB mit rund 1.000.000 Dokumenten sowie weiteren Inhalten wie Bildern, Grafiken, Zeichnungen und vergleichbaren Dateien. Primärsprache ist Deutsch. Es ist mit hohen Versionierungs- und Dublettenanteilen sowie mit sehr großen Dokumenten von bis zu ca. 900 Seiten zu rechnen.
Wesentliche Startquellen sind insbesondere:
SharePoint Online/OneDrive einschließlich Berechtigungsberücksichtigung
Fileshares (SMB) mit AD-Berechtigungen
DMS-Systeme (nscale, windream)
bestehendes Intranet/Wiki bzw. CMS-gestütztes Intranet
relationale Datenbanken, z. B. MS SQL Server
Die Lösung soll On-Premises betrieben werden. Ein Internetzugang kann technisch vorhanden sein, Unternehmensdaten dürfen jedoch nicht unkontrolliert an Dritte abfließen. Für eine erste Ausbaustufe ist ein Single-/Multi-Node-Betrieb mit Backup ausreichend; eine Hochverfügbarkeitsarchitektur wird zunächst nicht vorausgesetzt.
Die Einreichung soll in deutscher Sprache erfolgen.
Lösungsvorschläge sind über den KOINNOvationsplatz einzureichen.
Für die erste Stufe ist eine kompakte, strukturierte Darstellung ausdrücklich ausreichend
Eine bestehende Unternehmenspräsentation, Referenzübersicht oder Architekturübersicht kann ergänzend beigefügt werden.
Auch modulare Ansätze, Teillösungen oder Partnerkonstellationen sind willkommen, sofern klar beschrieben wird, welcher Leistungsumfang abgedeckt wird und wie ein belastbarer Pilot bzw. ein späterer Ausbau aussehen kann.
Bitte lassen Sie sich von der Breite der Anforderungen nicht abschrecken: Ziel der Challenge ist es, ein erstes Bild verfügbarer Lösungswege und Umsetzungsszenarien zu gewinnen.
Soweit sensible Informationen nicht öffentlich dargestellt werden sollen, können vertrauliche Zusatzangaben im geschützten Bereich der Einreichung übermittelt werden.
Diese Challenge dient der Markterkundung und der Vorbereitung einer möglichen späteren Beschaffung. Sie stellt keine Ausschreibung, keine Aufforderung zur Angebotsabgabe und keine Beauftragung dar.
Nach Ablauf der Einreichungsfrist erfolgt zunächst eine Vorauswahl anhand der veröffentlichten Bewertungskriterien. In einem zweiten Schritt werden ausgewählte Finalist*innen eingeladen, ihren Lösungsansatz einer fachkundigen Jury aus fachlich geeigneten Bewertungs- und Entscheidungsträgern vorzustellen. Die Jury prämiert die überzeugendsten Einreichungen und gibt eine Empfehlung für das weitere Vorgehen ab.
Die Rückmeldungen aus der Challenge sollen dazu dienen, Anforderungen, Pilotzuschnitt, Betriebsmodell, Sizing, Zuschnitt einer späteren Vergabe sowie die weitere Umsetzungsstrategie zu schärfen. Ziel ist eine möglichst zeitnahe Einführung einer geeigneten Lösung im Unternehmen. Sofern im Anschluss ein Vergabeverfahren eingeleitet wird, werden die Teilnehmenden hierüber gleichermaßen und rechtzeitig informiert.
Noch nicht veröffentlicht
Aufruf zum Einreichen von Lösungsvorschlägen
05.05.2026 - 15.06.2026
1 Monat 11 Tage verbleibend
Prüfung der Lösungen
16.06.2026 - 29.06.2026
Bewertung der Lösungen durch die Fachjury
30.06.2026 - 13.07.2026
Bekanntgabe des Gewinners
Ab 14.07.2026


