Neckarsulm/Rostock, 24. Juni 2026 – Planet AI, das KI-Forschungs- und Entwicklungsunternehmen der Bechtle Gruppe, hat die Competition on Multimodal Reasoning over Documents 2026 (DocVQA 2026) gewonnen. Der Wettbewerb im Rahmen der International Conference on Document Analysis and Recognition (ICDAR) gilt als weltweit anspruchsvollste Benchmark für dokumentenbasierte KI-Systeme. Das Rostocker Unternehmen konnte sich dabei sowohl in der Gesamtwertung als auch in sieben von acht Wettbewerbskategorien durchsetzen, mit rund 20 Prozentpunkten Vorsprung vor der typischen Mixture-of-Experts-Baseline und knapp 14 Prozentpunkten vor dem zweitplatzierten Team.
Jesper Kleinjohann, CEO von Planet AI: „Der Gewinn bei DocVQA 2026 ist für uns kein Selbstzweck. Er zeigt, dass europäische KI-Forschung international konkurrenzfähig ist und gleichzeitig die Anforderungen erfüllt, die gerade im öffentlichen Sektor nicht verhandelbar sind: Datensouveränität, DSGVO-Konformität sowie Unabhängigkeit bei der Wahl der Infrastruktur. Als KI-Lab der Bechtle Gruppe können wir das mit der Implementierungsstärke verbinden, die Unternehmen und Behörden für den Praxiseinsatz benötigen."
Ausgerichtet vom Computer Vision Center (CVC) der Universitat Autònoma de Barcelona, umfasste die Aufgabenstellung des diesjährigen Wettbewerbs tiefes Reasoning, Planung und mehrstufige Inferenz über reale Dokumente in acht eigenständigen Kategorien: Geschäftsberichte, wissenschaftliche Publikationen, Präsentationen, wissenschaftliche Poster, Infografiken, Karten, Comics und technische Zeichnungen. In der offenen Kategorie über 35 Milliarden Parameter durfte jedes Team mit jeder Architektur antreten, von einzelnen Frontier-Modellen über Mixture-of-Experts-Konfigurationen bis zu komplexen agentischen Flows, jeweils auf Basis der stärksten Foundation Models von Google, Anthropic, OpenAI und Alibaba.
Mehrschichtige Architektur führt zum Erfolg
Der von Planet AI gewählte Ansatz der Distributed Cognitive Architecture (DCA) koordiniert mehrere Foundation Models als kooperierendes Team. Sie ergänzt die Modelle um Fähigkeiten, die ihnen einzeln strukturell fehlen. Die Architektur arbeitet dabei in drei Schichten. IDA, die mehrfach ausgezeichnete Intelligente Dokumenten-Analyse von Planet AI, liefert deterministisch strukturierten Text als Fundament. Vier Vision-Language-Modelle – Gemini 3.1 Pro, Gemini 2.5 Pro, Claude Sonnet 4, Qwen3.5 – lesen das Dokument unabhängig voneinander. Claude Opus 4.6 als orchestrierender Reasoning-Agent vergleicht die Aussagen aller Modelle, erkennt Widersprüche, gewichtet Quellen nach Dokumenttyp und stellt Rückfragen an einzelne Lese-Agenten, bevor er sich festlegt. Das System ist vollständig modell-agnostisch und profitiert automatisch von Fortschritten in Foundation Models. Als Betriebsumgebung eignen sich sowohl On-Premises- als auch Cloud-Infrastrukturen.
„Große Foundation Models verfügen über beeindruckendes Weltwissen und Sprachfähigkeit. Denken und Intelligenz erfordern aber mehr: Gedächtnis, exekutive Kontrolle und eine Konvergenzdynamik. Genau das ergänzt DCA und erweitert Foundation Models zu intelligenten Wissensarbeitern. Hierdurch eröffnet sich das Potenzial für eine eigenständige neue Produktkategorie“, sagt Welf Wustlich, CTO und Gründer von Planet AI.
Europäische KI-Kompetenz auf Weltklasse-Niveau
Planet AI wurde 2015 in Rostock gegründet und ist über mehr als ein Jahrzehnt in Kooperationen mit europäischen Universitäten und im Rahmen europäischer Forschungsprogramme wie FP7 und Horizon 2020 gewachsen. Der Erfolg bei DocVQA 2026 ist auch ein konkretes Ergebnis des Forschungsvorhabens SPOC-AI (Single Point of Contact for AI), das Planet AI seit August 2024 im Verbund mit dem Technologieunternehmen Altow Digital Innovation und der Universität Rostock betreibt, gefördert vom Land Mecklenburg-Vorpommern über das Technologie-Beratungs-Institut (TBI). Das erste Spitzenergebnis kommt mehr als ein Jahr vor dem offiziellen Projektende im Juli 2027. Öffentlich geförderte KI-Forschung in Deutschland erzeugt damit Ergebnisse, die international wahrgenommen werden.
Die offizielle Preisverleihung findet auf der ICDAR 2026 in Wien statt (30. August bis 4. September 2026). Die wissenschaftlichen Grundlagen sind im technischen Bericht DocVQA 2026 dokumentiert, verfügbar über Zenodo (Cern): https://zenodo.org/records/20819848