PDF-Belege automatisch in DATEV-Buchungssatze umwandeln. Kooperation mit Prof. Dr. Falko Tappen.
| Anbieter | Land | Kann PDF zu DATEV? | KI-Tiefe | Zielgruppe | Schwache |
|---|---|---|---|---|---|
| Finmatics | AT/DACH | Ja, tief | ML-Kontierung, mandantenspezifisch lernend | Kanzleien | Kein LLM-Ansatz, AT-Fokus (RZL), Pricing unklar |
| DATEV Automatisierung | DE | Ja, nativ | KI-Buchungsvorschlage, Copilot (Chat) | DATEV-Kanzleien | Langsame Innovation, Copilot = Chat, kein FIBU-Automat |
| BuchhaltungsButler | DE | DATEV-Export | Selbstlernend, 95% Automatisierung | SMBs | Keine Kanzlei-Architektur, begrenzte FIBU-Tiefe |
| Candis | DE | DATEV-Export | OCR + Vorkontierung | KMUs | Fokus Approval, nicht Buchungssatz. 369+ EUR/Mo |
| Tabula (YC W24) | DE | LLM zu DATEV | LLM-basiert, $4.6M Funding | Kanzleien | Fruh, kleines Team (5), direkter Wettbewerber! |
| Taxforce | DE | In Entwicklung | KI-native Kanzlei | Eigene Kanzlei | Tenet-Fonds Roll-up, nicht als Tool verfugbar |
| sevDesk | DE | CSV/XML | OCR-Level | Freelancer/KMU | Keine tiefe Kontierung, kein Kanzlei-Tool |
| lexoffice | DE | DATEVconnect | Basis-OCR | Freelancer | Minimale KI, reine SMB-Losung |
| Anbieter | Land | KI-Level | Besonderheit | DATEV? |
|---|---|---|---|---|
| Vic.ai | NO | 1 Mrd+ trainierte Rechnungen, 85% No-Touch | Technologisch fuhrend | Nein |
| Rossum | CZ | 95-98% template-freie Extraktion | Beste OCR/Extraktion | Nein |
| Dext | UK | Marktfuhrer Belegerfassung | Xero/QuickBooks | Nein |
| Truewind | US | AI Bookkeeping | QuickBooks-Fokus | Nein |
| Botkeeper | US | AI + Human Bookkeeping | QuickBooks/Xero | Nein |
| Bench | CA | Ubernommen (Ende 2024) | Geschlossen/Employer 1-800-Accountant | Nein |
Niemand kombiniert drei Dinge gleichzeitig:
Finmatics kommt am nachsten, nutzt aber kein LLM. DATEV selbst ist zu langsam. Tabula (YC) baut dasselbe, ist aber noch fruh. Tappens Vorteil: Domain-Expertise + echte Mandanten + Trainingsdaten vom Tag 1.
Open-Source Bausteine: pydatev (Python DATEV-Format), TaxHacker (LLM Steuer-Ansatz), invoice2data (Rechnungs-OCR)
15 Kandidaten recherchiert. Gerankt nach: LLM-Produkterfahrung, DATEV-Nahe, Shipping-Mentalitat, Verfugbarkeit.
3 Jahre exakt dasselbe Problem gelost: PDF-Rechnungen zu DATEV-Buchungen via KI bei Candis.
9 Jahre CTO-Erfahrung (Rocket Internet, Lendico, Alteos). M.Sc. TU Dresden. Kennt DATEV-Schnittstellen in- und auswendig.
Status: Scheint seit Dez 2024 nicht mehr bei Candis. Perfektes Timing-Fenster.
Risiko: Konnte bereits im nachsten Startup stecken. Moglicherweise "das Thema durch".
Baut gerade KI-Steuerberatung: Belegabgleich, Fristenmonitoring, OPOS bei Fideus (900K Pre-Seed).
Ex-CTO Optilyz, McKinsey-Background. Mathe/Physik-Studium. Aktiver Open-Source-Dev, APX Mentor.
Ansatz: Kooperation statt Abwerbung (Fideus = Holdings-Nische, nicht laufende FIBU).
Risiko: Eigenes Startup. Eher Sparringspartner als CTO.
Hat bereits DATEV-AI-Tool gebaut: Open-Source auf GitHub (Datev-AI-Datenautomatisierung).
Nutzt GPT-4 Vision API fur DATEV-Docs. Hat Qwen Vision-Language Models auf deutsche Dokumente fine-tuned.
Ideal fur MVP-Phase: Indie-Hacker-Mentalitat, baut und shipped schnell. Niedrige Kontaktschwelle.
Risiko: Kein CTO-Track-Record in Unternehmen. Eher Einzelkampfer.
Ex-Head of Engineering Klarna (140+ Ingenieure). Baut KI-native Steuerkanzlei.
Nutzen: Netzwerk-Kontakt, Erfahrungsaustausch. Tenet-Fonds (80M) macht Roll-ups.
DER DATEV-KI-Partner: 800+ Steuerberater-Kunden, 100+ MA. Seit 2016 an dem Problem.
Nutzen: Kooperationspartner oder Finmatics-Alumni als Kandidaten.
Hat ML/Data-Science-Team bei sevDesk aufgebaut. KI fur Buchhaltung in Produktion.
Nutzen: Praktische Erfahrung KI + DATEV-Export.
6+ Jahre CTO bei FastBill (Cloud-Buchhaltung). FastBill 2024 von Grundern zuruckgekauft - mogliche Unruhe.
Risiko: Unklar ob AI/ML-Tiefe. Eher klassischer Engineering-CTO.
Hat Open-Source Stripe-zu-DATEV-Exporter gebaut. Versteht DATEV-Formate. Python.
Risiko: Kein AI/ML-Background. Fur DATEV-Schnittstelle nutzlich, nicht als alleiniger CTO.
Invoice-to-Pay Automatisierung. Ex-Tech-Lead Tacto. Munchner Startup-Szene.
Nutzen: Finto-Alumni oder abgeworbene Ingenieure konnten interessant sein.
| Unternehmen | Team | Funding | Bedrohung |
|---|---|---|---|
| Tabula (YC W24, Berlin) | Tim Hermes (ex-Taxfix), Leo von Kleist (ex-Hive CTO, ETH) | $4.6M | Direkt |
| Finmatics (Wien/Berlin) | Patrick Sagmeister, 100+ MA | VC-backed | Hoch |
| Supercount AI (Linz) | Markus Waghubinger | Fruh | Mittel (AT) |
| boring.tax (Berlin) | Juan Garcia-Berdoy, Thomas Flassbeck | Bootstrapped | Mittel |
Einfachster Weg: EXTF-CSV Datei generieren, Steuerberater importiert mit 1 Klick in DATEV Rechnungswesen.
Kritische Header-Felder: Kennung="EXTF", Version=700, Sachkontenlange=4, SKR="03", korrektes Wirtschaftsjahr + Buchungszeitraum.
Haufigste Fehler (vermutlich Tappens Kollege):
Library: pydatev (pip install pydatev) - einzige Python-Library fur DATEV-Format
Problem: §203 StGB + §57 StBerG = Verschwiegenheitspflicht. Mandantendaten an US-Cloud-APIs senden = Straftat.
Losung fur MVP:
Zwingend notig: AVV nach Art. 28 DSGVO + Verschwiegenheitsverpflichtung nach §203 Abs. 4 StGB
| Metrik | Monat 1 | Monat 3 | Monat 6+ |
|---|---|---|---|
| OCR-Extraktion korrekt | 95%+ | 95%+ | 98%+ |
| Richtiges Sachkonto | 60-70% | 75-85% | 85-90% |
| Richtiger BU-Schlussel | 70-80% | 80-90% | 90%+ |
| Komplett korrekte Buchung | 50-60% | 65-75% | 80%+ |
80/20-Regel: KI schlagt 80% korrekt vor. StB reviewed alle, korrigiert 20%. System lernt aus Korrekturen. Von 5 Min/Beleg auf 30 Sek/Beleg.
| Komponente | Technologie | Begrundung |
|---|---|---|
| Sprache | Python 3.11+ | Bestes ML/LLM-Okosystem, pydatev ist Python |
| Backend | FastAPI | Async, schnell, API-first |
| Frontend | Streamlit (MVP) | Schnellster Weg zu funktionalem UI |
| OCR | Azure Document Intelligence | Bester Benchmark fur DE-Rechnungen |
| LLM | Llama 3.1 70B (Self-hosted) | Datenschutz, keine Cloud-APIs fur Mandantendaten |
| RAG | ChromaDB | Embedded, einfach, reicht fur MVP |
| DATEV Export | pydatev | Einzige Python-Library fur DATEV-Format |
| Hosting | Hetzner Cloud (DE) | DSGVO, gunstig, performant |
Eigenlosung bauen oder Finmatics/Candis anpassen?
15-30K EUR fur 8-Wochen-Prototyp mit Freelance-CTO
Welchen Kandidaten kontaktieren? Wer fuhrt das Gesprach?
Advisory (1-2h/Wo), Projektsteuerung, oder Vermittler?