Sub-Prozessoren & AVV-Übersicht

Welche AI-Dienste der Club einsetzt — und wie deren Auftragsverarbeitung geregelt ist.

Diese Seite fasst für die rechtliche Prüfung zusammen, welche externen AI-Anbieter im konversion.digital Club aktiv eingebunden sind, welche Daten an sie übermittelt werden und wo der jeweilige Auftragsverarbeitungsvertrag (AVV bzw. DPA) zu beziehen ist. Sie ist als Anhang zur Datenschutzerklärung gedacht — nicht öffentlich, nicht im Index.

Verantwortlicher: konversion.digital GmbH, Am Kabellager 11, 51063 Köln Produkt: konversion.digital Club (Pilot, noindex) Erreichbar unter: /club/ · App: /club-app/ Ansprechpartner: marketing@konversion.digital

1 · Was ist der Club?

Der Club ist ein interner, handverlesener Mitgliederbereich rund um den Podcast TRIEBWERK. Er ist nicht öffentlich beworben, läuft auf noindex und wird nicht über den Footer der Hauptseite verlinkt. Es gibt zwei Stufen:

Standard

Club Member · 29 €/Monat

Hörer-Tarif für TRIEBWERK-Hörer und konversion.digital-Kontakte.

  • Podcast-Archiv mit Transkripten
  • Wissens-Tracks (Lerninhalte, kein zertifizierter Lehrgang)
  • Tägliches Mitglieder-Matching
  • Kein privater KI-Assistent
Premium

Club CEO · 89 €/Monat

Für eingeladene TRIEBWERK-Podcast-Gäste (Geschäftsführer / Mittelstand).

  • Alles aus „Member"
  • Privater KI-Assistent, trainiert auf der eigenen Podcast-Folge
  • Codex · CEO-Selbstvisualisierung aus dem Gespräch
  • Eigener Qdrant-Namespace (DSGVO-Trennung pro Mitglied)
Wichtig für die rechtliche Einordnung: Im CEO-Tarif werden personenbezogene Daten der Mitglieder (Stimme, Inhalte des Podcast-Gesprächs, Profilangaben) verarbeitet und teilweise an die unten genannten US-Anbieter übermittelt. Mitglieder treten dem Club aktiv bei (Einwilligung + Vertrag); zusätzlich liegt für Podcast-Gäste eine separate Einwilligung zur Audio-Verarbeitung vor.

2 · Verarbeitungsschritte im Überblick

Die folgende Kette läuft einmalig pro Podcast-Folge ab. Sie wird ausschließlich für CEO-Mitglieder ausgelöst und liefert die Wissensbasis, auf der der private Assistent später Antworten formuliert.

Hauptkette · Aufnahme → privater Assistent

Datenfluss vom Podcast-Audio bis zur Chat-Antwort im Club.

01
Audio
Aufzeichnung
MP3/M4A vom Podcast-Schnitt, auf eigenem Server in club-storage/ abgelegt.
02
OpenAI
Transkription
Audio → Text mit Zeitstempeln (whisper-1, deutsch).
03
Voyage AI
Embeddings
Text-Chunks (200 Wörter) → 1024-dim Vektoren (voyage-3-large).
04
Qdrant
Speicherung
Vektoren in eigenem Namespace club_member_<id>.
05
Anthropic
Antwort
Frage + Top-5-Treffer → Claude generiert Antwort mit Quellenangabe.

Parallelkette · Codex-Selbstvisualisierung

Läuft einmalig pro Gast aus dem fertigen Transkript — Ergebnis ist das Radar-Diagramm samt strukturierter Selbstbeschreibung (siehe Abschnitt 3).

A
Transkript
Eingabe
Vollständiger Whisper-Text des Gesprächs (lokal aus Schritt 02 oben).
B
Anthropic
Strukturierung
Claude erzeugt per Tool-Use (submit_codex) ein JSON: 5–7 Achsen, 4–7 Themen, 3–5 Spannungspaare, 8–15 Lexicon-Begriffe.
C
lokal
Speicherung
Ablage als lead.codex in admin-storage/podcast-leads.json. Anzeige als animiertes Radar in der Club-App.

Codex · Selbstvisualisierung pro Gast

Der „Codex" ist ein eigener Anwendungsfall, der seit 16.06.2026 live ist. Er erzeugt aus dem Transkript einer Podcast-Folge eine strukturierte Selbstbeschreibung des Gastes (Radar-Chart mit 5–7 Achsen, prägnante Themen mit Original-Zitaten, Spannungspaare, charakteristisches Lexikon). Der Codex ist als Persönlichkeits-Visualisierung gedacht — nicht als psychologisches Gutachten oder als Grundlage für rechtliche/wirtschaftliche Entscheidungen.

Codex-Generierung

Pipeline-Schritt 4 in admin-api/podcast-pipeline.php · Funktion pc_claude_codex()
Persönlichkeits-Profil · Einwilligung nötig
Eingabe
Vollständiges Whisper-Transkript der Podcast-Folge des Gastes (Plaintext, deutsch).
Verarbeitender Sub-Prozessor
Anthropic (siehe Abschnitt 3). Modell wie für den Assistenten: claude-sonnet-4-6, Tool-Use mit submit_codex.
Ausgabe
Strukturiertes JSON: Kurz-Essenz, Achsen (Score 0–100 mit Belegtext), Themen (mit Original-Zitat), Spannungspaare, Lexicon.
Speicherort
Lokal als lead.codex in admin-storage/podcast-leads.json. Anthropic speichert das Ergebnis nicht.
Anzeige
Animiertes Radar-Modul auf /club/#apps (Demo) · später eigener Tab „Mein Codex" in der Club-PWA · CEO-Cross-Member-View für den Inhaber (David Odenthal).
Anwendung pro Gast
Einmal nach Interview-Veröffentlichung. Resumable. Schon vorhanden für: Stefan Merath, Frank Überall, Bastian Braun, David Odenthal (Moderator-Codex aus Host-Anteilen).

Hinweis für die rechtliche Prüfung

  • Codex ist eine automatisierte Persönlichkeits-Visualisierung aus den eigenen Worten des Gastes. Auch wenn er nicht in die DSGVO-Definition der „automatisierten Einzelentscheidung mit rechtlicher Wirkung" (Art. 22 DSGVO) fällt, ist er als Form des Profilings einzuordnen.
  • Rechtsgrundlage: separate Einwilligung des Podcast-Gastes — gleichzeitig mit der Einwilligung zur Aufnahme-Verarbeitung und zur Club-Aufnahme einzuholen.
  • Betroffenenrechte: Auskunft (Anzeige des eigenen Codex), Berichtigung (Neuerstellung), Löschung (Entfernen des lead.codex-Schlüssels). Die Löschung wirkt sofort und vollständig, da Anthropic die Ausgabe nicht persistiert.
  • Der Codex ist nicht öffentlich. Sichtbar nur für (a) den betroffenen Gast in seinem Club-Zugang und (b) den Inhaber konversion.digital für die interne Übersicht.

3 · Aktiv eingesetzte Sub-Prozessoren

Jeder dieser Dienste verarbeitet personenbezogene Daten im Auftrag von konversion.digital. Für jeden liegt ein AVV vor oder ist über das jeweilige Trust-Center beziehbar.

OpenAI, L.L.C.

San Francisco, CA · USA · Drittland (USA)
AVV verfügbar
Eingesetztes Modell
whisper-1 (Speech-to-Text API)
Zweck im Club
Transkription der Podcast-Audiodatei in Text mit Zeitstempeln.
Verarbeitete Daten
Audio-Aufnahme des Podcast-Gesprächs (Stimme des Gastes, Inhalte des Gesprächs).
Rechtsgrundlage Drittland
EU-Standardvertragsklauseln (SCC, Modul 2) + EU-US Data Privacy Framework (zertifiziert).
Trainings-Nutzung
Nein — API-Eingaben werden laut OpenAI Business Terms nicht zum Modell-Training verwendet (Default-Opt-out für API).
Speicherdauer beim Anbieter
Bis zu 30 Tage (Missbrauchs-Monitoring), danach Löschung. Zero-Data-Retention auf Anfrage möglich.
AVV / DPA
openai.com/policies → „Data Processing Addendum" (Self-Service-Abschluss im OpenAI-Konto)
Trust Center

Capabilities, die im Club genutzt werden

  • Speech-to-Text (Whisper): Konvertiert deutsche Sprache in segmentierten Text inkl. Zeitstempeln.

Nicht genutzt

  • Bildgenerierung (DALL·E), Text-Generierung (GPT-Modelle), Embeddings, Text-to-Speech, Assistants-API, Code-Interpreter, File-Search.

Anthropic PBC

San Francisco, CA · USA · Drittland (USA)
AVV verfügbar
Eingesetzte Modelle
claude-sonnet-4-6 (Default), optional claude-opus-4-7 (lange Synthese), claude-haiku-4-5 (leichtgewichtige Aufgaben)
Zweck im Club
Zwei getrennte Anwendungsfälle:
a) Assistent-Chat: Antwort aus der Nutzerfrage + per Vektorsuche gefundenen Transkript-Ausschnitten (RAG).
b) Codex-Generierung: Strukturierung des gesamten Folgen-Transkripts in das Codex-JSON (siehe Abschnitt „Codex").
Verarbeitete Daten
Assistent: Nutzer-Frage + ausgewählte Transkript-Chunks.
Codex: vollständiges Folgen-Transkript des betroffenen Gastes + Name des Gastes.
In beiden Fällen keine Audiodaten und keine Zahlungs-/Profildaten.
Rechtsgrundlage Drittland
EU-Standardvertragsklauseln (SCC, Modul 2) + EU-US Data Privacy Framework (zertifiziert).
Trainings-Nutzung
Nein — Commercial-API-Eingaben werden laut Anthropic Commercial Terms nicht zum Modell-Training verwendet.
Speicherdauer beim Anbieter
Bis zu 30 Tage Trust & Safety-Cache; Zero-Retention auf Anfrage für berechtigte Kunden.
AVV / DPA
anthropic.com/legal → „Data Processing Addendum" (per Mail oder Self-Service über das Konsolen-Konto)
Trust Center

Capabilities, die im Club genutzt werden

  • Messages-API (Claude): Chat-Antwort des Assistenten aus System-Prompt + Nutzerfrage + Quellen-Kontext.
  • Tool-Use / Function-Calling: Erzwingt für die Codex-Generierung ein vorgegebenes JSON-Schema (Tool submit_codex) und stellt damit sicher, dass die Ausgabe maschinell verarbeitbar ist.

Nicht genutzt

  • Vision (Bilder), Computer-Use, Batch-API, Files-API, Web-Search-Tool, Memory.

Voyage AI (MongoDB, Inc.)

Palo Alto, CA · USA · seit 02/2024 Tochter der MongoDB, Inc. · Drittland (USA)
AVV verfügbar
Eingesetztes Modell
voyage-3-large (1024-dim Embedding-Vektoren)
Zweck im Club
Erzeugt aus jedem Transkript-Chunk einen numerischen Vektor, der die semantische Bedeutung des Textes abbildet. Diese Vektoren werden anschließend lokal in Qdrant gespeichert.
Verarbeitete Daten
Text-Chunks (max. ca. 200 Wörter) aus dem Podcast-Transkript. Keine Audio-, Bild- oder Profildaten.
Rechtsgrundlage Drittland
EU-Standardvertragsklauseln (SCC, Modul 2). MongoDB ist unter dem EU-US Data Privacy Framework zertifiziert; Voyage AI wird über die MongoDB-Compliance abgedeckt.
Trainings-Nutzung
Nein — laut Voyage Terms werden API-Eingaben nicht zum Training verwendet.
Speicherdauer beim Anbieter
Anfragen werden für die Antwort verarbeitet und nicht persistiert (Stateless).
AVV / DPA
voyageai.com bzw. mongodb.com/legal → „Data Processing Addendum" (über MongoDB Legal anfragen)
Trust Center

Capabilities, die im Club genutzt werden

  • Text-Embeddings: Umwandlung von Text in 1024-dimensionale Zahlenvektoren für semantische Ähnlichkeitssuche.

Nicht genutzt

  • Multimodal-Embeddings, Reranking-API.

Qdrant Solutions GmbH

Berlin · Deutschland · EU/EWR (Hosting wahlbar in Frankfurt)
AVV verfügbar · EU-Hosting
Produkt
Qdrant Cloud — gehostete Vektor-Datenbank
Zweck im Club
Speichert die von Voyage erzeugten Vektoren in einem eigenen Namespace pro Mitglied und liefert auf Anfrage die ähnlichsten Treffer für die Assistenten-Antwort.
Verarbeitete Daten
Numerische Vektoren (1024-dim) + Metadaten der jeweiligen Stelle (Folge-ID, Zeitstempel, Original-Text-Ausschnitt).
Hosting-Region
EU (Frankfurt/Deutschland) — keine Drittlandübermittlung.
Trainings-Nutzung
Nicht zutreffend — reine Datenbank, kein Modell-Training.
Speicherdauer beim Anbieter
Solange das Mitglied im Club ist; Löschung pro Namespace möglich (Code-Funktion kd_qdrant_delete_collection vorhanden).
AVV / DPA
qdrant.tech/legal → „Data Processing Agreement"
Trust Center
qdrant.tech/legal (Trust-/Security-Übersicht inkl. SOC 2)

Capabilities, die im Club genutzt werden

  • Collection-Management: ein eigener Namespace (Collection) pro CEO-Mitglied.
  • Upsert & Vektor-Suche: Speichern und semantisches Auffinden der Transkript-Chunks.
  • Löschung auf Anfrage: komplette Collection eines Mitglieds kann auf Knopfdruck entfernt werden.

Stripe Payments Europe, Ltd.

Dublin · Irland · EU/EWR (mit Datenübermittlung an Stripe Inc., USA)
AVV verfügbar
Zweck im Club
Abwicklung der Tarif-Zahlung (Member 29 €/M, CEO 89 €/M) inkl. wiederkehrender Abbuchung und Rechnungserstellung.
Verarbeitete Daten
Name, E-Mail, Zahlungsdaten (Karte/SEPA), Rechnungsadresse, Transaktions-Metadaten. Keine Audio-, Transkript- oder Inhaltsdaten.
Rechtsgrundlage Drittland
EU-Verarbeitung primär durch Stripe Payments Europe (Dublin). Bei Weitergabe an Stripe Inc. (USA): SCC + EU-US Data Privacy Framework (Stripe ist zertifiziert).
Speicherdauer
Gemäß handels- und steuerrechtlicher Aufbewahrungspflichten (10 Jahre für Buchungsbelege).

Capabilities, die im Club genutzt werden

  • Checkout-Session: Tarif-Auswahl und Erstabbuchung.
  • Subscription-Billing: wiederkehrende monatliche/jährliche Abbuchung.
  • Billing-Portal: Kunden-Selbstverwaltung (Zahlungsmittel, Kündigung).
  • Webhook-Verarbeitung: Synchronisation des Mitgliedsstatus bei Zahlung/Storno.

4 · Geparkte / geplante Dienste

Diese Anbieter sind noch nicht produktiv eingebunden, stehen aber auf der Roadmap. Sie sind hier aufgeführt, damit die rechtliche Prüfung vorab erfolgen kann.

Hume AI, Inc.

New York, NY · USA · Drittland (USA)
Geparkt · evaluiert nach Folge 3
Geplantes Modell
Hume Expression Measurement API (Voice Prosody)
Geplanter Zweck
Emotionsklassifikation auf den Stimmsegmenten des Podcast-Gastes (z. B. „bestimmt", „unsicher", „angespannt") — als Differenzierungs-Merkmal im Transkript-View.
Würde verarbeitete Daten
Audio-Segmente aus dem Podcast-Gespräch.
Status
Noch nicht angebunden, kein API-Key, kein Live-Datenfluss. Entscheidung über Einsatz nach Podcast-Folge 3.
AVV / DPA
hume.ai → „Legal" (DPA auf Anfrage über sales@hume.ai)
Drittland-Mechanismus
Bei Einsatz: SCC + Prüfung, ob Hume unter EU-US DPF zertifiziert ist (zum Stand 17.06.2026 noch zu verifizieren).

Besonderheit für die rechtliche Prüfung

  • Emotionsmessung gilt nach EU AI Act (in Kraft seit 02.2024, gestaffelt anwendbar) als biometrische Kategorisierung; in beschäftigungs- oder bildungs­bezogenen Kontexten verboten. Im Podcast-Gast-Kontext muss vor Einsatz geprüft werden, ob unsere Konstellation darunterfällt.
  • Vor Aktivierung: separate Einwilligung des betroffenen Podcast-Gastes einholen.

openSMILE / pyAudioAnalysis (selbst-gehostet)

Open-Source-Software, Betrieb auf eigenem Server in Deutschland
Geparkt · Stufe 2
Geplanter Zweck
Akustische Features pro Sprachsegment: Lautstärke, Pitch-Varianz, Jitter/Shimmer — als prosodische Marker im Transkript.
Datenfluss
Kein Datenfluss an Dritte — Verarbeitung läuft komplett auf dem konversion.digital-Server.
Sub-Prozessor nötig?
Nein — Software-Bibliothek, kein Cloud-Dienst, kein AVV erforderlich.
Lizenz
openSMILE: dual-licensed (research/commercial) · pyAudioAnalysis: Apache 2.0

Deepgram, Inc.

San Francisco, CA · USA · Drittland (USA)
Alternative · derzeit nicht aktiv
Status
Ursprünglich als Alternative zu Whisper für Speaker-Diarisation diskutiert (siehe Stack-Konzept). Aktuell nicht angebunden. Wechsel zu Deepgram würde nur erfolgen, wenn Whisper bei mehrstimmigen Aufnahmen nicht ausreicht.
Geplanter Zweck
Transkription mit automatischer Sprechertrennung (Diarisation).
AVV / DPA
deepgram.com/legal → „Data Processing Addendum"

5 · Allgemeine Hinweise zur Verarbeitung

Trennung pro Mitglied
Jedes CEO-Mitglied bekommt einen eigenen Qdrant-Namespace (club_member_<id>). Vektoren verschiedener Mitglieder werden nie vermischt; eine Such­anfrage erreicht ausschließlich den Namespace des angemeldeten Mitglieds.
Audio-Speicherung
Original-Audiodatei verbleibt auf dem konversion.digital-Server unter club-storage/episodes/<slug>/. Übermittlung an OpenAI nur für den einmaligen Transkriptions-Vorgang.
Transkript-Speicherung
Volltext und Whisper-Segmente liegen in der eigenen MySQL-Datenbank (Tabelle club_episodes), nicht beim AI-Anbieter.
Codex-Speicherung
Strukturiertes Codex-JSON pro Gast liegt lokal in admin-storage/podcast-leads.json als lead.codex. Keine Cloud-Spiegelung, keine externen Backups.
Logs & Monitoring
Pipeline-Logs unter club-storage/pipeline-logs/. Keine externen Logging-Dienste (kein Datadog, kein Sentry).
Authentifizierung
Eigenes JWT-Login mit getrennter Audience (club-api), kein Single-Sign-On Dritter.
Betroffenenrechte
Auskunft, Löschung und Datenübertragbarkeit über marketing@konversion.digital. Löschung umfasst: Datenbank-Eintrag, Audio-Datei, kompletter Qdrant-Namespace.
Browser-Spracheingabe
Die optionale Voice-Eingabe im Chat nutzt die Web Speech API des Browsers (clientseitig). Bei Chrome/Edge bedeutet dies eine Übermittlung an Google-Server; entsprechender Hinweis steht in der Datenschutzerklärung.
Keine Datenweitergabe an Werbenetzwerke
Aus dem Club-Bereich werden keine Mitglieds- oder Inhaltsdaten an Werbe-/Marketing-Plattformen übermittelt. GTM/Ads laden im Club-Bereich nur nach Consent und nur für Marketing-Funktionen außerhalb des Mitglieder-Bereichs.
Hinweis für die juristische Prüfung: Die hier aufgeführten Links zu DPA/AVV-Dokumenten verweisen auf die Trust-/Legal-Seiten der jeweiligen Anbieter. Die tatsächlich vom Anbieter ausgestellten und gegengezeichneten Verträge liegen bei konversion.digital separat ab und können auf Anfrage gemeinsam zur Verfügung gestellt werden.