Sub-Prozessoren & AVV-Übersicht

Welche AI-Dienste der Club einsetzt — und wie deren Auftragsverarbeitung geregelt ist.

Diese Seite fasst für die rechtliche Prüfung zusammen, welche externen AI-Anbieter im konversion.digital Club aktiv eingebunden sind, welche Daten an sie übermittelt werden und wo der jeweilige Auftragsverarbeitungsvertrag (AVV bzw. DPA) zu beziehen ist. Sie ist als Anhang zur Datenschutzerklärung gedacht — nicht öffentlich, nicht im Index.

Verantwortlicher: konversion.digital GmbH, Am Kabellager 11, 51063 Köln Produkt: konversion.digital Club (Pilot, noindex) Erreichbar unter: /club/ · App: /club-app/ Ansprechpartner: marketing@konversion.digital

1 · Was ist der Club?

Der Club ist ein interner, handverlesener Mitgliederbereich rund um den Podcast TRIEBWERK. Er ist nicht öffentlich beworben, läuft auf noindex und wird nicht über den Footer der Hauptseite verlinkt. Es gibt zwei Stufen:

Standard

Club Member · 29 €/Monat

Hörer-Tarif für TRIEBWERK-Hörer und konversion.digital-Kontakte.

Podcast-Archiv mit Transkripten
Wissens-Tracks (Lerninhalte, kein zertifizierter Lehrgang)
Tägliches Mitglieder-Matching
Kein privater KI-Assistent

Premium

Club CEO · 89 €/Monat

Für eingeladene TRIEBWERK-Podcast-Gäste (Geschäftsführer / Mittelstand).

Alles aus „Member"
Privater KI-Assistent, trainiert auf der eigenen Podcast-Folge
Codex · CEO-Selbstvisualisierung aus dem Gespräch
Eigener Qdrant-Namespace (DSGVO-Trennung pro Mitglied)

Wichtig für die rechtliche Einordnung: Im CEO-Tarif werden personenbezogene Daten der Mitglieder (Stimme, Inhalte des Podcast-Gesprächs, Profilangaben) verarbeitet und teilweise an die unten genannten US-Anbieter übermittelt. Mitglieder treten dem Club aktiv bei (Einwilligung + Vertrag); zusätzlich liegt für Podcast-Gäste eine separate Einwilligung zur Audio-Verarbeitung vor.

2 · Verarbeitungsschritte im Überblick

Die folgende Kette läuft einmalig pro Podcast-Folge ab. Sie wird ausschließlich für CEO-Mitglieder ausgelöst und liefert die Wissensbasis, auf der der private Assistent später Antworten formuliert.

Hauptkette · Aufnahme → privater Assistent

Datenfluss vom Podcast-Audio bis zur Chat-Antwort im Club.

Audio

Aufzeichnung

MP3/M4A vom Podcast-Schnitt, auf eigenem Server in club-storage/ abgelegt.

OpenAI

Transkription

Audio → Text mit Zeitstempeln (whisper-1, deutsch).

Voyage AI

Embeddings

Text-Chunks (200 Wörter) → 1024-dim Vektoren (voyage-3-large).

Qdrant

Speicherung

Vektoren in eigenem Namespace club_member_<id>.

Anthropic

Antwort

Frage + Top-5-Treffer → Claude generiert Antwort mit Quellenangabe.

Parallelkette · Codex-Selbstvisualisierung

Läuft einmalig pro Gast aus dem fertigen Transkript — Ergebnis ist das Radar-Diagramm samt strukturierter Selbstbeschreibung (siehe Abschnitt 3).

Transkript

Eingabe

Vollständiger Whisper-Text des Gesprächs (lokal aus Schritt 02 oben).

Anthropic

Strukturierung

Claude erzeugt per Tool-Use (submit_codex) ein JSON: 5–7 Achsen, 4–7 Themen, 3–5 Spannungspaare, 8–15 Lexicon-Begriffe.

lokal

Speicherung

Ablage als lead.codex in admin-storage/podcast-leads.json. Anzeige als animiertes Radar in der Club-App.

Codex · Selbstvisualisierung pro Gast

Der „Codex" ist ein eigener Anwendungsfall, der seit 16.06.2026 live ist. Er erzeugt aus dem Transkript einer Podcast-Folge eine strukturierte Selbstbeschreibung des Gastes (Radar-Chart mit 5–7 Achsen, prägnante Themen mit Original-Zitaten, Spannungspaare, charakteristisches Lexikon). Der Codex ist als Persönlichkeits-Visualisierung gedacht — nicht als psychologisches Gutachten oder als Grundlage für rechtliche/wirtschaftliche Entscheidungen.

Codex-Generierung

Pipeline-Schritt 4 in admin-api/podcast-pipeline.php · Funktion pc_claude_codex()

Persönlichkeits-Profil · Einwilligung nötig

Eingabe

Vollständiges Whisper-Transkript der Podcast-Folge des Gastes (Plaintext, deutsch).

Verarbeitender Sub-Prozessor

Anthropic (siehe Abschnitt 3). Modell wie für den Assistenten: claude-sonnet-4-6, Tool-Use mit submit_codex.

Ausgabe

Strukturiertes JSON: Kurz-Essenz, Achsen (Score 0–100 mit Belegtext), Themen (mit Original-Zitat), Spannungspaare, Lexicon.

Speicherort

Lokal als lead.codex in admin-storage/podcast-leads.json. Anthropic speichert das Ergebnis nicht.

Animiertes Radar-Modul auf /club/#apps (Demo) · später eigener Tab „Mein Codex" in der Club-PWA · CEO-Cross-Member-View für den Inhaber (David Odenthal).

Anwendung pro Gast

Einmal nach Interview-Veröffentlichung. Resumable. Schon vorhanden für: Stefan Merath, Frank Überall, Bastian Braun, David Odenthal (Moderator-Codex aus Host-Anteilen).

Hinweis für die rechtliche Prüfung

Codex ist eine automatisierte Persönlichkeits-Visualisierung aus den eigenen Worten des Gastes. Auch wenn er nicht in die DSGVO-Definition der „automatisierten Einzelentscheidung mit rechtlicher Wirkung" (Art. 22 DSGVO) fällt, ist er als Form des Profilings einzuordnen.
Rechtsgrundlage: separate Einwilligung des Podcast-Gastes — gleichzeitig mit der Einwilligung zur Aufnahme-Verarbeitung und zur Club-Aufnahme einzuholen.
Betroffenenrechte: Auskunft (Anzeige des eigenen Codex), Berichtigung (Neuerstellung), Löschung (Entfernen des lead.codex-Schlüssels). Die Löschung wirkt sofort und vollständig, da Anthropic die Ausgabe nicht persistiert.
Der Codex ist nicht öffentlich. Sichtbar nur für (a) den betroffenen Gast in seinem Club-Zugang und (b) den Inhaber konversion.digital für die interne Übersicht.

3 · Aktiv eingesetzte Sub-Prozessoren

Jeder dieser Dienste verarbeitet personenbezogene Daten im Auftrag von konversion.digital. Für jeden liegt ein AVV vor oder ist über das jeweilige Trust-Center beziehbar.

OpenAI, L.L.C.

San Francisco, CA · USA · Drittland (USA)

AVV verfügbar

Eingesetztes Modell

whisper-1 (Speech-to-Text API)

Zweck im Club

Transkription der Podcast-Audiodatei in Text mit Zeitstempeln.

Verarbeitete Daten

Audio-Aufnahme des Podcast-Gesprächs (Stimme des Gastes, Inhalte des Gesprächs).

Rechtsgrundlage Drittland

EU-Standardvertragsklauseln (SCC, Modul 2) + EU-US Data Privacy Framework (zertifiziert).

Trainings-Nutzung

Nein — API-Eingaben werden laut OpenAI Business Terms nicht zum Modell-Training verwendet (Default-Opt-out für API).

Speicherdauer beim Anbieter

Bis zu 30 Tage (Missbrauchs-Monitoring), danach Löschung. Zero-Data-Retention auf Anfrage möglich.

AVV / DPA

openai.com/policies → „Data Processing Addendum" (Self-Service-Abschluss im OpenAI-Konto)

Trust Center

trust.openai.com

Capabilities, die im Club genutzt werden

Speech-to-Text (Whisper): Konvertiert deutsche Sprache in segmentierten Text inkl. Zeitstempeln.

Nicht genutzt

Bildgenerierung (DALL·E), Text-Generierung (GPT-Modelle), Embeddings, Text-to-Speech, Assistants-API, Code-Interpreter, File-Search.

Anthropic PBC

San Francisco, CA · USA · Drittland (USA)

AVV verfügbar

Eingesetzte Modelle

claude-sonnet-4-6 (Default), optional claude-opus-4-7 (lange Synthese), claude-haiku-4-5 (leichtgewichtige Aufgaben)

Zweck im Club

Zwei getrennte Anwendungsfälle:
a) Assistent-Chat: Antwort aus der Nutzerfrage + per Vektorsuche gefundenen Transkript-Ausschnitten (RAG).
b) Codex-Generierung: Strukturierung des gesamten Folgen-Transkripts in das Codex-JSON (siehe Abschnitt „Codex").

Verarbeitete Daten

Assistent: Nutzer-Frage + ausgewählte Transkript-Chunks.
Codex: vollständiges Folgen-Transkript des betroffenen Gastes + Name des Gastes.
In beiden Fällen keine Audiodaten und keine Zahlungs-/Profildaten.

Rechtsgrundlage Drittland

EU-Standardvertragsklauseln (SCC, Modul 2) + EU-US Data Privacy Framework (zertifiziert).

Trainings-Nutzung

Nein — Commercial-API-Eingaben werden laut Anthropic Commercial Terms nicht zum Modell-Training verwendet.

Speicherdauer beim Anbieter

Bis zu 30 Tage Trust & Safety-Cache; Zero-Retention auf Anfrage für berechtigte Kunden.

AVV / DPA

anthropic.com/legal → „Data Processing Addendum" (per Mail oder Self-Service über das Konsolen-Konto)

Trust Center

trust.anthropic.com

Capabilities, die im Club genutzt werden

Messages-API (Claude): Chat-Antwort des Assistenten aus System-Prompt + Nutzerfrage + Quellen-Kontext.
Tool-Use / Function-Calling: Erzwingt für die Codex-Generierung ein vorgegebenes JSON-Schema (Tool submit_codex) und stellt damit sicher, dass die Ausgabe maschinell verarbeitbar ist.

Nicht genutzt

Vision (Bilder), Computer-Use, Batch-API, Files-API, Web-Search-Tool, Memory.

Voyage AI (MongoDB, Inc.)

Palo Alto, CA · USA · seit 02/2024 Tochter der MongoDB, Inc. · Drittland (USA)

AVV verfügbar

Eingesetztes Modell

voyage-3-large (1024-dim Embedding-Vektoren)

Zweck im Club

Erzeugt aus jedem Transkript-Chunk einen numerischen Vektor, der die semantische Bedeutung des Textes abbildet. Diese Vektoren werden anschließend lokal in Qdrant gespeichert.

Verarbeitete Daten

Text-Chunks (max. ca. 200 Wörter) aus dem Podcast-Transkript. Keine Audio-, Bild- oder Profildaten.

Rechtsgrundlage Drittland

EU-Standardvertragsklauseln (SCC, Modul 2). MongoDB ist unter dem EU-US Data Privacy Framework zertifiziert; Voyage AI wird über die MongoDB-Compliance abgedeckt.

Trainings-Nutzung

Nein — laut Voyage Terms werden API-Eingaben nicht zum Training verwendet.

Speicherdauer beim Anbieter

Anfragen werden für die Antwort verarbeitet und nicht persistiert (Stateless).

AVV / DPA

voyageai.com bzw. mongodb.com/legal → „Data Processing Addendum" (über MongoDB Legal anfragen)

Trust Center

mongodb.com/trust

Capabilities, die im Club genutzt werden

Text-Embeddings: Umwandlung von Text in 1024-dimensionale Zahlenvektoren für semantische Ähnlichkeitssuche.

Nicht genutzt

Multimodal-Embeddings, Reranking-API.

Qdrant Solutions GmbH

Berlin · Deutschland · EU/EWR (Hosting wahlbar in Frankfurt)

AVV verfügbar · EU-Hosting

Produkt

Qdrant Cloud — gehostete Vektor-Datenbank

Zweck im Club

Speichert die von Voyage erzeugten Vektoren in einem eigenen Namespace pro Mitglied und liefert auf Anfrage die ähnlichsten Treffer für die Assistenten-Antwort.

Verarbeitete Daten

Numerische Vektoren (1024-dim) + Metadaten der jeweiligen Stelle (Folge-ID, Zeitstempel, Original-Text-Ausschnitt).

Hosting-Region

EU (Frankfurt/Deutschland) — keine Drittlandübermittlung.

Trainings-Nutzung

Nicht zutreffend — reine Datenbank, kein Modell-Training.

Speicherdauer beim Anbieter

Solange das Mitglied im Club ist; Löschung pro Namespace möglich (Code-Funktion kd_qdrant_delete_collection vorhanden).

AVV / DPA

qdrant.tech/legal → „Data Processing Agreement"

Trust Center

qdrant.tech/legal (Trust-/Security-Übersicht inkl. SOC 2)

Capabilities, die im Club genutzt werden

Collection-Management: ein eigener Namespace (Collection) pro CEO-Mitglied.
Upsert & Vektor-Suche: Speichern und semantisches Auffinden der Transkript-Chunks.
Löschung auf Anfrage: komplette Collection eines Mitglieds kann auf Knopfdruck entfernt werden.

Stripe Payments Europe, Ltd.

Dublin · Irland · EU/EWR (mit Datenübermittlung an Stripe Inc., USA)

AVV verfügbar

Zweck im Club

Abwicklung der Tarif-Zahlung (Member 29 €/M, CEO 89 €/M) inkl. wiederkehrender Abbuchung und Rechnungserstellung.

Verarbeitete Daten

Name, E-Mail, Zahlungsdaten (Karte/SEPA), Rechnungsadresse, Transaktions-Metadaten. Keine Audio-, Transkript- oder Inhaltsdaten.

Rechtsgrundlage Drittland

EU-Verarbeitung primär durch Stripe Payments Europe (Dublin). Bei Weitergabe an Stripe Inc. (USA): SCC + EU-US Data Privacy Framework (Stripe ist zertifiziert).

Speicherdauer

Gemäß handels- und steuerrechtlicher Aufbewahrungspflichten (10 Jahre für Buchungsbelege).

AVV / DPA

stripe.com/de/legal/dpa

Trust Center

stripe.com/de/privacy-center

Capabilities, die im Club genutzt werden

Checkout-Session: Tarif-Auswahl und Erstabbuchung.
Subscription-Billing: wiederkehrende monatliche/jährliche Abbuchung.
Billing-Portal: Kunden-Selbstverwaltung (Zahlungsmittel, Kündigung).
Webhook-Verarbeitung: Synchronisation des Mitgliedsstatus bei Zahlung/Storno.

4 · Geparkte / geplante Dienste

Diese Anbieter sind noch nicht produktiv eingebunden, stehen aber auf der Roadmap. Sie sind hier aufgeführt, damit die rechtliche Prüfung vorab erfolgen kann.

Hume AI, Inc.

New York, NY · USA · Drittland (USA)

Geparkt · evaluiert nach Folge 3

Geplantes Modell

Hume Expression Measurement API (Voice Prosody)

Geplanter Zweck

Emotionsklassifikation auf den Stimmsegmenten des Podcast-Gastes (z. B. „bestimmt", „unsicher", „angespannt") — als Differenzierungs-Merkmal im Transkript-View.

Würde verarbeitete Daten

Audio-Segmente aus dem Podcast-Gespräch.

Status

Noch nicht angebunden, kein API-Key, kein Live-Datenfluss. Entscheidung über Einsatz nach Podcast-Folge 3.

AVV / DPA

hume.ai → „Legal" (DPA auf Anfrage über sales@hume.ai)

Drittland-Mechanismus

Bei Einsatz: SCC + Prüfung, ob Hume unter EU-US DPF zertifiziert ist (zum Stand 17.06.2026 noch zu verifizieren).

Besonderheit für die rechtliche Prüfung

Emotionsmessung gilt nach EU AI Act (in Kraft seit 02.2024, gestaffelt anwendbar) als biometrische Kategorisierung; in beschäftigungs- oder bildungsbezogenen Kontexten verboten. Im Podcast-Gast-Kontext muss vor Einsatz geprüft werden, ob unsere Konstellation darunterfällt.
Vor Aktivierung: separate Einwilligung des betroffenen Podcast-Gastes einholen.

openSMILE / pyAudioAnalysis (selbst-gehostet)

Open-Source-Software, Betrieb auf eigenem Server in Deutschland

Geparkt · Stufe 2

Geplanter Zweck

Akustische Features pro Sprachsegment: Lautstärke, Pitch-Varianz, Jitter/Shimmer — als prosodische Marker im Transkript.

Datenfluss

Kein Datenfluss an Dritte — Verarbeitung läuft komplett auf dem konversion.digital-Server.

Sub-Prozessor nötig?

Nein — Software-Bibliothek, kein Cloud-Dienst, kein AVV erforderlich.

Lizenz

openSMILE: dual-licensed (research/commercial) · pyAudioAnalysis: Apache 2.0

Deepgram, Inc.

San Francisco, CA · USA · Drittland (USA)

Alternative · derzeit nicht aktiv

Status

Ursprünglich als Alternative zu Whisper für Speaker-Diarisation diskutiert (siehe Stack-Konzept). Aktuell nicht angebunden. Wechsel zu Deepgram würde nur erfolgen, wenn Whisper bei mehrstimmigen Aufnahmen nicht ausreicht.

Geplanter Zweck

Transkription mit automatischer Sprechertrennung (Diarisation).

AVV / DPA

deepgram.com/legal → „Data Processing Addendum"

5 · Allgemeine Hinweise zur Verarbeitung

Trennung pro Mitglied

Jedes CEO-Mitglied bekommt einen eigenen Qdrant-Namespace (club_member_<id>). Vektoren verschiedener Mitglieder werden nie vermischt; eine Suchanfrage erreicht ausschließlich den Namespace des angemeldeten Mitglieds.

Audio-Speicherung

Original-Audiodatei verbleibt auf dem konversion.digital-Server unter club-storage/episodes/<slug>/. Übermittlung an OpenAI nur für den einmaligen Transkriptions-Vorgang.

Transkript-Speicherung

Volltext und Whisper-Segmente liegen in der eigenen MySQL-Datenbank (Tabelle club_episodes), nicht beim AI-Anbieter.

Codex-Speicherung

Strukturiertes Codex-JSON pro Gast liegt lokal in admin-storage/podcast-leads.json als lead.codex. Keine Cloud-Spiegelung, keine externen Backups.

Logs & Monitoring

Pipeline-Logs unter club-storage/pipeline-logs/. Keine externen Logging-Dienste (kein Datadog, kein Sentry).

Authentifizierung

Eigenes JWT-Login mit getrennter Audience (club-api), kein Single-Sign-On Dritter.

Betroffenenrechte

Auskunft, Löschung und Datenübertragbarkeit über marketing@konversion.digital. Löschung umfasst: Datenbank-Eintrag, Audio-Datei, kompletter Qdrant-Namespace.

Browser-Spracheingabe

Die optionale Voice-Eingabe im Chat nutzt die Web Speech API des Browsers (clientseitig). Bei Chrome/Edge bedeutet dies eine Übermittlung an Google-Server; entsprechender Hinweis steht in der Datenschutzerklärung.

Keine Datenweitergabe an Werbenetzwerke

Aus dem Club-Bereich werden keine Mitglieds- oder Inhaltsdaten an Werbe-/Marketing-Plattformen übermittelt. GTM/Ads laden im Club-Bereich nur nach Consent und nur für Marketing-Funktionen außerhalb des Mitglieder-Bereichs.

Hinweis für die juristische Prüfung: Die hier aufgeführten Links zu DPA/AVV-Dokumenten verweisen auf die Trust-/Legal-Seiten der jeweiligen Anbieter. Die tatsächlich vom Anbieter ausgestellten und gegengezeichneten Verträge liegen bei konversion.digital separat ab und können auf Anfrage gemeinsam zur Verfügung gestellt werden.