// COMPUTERBASE — MOBILE & WEB
Bücher für Modell-Training vernichten: Warum KI-Firmen die Bestände von Antiquariaten kaufen
Es ist eine kuriose Entwicklung, von der Antiquariatshändler laut dem Schweizer Radio und Fernsehen (SRF) berichten: Sachbücher und Romane, die bislang Ladenhüter waren, wandern in hoher Stückzahl in die USA. KI-Unternehmen nutzen diese, um legal Trainingsdaten zu generieren.
Ein Online-Antiquariat registrierte ab Anfang Mai hohe Auftragsvolumen, die jeweils nachts zwischen 3 und 5 Uhr eingingen. Das Vorgehen wirkte automatisiert, systematisch und ist Berichten in Online-Foren zufolge kein Einzelfall. Mehrere Händler melden die Vorfälle.
Interessant ist, dass es sich bei den Einkäufen um Ladenhüter handelt. Das Interesse besteht an Kochbüchern, Biografien, Belletristik. „Gekauft wurden gezielt Non-Fiction-Titel ab 1970 mit ISBN-Nummern – angestaubte Lagerleichen, die seit Jahren niemand wollte“, schreibt ein Händler laut dem SRF. Ein Weiterverkauf wäre demnach ausgeschlossen, weil die Bücher wertlos seien und pro Titel immer nur exakt ein Exemplar erworben wird.
Bei den Mengen ist von 700.000 Büchern allein aus Deutschland die Rede, die sich in einem Lagerort nahe der tschechisch-deutschen Grenze befinden. Weltweit sind es Schätzungen der Händler zufolge rund drei Millionen.
Hinter den Käufen soll unter anderem das kanadische Unternehmen Zoom Books stecken. Das bestreitet aber, ein KI-Zulieferer zu sein. Auf Anfrage spricht des SRF erklärt das Unternehmen, ein Recycling- und Handelsmodell zu betreiben.
Aus Sicht der KI-Unternehmen ergibt es Sinn, massenhaft alte Bücher zu erwerben. Eines der ersten Urteile zum KI-Urheberrecht in einem Anthropic-Fall besagte im Sommer 2025: Bücher ohne Erlaubnis der Inhaber zu kopieren und für das KI-Training zu verwenden, ist ein Verstoß gegen das Urheberrecht. Wenn ein KI-Unternehmen ein Buch aber besitzt und die Inhalte dann für das KI-Training nutzt, fällt das Vorgehen unter die Fair-Use-Regeln.
Das Argument ist: Beim KI-Training mit den Buchinhalten entsteht etwas Neues, das über den ursprünglichen Nutzungszweck hinausgeht. „Sie müssen vielleicht dafür bezahlen, den Text erst einmal in den Händen zu halten. Aber es wäre undenkbar, jemanden für die Nutzung eines Buchs zahlen zu lassen; jedes Mal, wenn sie es aus dem Gedächtnis abrufen, jedes Mal, wenn sie darauf zurückgreifen, um neue Dinge in einer neuen Weise zu schreiben“, erklärte der Richter im Urteil vom Juni 2025.
Eine Vorgabe ist aber, dass das jeweilige Buch nach dem „Lesen“ – also dem Training – vernichtet wird. Damit stellen Unternehmen formal sicher, dass keine widerrechtlichen Kopien mehr im Umlauf sind, berichtete die Washington Post im Januar dieses Jahres.
Gerichtsdokumente belegten, dass Anthropic im Rahmen des Projekts Panama systematisch Bücher kauft, scannt und dann vernichtet. Bücher sind laut Aussage eines Anthropic-Mitgründers besonders gut für Trainingsdatensätze geeignet, weil Modelle anstelle von minderwertigem Internet-Sprech ein „gutes Schreiben“ beibringen. Meta bezeichnete Bücher bereits im Jahr 2024 als essenziell für das KI-Training.