Titolarità dei diritti e possibili violazioni di diritti di terzi nell’addestramento dei sistemi di AI generativa o nei risultati creativi
Indice
Introduzione
Il tema dello sviluppo dei sistemi di intelligenza artificiale (di seguito anche AI1) è sempre più discusso e dibattuto.
Tra le tante applicazioni dell’intelligenza artificiale una delle più note è senz’altro è l’AI generativa, che consente la creazione di contenuti di vario tipo: testi, immagini, suoni, video etc.
Senza voler approfondire i dettagli tecnici del funzionamento dei sistemi di intelligenza artificiale, si può sinteticamente dire che la creazione di contenuti ha origine dall’immissione di un input da parte dell’utente, attraverso un prompt, ossia un testo espresso in linguaggio naturale, attraverso il quale vengono fornite alla macchina le istruzioni in merito al risultato (output) che si intende ottenere.
Il sistema di intelligenza artificiale analizza il prompt per restituire un risultato coerente con le richieste dell’utente, e lo fa elaborando una notevolissima quantità di dati che sono stati immessi in precedenza al fine di addestrare il sistema stesso.
Per le sue caratteristiche, che consentono la creazione di contenuti nuovi (o apparentemente tali) l’AI generativa pone numerose questioni anche in ordine alla possibile violazione di diritti di terzi soggetti, sia nella creazione del risultato sia, più a monte, nell’addestramento dei sistemi.
Si pone inoltre il problema di comprendere se i risultati creati con l’ausilio dell’intelligenza artificiale possano considerarsi protetti dal diritto d’autore, e di comprendere chi possa essere eventualmente considerato in concreto l’autore.
I rapporti con il diritto d’autore
Tutelatilità e titolarità dei risultati
È bene anzitutto chiarire alcuni principi fondamentali del diritto d’autore.
La legge italiana sul diritto d’autore (legge 633/1941, di seguito anche l.d.a.) tutela “le opere dell’ingegno di carattere creativo che appartengono alla letteratura, alla musica, alle arti figurative, all’architettura, al teatro ed alla cinematografia, qualunque ne sia il modo o la forma di espressione“.
Ciò che è dunque necessario perché una creazione intellettuale possa essere tutelata dal diritto d’autore è che la stessa possieda carattere creativo. Per comune opinione, si considera creativa un’opera che possieda i requsiti della novità (sia cioè diversa da opere preesistenti) e originalità (sia cioè idonea a rispecchiare la personalità dell’autore).
L’autore, attualmente, può essere esclusivamente una persona fisica, ossia un essere umano. Infatti, mentre i diritti economici d’autore possono essere ceduti a terzi, anche a soggetti giuridici diversi dalle persone fisiche (società, associazioni, fondazioni etc.), i diritti morali (come quello alla paternità dell’opera) sono intrasferibili e sono qualificati giuridicamente come diritti della personalità, che per loro natura possono appartenere esclusivamente a persone fisiche.
Perché un’opera possa essere protetta dal diritto d’autore, quindi, è necessario:
- che sia stata creata da un essere umano
- che sia dotata di carattere creativo (sia cioè nuova e originale)
Queste considerazioni porterebbero a escludere alla radice la possibilità che un sistema di intelligenza artificiale possa essere considerato autore del risultato generato su richiesta dell’utente.
Al contempo, però, non sempre è agevole sostenere che invece possa considerarsi autore l’utente stesso.
Infatti, il diritto d’autore tutela soltanto il risultato espressivo, e non anche le idee e i concetti che ne stanno alla base.
L’utente, tuttavia, di norma non partecipa attivamente alla creazione dell’opera, ma fornisce alla macchina le istruzioni per realizzarla.
Di conseguenza appare difficile, per questa ragione, poter qualificare l’utente come autore del risultato prodotto dall’AI, soprattutto quando – a fronte di un prompt testuale – il risultato creativo sia espresso in una forma diversa dal testo (immagine, video, suoni).
È tuttavia anche possibile che il prompt stesso possa considerarsi sufficientemente originale (non è richiesto dalla l.d.a. un grado di originalità elevato ai fini della protezione): in questo caso, il prompt potrà considerarsi a sua volta opera originale, ma il risultato restituito dalla macchina – che rappresenterà una elaborazione di quel prompt – potrebbe ancora una volta non risultare agevolmente proteggibile, trattandosi di una elaborazione realizzata dalla macchina e non dall’utente.
Quando però il risultato restituito dalla macchina sia frutto di una concreta scelta dell’utente, magari attraverso un affinamento delle istruzioni impartite alla macchina, allora la partecipazione dell’utente stesso al processo creativo potrebbe considerarsi non più limitata all’idea originaria, ma potrebbe considerarsi a tutti gli effetti un contributo autoriale, consentendo quindi di attribuire legittimamente all’utente la paternità del risultato e i diritti di utilizzo sullo stesso.
Questo, in ogni caso, sempre a condizione che il risultato sia nuovo e orignale, e che non violi diritti di terzi soggetti.
Merita una breve menzione anche il contenuto dell’art. 27 della legge 206/2023 (“Disposizioni organiche per la valorizzazione, la promozione e la tutela del made in Italy“), che definisce come creatori digitali “gli artisti che sviluppano opere originali ad alto contenuto digitale“.
La norma prevede che, al fine di tutelare i diritti dei creatori, venga istituito un “repertorio delle opere dei creatori digitali” nell’ambito del Registro Pubblico Generale delle opere protette tenuto dal Ministero della Cultura.
La disposizione, tuttavia, non sembra aprire la strada all’individuazione di autori non umani, limitandosi a prevedere un meccanismo di maggiore tracciabilità delle opere ad alto contenuto digitale, che devono comunque risultare “originali” (e, come si è visto, non pare che il requisito dell’originalità, che presuppone che l’opera rispecchi la personalità dell’autore, possa essere riconosciuto a soggetti appunto non umani).
Addestramento dei sistemi di AI e diritti di terzi
Le ultime considerazioni svolte portano a domandarsi se le modalità di addestramento dei sistemi di intelligenza artificiale possano in qualche modo determinare la violazione di diritti di terzi soggetti.
Si è detto, infatti, che l’addestramento presuppone anzitutto l’immissione nei sistemi di AI di una grande quantità di dati, compresi in particolare i contenuti di opere preesistenti.
A titolo di esempio, per richiedere all’AI di realizzare un’immagine che imiti lo stile pittorico di un determinato artista, è anzitutto necessario che la macchina conosca quello stile: per farlo, l’AI rielabora i dati estrapolati da tutte le opere di quell’artista che sono state precedentemente immesse nel sistema; ma elabora anche i testi di libri e articoli che parlano di quel determinato artista, etc.
L’immissione di questi dati, tuttavia, normalmente avviene senza il consenso dei titolari di diritti su quelle opere.
L’eccezione di Text and Data Mining (TDM) nella legge sul diritto d’autore
Il legislatore italiano, recependo la Direttiva UE 790/2019, ha aggiunto nel 2021 l’art. 70-quater alla legge sul diritto d’autore, che riguarda il cosiddetto Text and Data Mining, che la Direttiva definisce all’art. 2 come “qualsiasi tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni inclusi, a titolo non esaustivo, modelli, tendenze e correlazioni“.
L’art. 70-quater l.d.a. al comma 1 prevede che “sono consentite le riproduzioni e le estrazioni da opere o da altri materiali contenuti in reti o in banche di dati cui si ha legittimamente accesso ai fini dell’estrazione di testo e di dati“. Ai sensi del comma 2, le riproduzioni ed estrazioni possono tuttavia essere conservate “solo per il tempo necessario ai fini dell’estrazione di testo e di dati“.
Precisa però la norma che la riproduzione e l’estrazione è consentita soltanto “quando l’utilizzo delle opere e degli altri materiali non è stato espressamente riservato dai titolari del diritto d’autore e dei diritti connessi nonché dai titolari delle banche dati“.
La norma, quindi, consente attualmente la riproduzione e l’estrazione del contenuto di opere e banche dati preesistenti, al fine di estrapolare dati e informazioni, a condizione che:
- chi esegue l’operazione abbia avuto legittimo accesso alle opere o alle banche dati;
- le riproduzioni ed estrazioni vengano conservate solo per il tempo necessario per l’estrazione stessa;
- i titolari dei diritti sulle opere e banche non abbiano fatto espressa riserva di utilizzo di tali diritti (cosiddetto opt out).
Il diritto di opt out non opera invece per l’estrazione di dati effettuata “da organismi di ricerca e da istituti di tutela del patrimonio culturale” quando sia fatta “per scopi di ricerca scientifica“, ai sensi dell’art. 70-ter l.d.a., che consente anche “la comunicazione al pubblico degli esiti della ricerca ove espressi in nuove opere originali“.
La norma citata quindi, da un lato, pare consentire l’estrazione di testo e altri dati da opere e banche dati preesistenti ai fini anche dell’addestramento di sistemi di intelligenza artificiale.
Al tempo stesso, tuttavia, si è visto che l’estrazione è consentita soltanto a chi abbia avuto legittimo accesso a quei contenuti, e salvo che il titolare dei diritti non li abbia espressamente riservati.
L’estrazione di dati per l’addestramento di sistemi di AI, pertanto, dovrà in ogni caso soggiacere al rispetto delle considizioni sopra indicate: deve quindi ritenersi in ogni caso non consentita l’estrazione indiscriminata in mancanza delle condizioni predette2.
Il Regolamento UE 2024/1689 (AI Act)
È di recente entrato in vigore nel territorio dell’Unione Europea il cosiddetto AI Act, Regolamento che “stabilisce regole armonizzate sull’intelligenza artificiale“.
Nonostante nei propri Considerando il Regolamento faccia più volte richiamo ai diritti d’autore, nei fatti l’atto non contiene una regolamentazione puntuale dei rapporti tra diritto d’autore e intelligenza artificiale.
Soltanto l’art. 53 stabilisce che gli Stati membri “attuano una politica volta ad adempiere al diritto dell’Unione in materia di diritto d’autore e diritti ad esso collegati“: in particolare, la disposizione prevede che – anche attraverso misure tecnologiche all’avanguardia – sia garantita l’effettività della riserva di diritti (opt out) da parte dei titolari degli stessi con riguardo all’utilizzo delle opere nell’ambito del Text and Data Mining3.
Il nuovo disegno di legge sull’intelligenza artificiale
È attualmente in discussione in Parlamento un DDL di iniziativa governativa volto a regolamentare, nell’ordinamento italiano, lo sviluppo e l’utilizzo di sistemi di intelligenza artificiale4.
Il DDL contiene anche alcune disposizioni in materia di diritto d’autore.
In particolare, l’art. 24 del DDL propone che nell’art. 1 l.d.a. – che come si è visto stabilisce che sono tutelate le “opere dell’ingegno di carattere creativo […] qualunque ne sia il modo o la forma di espressione”, sia aggiunta la parola “umano” dopo la parola “ingegno“. Si propone inoltre di specificare che le opere siano tutelate “anche laddove create con l’ausilio di strumenti di intelligenza artificiale, purché costituenti risultato del lavoro intellettuale dell’autore“.
Entrambe le previsioni, come si è visto sopra, sembrano già ricavabili dall’attuale impianto della legge sul diritto d’autore. Qualora il DDL venisse effettivamente approvato, tali principi risulterebbero però ulteriormente esplicitati.
Il DDL propone inoltre, in tema di addestramento dell’AI, l’inserimento nella l.d.a. di un art. 70-septies, a norma del quale “La riproduzione e l’estrazione di opere o altri materiali attraverso modelli e sistemi di intelligenza artificiale anche generativa sono consentite in conformità alle disposizioni di cui agli articoli 70-ter e 70-quater“.
Anche in questo caso, come si è visto, il principio espresso dalla norma in discussione parrebbe già ricavabile dalle disposizioni vigenti della l.d.a., ma evidentemente il legislatore ha ritenuto in questo modo di poter fare ulteriore chiarezza in ordine all’estensione e alla portata dell’eccezione di Text and Data Mining di cui si è parlato sopra.