Intelligenza artificiale generativa e riscrittura del software: un passo verso il superamento del copyleft?

Il tema di partenza

È emerso negli ultimi tempi, da più parti, un interessante spunto di riflessione in merito all’utilizzo dell’intelligenza artificiale come possibile strumento di “liberazione” del software dal copyleft, o più precisamente dai vincoli imposti dalle licenze copyleft.

Il tema di partenza è il seguente: sviluppatori e utenti meno esperti avrebbero la possibilità – fornendo agli strumenti di intelligenza artificiale generativa il codice di un software rilasciato con licenza copyleft – di far creare all’AI un nuovo codice, che consenta al relativo software di conseguire le stesse funzionalità di quello originario, ma che se ne discosti in modo sostanziale. In questo modo, il “nuovo” software potrebbe essere rilasciato con una licenza più permissiva (come ad esempio una licenza MIT), così liberando il suo “autore” dall’obbligo di rilasciarlo con una licenza analoga a quella apposta sul software originario (ad esempio una licenza GNU GPL).

Prima di sviluppare il ragionamento sul tema, è opportuno qualche chiarimento sul contenuto delle licenze di software libero, e sui principi del diritto d’autore applicato ai programmi per elaboratore.

Le licenze di software libero

Si parla di software “libero” per riferirsi comunemente a quei programmi che vengono rilasciati dai loro autori sotto licenze di vario tipo, che consentono agli utilizzatori di accedere al codice sorgente e modificarlo entro limiti più o meno stringenti. Nella prassi, anche e soprattutto in seno a movimenti sorti con lo scopo di promuovere una maggiore libertà nella circolazione della conoscenza e delle opere, si sono sviluppate alcune licenze di portata generale e di contenuto standardizzato, che vengono di norma categorizzate in:

  • licenze copyleft, a loro volta distinte in:
    • copyleft forte: l’utilizzatore ha la facoltà di studiare il codice e modificarlo, realizzando software derivato. Quest’ultimo, però, dovrà necessariamente essere rilasciato al pubblico con una licenza di contenuto analogo (il principale esempio è rappresentato dalla GNU General Public License (GPL)). Si intende in questo modo far sì che tutte le derivazioni del software originario circolino con lo stesso grado di libertà con cui ha circolato quest’ultimo, e in particolare evitare che il software ulteriormente derivato possa essere trattato come software proprietario.
    • copyleft debole: anche in questo caso il software derivato da software precedentemente rilasciato ad esempio con licenza GPL dovrà essere rilasciato con una licenza analoga. Tuttavia, è consentito il link con software non libero (ad esempio, per integrare la parte di software derivato con un software più ampio, elaborato dall’utente senza partire da un altro software libero). La principale di queste licenze è la LGPL (Lesser General Public License)
  • licenze non copyleft, generalmente più permissive nei confronti degli utilizzatori, ai quali è di norma consentito modificare il codice senza l’obbligo di rilasciare il software derivato con una licenza di contenuto analogo (alcuni esempi: Licenza Apache 2.0, Licenza MIT, Licenze BSD).

Tornando dunque al tema principale di cui qui si discute, un programma risultante dalla rielaborazione di un software originariamente rilasciato con licenza copyleft forte potrebbe essere a sua volta rilasciato esclusivamente con un’altra licenza identica. L’autore del software derivato non potrebbe invece mettere in circolazione quest’ultimo con una licenza maggiormente permissiva nei confronti dei futuri utilizzatori/elaboratori.

Opere derivate e diritto di elaborazione

L’esigenza di regolamentare il software derivato (e più in generale qualsiasi dopera dell’ingegno frutto dell’elaborazione di opere preesistenti) sorge dall’assetto dei principi generali in materia di diritto d’autore.

La legge italiana sul diritto d’autore (legge 633/1941, si seguito anche “lda” – ma principi analoghi valgono in termini generali per la gran parte delle legislazioni europee e non solo), riconosce alle elaborazioni creative di opere preesistenti una forma di tutela differenziata rispetto a queste ultime. Mentre infatti le opere “originali” sono destinatarie di una tutela piena e autonoma, le opere derivate (frutto appunto dell’elaborazione di opere preesistenti) richiedono, per poter essere utilizzate, il consenso dell’autore originario.

Consenso che può essere concesso:

  • o attraverso un accordo di cessione dei diritti (attraverso il quale l’autore originario trasferisce la titolarità di tutti i diritti sull’opera o solo alcuni di essi, compreso quello di elaborazione) all’autore dell’opera derivata
  • o attraverso una licenza, con la quale l’autore originario “autorizza” l’elaboratore a utilizzare l’opera risultante dall’elaborazione nei limiti dello stesso accordo di licenza (estensione geografica, durata, corrispettivi economici, esclusiva o meno, etc.).

Le licenze, quando concesse su base non esclusiva – ossia quando non vengono concesse in favore di un solo e unico soggetto – possono essere individuali (ossia negoziate personalmente tra autore originario e autore dell’elaborazione) o generali (ossia rilasciate “a monte” dall’autore originario in favore di qualsiasi possibile utilizzatore futuro dell’opera, che potrà legittimamente utilizzare quest’ultima senza dover acquisire personalmente il consenso dell’autore dell’opera originaria, ma sempre nei limiti imposti dalla licenza stessa).

In ambito software, inoltre, la legge stabilisce che il consenso dell’autore del programma originaria sia necessario non solo per utilizzare economicamente il software derivato, ma anche solo per modificare o elaborare il software preesistente (art. 64-bis lda: previsione che si giustifica con motivazioni di natura principalmente tecnica).

Con riferimento al software “proprietario” (quello cioè non rilasciato con una licenza libera), invece, i margini concessi all’utilizzatore sono nettamente più limitati, salve alcune libere utilizzazioni riconosciute dalla legge per finalità e scopi specifici (come ad esempio la decompilazione, che consente la ricostruzione del codice sorgente, o più precisamente di uno “pseudo-codice”, da chi non ha accesso a quest’ultimo, legittima però nei soli limiti in cui essa sia diretta a “ottenere le informazioni necessarie per conseguire l’interoperabilità, con altri programmi, di un programma per elaboratore creato autonomamente“: art. 64-quater lda).

Fanno eccezione alla regola del consenso le cosiddette variazioni «costituenti di per sé opera originale», alle quali la legge accorda una tutela piena e autonoma al pari di qualsiasi opera originale. Benché la lda (art. 2, n. 2) riferisca questa eccezione esclusivamente alle variazioni musicali di per sé originali, si è ritenuto in giurisprudenza e in dottrina che la previsione sia espressione di un principio più generale: semplificando notevolmente, si può affermare che – quando il risultato dell’elaborazione si discosti dall’opera originaria al punto da potersi qualificare come una nuova opera (o perché l’opera preesistente non risulti più riconoscibile o perché ne venga alterato sostanzialmente il significato) – tale risultato non possa più qualificarsi come “semplice” elaborazione, e il suo utilizzo non richieda più appunto il consenso dell’autore originario.

L’AI come strumento di “liberazione” del software?

Venendo all’argomento da cui si è partiti, pare per la verità – a ben vedere – che il tema ponga questioni non dissimili da quelle poste da qualsiasi attività di modifica ed elaborazione di opere dell’ingegno (nella fattispecie software) preesistenti.

In questa prospettiva, tuttavia, le possibilità tecniche fornite dall’AI amplificano alcuni aspetti critici, prima tra tutte la velocità esponenzialmente maggiore con cui determinate operazioni di riscrittura del codice risultano possibili attraverso il ricorso a strumenti i intelligenza artificiale, nonché il fatto che quest’ultima sia in grado di operare con un ampio livello di autonomia anche a seguito di istruzioni relativamente semplici fornite dall’utente ed espresse in linguaggio comune (prompt); cosa, questa, che peraltro rende queste operazioni accessibili anche a soggetti privi di competenze tecniche in materia di programmazione e sviluppo software, così estendendo notevolmente la platea dei soggetti potenzialmente coinvolti o interessati.

Detto questo, ad ogni modo, la risposta al quesito iniziale non può prescindere dalla risposta a una domanda più ampia e generale, ossia: cosa tutela il diritto d’autore?

L’interrogativo, apparentemente banale, contiene in sé (se non proprio la chiave della questione) perlomeno la gran parte degli elementi utili al fine di inquadrare il problema.

Deve a questo proposito prendersi le mosse dalla distinzione cardine tra idee e forma espressiva dell’opera dell’ingegno.

Le idee, così come i concetti generali che stanno alla base dell’opera stessa, per espressa scelta legislativa non sono oggetto di tutela da parte del diritto d’autore. Ciò non significa che idee, conoscenze e informazioni non abbiano un riconoscimento giuridico e non siano tutelate in assoluto: significa però che la loro eventuale tutela, quando sia possibile, non passa in linea generale dal diritto d’autore.

Quest’ultimo, per contro, riconosce protezione giuridica esclusivamente alla forma espressiva dell’opera, ossia – pur a costo di una inevitabile ripetizione – alla forma in cui l’opera è espressa.

Deve ad ogni modo precisarsi che, quando si parla di forma espressiva, non si fa riferimento esclusivamente alla forma esterna dell’opera – ossia alla forma finale con cui la stessa si presenta e viene fruita – ma anche alla cosiddetta forma interna, intesa come la struttura espositiva dell’opera, o ancora come il modo in cui concetti e idee vengono organizzati e disposti tra loro dall’autore, quando tale organizzazione assuma di per sé una connotazione sufficientemente creativa e originale.

In ambito software, per espressa scelta normativa (a livello europeo e non solo), i programmi per elaboratore sono tutelati «come opere letterarie», attraverso una sorta di finzione giuridica che identifica il codice come una sorta di “manuale di istruzioni” destinato alla macchina. La scelta normativa alla base della tutela del software attraverso il diritto d’autore comporta, proprio per quanto detto poc’anzi, che la protezione non possa estendersi alle funzionalità conseguite dal programma, ma esclusivamente al modo in cui il codice è espresso. Sono fatti salvi i casi in cui possa essere riconosciuta al software anche la tutela brevettuale; casi limitati però alle ipotesi in cui il programma consenta il conseguimento di un effetto tecnico ulteriore rispetto alla sola interazione tra software e hardware.

Più programmi, pertanto (sempre con esclusione delle ipotesi di tutela brevettuale), possono svolgere identiche funzionalità, a condizione che siano espressi in forme differenti.

Tornando al codice “riscritto” dall’AI su richiesta e indicazione dell’utente, quando il risultato di questa attività di rielaborazione sia tale da discostarsi sostanzialmente dal codice originario, si dovrebbe poter ritenere che l’utilizzazione di tale risultato possa prescindere dal consenso dell’autore originario, e conseguentemente anche dall’osservanza delle condizioni della licenza con cui il software originario sia stato rilasciato. Analogo discorso varrebbe qualora il software derivato potesse qualificarsi quantomeno come variazione di per sé originale.

Quando invece il nuovo codice restituito dall’AI a seguito dell’attività di riscrittura possa invece qualificarsi come semplice elaborazione del software preesistente, il rispetto delle condizioni di licenza resterà imprescindibile per un suo legittimo utilizzo.

La questione maggiormente problematica, in questa prospettiva, è rappresentata proprio dalla distinzione in concreto tra elaborazione, variazione originale e nuovo software. L’assenza di criteri normativi specifici, tale distinzione non potrà però che essere fatta in concreto dal giudice in una eventuale sede contenziosa. Deve ad ogni modo sempre tenersi presente, sulla scorta di quanto già precisato sopra, che il semplice conseguimento di identiche funzionalità non potrebbe essere ritenuto sufficiente a qualificare il “nuovo” software come derivazione del primo.

Come già anticipato, le considerazioni qui svolte valgono in analoga misura per le modifiche/elaborazioni realizzate attraverso qualsiasi strumento, sia che l’elaboratore abbia proceduto a una riscrittura “manuale” del codice, sia che si sia avvalso dell’AI.

Ma è proprio l’utilizzo “strumentale” dell’intelligenza artificiale a porre un’ulteriore (e forse ancora più problematica) questione. Si è finora omesso di precisare, infatti, che la legge sul diritto d’autore richiede espressamente, quale condizione indefettibile per la protezione di un’opera, che questa sia frutto del lavoro intellettuale di un autore umano. Se questa posizione era già sostanzialmente condivisa in passato, attualmente il principio è stato esplicitato dalla legge 132/2025, che ha modificato l’art. 1 della legge 633/1941 precisando che la tutela del diritto d’autore è riservata alle «opere dell’ingegno umano».

La stessa norma precisa ora che anche le opere «create con l’ausilio di strumenti di intelligenza artificiale» possano essere tutelate dal diritto d’autore, a condizione però che siano «risultato del lavoro intellettuale dell’autore».

Proprio in questo risiede un ulteriore elemento chiave della questione: il ricorso all’intelligenza artificiale non esclude la tutela autorale, se però l’AI ha svolto una funzione di “ausilio” all’autore umano (in assenza di ulteriori specificazioni normative, la portata del concetto di “ausilio” dovrà tuttavia essere valutata alla luce della futura interpretazione giurisprudenziale).

La riscrittura del codice affidata a strumenti di intelligenza artificiale generativa, in questo senso, pone però un importante interrogativo, soprattutto nelle ipotesi – sopra richiamate – in cui l’utente (umano) dia “in pasto” all’AI il codice del software originario, formulando un semplice prompt con il quale si limiti a richiedere all’AI stessa di scrivere un nuovo codice, senza fornire alcuno specifico apporto creativo alla sua generazione. In casi simili, infatti, proprio l’assenza di un apporto creativo da parte dell’utente umano – a prescindere del tutto dal livello di novità del codice restituito dalla macchina come output – in applicazione dei principi richiamati dovrebbe portare il nuovo software a essere ritenuto privo dei requisiti minimi per poter essere tutelato dal diritto d’autore. In questo senso, il tema della possibilità di rilasciare il nuovo codice con una licenza più o meno permissiva non si porrebbe neppure, perché – non essendo tale codice tutelato dal diritto d’autore – lo stesso sarebbe in teoria liberamente utilizzabile da chiunque, e l’utente che ne abbia richiesto la “creazione” all’AI – non potendosi qualificare come “autore” nel senso giuridico del termine – non sarebbe neppure titolato a disporne attraverso alcun tipo di licenza.

Soluzioni come quelle descritte comporterebbero dunque non tanto una “liberazione” del software dai soli vincoli delle licenze copyleft, quanto piuttosto l’esclusione dal riconoscimento tout court di qualsiasi diritto d’autore. Alla luce delle premesse da cui è partita questa riflessione, pare però che questo risultato vada ben oltre gli intenti di chi vede nell’AI una possibile via di superamento dei limiti contrattuali delle citate licenze.

Utilizzo di software preesistente nell’addestramento dell’AI

Le considerazioni qui svolte non tengono inoltre conto di un ulteriore aspetto: l’utilizzo di qualsiasi opera tutelata (compreso un software) ai fini di addestramento di sistemi di intelligenza artificiale è legittimo solo alle condizioni stabilite dalle previsioni dell’art. 70-septies lda (che a sua volta richiama le condizioni stabilite dagli artt. 70-ter e 70-quater lda) in tema di Text and Data Mining, nella misura in cui l’autore originario non abbia riservato a sé tutti i diritti di utilizzo.

Qualora nelle condizioni della licenza sul software originario sia presente l’espressa riserva di diritti (cosiddetto opt-out), infatti, l’operazione stessa di “alimentazione” dell’AI generativa con il codice del programma originario si presenterebbe come illegittima, rendendo conseguentemente illecito l’utilizzo di qualsiasi risultato ottenuto attraverso all’esito della medesima operazione.

Le attuali licenze copyleft non contengono una clausola di espressa riserva dei diritti. Al tempo stesso, si ritiene che il contenuto delle licenze copyleft standard non possa essere interpretato come se implicasse una simile riserva di diritti (come chiarito ad esempio da Creative Commons per le licenze CC1); parallelamente, l’aggiunta di una clausola di riserva parrebbe incompatibile con il modello copyleft, tenuto conto del fatto che i principi alla sua base implicano il divieto di restrizioni aggiuntive rispetto a quelle già contenute nei testi delle licenze standard. Discussa è anche la possibilità per il singolo licenziatario di affiancare alla licenza copyleft una espressa riserva dei diritti, che anche in questo caso potrebbe considerarsi compatibile con la licenza esclusivamente nella misura in cui non incidesse negativamente sulle facoltà concesse dalla licenza medesima. Si discute, a questo proposito, di una possibile integrazione delle principali licenze copyleft con una apposita clausola di opt-out: è un tema che richiederebbe però una trattazione a sé, ma che meritava comunque in questa sede quantomeno un sintetico accenno.


1 Si veda ad esempio il contenuto del documento “Creative Commons Statement on the Opt-Out Exception Regime / Rights Reservation Regime for Text and Data Mining under Article 4 of the EU Directive on Copyright in the Digital Single Market“, pubblicato da Creative Commons per fornire specifici chiarimenti in merito al rapporto tra le licenze CC e l’eccezione di Text and Data Mining prevista dall’art. 4 della Direttiva UE 2019/790).