Google trasparency report: richieste di rimozioneCon un annuncio sul blog Inside Search, Google il 10 agosto informa di una importante modifica all'algoritmo del motore di ricerca. È Amit Singhal a spiegare che da ora in poi nella realizzazione dell'indice Google terrà conto anche del numero di rimozioni valide per violazione del copyright.
Singhal chiarisce che non si tratta di violazioni effettive, cioè controllate da un giudice oppure analizzate da un ufficio legale, perché, continua, solo i detentori del copyright sanno se qualcosa è effettivamente autorizzato ad essere pubblicato da terzi, e solo un giudice può decidere se c'è una effettiva violazione del diritto d'autore. Google non può determinare se una pagina web viola il copyright, per cui si tratta solo di avvisi (notice) di violazione del copyright, cioè richieste di rimozione di un certo contenuto valide sulla base del DMCA, la normativa americana che detta le regole per la responsabilità degli intermediari della comunicazione e specifica le modalità per inviare una richiesta di rimozione di un contenuto in violazione del copyright (notice and takedown).

Quindi, i siti che ricevono un elevato numero di avvisi di rimozione conformi alle norme del DMCA si vedranno declassare nell'indice del motore di ricerca di Google.
Questa modifica dell'algoritmo del motore di ricerca, continua Singhal, dovrebbe aiutare gli utenti a trovare contenuti legittimi sul web.

In linea di massima sembrerebbe un'operazione utile, se non fosse per quel piccolo particolare che, come chiarisce l'annuncio, non saranno penalizzati i siti che pubblicano contenuti illeciti, bensì i siti che ricevono richieste di rimozione indipendentemente dal fatto che i contenuti siano effettivamente illeciti.
A questo punto, per inquadrare correttamente la vicenda, occorre ricordare due eventi accaduti nei mesi scorsi. Prima di tutto la pubblicazione a maggio 2012 del Trasparency Report, col quale Google pubblicizza il numero di richieste di rimozione per violazione del copyright ricevute, precisando anche gli url di riferimento, i principali siti oggetti di rimozione, e i titolari più attivi nelle richieste di rimozione. È interessante notare che il numero di richieste di rimozione, come visualizzate nel grafico, tende a crescere quasi esponenzialmente, fino a superare un milione di richieste alla settimana.
Anche qui va tenuto presente che non stiamo parlando affatto di contenuti illeciti, ma solo presunti, cioè si tratta di richieste di rimozione provenienti dai titolari dei diritti, ma anche da terzi, non valutate da alcun giudice od autorità deputata a questo compito.

Chiaramente l'intento dei detentori dei diritti è di rendere non più disponibili i contenuti pirata attraverso il motore di Google. Purtroppo, come rilevato, non essendoci una valutazione di autorità giudiziarie su queste richieste, talvolta incappano nella rimozione anche contenuti del tutto leciti, come trailer cinematografici, pagine di siti autorizzate, ecc....
Bisogna infatti ricordare che in relazione al copyright non è mai il file in sé ad essere illegittimo, quanto piuttosto l'uso che se ne fa del file, per cui un terzo, rispetto al titolare, potrebbe avere dei diritti concorrenti che gli consentono di pubblicare quell'opera. I titolari del copyright, però, hanno la tendenza a non andare troppo per il sottile e a chiedere la rimozione di tutti i contenuti simili alle proprie opere in catalogo, senza discernere tra contenuti leciti ed illeciti.
Il parametro usato dalle major non appare tanto dato dalla illiceità, quanto dal fatto che il contenuto sia in "concorrenza" con il loro catalogo!

Altra considerazione ovvia è che i contenuti effettivi, i file, non vengono rimossi dal web rimanendo sui siti originari, solo non saranno più menzionati nell'indice di Google. Certo, le lobby faticherebbero di più a contattare tutti i siti che pubblicano file illeciti, o presunti tali, e non è detto che quei siti, spesso su server non americani, addivengano alle richieste delle aziende statunitensi, per questo motivo è Google il soggetto di continue e crescenti richieste di takedown.

Tanto per chiarire possiamo ricordare che la Warner Bros, in relazione al film Wrath of the titans (La Furia dei titani) ha chiesto la rimozione del trailer ufficiale di Apple (punto 32) insieme a quello su Hulu (37), la scheda del film su IMDb, nonché la rimozione di tutta una serie di siti che semplicemente parlavano del film commentandolo!
Ancora, la RIAA che chiede la rimozione dell'intera sezione Electro Pop su Last FM ("Allegedly infringing URLs: 0. http://www.last.fm/tag/electropop").

Solo pochi esempi per precisare come talvolta accade che le major esagerino con le richieste di rimozione di contenuti. Talvolta si chiede la rimozione di tutto ciò che ha un qualche collegamento col nome di un film, senza verificare i contenuti della pagina web.
Non dimentichiamo che in alcuni casi i titolari dei diritti sono stati forniti di un accesso privilegiato ai contenuti di un hosting, in modo da poter rimuovere autonomamente i file ritenuti illeciti. Almeno in un caso tale privilegio è sfociato in un abuso al punto che Hotfile portò in giudizio la Warner per abuso del copyright, cioè per aver dichiarato falsamente di essere titolare di contenuti sui quali non aveva invece alcun diritto, rimuovendoli, compreso software opensource.

Il DMCA introduce una prima fase di regolamentazione interamente basata sull'accordo delle parti (sul genere che avrebbero dovuto introdurre SOPA, PIPA e ACTA), intendendo per parti non il titolare del diritto e l'uploader presunto pirata, bensì il titolare del diritto e il fornitore di hosting, quest'ultimo terzo rispetto alla contesa. Il titolare del diritto, sulla base del DMCA, afferma (non prova) la sua titolarità e chiede la rimozione di un contenuto. Questo è ciò che occorre perché una richiesta sia "valida". È evidente che il fornitore di hosting non ha interesse a prendere le difese dell'uploader, spesso un soggetto privato che ben pochi problemi può causare al provider, a differenza del titolare del diritto, o presunto tale, che è una multinazionale.
Appare ovvio che, per come è congegnato, il DMCA si presta facilmente ad abusi, laddove la tutela dell'uploader è tutta concentrata nella fase successiva, del tutto eventuale, nella quale è l'uploader a dover avviare un controricorso e poi eventualmente una causa contro il titolare del diritto, con le spese di avvio della procedura a suo carico.

Ecco, quindi, che l'annuncio di Google appare quanto meno strano, visto che la stessa azienda di Moutain View si è lamentata dell'elevato numero di richieste fasulle, e adesso, invece, inserisce tale parametro nell'algoritmo del motore di ricerca sapendo bene che non necessariamente una richiesta di takedown, pur se "valida", cioè conforme al DMCA, riguarda un file illecito.
E qui dobbiamo ricordare un altro evento, e precisamente un incontro a porte chiuse nel gennaio di quest'anno, quando i detentori del copyright hanno consegnato una lista di richieste a Google, Yahoo e Bing, cioè i principali motori di ricerca sul web.
Non è un segreto che la lobby del copyright ritiene che i motori di ricerca non stiano facendo abbastanza per eliminare la pirateria online, e giusto a dicembre 2011 la RIAA pubblicò un rapporto nel quale evidenziava come Google fosse il principale oggetto di tali critiche, in quanto, secondo l'associazione, riceve benefici finanziari da siti che esercitano la pirateria. Quello che la RIAA chiede è rimozioni più veloci e il delisting dei siti di file sharing più popolari.
Infatti, il documento, un codice volontario di condotta non destinato alla pubblicazione (ottenuto grazie ad una richiesta ai sensi del Freedom of information act), riguarda proprio i seguenti punti:

- assegnare un ranking inferiore nell'indice del motore di ricerca per i siti che pubblicano ripetutamente contenuti senza licenza in violazione del copyright;
- dare priorità ai siti web che ottengono una certificazione come sito autorizzato;
- rimuovere dall'indice del motore di ricerca i siti oggetto di ordinanze del tribunale.

Di fatto l'industria del copyright chiede modifiche sostanziali al motore di ricerca, in modo da porre in cima i siti autorizzati (ovviamente saranno autorizzati da RIAA e MPAA), e far scendere i siti che pubblicano contenuti ritenuti (ovviamente dall'industria del copyright) illeciti.
Ma non si fa alcuna menzione dei danni collaterali conseguenti all'applicazione di tali filtri. Tutti gli autori che non sono legati a qualche editore o alle aziende del copyright, e preferiscono distribuire di persona le proprie opere, faticano a trovare spazi, per cui giocoforza devono rivolgersi a siti che vengono additati come pirati, utilizzandoli però lecitamente. Sono questi che pagheranno le conseguenze in termini di minore visibilità sul web.

E, tanto per fare un esempio di prioritizzazione come richiesta dalle major, nel documento si citano le ricerche sui termini: mp3, flac, wma, aac, torrent, download, rip, stream, listen, free; in abbinamento con il nome di un artista oppure il titolo di un album, come ricerche da far scendere in classifica. Ancora una volta per la RIAA il "free" è sinonimo di illegale!

Per Hollywood, quindi, l'annuncio di Google è una evidente vittoria, visto che Moutain View accoglie una delle richieste delle major. E forse per la prima volta Google invece di modificare l'algoritmo di ricerca per andare incontro agli utenti, invece realizza un cambiamento che va incontro alle aspettative dell'industria, col risultato possibile di penalizzare siti molto ricercati dagli utenti stessi, anche a fini del tutto legittimi. Questo cambio di rotta potrebbe portare ad un ulteriore aumento delle richieste di takedown, perché, sia chiaro, l'industria non si accontenterà mai fino a quando non otterrà tutto ciò che vuole. Infatti, appena qualche giorno dopo l'annuncio di Google la RIAA ha precisato che non è abbastanza, ed anche l'MPAA chiede a Google ulteriori passi in avanti.
Ma non solo, visto che appare sempre più palese che ciò che Hollywood vuole rimuovere è la concorrenza, illecita o lecita (ad esempio "free") non importa, qualcuno potrebbe anche cominciare a chiedersi perché i siti legati a RIAA ed MPAA debbano essere privilegiati nel motore di ricerca. Google, con le sue scelte, potrebbe in tal modo aprire un contenzioso con le autorità antitrust di mezzo mondo, anche in considerazione del fatto che i principali siti oggetto di richiesta di takedown si trovano al di fuori dei confini americani. Una white list facilmente potrebbe incorrere nelle ire della Commissione Europea.


Sembrerebbe, quindi, che Google si sia arresa alla lobby del copyright, andando a modificare proprio il suo prodotto principale in un senso non migliorativo per gli utenti, consegnando all'industria il potere assoluto in questa materia. In fondo a pensarci bene i siti che ricevono molte richieste di takedown sono i siti più popolari, sembra decisamente una forzatura ritenerli "cattivi" solo per questo.
Il prossimo passo sarà lasciar decidere a RIAA e MPAA quali sono i siti buoni, da porre in alto nell'indice, e quelli cattivi, da declassare?

Il problema principale degli "accordi volontari" è che coloro che spingono per essi non hanno alcun interesse a trovare un equilibrio che garantisca anche i soggetti deboli, gli utenti della rete in questo caso. Ed è per questo che le leggi, applicate da giudici terzi, rimangono ancora oggi l'unico modo democratico per procedere in queste materie. Invece, ormai ci siamo incamminati sul sentiero oscuro degli accordi sottobanco tra multinazionali.