La Voce del Gongoro: Mentire con i pixel

Vedere non è più credere. Nel luglio del 2000 questo articolo – di cui ho già riportato alcuni estratti in altri post – annunciava il nuovo secolo come l'epoca della falsificazione video, permessa dalla nuova tecnologia di video-manipolazione in tempo reale.

Vale la pena rileggerlo per intero, se non altro per ripensare a cos'è, effettivamente, quella che chiamiamo realtà.

Forse, chissà, qualcosa potrebbe esserci sfuggito.
___________________________

Di Ivan Amato

L'anno scorso, Steven Livingston, professore di comunicazione politica alla George Washington University, ha stupito il pubblico di un congresso sui pro e i contro geopolitici delle immagini provenienti dal satellite. Non ha prodotto prove di nuove mobilitazioni militari o di pandemie globali. Invece, ha mostrato un video della pattinatrice Katarina Witt durante una gara del 1998.

Nella clip, Witt volteggia con garbo sul ghiaccio per circa 20 secondi. Quindi è stato mostrato quello che forse è uno dei replay sportivi più insoliti mai visti. Lo sfondo era lo stesso, i movimenti di macchina erano gli stessi. In effetti, l'immagine era identica all'originale in tutti i sensi tranne uno, piuttosto importante: la Witt era sparita, e con lei ogni sua traccia, come le ombre o gli spruzzi di ghiaccio sollevati dai suoi pattini. Al loro posto c'era esattamente ciò che vi sareste aspettati se la Witt non ci fosse mai stata da principio: il ghiaccio, le pareti della pista di pattinaggio e la folla.

Dov'è questa gran cosa, chiederete. Dopo tutto, lo staff di Stalin aerografava via dalle foto regolarmente ogni persona non grata più di mezzo secolo fa. E Woody Allen introdusse 17 anni fa una variazione sulla modifica della realtà nei film con Zelig, in cui si inserì vicino ad Adolf Hitler ed a Babe Ruth. In film come Forrest Gump e Wag the dog, la distorsione della realtà è diventata un luogo comune.

Quello che differenzia – radicalmente differenzia – la dimostrazione con la Witt è che la tecnologia usata per la “cancellazione virtuale” della pattinatrice oggi può essere applicata in tempo reale, dal vivo, proprio mentre una videocamera registra una scena e la trasmette in diretta agli spettatori. Nella frazione di un secondo fra i fotogrammi, ogni persona o oggetto che si muove in primo piano può essere cancellato e oggetti che non ci sono possono essere pubblicati dentro ed essere fatti per sembrare reali. “Plasticità del pixel,” la chiama Livingston. L'implicazione per i partecipanti al congresso sulle immagini satellitari erano serie: le immagini dall'orbita possono non essere necessariamente ciò che la videocamera elettronica del satellite ha registrato realmente.

Ma le ramificazioni di questa nuova tecnologia vanno oltre le immagini provenienti dai satelliti. Con la realizzazione della manipolazione elettronica dal vivo, la credibilità di ogni video diventerà altrettanto sospetta quanto le foto sovietiche dalla guerra fredda. Il problema proviene dalla natura del video moderno. Dal vivo o no, è fatto di pixel e come Livingston dice, i pixel si possono cambiare.

Gli esempi più noti di video manipolazione in tempo reale finora sono le “inserzioni virtuali” nelle trasmissioni degli sport professionistici. Il 30 gennaio scorso, per esempio, quasi la sesta parte dell'umanità in più di 180 paesi ha visto ripetutamente una linea arancione tracciata lungo il campo di football americano mentre guardavano il Super Bowl. La Sportvision di New York ha creato quella linea e l'ha inserita nelle riprese dal vivo della trasmissione. Per aiutare a determinare dove inserire i pixel arancioni, parecchie videocamere sono attrezzate con dei sensori che hanno seguito le posizioni spaziali delle videocamere ed i livelli dello zoom. A migliorare l'illusione della realtà il sistema Sportvision ha la capacità di assicurarsi che i giocatori e gli arbitri coprano la linea virtuale quando i loro corpi la attraversano.

La primavera e l'estate scorse, mentre Sportvision e rivali come Princeton Video Imaging (PVI) di Lawrenceville nel New Jersey trasmettevano prodotti di inserzione virtuale, compresi i tabelloni pubblicitari simulati sulle barriere dietro ai battitori della major league, una squadra di assistenti tecnici della Sarnoff Corp. di Princeton, New Jersey, volarono al Coalition Allied Operations Center della Operation Allied Force della NATO a Vicenza, in Italia. La loro missione: trasformare la loro tecnologia sperimentale di manipolazione video in uno strumento operativo per l'individuazione e il puntamento rapido dei veicoli militari serbi in Kosovo. Il progetto era denominato TIGER, per “puntamento da georegistrazione di immagini.” [Targeting by Image GEoRegistration] “Digiti semplicemente le coordinate ed è fatta,” spiega Michael Hansen, un giovane smanettone caffeinato di Sarnoff che può a malapena credere che l'anno scorso stava aiutando a combattere una guerra.

Confrontato al lavoro della PVI, l'operazione tecnica militare era più difficile – e la posta molto più alta. Invece di alterare la trasmissione di una partita di football, la squadra TIGER ha manipolato una ripresa video dal vivo di un Predator, un velivolo di ricognizione senza equipaggio in volo a circa 450 metri sopra i campi di battaglia del Kosovo. Invece di sovrapporre le linee o gli annunci virtuali negli scenari sportivi, l'operazione era di ricoprire, in tempo reale, le immagini “georegistrate” del Kosovo sulle scene corrispondenti in arrivo dal vivo dalla videocamera del Predator. Le immagini del terreno erano state prese precedentemente con fotografie aeree ed erano state immagazzinate digitalmente. Il sistema TIGER, che rilevava automaticamente gli oggetti in moto sullo sfondo, poteva fornire quasi immediatamente agli addetti al puntamento le coordinate di qualsiasi veicolo serbo nella visuale del Predator. Davvero un'ottima funzionalità tecnica, poiché il Predator si muoveva ed il suo angolo visuale cambiava costantemente, tuttavia quelle riprese dovevano essere allineate e registrate elettronicamente con le immagini immagazzinate in meno di un trentesimo di secondo (per adattarle al frame rate della video registrazione).

In linea di principio, il puntamento poteva essere trasmesso alle armi di precisione. “Non stavamo realmente facendo quello nella Allied Force,” nota Hansen. “Dicevamo soltanto agli addetti al puntamento dove esattamente si trovavano gli obiettivi serbi e loro passavano le informazioni agli aerei che andavano a colpire gli obiettivi.” In tal modo i decisori umani potevano prevenire eventuali decisioni difettose della macchina. Secondo la Defense Advanced Research Projects Agency, la tecnologia della TIGER è stata utilizzata estesamente nelle tre settimane finali delle operazioni in Kosovo, durante cui “tra l'80 e il 90 per cento degli obiettivi mobili sono stati colpiti.”

Finora, la video manipolazione in tempo reale è rimasta in possesso soltanto di organizzazioni tecnologicamente sofisticate quali le reti TV ed i militari. Ma gli sviluppatori della tecnologia dicono che sta diventando semplice ed abbastanza a buon mercato per diffondersi ovunque. E questo ha portato alcuni osservatori a domandarsi se la video manipolazione in tempo reale corroderà la fiducia del pubblico nelle immagini televisive in diretta, anche quando trasmesse dai telegiornali. “Vedere non è più credere,” dice Norman Winarsky, vice presidente corporativo per la tecnologia dell'informazione a Sarnoff. “Potreste non sapere di cosa fidarvi.”

Dal sublime al ridicolo

Una forma grezza di video manipolazione sta già avendo luogo nella comunità delle immagini provenienti dal satellite. La pubblicazione settimanale Space News ha segnalato all'inizio di quest'anno che il governo indiano rilascia le immagini dai suoi satelliti di percezione a distanza solo dopo che le installazioni della difesa sono state cancellate. In questo caso, non è una manipolazione in tempo reale ed è palese, come il pennarello nero del censore. Ma i pixel sono plastici. Ora è perfettamente possibile inserire insiemi di pixel nei dati delle immagini provenienti dal satellite che gli osservatori vedrebbero come battaglioni di carri armati, o aeroplani da guerra, o fosse comuni, o file di rifugiati, o mucche morte che degli attivisti sostengono essere vittime di un incidente biotecnologico.

Un nastro dimostrativo fornito da PVI rinforza queste ipotesi nello scenario prosaico di un parcheggio suburbano. La scena sembra ordinaria tranne per una caratteristica preoccupante: tra i SUV e i furgoncini sono parcheggiati parecchi carri armati ed un colosso corazzato passa incongruamente di fianco. Immaginate un nastro di carri armati pakistani virtuali che avanzano oltre il confine in India trasmesso dai telegiornali come autentico, ed avrete un'idea del tipo di problemi che un ingannevole linguaggio figurato potrebbe provocare.

I fornitori commerciali di servizi di inserzione virtuale sono troppo concentrati sulle nuove occasioni di vendita per preoccuparsi della geopolitica. Hanno messo gli occhi su mercati molto più lucrativi. Improvvisamente quei lunghi stralci di programmazione fra gli annunci pubblicitari – ovvero, il vero show – diventano disponibili per pubblicità in prima serata del valore di miliardi di dollari. Il nastro dimostrativo della PVI, per esempio, comprende una scena in cui una scatola di Microsoft Windows compare – virtualmente, s'intende – su una mensola dello studio di Frasier Crane. Questo genere di product placement potrebbe diventare sempre più importante mentre le nuove tecnologie di video registrazione come TiVo e RePlayTV danno a agli spettatori più potere di eliminare gli annunci pubblicitari.

Dennis Wilkinson, un esperto di marketing, guidatore di Porsche e amante dello sport, che è diventato un CEO della decennale PVI circa un anno fa, non potrebbe essere più felice a tale proposito. Gli occhi di Wilkinson brillano quando descrive il futuro (prossimo) in cui la tecnologia dell'inserzione virtuale spingerà la pubblicità all'estrema personalizzazione. In combinazione con i servizi di data-mining con cui i gusti individuali, le avversioni ed i modelli di acquisto dello spettatore possono essere implacabilmente seguiti e analizzati, l'inserzione virtuale apre la capacità di trasmettere pubblicità personalizzate attraverso le linee telefoniche o via cavo agli utenti del web ed agli spettatori delle TV. Diciamo che vi piace la Pepsi ma il vostro vicino preferisce la Coca e quello nella casa di fronte invece la Seven-Up – il tipo di dati che può essere raccolto dagli scontrini del supermercato. Diventerà possibile adattare l'immagine delle bibite analcoliche nel segnale di trasmissione in modo da raggiungere ciascuno con la sua marca preferita.

A soli 15 minuti di strada dalla PVI, anche gli occhi di Winarsky da Sarnoff stanno luccicando – non tanto per la conquista di percentuali di mercato quanto per il potere di trasformazione della tecnologia. Sarnoff ha una storia distinta in questo senso; l'azienda è la discendente dei laboratori della RCA, che hanno cominciato ad innovare nella tecnologia televisiva all'inizio degli anni 40 ed hanno dato alla luce ad una pletora di tecnologie mediatiche. Il tubo della TV a colori, i display a cristalli liquidi e la TV ad alta definizione sono tutte arrivate, almeno in parte, dalla RCA ora Sarnoff, che ha cinque Emmy tecnici nella sua entrata.

La capacità di manipolare i dati video in tempo reale, dice, ha tanto molto potenziale quanto alcuni di questi precursori. “Ora che potete alterare il video in tempo reale, avete cambiato il mondo,” dice. Questo può suonare esagerato, ma dopo aver assistito alla dimostrazione con Katarina Witt, le parole di Winarsky sul “cambiamento del mondo” sembrano un po' meno iperboliche.

Cancellare persone od oggetti dal video dal vivo, o inserire la persone od oggetti registrati precedentemente nelle scene dal vivo, è soltanto l'inizio degli inganni che diventano possibili. Praticamente qualsiasi parte del video che sia stato mai registrato diventa un clip-art che i produttori possono digitalmente inserire nella storia che vogliono raccontare, secondo Eric Haseltine, senior vice presidente per R&D alla Walt Disney Imagineering di Glendale, in California. Con le tecnologie supplementari di manipolazione video, agli attori precedentemente registrati si possono far dire e fare cose che non hanno mai realmente fatto o detto. “Potete avere stelle morte in film interamente nuovi,” dice Haseltine.

Riprese contemporanee che comprendono immagini di attori morti sono in circolazione da parecchi anni. Ma l'arte dell'illusione hollywoodiana che, per esempio, ha inserito John Wayne in una pubblicità televisiva ha richiesto un lavoro scrupoloso di post-produzione, fotogramma per fotogramma, da parte di tecnici esperti. Ora c'è una grande differenza, dice Haseltine: “quello che richiedeva un'ora [per fotogramma], ora può essere fatto in un sessantesimo di secondo.” Questa drastica accelerazione significa che la manipolazione può essere fatta in tempo reale, in moto, mentre una videocamera registra o trasmette. John Wayne, Fred Astaire o Saddam Hussein possono essere inseriti virtualmente non solo in annunci pre-prodotti, ma anche, per esempio, in una trasmissione dal vivo del The Drew Carey Show.

La combinazione di inserzione virtuale in tempo reale con le tecniche esistenti ed emergenti di post-produzione apre un mondo di occasioni di manipolazione. Considerate la tecnologia Video Rewrite, che i suoi sviluppatori all'Interval Corp. e all'Università della California a Berkeley hanno dimostrato per primi pubblicamente tre anni fa. Con appena pochi minuti di video di qualcuno che parla, il loro sistema blocca ed immagazzina un insieme di video fotografie istantanee del modo in cui la zona della bocca della persona si muove quando pronuncia differenti gruppi di suoni. Estraendo dalla risultante biblioteca di “visemi” permette di mostrare la persona che dice qualsiasi cosa i produttori immaginino – comprese affermazioni che il soggetto non direbbe nemmeno morto.

In un'applicazione di prova, l'informatico Christoph Bregler, ora dell'Università di Stanford, e alcuni colleghi hanno digitalizzato due minuti di riprese pubbliche del presidente John F. Kennedy che parla durante la crisi dei missili cubani nel 1962. Usando la biblioteca di visemi, i ricercatori hanno generato “animazioni” della bocca di Kennedy che dice cose che non ha mai detto, tra le altre, “non ho mai incontrato Forrest Gump.” Con tecnologia come questa, gli attivisti politici del prossimo futuro potranno in teoria preparare webcast dei loro avversari che dicono cose che potrebbero far sembrare Howard Stern un galantuomo.

Haseltine crede che le tecniche di manipolazione video saranno portate rapidamente al loro estremo logico: “posso predire con certezza assoluta,” dice, “che una persona seduta davanti ad un computer potrà scrivere un testo, disegnare dei personaggi, preparare l'illuminazione ed il guardaroba, fare tutta la recitazione ed i dialoghi, e la post-production, distribuire su una rete a banda larga, fare tutto questo su un laptop – e gli spettatori non capiranno la differenza.”

La fine dell'autenticità

Finora, le applicazioni ampiamente testimoniate di manipolazione video in tempo reale sono state in aree benigne come gli sport e l'intrattenimento. Già l'anno scorso, tuttavia, la tecnologia ha cominciato a diffondersi oltre queste sedi in applicazioni che hanno fatto alzare delle sopracciglia. L'autunno scorso, per esempio, CBS ha assunto PVI per inserire virtualmente il familiare marchio in tutta New York – sui palazzi, sui poster pubblicitari, sulle fontane e su altri luoghi – durante le trasmissioni di The Early Show. Il New York Times ha pubblicato una prima pagina in gennaio che solleva questioni circa l'etica giornalistica di alterare l'apparenza della realtà.

La combinazione di inserzione virtuale in tempo reale, di cyber-marionette, di riscrittura video e di altre tecnologie di manipolazione video con un'infrastruttura di mass-media che immediatamente trasporta notizie video in tutto il mondo ha preoccupato alcuni analisti. “Immaginate di essere il governo di un ipotetico paese che vuole il più aiuti finanziari internazionali,” dice Livingston della George Washington University. “Potreste trasmettere il video di una regione isolata con gente che muore di fame e potrebbe non essere mai successo.”

Haseltine concorda. “Sono stupito che non abbiamo ancora visto video falsi,” dice, prima di ripensarci: “forse lo abbiamo visto. Chi può dirlo?”

È proprio il tipo di piano immaginato nel film Wag the dog nel 1998, in cui alti funzionari presidenziali cospirano con un produttore di Hollywood per teletrasmettere una guerra virtuale fra gli Stati Uniti e l'Albania per deviare l'attenzione da un nascente scandalo presidenziale. Haseltine ed altri si domandano quando la realtà imiterà l'arte che imita la realtà.

L'importanza della questione potrà soltanto intensificarsi con la maggiore accessibilità della tecnologia. Quello che ora richiede tipicamente una scatola di elettronica da 80.000 dollari della dimensione di un piccolo frigorifero, secondo Winarsky potrebbe presto essere fattibile con una carta grande un palmo (ed infine un singolo chip) che si adatta all'interno di un videorecorder commerciale. “Questo sarà a disposizione della gente a Circuit City,” dice. L'attrezzatura per la video inserzione virtuale per i consumatori è probabile che richiederà una videocamera portatile con una carta o un chip di image-processing specializzato. Questo hardware riceveranno i segnali dai sensori della videocamera immagine elettronica e li convertiranno in una forma che potrà essere analizzata e manipolata con un computer usando appropriati software – in modo molto simile a quello che fanno i tecnici dei giornali con Adobe Photoshop ed altri programmi che “puliscono” le immagini digitali. Un utente domestico potrebbe, per esempio, inserire i membri della famiglia assenti nel video dell'ultima riunione o rimuovere gli intrusi che avrebbero preferito non ci fossero portando la revisione storica di stile sovietico nel focolare familiare.

Unite la potenziale erosione della fiducia nella video autenticità con il cosiddetto “effetto CNN” e la scena è pronta affinché l'inganno possa spostare il mondo in modi nuovi. Livingston descrive l'effetto CNN come la capacità dei mass media di andare oltre la mera segnalazione di ciò che sta accadendo realmente ad influenzare i responsabili delle decisioni mentre considerano l'assistenza militare e internazionale ed altre questioni nazionali ed internazionali. “L'effetto CNN è reale,” dice James Currie, professore di Scienze Politiche alla National Defense University di Fort McNair a Washington. “Ogni ufficio in cui entrate al Pentagono ha la scritta CNN.” E questo significa, dice, che un governo, un gruppo terrorista o di pressione potrebbero mettere in moto eventi geopolitici con la sola forza di poche ore di credibilità ottenute distribuendo un frammento di video ben aggiustato.

Con esperienza come riservista dell'esercito, come membro della Commissione dei Servizi Segreti del Senato con un'autorizzazione top-secret, e come collegamento legislativo per il Segretario dell'Esercito, Currie ha visto le decisioni e le politiche governative da vicino. È convinto che la manipolazione video in tempo reale sarà, o già è, nelle mani dei militari e delle comunità dei servizi segreti. E anche se non ha ancora la prova che qualche governo o organizzazione non governativa abbia schierato le tecniche di manipolazione video, in tempo reale o meno, per obiettivi politici o militari, non ha problema ad evocare scenari di disinformazione. Per esempio, dice, considerate l'effetto di un video fabbricato che sembri mostrare Saddam Hussein “che si versa uno scotch e lo trangugia. Potreste trasmetterlo sulle televisioni in Medio-Oriente e insidiare completamente la sua credibilità con il pubblico islamico.”

Nonostante tutto l'affanno, tuttavia, alcuni esperti rimangono scettici che la manipolazione video in tempo reale ponga una minaccia reale, non importa quanto buona la tecnologia diventi. John Pike, un analista della comunità dei servizi segreti per la Federazione degli Scienziati Americani a Washington, dice che i rischi della credibilità per i governi o le organizzazioni serie sono semplicemente troppo grandi per rischiare di essere beccati tentando di ingannare il pubblico. E per le organizzazioni che sarebbero disposte a rischiare, dice Pike, i giornalisti – sapendo quello che la tecnologia può fare – diventeranno sempre più vigili.

Monday, October 13, 2008

Mentire con i pixel

1 comment: