📂 Categoría: AI,deepfake,as-told-to | 📅 Fecha: 1782035413
🔍 En este artículo:
Este ensayo contado se basa en una conversación con Hany Farid, experto en forense digital y ex profesor de la Universidad de California, Berkeley. Farid también cofundó GetReal, una startup de ciberseguridad y ciencia forense digital. Ha sido editado para mayor extensión y claridad.
El usuario promedio de Internet de hoy en día no puede saber si una imagen, video o grabación de audio en su feed es real o no.
Hemos realizado estudios de percepción sobre este tema. Los sistemas visuales y auditivos humanos simplemente no son lo suficientemente buenos para realizar esta tarea de manera confiable.
Eso no significa que no podamos saberlo. Disponemos de herramientas informáticas y matemáticas. ¿Nos darás algo de contenido y algo de tiempo? Sí, lo descubriremos.
Pero hay una gran diferencia entre lo que hacemos en GetReal, una startup de investigaciones digitales que cofundé, y lo que es capaz de hacer la persona promedio que navega por las redes sociales.
Empecé a estudiar forense digital cuando el campo apenas existía
Comencé mi carrera académica en Dartmouth College en 1999.
Es difícil recordar el año 1999. Vivimos en un mundo en gran medida analógico. Todavía estábamos tomando fotografías de la película. Estaban surgiendo las cámaras digitales. Internet estaba surgiendo, pero era casi nada. Las redes sociales realmente no existían.
Nadie sabía adónde iba esto. Empecé a pensar en pruebas digitales que son inherentemente maleables en los tribunales. En ese momento nadie pensó que fuera un problema y tenían razón. Pensé que podría deberse a que era poco probable que la revolución digital se detuviera. Así que comenzamos este campo pequeño, extraño, de nicho y hecho a medida llamado análisis forense digital: solo yo y un grupo de excelentes estudiantes graduados de Dartmouth escribiendo artículos. Todo el mundo decía: «Eso está bien, pero ¿qué tiene eso que ver con todo?»
Entonces lo digital despegó. Han surgido periodistas ciudadanos. Empezamos a ver a Associated Press y Reuters diciendo: «Oye, ¿cómo sabemos que esta foto que alguien nos envió es real?»
A lo largo de los años, el problema se ha expandido desde audiencias mensuales ante los medios y en los tribunales y audiencias de seguridad nacional una vez al año hasta todos los días.
De repente, todo nuestro mundo está patas arriba.
Al principio, las imágenes falsas a menudo dejaban pistas.
Al comienzo de mi campo, pensé principalmente en la fotografía. El vídeo fue muy difícil de manipular. Tiene de 24 a 30 fotogramas por segundo y tiene una pista de audio. Las imágenes eran más fáciles de manipular usando herramientas como Photoshop.
La buena noticia era que el manejo aún requería conocimientos. Entonces encontrarías errores. Encontrarías artefactos. Sombras desalineadas, geometría incorrecta y tamaños incorrectos. A veces tienes metadatos que indican que una foto ha sido editada en Photoshop.
Hoy no necesitas habilidades. No necesitas tiempo. No necesitas nada. Sólo necesitas un teclado y una conexión a Internet. Puedes escribir “Haz esto en esta imagen, audio o video” y la IA toma el control y puede hacer cosas notables, cosas que eran inimaginables hace cinco o diez años.
El contenido generado por IA se vuelve visualmente indistinguible
Independientemente de la tecnología, no estás mirando dónde está el disco. Miras hacia dónde va el disco.
Sabíamos que llegaríamos a un punto en el que el contenido sería visualmente indistinguible (no necesariamente computacionalmente indistinguible, pero sí visualmente).
Las imágenes fueron probablemente las primeras en atravesar este extraño valle. Luego vino la voz, con la inflexión, la risa y las pausas.
El vídeo ahora avanza por el valle inquietante. Si alguien me da un vídeo HD de 30 minutos, probablemente no sea IA. Pero si se trata de un vídeo de 15 a 30 segundos (el vídeo típico que se ve en línea), es difícil saberlo únicamente a partir de señales visuales. Por ahora.
Los videos generados por IA duraron aproximadamente cuatro segundos. Ahora algunos llegan a 30 o 40 segundos cosiéndolos.
El contenido mejorará. Será más barato y más fácil de usar. Y se volverá omnipresente.
Podemos investigar las falsificaciones, pero Internet avanza más rápido
La IA generativa no sabe nada sobre el mundo 3D. No sabe de física ni de sombras. Digo «saber» entre comillas.
La IA puede generar cosas que, para el cerebro humano, son bastante buenas. Pero la física está sutilmente equivocada.
Mientras estés haciendo algo que sea físicamente inverosímil, tenemos una señal que podemos detectar.
A veces, encontrar una falsificación puede ser muy rápido y relativamente sencillo. Una vez que encuentres algo mal, lo harás.
La otra cara de la moneda –autenticar algo– es mucho más difícil. Ejecutas prueba tras prueba y no encuentras nada malo. ¿Eso significa que es real? No precisamente. Esto significa que no encontraste nada.
En promedio, el trabajo puede durar alrededor de una hora. Pero en Internet una hora es mucho tiempo. Es básicamente una eternidad.
Normalmente recibimos una llamada sobre algo y ya tiene un millón de visitas. Trabajaremos en ello, hablaremos con un periodista y él nos informará. Ahora hay 10 millones de visitas.
Estamos un poco post mortem en este sentido. La verificación de hechos ocurre después del hecho.
Lo que más me asusta es que estemos perdiendo nuestro sentido común de la realidad.
Los riesgos y las consecuencias de cometer un error son cada vez mayores. Pones a la gente en prisión. Tomas decisiones geopolíticas. Informas de lo que sucede en el mundo para intentar informar a ocho mil millones de personas. Tienes que hacerlo bien.
Lo que más me asusta es que nosotros, como sociedad, estamos perdiendo nuestro sentido común de la realidad.
No discutimos cuál debería ser la tasa impositiva, el papel del gobierno, el papel de la política exterior u otros temas en los que podemos y debemos estar en desacuerdo.
Nos preguntamos si dos más dos son cuatro. Yo digo que dos más dos son cuatro y la otra persona dice: «No, no es así. Es puré de manzana».
Este es el tenor de la conversación.
No sé cómo se puede tener una democracia estable sin un sentido compartido de la realidad. Podemos no estar de acuerdo. Está bien. El desacuerdo es bueno. No podemos decir: «Eso sucedió» y hacer que el otro diga: «No, no sucedió».
No puede ser así como tenemos una sociedad.






:max_bytes(150000):strip_icc():format(jpeg)/prince-william-charlotte-fathers-day-062126-b129a3546e4c40689716960324faaf5a.jpg?w=100&resize=100,75&ssl=1)

