¿Real o Deepfake? Qué es, cómo funciona y qué dice la ley

Para clonar una voz convincente bastan unos tres segundos de audio ¹.

Con ese material, un sistema de inteligencia artificial puede reproducir el tono y la cadencia de cualquier persona con un 85 % de coincidencia.

En enero de 2024 un empleado de la consultora Arup transfirió 25,6 millones de dólares tras una videollamada en la que todos sus interlocutores —incluido el supuesto director financiero— eran un deepfake ².

No sospechó nada: veía sus caras y oía sus voces. Esta ficha explica qué es exactamente un deepfake, cómo funciona, qué riesgos plantea y qué dice la ley en España, sin alarmismo y con datos.

Resumen

Un deepfake es un contenido audiovisual sintético —vídeo, audio o imagen— creado con inteligencia artificial para falsificar el rostro, la voz o los gestos de una persona real con un realismo difícil de distinguir del original.

Se apoya en el deep learning; sus arquitecturas clave son las GAN (redes generativas antagónicas), los autoencoders y, cada vez más, los modelos de difusión, que han eliminado las señales que antes delataban un montaje.

Ya no es solo un problema de desinformación: las pérdidas por fraude con deepfake alcanzaron unos 1.000 millones de dólares en 2025. Europa lo regula con el AI Act y España, con la Ley de IA aprobada en mayo de 2026, que prohíbe los deepfakes sexuales y multa hasta con 35 millones de euros.

Contenido del artículo

Qué es un deepfake

Un deepfake es un contenido audiovisual sintético —vídeo, audio o imagen— generado con inteligencia artificial para sustituir o falsificar el rostro, la voz o los gestos de una persona real, con un realismo difícil de distinguir del original ³.

El término, surgido en 2017, combina deep learning (aprendizaje profundo, la técnica que lo hace posible) y fake (falso). Es la cara más conocida de los medios sintéticos (synthetic media, contenido creado o alterado por una máquina); en español también se traduce como ultrafalso.

La idea que lo distingue de un simple montaje es el aprendizaje. Un retoque tradicional recorta y pega; un deepfake aprende cómo se mueve un rostro o cómo suena una voz y genera fotogramas o sonido nuevos que nunca existieron. Por eso resulta tan creíble: no copia, recrea.

Comparación entre un rostro real y un deepfake con las señales de manipulación señaladas.

Cómo funciona: deep learning, GAN y modelos de difusión

Un deepfake funciona entrenando redes neuronales artificiales (capas de nodos que procesan información imitando, de forma muy simplificada, al cerebro) —la base del aprendizaje profundo, una rama del machine learning— con muchas imágenes o grabaciones de una persona, hasta que el sistema aprende a reproducir sus rasgos y los genera de cero ⁴. Tres arquitecturas concentran la mayoría de casos.

La más conocida son las GAN (redes generativas antagónicas), introducidas por Ian Goodfellow en 2014 ⁵. Funcionan con dos redes que compiten: un generador fabrica imágenes falsas y un discriminador intenta detectarlas.

El generador mejora hasta que el discriminador ya no distingue lo falso de lo real. Los autoencoders se usan sobre todo para el intercambio de caras: comprimen un rostro en sus rasgos esenciales y lo reconstruyen sobre otro cuerpo.

La novedad reciente son los modelos de difusión —la misma familia de la IA generativa que está detrás de Stable Diffusion o Flux—, que parten de ruido y lo "limpian" paso a paso hasta formar la imagen ⁴.

Importan por una razón práctica: han borrado las firmas forenses que antes permitían cazar un deepfake, lo que complica la detección.

Tipos de deepfake

No todos los deepfakes manipulan lo mismo ni con la misma técnica. Estas son las modalidades más habituales ⁴⁸:

Tipo	Qué falsifica	Uso típico
Intercambio de caras (face swap)	Sustituye el rostro de una persona por otro	Vídeos virales, pornografía no consentida
Recreación / sincronización labial (lip-sync)	Pone palabras nuevas en boca de alguien real	Desinformación, declaraciones falsas
Clonación de voz (audio deepfake)	Imita la voz de una persona	Estafas telefónicas, fraude al CEO
Imagen sintética	Crea rostros o cuerpos de personas inexistentes	Perfiles falsos, suplantación
Deepfake en tiempo real	Falsifica un rostro o voz en directo	Videollamadas fraudulentas

La modalidad que más ha crecido en impacto económico es la clonación de voz, precisamente por lo poco que necesita para funcionar: segundos de audio que cualquiera deja en un vídeo público o una nota de voz.

Para qué se usan los deepfakes: del cine al fraude

La tecnología no es maligna por sí misma. Tiene usos legítimos en cine y doblaje (rejuvenecer actores, traducir con sincronía labial), en educación, accesibilidad o sátira.

El problema es que la misma capacidad de recrear a una persona abre la puerta a usos dañinos, y ahí es donde están creciendo las cifras.

El fraude corporativo es el caso de uso malicioso que más rápido escala, y los ejemplos más conocidos comparten un patrón: una petición urgente de dinero respaldada por una cara o una voz de confianza.

Además del caso Arup, en julio de 2024 unos atacantes intentaron suplantar al consejero delegado de Ferrari, Benedetto Vigna, con una voz clonada en una llamada de WhatsApp ⁹.

Ya en 2019, una empresa energética británica perdió 220.000 euros tras una llamada de alguien que sonaba exactamente como su director general ⁴.

No son anécdotas aisladas: el fraude al directivo (CEO fraud) mediante deepfake se ha convertido en una de las modalidades de ataque de mayor crecimiento contra las empresas ¹¹.

Los números acompañan la sensación:

El FBI registró en 2025 más de 22.000 denuncias por fraude relacionado con IA, con pérdidas superiores a 893 millones de dólares ¹².
Y solo las pérdidas atribuidas a deepfakes en 2025 rondaron los 1.000 millones de dólares, frente a los 130 millones de los cinco años anteriores juntos ¹³.

Escalada de pérdidas por fraude con deepfake: 130 millones de dólares en 2019-2023 frente a unos 1.000 millones solo en 2025

Riesgos y el mito de que "siempre se nota"

Aquí conviene la honestidad que falta en muchos titulares.

El mito más extendido es que un deepfake siempre se detecta a simple vista; en realidad, las personas solo aciertan el 24,5 % de las veces ante un vídeo falso de alta calidad, y el 70 % reconoce no confiar en su capacidad de distinguir una voz clonada de una real ⁴.

Las señales clásicas —parpadeo antinatural, bordes borrosos, iluminación incoherente— han desaparecido con los modelos de difusión.

De esa verosimilitud nacen los principales riesgos:

Fraude y suplantación: estafas con voz o vídeo clonados que sortean la desconfianza de la víctima.
Pornografía no consentida: históricamente, la mayoría de los deepfakes en circulación, con un daño grave y dirigido casi siempre a mujeres.
Desinformación: declaraciones o escenas falsas atribuidas a figuras públicas, especialmente sensibles en contextos electorales.
Erosión de la confianza: cuando todo puede ser falso, también lo real se pone en duda —el llamado "dividendo del mentiroso"—.

Reconocer estos riesgos no es tecnofobia: es la condición para responder con criterio en lugar de con pánico.

Cómo detectar un deepfake

Detectar un deepfake combina hoy tres vías, porque ninguna basta por sí sola.

La primera, la inspección visual, es cada vez menos fiable: aún pueden ayudar las incoherencias en manos, dientes, reflejos de los ojos o la sincronía entre voz y labios, pero no hay que confiar en ellas con material reciente ⁴.

La segunda son los detectores automáticos, modelos de IA entrenados para reconocer rastros de generación.

Funcionan, pero van por detrás de los generadores en una carrera constante.

La vía más prometedora es la tercera: la procedencia verificable. Aquí destacan dos estándares:

SynthID, la marca de agua invisible de Google DeepMind para texto, audio, imagen y vídeo, que en 2026 adoptaron también OpenAI, ElevenLabs y Kakao ¹⁶.
C2PA / Content Credentials, un estándar abierto que adjunta al archivo metadatos verificables sobre quién lo creó, cuándo y con qué herramienta ¹⁷.

Método	Qué hace	Límite
Inspección visual	Buscar incoherencias en cara, manos, audio	Casi inútil con difusión moderna
Detectores de IA	Reconocer rastros de generación	Siempre por detrás del generador
Marca de agua (SynthID)	Insertar una señal invisible al crear el contenido	Solo si la herramienta la aplica
Procedencia (C2PA)	Certificar origen y ediciones del archivo	La ausencia de credencial no prueba nada

La clave práctica: la ausencia de marca de agua o de credenciales no demuestra que un contenido sea auténtico ⁴.

La procedencia certifica lo verificado, no descarta lo no verificado.

Ante un mensaje urgente con dinero de por medio, el mejor detector sigue siendo verificar por un segundo canal.

En España, quien sufra una suplantación o tenga dudas puede recurrir al INCIBE (Instituto Nacional de Ciberseguridad) y a su línea de ayuda gratuita 017 ¹⁹.

Deepfakes y la ley en España y Europa

En Europa, los deepfakes están regulados por el Reglamento (UE) 2024/1689, conocido como AI Act, que impone obligaciones de transparencia: el contenido generado o manipulado artificialmente debe señalarse como tal ²⁰.

España ha dado un paso más. El Consejo de Ministros aprobó el 26 de mayo de 2026 el proyecto de Ley para el buen uso y la gobernanza de la inteligencia artificial, que adapta el reglamento europeo y añade un régimen sancionador propio ⁴.

La norma española prohíbe expresamente los deepfakes sexuales sin consentimiento —con disposiciones específicas en el Código Penal— y obliga a advertir cuando un contenido ha sido manipulado con IA ⁴²³.

Las sanciones van de los 6.000 euros a los 35 millones para las infracciones más graves, o hasta el 7 % de la facturación mundial de la empresa infractora si esa cifra es mayor ⁴.

Para particulares y empresas, el mensaje es claro: crear o difundir un deepfake dañino ha dejado de ser un vacío legal.

En resumen

Un deepfake no es magia ni un montaje cualquiera: es un sistema que aprende a recrear a una persona y produce material nuevo casi indistinguible del real.

Esa misma potencia explica sus usos legítimos y sus fraudes millonarios. La defensa no es la paranoia, sino el criterio: saber qué es posible hoy, desconfiar de la urgencia y verificar la procedencia.

La próxima vez que un vídeo o una llamada te pida algo importante, la pregunta útil no es si parece real, sino cómo puedes comprobar que lo es. ¿Sabrías hacerlo?

Este artículo tiene carácter informativo y divulgativo y no constituye asesoramiento legal. Para casos concretos, consulta a un profesional o a las autoridades competentes.

Preguntas frecuentes

¿Qué es un deepfake en palabras sencillas?

Es un vídeo, audio o imagen falso creado con inteligencia artificial que imita a una persona real. La IA aprende cómo es su cara o su voz a partir de material existente y genera contenido nuevo tan realista que cuesta distinguirlo del original. El nombre une deep learning y fake.

¿Cómo se detecta un deepfake?

Combinando inspección visual, detectores automáticos y, sobre todo, la procedencia del archivo. Las señales a simple vista (manos, dientes, sincronía labial) ya no son fiables con la tecnología actual. Lo más sólido es verificar marcas de agua como SynthID o credenciales C2PA, y ante peticiones de dinero, confirmar por un segundo canal.

¿Es legal hacer un deepfake en España?

Depende del uso: los deepfakes sexuales sin consentimiento están prohibidos y el contenido manipulado debe etiquetarse. La Ley de IA aprobada en mayo de 2026 sanciona los usos dañinos con multas de hasta 35 millones de euros e incluye disposiciones penales específicas. Usos legítimos como la sátira o el doblaje no son delito, pero la difusión engañosa sí puede serlo.

¿Qué tipos de deepfake existen?

Los principales son el intercambio de caras, la clonación de voz, la sincronización labial, la imagen sintética y el deepfake en tiempo real. Cada uno falsifica un elemento distinto —rostro, voz, palabras o presencia en directo— y se asocia a usos diferentes, desde vídeos virales hasta el fraude en videollamadas.

¿Cómo me protejo de una estafa con voz clonada?

Verifica siempre por un segundo canal cualquier petición urgente de dinero o datos. Como bastan segundos de audio para clonar una voz, no te fíes solo de reconocerla. Acuerda con tu familia o tu empresa una palabra clave de seguridad y desconfía de la urgencia, que es la herramienta favorita del estafador.