Vender datos para entrenar IA en 2026: Scale AI, Outlier, Mercor (guía real)

La oportunidad freelance más caliente de 2026: trabajar para los laboratorios de IA generando, anotando y revisando datos. Plataformas, tarifas reales por nivel y requisitos honestos.

OpenAI, Anthropic, Meta, Google y los nuevos laboratorios de IA necesitan algo que no se puede automatizar: humanos cualificados que generen datos de entrenamiento de calidad. La economía detrás del boom IA tiene un mercado nuevo que casi nadie cuenta en español: empresas como Scale AI, Outlier (Scale), Surge AI y Mercor pagan entre 8 y 150 USD/h por tareas que van de "clasificar imágenes" a "resolver problemas de código en producción".

Workflow de IA en pantalla con nodos conectados, vista cenital editorial.
El siguiente modelo de IA necesita datos. Y los datos los generan humanos.
Resumen rápido. Tarifas: básico 8-15 USD/h, estándar 15-30 USD/h, especialista 30-60 USD/h, top experto 60-150 USD/h. Las plataformas serias: Scale AI / Outlier (volumen), Surge AI (calidad), Mercor (premium). Requisito mínimo: inglés B2-C1 y dominio de instrucciones. Ingresos típicos a tiempo parcial: 800-2.500 €/mes. Especialistas (código, derecho, medicina): 2.000-7.000 €/mes.

Qué es el "data labeling" y RLHF

Dos categorías:

  • Data labeling clásico: anotar imágenes, transcribir audio, clasificar texto. Tareas mecánicas, tarifas bajas.
  • RLHF (Reinforcement Learning from Human Feedback): revisar respuestas de un LLM, comparar 2 respuestas y elegir la mejor, escribir respuestas modelo, generar prompts adversariales. Tarifas medias-altas.
  • Generación experta: escribir código de calidad para entrenar modelos de programación, resolver problemas matemáticos paso a paso, generar diagnósticos médicos sintéticos. Tarifas premium.

Las plataformas serias en 2026

PlataformaTipoTarifa rangoAcceso
Scale AIVolumen10-25 USD/hWeb propia + Outlier para crowd
Outlier (Scale)RLHF/expertos15-50 USD/houtlier.ai, prueba inicial
Surge AIPremium calidad20-60 USD/hSelección rigurosa
MercorTop expertos40-150 USD/hCV + entrevista
TolokaVolumen entry3-12 USD/hAbierta
Appen / Telus AIMixto8-25 USD/hConvocatorias
RemotasksVolumen5-15 USD/hPruebas iniciales

Tarifas reales por nivel

  • Básico (anotación, clasificación, transcripción simple): 8-15 USD/h.
  • Estándar (RLHF, revisión calidad respuestas LLM, traducción nicho): 15-30 USD/h.
  • Especialista (programador con stack específico, abogado, médico, lingüista, financiero): 30-60 USD/h.
  • Top experto (PhD STEM, médico especialista, abogado senior, top developer): 60-150 USD/h.
Pantalla con dashboard editorial sobre fondo oscuro, tonos azules tenues.
El nivel determina la tarifa. La especialización es la palanca individual más fuerte.

Qué tareas hay (con ejemplos)

  • RLHF para LLM: el sistema te da 2 respuestas a un prompt, eliges la mejor y explicas por qué. Una tarea típica dura 5-15 min y paga 1-3 USD.
  • Generación de respuestas modelo: escribes la respuesta ideal a un prompt complejo. 10-30 min, paga 4-10 USD según calidad.
  • Evaluación de código: ejecutas un snippet, identificas bugs, propones fix. 15-30 min, paga 6-20 USD.
  • Anotación visual: dibujas bounding boxes o máscaras en imágenes. 1-3 min/imagen, paga 0,15-0,80 USD.
  • Adversarial testing: intentas que un chatbot dé respuestas peligrosas o erróneas. 30-60 min/sesión, 15-50 USD.
  • Traducción y localización: validar pares de traducción humano vs IA. 12-25 USD/h.

Cómo entrar en cada plataforma

  1. Outlier (Scale): registro en outlier.ai, prueba inicial de inglés y razonamiento. Si la pasas, accedes a tareas. Aprobación 3-7 días.
  2. Mercor: sube CV con experiencia técnica verificable. Entrevista de 30-45 min con vídeo de IA. Si pasas, te asignan a proyectos premium.
  3. Surge AI: aplicación restringida. Suelen contactar a partir de LinkedIn o referidos.
  4. Toloka, Appen, Remotasks: abiertas. Pruebas iniciales sencillas.

Cómo subir de tarifa

  • Acumula horas con buena calidad: el sistema te asigna tareas mejor pagadas si tu rating es alto.
  • Especialización verificable: sube certificados, perfil LinkedIn, GitHub. Mercor escala mucho con datos verificables.
  • Idiomas raros: catalán, vasco, portugués europeo, italiano, japonés. Pagan extra por escasez.
  • Disponibilidad: contestar antes que otros sube ranking en plataformas dinámicas.

Fiscalidad en España con plataforma USA

  • Alta en Hacienda (modelo 037) si recurrente. Epígrafe IAE 849.2 (servicios profesionales).
  • RETA con tarifa plana 80 €/mes el primer año.
  • Modelo 130 trimestral (IRPF). Modelo 303 trimestral (IVA al 0 % para servicios prestados a empresa USA = exportación de servicios).
  • Pago en USD: convierte por contravalor a la fecha de cobro. Conserva extractos PayPal/Wise.
  • El cliente USA no envía 1099 ni W-9 (lo tuyo es factura emitida desde España).
Vista cenital editorial de notas y libros sobre escritorio oscuro.
Cobrar en USD con costes en € es la palanca individual más fuerte de cualquier freelance hispano.

Preguntas frecuentes

¿Cuánto pagan?

8-15 USD/h básico, 15-30 estándar, 30-60 especialista, 60-150 top experto.

¿Qué se hace?

Anotar, clasificar, RLHF, generar respuestas modelo, evaluar código, traducir, adversarial testing.

¿Requisitos?

Inglés B2-C1, ordenador, capacidad de instrucciones. Para premium: titulación verificable.

¿Cuánto se gana al mes?

200-600 € casual, 800-2.500 € activo, 2.000-7.000 € especialista, 6.000-15.000 € top experto.

¿Tributa?

Sí. Alta autónomo + RETA + 130 + 303. Las facturas son exportación de servicios.

Cómo funciona el proceso paso a paso

El flujo de trabajo real en una plataforma como Outlier o Surge:

  1. Registro y prueba inicial: rellenas el perfil, indicas tus especialidades (idiomas, formación, experiencia técnica). La plataforma te envía una serie de tareas de evaluación. Esta fase puede durar 1-2 semanas y muchos candidatos no la superan si no leen las instrucciones con atención extrema.
  2. Acceso a proyectos: si apruebas, entras en la cola de proyectos disponibles. Los proyectos se asignan o se abren para "claim" (tú los coges antes que otros). La velocidad y la disponibilidad importan en las plataformas dinámicas.
  3. Ejecución de tareas: cada tarea tiene instrucciones muy detalladas (a veces 20-30 páginas de guidelines). Seguirlas al pie de la letra es más importante que la calidad subjetiva del output.
  4. Revisión y puntuación: cada tarea se puntúa. Tu rating acumulado determina qué proyectos te asignan. Un rating bajo te excluye de proyectos mejor pagados.
  5. Pago: normalmente semanal o quincenal via PayPal, Wise o transferencia. En USD. Conserva todos los registros para la declaración.

Para quién funciona este modelo (y para quién no)

Funciona bien si: tienes una especialización verificable (desarrollador, médico, abogado, matemático, lingüista), dominas el inglés al nivel de leer y seguir instrucciones técnicas complejas, tienes paciencia para la fase inicial de baja productividad, y buscas un ingreso complementario flexible (no un empleo a tiempo completo).

No funciona si: buscas ingresos inmediatos (la fase de cualificación toma semanas), no tienes especialización diferencial (las tareas básicas están saturadas y pagan poco), o tienes dificultades con el inglés técnico (la mayoría de guidelines están en inglés incluso para proyectos en español).

La realidad del mercado en 2026: saturación selectiva

El mercado de datos de IA en 2026 tiene una estructura bimodal que conviene entender antes de entrar:

  • Tareas básicas (etiquetado de imágenes, clasificación simple, transcripción): saturadas. Miles de colaboradores de Asia, África y América Latina compiten por estas tareas. Las tarifas son bajas (3-12 USD/h) y la disponibilidad de trabajo es irregular.
  • Tareas expertas (evaluación de código, razonamiento jurídico, diagnóstico médico, matemáticas avanzadas): escasez real de buenos colaboradores. Aquí sí hay proyectos estables y tarifas altas. El problema es que la barrera de entrada es alta: necesitas titulación verificable y superar pruebas técnicas más exigentes.

La estrategia óptima para alguien en España: no competir en tareas básicas (la diferencia salarial con otros países hace inviable), sino posicionarse directamente en el nivel experto usando la titulación o experiencia que ya tienes.

Ventaja del castellano y lenguas co-oficiales

Un factor diferencial que pocas personas de habla hispana aprovechan: los modelos de IA necesitan datos de altísima calidad en español para mejorar su rendimiento en ese idioma. Esto genera demanda específica de evaluadores nativos:

  • Español neutro de España: alta demanda para proyectos que quieren diferenciarse del español latinoamericano.
  • Español de LATAM (México, Argentina, Colombia): también alta demanda pero con más oferta de evaluadores locales.
  • Catalán, gallego, euskera: muy poca oferta de colaboradores expertos. Tarifas superiores a la media por escasez. Si hablas alguna de estas lenguas a nivel nativo, es una ventaja competitiva directa.
  • Portugués europeo vs brasileño: proyectos que necesitan diferenciación entre ambas variedades pagan extra por la especificidad.

Errores más comunes al empezar

  1. No leer las guidelines completas. Las instrucciones de cada proyecto son largas y detalladas. Muchos colaboradores las leen superficialmente y fallan las tareas de evaluación inicial por omisión, no por incapacidad.
  2. Priorizar velocidad sobre calidad. El rating se basa en calidad, no en velocidad. Una tarea bien hecha y lenta vale más que tres rápidas y mediocres que bajan tu puntuación.
  3. Registrarse en demasiadas plataformas a la vez. La fase de cualificación consume mucho tiempo. Es mejor dominar una plataforma (Outlier) antes de expandirse a las demás.
  4. No declarar los ingresos. Los pagos en USD por PayPal o Wise quedan registrados. Hacienda cruza datos de cuentas extranjeras desde el modelo 720 (para saldos >50.000 €) y el CRS (Common Reporting Standard). Para ingresos corrientes, la declaración en IRPF es obligatoria desde el primer euro.
  5. Subestimar el tipo de cambio. Si cobras en USD y gastas en €, una variación del tipo de cambio del 10 % puede suponer 10 % menos de ingreso efectivo. Usa Wise para conversión eficiente (0,4-0,6 % comisión vs 3-5 % de los bancos tradicionales).

Plan de acción: primeros 7 días

  1. Día 1: Regístrate en Outlier.ai (la plataforma con mejor accesibilidad para principiantes competentes). Rellena el perfil con honestidad: especialidades reales, nivel de inglés real, titulaciones verificables.
  2. Día 2-3: Lee los foros de Reddit (r/outlier_ai, r/ScaleAI) para entender qué proyectos hay activos, qué tipo de tareas pagan mejor y cuáles son los errores más frecuentes en las pruebas de cualificación.
  3. Día 4-5: Realiza las tareas de cualificación sin prisas. Si puedes, espera al momento del día en que estás más concentrado. Las primeras 2-3 horas determinan si entras o no.
  4. Día 6: Si tienes titulación técnica (ingeniería, medicina, derecho, economía), regístrate también en Mercor con CV actualizado. La entrevista de vídeo-IA suele ser en inglés: prepara tu presentación en 2-3 minutos.
  5. Día 7: Abre cuenta en Wise para recibir pagos en USD. Es gratis, tarda 1-2 días en verificarse y te ahorra un 2-4 % en cada conversión respecto a PayPal o tu banco.