OpenAI, Anthropic, Meta, Google y los nuevos laboratorios de IA necesitan algo que no se puede automatizar: humanos cualificados que generen datos de entrenamiento de calidad. La economía detrás del boom IA tiene un mercado nuevo que casi nadie cuenta en español: empresas como Scale AI, Outlier (Scale), Surge AI y Mercor pagan entre 8 y 150 USD/h por tareas que van de "clasificar imágenes" a "resolver problemas de código en producción".

En esta guía
Qué es el "data labeling" y RLHF
Dos categorías:
- Data labeling clásico: anotar imágenes, transcribir audio, clasificar texto. Tareas mecánicas, tarifas bajas.
- RLHF (Reinforcement Learning from Human Feedback): revisar respuestas de un LLM, comparar 2 respuestas y elegir la mejor, escribir respuestas modelo, generar prompts adversariales. Tarifas medias-altas.
- Generación experta: escribir código de calidad para entrenar modelos de programación, resolver problemas matemáticos paso a paso, generar diagnósticos médicos sintéticos. Tarifas premium.
Las plataformas serias en 2026
| Plataforma | Tipo | Tarifa rango | Acceso |
|---|---|---|---|
| Scale AI | Volumen | 10-25 USD/h | Web propia + Outlier para crowd |
| Outlier (Scale) | RLHF/expertos | 15-50 USD/h | outlier.ai, prueba inicial |
| Surge AI | Premium calidad | 20-60 USD/h | Selección rigurosa |
| Mercor | Top expertos | 40-150 USD/h | CV + entrevista |
| Toloka | Volumen entry | 3-12 USD/h | Abierta |
| Appen / Telus AI | Mixto | 8-25 USD/h | Convocatorias |
| Remotasks | Volumen | 5-15 USD/h | Pruebas iniciales |
Tarifas reales por nivel
- Básico (anotación, clasificación, transcripción simple): 8-15 USD/h.
- Estándar (RLHF, revisión calidad respuestas LLM, traducción nicho): 15-30 USD/h.
- Especialista (programador con stack específico, abogado, médico, lingüista, financiero): 30-60 USD/h.
- Top experto (PhD STEM, médico especialista, abogado senior, top developer): 60-150 USD/h.

Qué tareas hay (con ejemplos)
- RLHF para LLM: el sistema te da 2 respuestas a un prompt, eliges la mejor y explicas por qué. Una tarea típica dura 5-15 min y paga 1-3 USD.
- Generación de respuestas modelo: escribes la respuesta ideal a un prompt complejo. 10-30 min, paga 4-10 USD según calidad.
- Evaluación de código: ejecutas un snippet, identificas bugs, propones fix. 15-30 min, paga 6-20 USD.
- Anotación visual: dibujas bounding boxes o máscaras en imágenes. 1-3 min/imagen, paga 0,15-0,80 USD.
- Adversarial testing: intentas que un chatbot dé respuestas peligrosas o erróneas. 30-60 min/sesión, 15-50 USD.
- Traducción y localización: validar pares de traducción humano vs IA. 12-25 USD/h.
Cómo entrar en cada plataforma
- Outlier (Scale): registro en outlier.ai, prueba inicial de inglés y razonamiento. Si la pasas, accedes a tareas. Aprobación 3-7 días.
- Mercor: sube CV con experiencia técnica verificable. Entrevista de 30-45 min con vídeo de IA. Si pasas, te asignan a proyectos premium.
- Surge AI: aplicación restringida. Suelen contactar a partir de LinkedIn o referidos.
- Toloka, Appen, Remotasks: abiertas. Pruebas iniciales sencillas.
Cómo subir de tarifa
- Acumula horas con buena calidad: el sistema te asigna tareas mejor pagadas si tu rating es alto.
- Especialización verificable: sube certificados, perfil LinkedIn, GitHub. Mercor escala mucho con datos verificables.
- Idiomas raros: catalán, vasco, portugués europeo, italiano, japonés. Pagan extra por escasez.
- Disponibilidad: contestar antes que otros sube ranking en plataformas dinámicas.
Fiscalidad en España con plataforma USA
- Alta en Hacienda (modelo 037) si recurrente. Epígrafe IAE 849.2 (servicios profesionales).
- RETA con tarifa plana 80 €/mes el primer año.
- Modelo 130 trimestral (IRPF). Modelo 303 trimestral (IVA al 0 % para servicios prestados a empresa USA = exportación de servicios).
- Pago en USD: convierte por contravalor a la fecha de cobro. Conserva extractos PayPal/Wise.
- El cliente USA no envía 1099 ni W-9 (lo tuyo es factura emitida desde España).

Preguntas frecuentes
¿Cuánto pagan?
8-15 USD/h básico, 15-30 estándar, 30-60 especialista, 60-150 top experto.
¿Qué se hace?
Anotar, clasificar, RLHF, generar respuestas modelo, evaluar código, traducir, adversarial testing.
¿Requisitos?
Inglés B2-C1, ordenador, capacidad de instrucciones. Para premium: titulación verificable.
¿Cuánto se gana al mes?
200-600 € casual, 800-2.500 € activo, 2.000-7.000 € especialista, 6.000-15.000 € top experto.
¿Tributa?
Sí. Alta autónomo + RETA + 130 + 303. Las facturas son exportación de servicios.