¿Cuánto pagan plataformas como Scale AI, Outlier o Mercor?

Tarifas medias 2026: tareas básicas (anotación, clasificación) 8-15 USD/h. Tareas estándar (revisión calidad RLHF, comparativa de respuestas LLM) 15-30 USD/h. Tareas expertas (especialista en código, matemáticas, medicina, derecho, idiomas raros) 30-60 USD/h. Top expertos (PhD en STEM, médicos, abogados senior): 60-150 USD/h. La plataforma cobra al cliente 2-3x lo que paga al colaborador.

¿Qué se hace exactamente?

Tareas habituales: 1) escribir o revisar respuestas de un LLM y rankearlas (RLHF), 2) anotar imágenes con bounding boxes o segmentación, 3) transcribir audio en idiomas raros, 4) resolver problemas de código o matemáticas para entrenamiento, 5) generar prompts y respuestas en tu idioma materno, 6) testear chatbots con preguntas adversariales, 7) traducir y validar pares lingüísticos. Lo común: el modelo necesita ejemplos de calidad para aprender.

¿Qué requisitos hay para entrar?

Mínimos: edad legal, dominio de inglés (B2-C1), capacidad de seguir instrucciones largas, ordenador con buena conexión. Para tareas básicas no se piden títulos. Para tareas premium (programador, médico, abogado, lingüista) se exige titulación verificable. Mercor en particular exige perfil tipo LinkedIn revisado y entrevista. Las pruebas iniciales (qualification) pueden tardar 1-2 semanas y muchas no las superan.

¿Cuánto se puede ganar al mes?

Casual (5-10 h/sem) en tareas básicas: 200-600 €/mes. Activo (15-25 h/sem) en tareas estándar: 800-2.500 €/mes. Especialista (programador, médico, abogado): 2.000-7.000 €/mes con disponibilidad parcial. Top expertos en plataformas como Mercor con tarifas de 60-150 USD/h y 20+ h/sem: 6.000-15.000 €/mes. Las cifras dependen mucho del país (las plataformas pagan más a colaboradores en países hispanohablantes que a India/Filipinas, pero menos que a EE.UU.).

¿Tributan estos ingresos en España?

Sí. Como rendimientos de actividad económica (servicios profesionales). Si es esporádico y poco volumen, RENTA simple. Si es habitual: alta autónomo (modelo 037) + RETA (tarifa plana 80 €/mes) + 130 + 303 trimestrales. Las plataformas (Scale, Outlier, Mercor) son estadounidenses: facturas como exportación de servicios, IVA al 0 %. Pago en USD vía PayPal, Wise o transferencia internacional.

Vender Datos para Entrenar IA en 2026

OpenAI, Anthropic, Meta, Google y los nuevos laboratorios de IA necesitan algo que no se puede automatizar: humanos cualificados que generen datos de entrenamiento de calidad. La economía detrás del boom IA tiene un mercado nuevo que casi nadie cuenta en español: empresas como Scale AI, Outlier (Scale), Surge AI y Mercor pagan entre 8 y 150 USD/h por tareas que van de "clasificar imágenes" a "resolver problemas de código en producción".

Workflow de IA en pantalla con nodos conectados, vista cenital editorial. — El siguiente modelo de IA necesita datos. Y los datos los generan humanos.

Resumen rápido. Tarifas: básico 8-15 USD/h, estándar 15-30 USD/h, especialista 30-60 USD/h, top experto 60-150 USD/h. Las plataformas serias: Scale AI / Outlier (volumen), Surge AI (calidad), Mercor (premium). Requisito mínimo: inglés B2-C1 y dominio de instrucciones. Ingresos típicos a tiempo parcial: 800-2.500 €/mes. Especialistas (código, derecho, medicina): 2.000-7.000 €/mes.

Qué es el "data labeling" y RLHF

Dos categorías:

Data labeling clásico: anotar imágenes, transcribir audio, clasificar texto. Tareas mecánicas, tarifas bajas.
RLHF (Reinforcement Learning from Human Feedback): revisar respuestas de un LLM, comparar 2 respuestas y elegir la mejor, escribir respuestas modelo, generar prompts adversariales. Tarifas medias-altas.
Generación experta: escribir código de calidad para entrenar modelos de programación, resolver problemas matemáticos paso a paso, generar diagnósticos médicos sintéticos. Tarifas premium.

Las plataformas serias en 2026

Plataforma	Tipo	Tarifa rango	Acceso
Scale AI	Volumen	10-25 USD/h	Web propia + Outlier para crowd
Outlier (Scale)	RLHF/expertos	15-50 USD/h	outlier.ai, prueba inicial
Surge AI	Premium calidad	20-60 USD/h	Selección rigurosa
Mercor	Top expertos	40-150 USD/h	CV + entrevista
Toloka	Volumen entry	3-12 USD/h	Abierta
Appen / Telus AI	Mixto	8-25 USD/h	Convocatorias
Remotasks	Volumen	5-15 USD/h	Pruebas iniciales

Tarifas reales por nivel

Básico (anotación, clasificación, transcripción simple): 8-15 USD/h.
Estándar (RLHF, revisión calidad respuestas LLM, traducción nicho): 15-30 USD/h.
Especialista (programador con stack específico, abogado, médico, lingüista, financiero): 30-60 USD/h.
Top experto (PhD STEM, médico especialista, abogado senior, top developer): 60-150 USD/h.

Pantalla con dashboard editorial sobre fondo oscuro, tonos azules tenues. — El nivel determina la tarifa. La especialización es la palanca individual más fuerte.

Qué tareas hay (con ejemplos)

RLHF para LLM: el sistema te da 2 respuestas a un prompt, eliges la mejor y explicas por qué. Una tarea típica dura 5-15 min y paga 1-3 USD.
Generación de respuestas modelo: escribes la respuesta ideal a un prompt complejo. 10-30 min, paga 4-10 USD según calidad.
Evaluación de código: ejecutas un snippet, identificas bugs, propones fix. 15-30 min, paga 6-20 USD.
Anotación visual: dibujas bounding boxes o máscaras en imágenes. 1-3 min/imagen, paga 0,15-0,80 USD.
Adversarial testing: intentas que un chatbot dé respuestas peligrosas o erróneas. 30-60 min/sesión, 15-50 USD.
Traducción y localización: validar pares de traducción humano vs IA. 12-25 USD/h.

Cómo entrar en cada plataforma

Outlier (Scale): registro en outlier.ai, prueba inicial de inglés y razonamiento. Si la pasas, accedes a tareas. Aprobación 3-7 días.
Mercor: sube CV con experiencia técnica verificable. Entrevista de 30-45 min con vídeo de IA. Si pasas, te asignan a proyectos premium.
Surge AI: aplicación restringida. Suelen contactar a partir de LinkedIn o referidos.
Toloka, Appen, Remotasks: abiertas. Pruebas iniciales sencillas.

Cómo subir de tarifa

Acumula horas con buena calidad: el sistema te asigna tareas mejor pagadas si tu rating es alto.
Especialización verificable: sube certificados, perfil LinkedIn, GitHub. Mercor escala mucho con datos verificables.
Idiomas raros: catalán, vasco, portugués europeo, italiano, japonés. Pagan extra por escasez.
Disponibilidad: contestar antes que otros sube ranking en plataformas dinámicas.

Fiscalidad en España con plataforma USA

Alta en Hacienda (modelo 037) si recurrente. Epígrafe IAE 849.2 (servicios profesionales).
RETA con tarifa plana 80 €/mes el primer año.
Modelo 130 trimestral (IRPF). Modelo 303 trimestral (IVA al 0 % para servicios prestados a empresa USA = exportación de servicios).
Pago en USD: convierte por contravalor a la fecha de cobro. Conserva extractos PayPal/Wise.
El cliente USA no envía 1099 ni W-9 (lo tuyo es factura emitida desde España).

Vista cenital editorial de notas y libros sobre escritorio oscuro. — Cobrar en USD con costes en € es la palanca individual más fuerte de cualquier freelance hispano.

Preguntas frecuentes

¿Cuánto pagan?

8-15 USD/h básico, 15-30 estándar, 30-60 especialista, 60-150 top experto.

¿Qué se hace?

Anotar, clasificar, RLHF, generar respuestas modelo, evaluar código, traducir, adversarial testing.

¿Requisitos?

Inglés B2-C1, ordenador, capacidad de instrucciones. Para premium: titulación verificable.

¿Cuánto se gana al mes?

200-600 € casual, 800-2.500 € activo, 2.000-7.000 € especialista, 6.000-15.000 € top experto.

¿Tributa?

Sí. Alta autónomo + RETA + 130 + 303. Las facturas son exportación de servicios.

Cómo funciona el proceso paso a paso

El flujo de trabajo real en una plataforma como Outlier o Surge:

Registro y prueba inicial: rellenas el perfil, indicas tus especialidades (idiomas, formación, experiencia técnica). La plataforma te envía una serie de tareas de evaluación. Esta fase puede durar 1-2 semanas y muchos candidatos no la superan si no leen las instrucciones con atención extrema.
Acceso a proyectos: si apruebas, entras en la cola de proyectos disponibles. Los proyectos se asignan o se abren para "claim" (tú los coges antes que otros). La velocidad y la disponibilidad importan en las plataformas dinámicas.
Ejecución de tareas: cada tarea tiene instrucciones muy detalladas (a veces 20-30 páginas de guidelines). Seguirlas al pie de la letra es más importante que la calidad subjetiva del output.
Revisión y puntuación: cada tarea se puntúa. Tu rating acumulado determina qué proyectos te asignan. Un rating bajo te excluye de proyectos mejor pagados.
Pago: normalmente semanal o quincenal via PayPal, Wise o transferencia. En USD. Conserva todos los registros para la declaración.

Para quién funciona este modelo (y para quién no)

Funciona bien si: tienes una especialización verificable (desarrollador, médico, abogado, matemático, lingüista), dominas el inglés al nivel de leer y seguir instrucciones técnicas complejas, tienes paciencia para la fase inicial de baja productividad, y buscas un ingreso complementario flexible (no un empleo a tiempo completo).

No funciona si: buscas ingresos inmediatos (la fase de cualificación toma semanas), no tienes especialización diferencial (las tareas básicas están saturadas y pagan poco), o tienes dificultades con el inglés técnico (la mayoría de guidelines están en inglés incluso para proyectos en español).

La realidad del mercado en 2026: saturación selectiva

El mercado de datos de IA en 2026 tiene una estructura bimodal que conviene entender antes de entrar:

Tareas básicas (etiquetado de imágenes, clasificación simple, transcripción): saturadas. Miles de colaboradores de Asia, África y América Latina compiten por estas tareas. Las tarifas son bajas (3-12 USD/h) y la disponibilidad de trabajo es irregular.
Tareas expertas (evaluación de código, razonamiento jurídico, diagnóstico médico, matemáticas avanzadas): escasez real de buenos colaboradores. Aquí sí hay proyectos estables y tarifas altas. El problema es que la barrera de entrada es alta: necesitas titulación verificable y superar pruebas técnicas más exigentes.

La estrategia óptima para alguien en España: no competir en tareas básicas (la diferencia salarial con otros países hace inviable), sino posicionarse directamente en el nivel experto usando la titulación o experiencia que ya tienes.

Ventaja del castellano y lenguas co-oficiales

Un factor diferencial que pocas personas de habla hispana aprovechan: los modelos de IA necesitan datos de altísima calidad en español para mejorar su rendimiento en ese idioma. Esto genera demanda específica de evaluadores nativos:

Español neutro de España: alta demanda para proyectos que quieren diferenciarse del español latinoamericano.
Español de LATAM (México, Argentina, Colombia): también alta demanda pero con más oferta de evaluadores locales.
Catalán, gallego, euskera: muy poca oferta de colaboradores expertos. Tarifas superiores a la media por escasez. Si hablas alguna de estas lenguas a nivel nativo, es una ventaja competitiva directa.
Portugués europeo vs brasileño: proyectos que necesitan diferenciación entre ambas variedades pagan extra por la especificidad.

Errores más comunes al empezar

No leer las guidelines completas. Las instrucciones de cada proyecto son largas y detalladas. Muchos colaboradores las leen superficialmente y fallan las tareas de evaluación inicial por omisión, no por incapacidad.
Priorizar velocidad sobre calidad. El rating se basa en calidad, no en velocidad. Una tarea bien hecha y lenta vale más que tres rápidas y mediocres que bajan tu puntuación.
Registrarse en demasiadas plataformas a la vez. La fase de cualificación consume mucho tiempo. Es mejor dominar una plataforma (Outlier) antes de expandirse a las demás.
No declarar los ingresos. Los pagos en USD por PayPal o Wise quedan registrados. Hacienda cruza datos de cuentas extranjeras desde el modelo 720 (para saldos >50.000 €) y el CRS (Common Reporting Standard). Para ingresos corrientes, la declaración en IRPF es obligatoria desde el primer euro.
Subestimar el tipo de cambio. Si cobras en USD y gastas en €, una variación del tipo de cambio del 10 % puede suponer 10 % menos de ingreso efectivo. Usa Wise para conversión eficiente (0,4-0,6 % comisión vs 3-5 % de los bancos tradicionales).

Plan de acción: primeros 7 días

Día 1: Regístrate en Outlier.ai (la plataforma con mejor accesibilidad para principiantes competentes). Rellena el perfil con honestidad: especialidades reales, nivel de inglés real, titulaciones verificables.
Día 2-3: Lee los foros de Reddit (r/outlier_ai, r/ScaleAI) para entender qué proyectos hay activos, qué tipo de tareas pagan mejor y cuáles son los errores más frecuentes en las pruebas de cualificación.
Día 4-5: Realiza las tareas de cualificación sin prisas. Si puedes, espera al momento del día en que estás más concentrado. Las primeras 2-3 horas determinan si entras o no.
Día 6: Si tienes titulación técnica (ingeniería, medicina, derecho, economía), regístrate también en Mercor con CV actualizado. La entrevista de vídeo-IA suele ser en inglés: prepara tu presentación en 2-3 minutos.
Día 7: Abre cuenta en Wise para recibir pagos en USD. Es gratis, tarda 1-2 días en verificarse y te ahorra un 2-4 % en cada conversión respecto a PayPal o tu banco.

En esta guía

Qué es el "data labeling" y RLHF

Las plataformas serias en 2026

Tarifas reales por nivel

Qué tareas hay (con ejemplos)

Cómo entrar en cada plataforma

Cómo subir de tarifa

Fiscalidad en España con plataforma USA

Preguntas frecuentes

¿Cuánto pagan?

¿Qué se hace?

¿Requisitos?

¿Cuánto se gana al mes?

¿Tributa?

Cómo funciona el proceso paso a paso

Para quién funciona este modelo (y para quién no)

La realidad del mercado en 2026: saturación selectiva

Ventaja del castellano y lenguas co-oficiales

Errores más comunes al empezar

Plan de acción: primeros 7 días

Sigue leyendo

Cómo ganar dinero con ChatGPT en 2026: 10 formas reales (con cifras)

Agentes de IA en 2026: qué son, cómo crearlos y cómo ganar dinero con ellos

Cómo ganar 1.000 € al mes online en 2026: plan real (España + LATAM)