Skip to content

Pantalla

Pantalla

Tu pantalla es una entrada. Pulsa el atajo de Visión, atenúa la pantalla, arrastra una región (o captura una ventana o monitor completo), y la imagen se convierte en materia prima para una IA que puede describirla, extraer su texto, analizar su estructura o añadirla a una nota.

Overlay de captura de pantalla con el dashboard y el Panel de Control visibles

TIP
La visión se combina naturalmente con la voz. Tras capturar, puedes grabar una pregunta hablada (*"¿Qué significa este error?"*, *"Resume los datos de esta tabla"*) antes de que la IA procese la imagen.

Cómo capturar la pantalla

Pulsa el atajo de Visión desde cualquier app:

Ctrl+Alt+S (por defecto, reasignable en Configuración → Atajos)

La pantalla se atenúa y aparece un overlay de recorte transparente con una barra de ayuda:

Barra de ayuda del overlay de recorte

GestoQué captura
Clic en una ventanaEsa ventana específica de la aplicación
Clic y arrastrarUna región rectangular personalizada
Shift + arrastrarUna forma libre
Pulsar FEl monitor activo completo
Pulsar ATodos los monitores como una imagen ancha
Pulsar EscCancela y vuelve a tu trabajo

Tras la selección el overlay se cierra y se abre el Panel de Acciones de Visión.

El Panel de Acciones de Visión

El panel de acciones te permite (opcionalmente) escribir o grabar una pregunta, y luego elegir qué debe hacer la IA con la captura:

Panel de Acciones de Visión con los botones Save / OCR / Edit / Clip / Chat / Note

Selectores de fuente y modo de captura

Selector de fuente de Visión — Image / Video / Color

Selector de modo de captura — Region / Full Screen

Salidas que consumen la pantalla

AcciónQué haceDestino
OCRExtrae cada carácter de la capturaPortapapeles / cursor
Describir (Clip / Chat)La IA describe lo que ve en lenguaje naturalNotificación / Chat Rápido
GuardarEscribe la captura en discoCarpeta de guardado configurada
NotaAñade la imagen + tu descripción hablada a tu archivo de notasNota
ChatAdjunta la imagen a una conversación de Chat RápidoChat Rápido

Selector de color y captura de video

La familia del atajo de Visión también incluye dos herramientas especializadas:

  • Selector de Color — un cursor con magnificador de píxeles que muestrea colores de tu pantalla, con una bandeja de muestras y atajos de teclado.
  • Barra de Grabación de Video — una pequeña barra/temporizador flotante para capturar grabaciones cortas de pantalla.

Selector de Color — tres colores muestreados

Selector de color en detalle

Los tooltips del magnificador de un solo píxel muestran los valores hex y RGB en vivo según mueves el cursor:

Magnificador del selector de color — píxel blanco

Magnificador del selector de color — píxel naranja

Las muestras se acumulan al hacer clic:

Selector de color — 5 colores muestreados

Visión local vs. nube

La visión se ejecuta sobre un modelo de IA multimodal:

  • Nube — Gemini Flash (wallet o BYOK), OpenAI GPT-4o con BYOK
  • Local — Ollama con minicpm-v o moondream (OCR soportado completo solo en minicpm-v)

Configura en Configuración → Motor IA → Visión.

NOTE
Los modelos de Visión locales son más pequeños y cuantizados — la precisión del OCR y el análisis de contexto largo son notablemente más fuertes en la ruta de nube.