Descripci�n general de la IA generativa en Vertex AI

La IA generativa en Vertex AI (tambi�n conocida como genAI o gen AI) te da acceso a muchos modelos grandes de IA generativa para que puedas evaluarlos, ajustarlos, implementarlos y, luego, usarlos en tus aplicaciones potenciadas por IA. En esta p�gina, se proporciona una descripci�n general del flujo de trabajo de IA generativo en Vertex AI, las funciones y los modelos disponibles y se te dirige a los recursos para empezar.

Flujo de trabajo de IA generativa

En el siguiente diagrama, se muestra una descripci�n general de alto nivel del flujo de trabajo IA generativa.

Diagrama del flujo de trabajo de IA generativa

Prompt

Prompt

El flujo de trabajo de la IA generativa por lo general empieza con las instrucciones. Una instrucci�n es una solicitud enviada a un modelo de IA generativa para obtener una respuesta. Seg�n el modelo, un mensaje puede contener texto, im�genes, videos y audio. , documentos y otras modalidades o incluso varias modalidades (multimodal).

Crear una instrucci�n para obtener la respuesta deseada del modelo es una pr�ctica llamada dise�o de instrucci�n. Si bien el dise�o de una instrucci�n es un proceso de prueba y error, hay principios y estrategias de dise�o de instrucciones que puedes usar para incentivar al modelo a comportarse de la manera deseada. Vertex AI Studio ofrece una herramienta de administraci�n de instrucciones para ayudarte a administrar tus instrucciones.

Modelos de base

Modelos de base

Las instrucciones se env�an a un modelo de IA generativa para la generaci�n de respuesta. Vertex AI tiene una variedad de modelos de base de IA generativa a los que se puede acceder a trav�s de una API administrada, incluidos los siguientes:

  • API de Gemini: Motivos avanzados, chat de varios turnos, generaci�n de c�digo y las instrucciones multimodales.
  • API de Imagen: generaci�n de im�genes, edici�n de im�genes y subt�tulos visuales.
  • MedLM: B�squeda de respuestas y resumen de preguntas m�dicas. (DG privada)

Los modelos difieren en tama�o, modalidad y costo. Puedes explorar modelos de Google, as� como modelos abiertos y modelos de socios de Google, en Model Garden.

Personalizaci�n de modelos

Personalizaci�n de modelos

Puedes personalizar el comportamiento predeterminado de los modelos de base de Google para que generen los resultados deseados de forma coherente sin usar prompts complejos. Este proceso de personalizaci�n se llama ajuste de modelos. El ajuste del modelo te ayuda a reducir el costo y la latencia de tus solicitudes, ya que te permite simplificarlas.

Vertex AI tambi�n ofrece herramientas de evaluaci�n de modelos para ayudarte a evaluar el rendimiento de tu modelo ajustado. Una vez que tu modelo ajustado est� listo para la producci�n, puedes implementarlo en un extremo y supervisar el rendimiento como en flujos de trabajo est�ndar de MLOps.

Solicitar magnificaci�n

Aumento

Vertex AI ofrece varios m�todos de magnificaci�n de solicitudes que le otorgan al modelo acceso a las APIs externas y a la informaci�n en tiempo real.

  • Fundamentos: Conecta las respuestas del modelo a una fuente de informaci�n, como tus propios datos o la b�squeda web, lo que ayuda a reducir las alucinaciones.
  • RAG: Conecta los modelos a fuentes de conocimiento externas, como documentos y bases de datos, para generar respuestas m�s informativas y precisas.
  • Llamadas a funciones: Permite que el modelo interact�e con APIs externas para obtener informaci�n en tiempo real y llevar a cabo tareas reales.

Verificaci�n de citas

Verificaci�n de citas

Despu�s de que se genera la respuesta, Vertex AI verifica si las citas deben incluirse en la respuesta. Si una cantidad significativa del texto en la respuesta proviene de una fuente en particular, esa fuente se agrega a los metadatos de cita en la respuesta.

IA responsable y seguridad

IA responsable y seguridad

La �ltima capa de verificaciones que se realizan en la solicitud y la respuesta antes de que se devuelvan son los filtros de seguridad. Vertex AI verifica la instrucci�n y la respuesta para determinar cu�nto pertenecen a una categor�a de seguridad. Si se excede el umbral para una o m�s categor�as, la respuesta se bloquea y Vertex AI devuelve una respuesta de resguardo.

Respuesta

Respuesta

Si el mensaje y la respuesta pasan las verificaciones de filtro de seguridad, se devuelve la respuesta. Por lo general, la respuesta se devuelve de una sola vez. Sin embargo, tambi�n puedes recibir respuestas de forma progresiva a medida que se generan a trav�s de la habilitaci�n de la transmisi�n.

APIs y modelos de IA generativa

Los modelos de IA generativa disponibles en Vertex AI, tambi�n llamados modelos de base, se clasifican por el tipo de contenido que est�n dise�ados para generar. Este contenido incluye texto, chat, imagen, c�digo, video, incorporaciones y datos multimodales. Cada modelo se expone a trav�s de un extremo de publicador espec�fico para tu proyecto de Google Cloud, por lo que no es necesario implementar el modelo de base, a menos que necesites ajustarlo para un caso de uso espec�fico.

Ofertas de la API de Gemini

La API de Vertex AI Gemini contiene los extremos del publicador para los modelos de Gemini que desarroll� Google DeepMind.

  • Gemini 1.5 Pro (versi�n preliminar) admite mensajes multimodales. Puedes incluir archivos de texto, imagen, audio, video y PDF en las solicitudes de instrucciones y obtener respuestas de texto o c�digo. Gemini 1.5 Pro (versi�n preliminar) puede procesar colecciones de im�genes m�s grandes, documentos de texto m�s grandes y videos m�s largos que Gemini 1.0 Pro Vision.
  • Gemini 1.0 Pro se dise�� para manejar tareas de lenguaje natural, chat de c�digo y texto de varios turnos y generaci�n de c�digo.
  • Gemini 1.0 Pro Vision admite mensajes multimodales. Puedes incluir texto, im�genes, video y PDF en las solicitudes de instrucciones y obtener respuestas de texto o c�digo.

En la siguiente tabla, se muestran algunas diferencias entre los modelos de Gemini que pueden ayudarte a elegir la mejor para ti:

Modelo de Gemini Modalidades Ventana de contexto
Gemini 1.0 Pro / Gemini 1.0 Pro Vision
  • Texto, c�digo, PDF (Gemini 1.0 Pro Vision)
  • Hasta 16 im�genes
  • Video de hasta 2 minutos
  • 8,192 tokens de entrada
  • 2,048 tokens de salida
Gemini 1.5 Pro (Versi�n preliminar)
  • Texto, c�digo, im�genes, audio, video, PDF
  • Hasta 3,000 im�genes
  • Audio hasta 8.4 horas
  • Video con audio de hasta 1 hora
  • 1 mill�n de tokens de entrada
  • 8,192 tokens de salida

Ofertas de la API de PaLM

La API de PaLM de Vertex AI contiene los extremos del publicador para el Pathways Language Model 2 (PaLM 2) de Google, que son modelos grandes de lenguaje (LLM) amplios que generan texto y c�digo en respuesta a indicaciones de lenguaje natural.

  • La API de PaLM para texto est� ajustada para tareas de lenguaje, como clasificaci�n, resumen y extracci�n de entidades.
  • La API de PaLM para el chat es ajustada para el chat de varios turnos, en el que el modelo realiza un seguimiento de los mensajes anteriores en el chat y los usa como contexto para generar respuestas nuevas.

Otras ofertas de IA generativa

  • La incorporaci�n de texto genera incorporaciones vectoriales para el texto de entrada. Puedes usar incorporaciones para tareas como la b�squeda sem�ntica, la recomendaci�n, la clasificaci�n y la detecci�n de valores at�picos.

  • La incorporaci�n multimodal genera incorporaciones vectoriales basadas en entradas de imagen y texto. Estas incorporaciones se pueden usar luego para otras tareas posteriores, como la clasificaci�n de im�genes o las recomendaciones de contenido.

  • Imagen, nuestro modelo de base de texto a imagen, te permite generar y personalizar im�genes de nivel de estudio a gran escala.

  • Los modelos de socios son una lista seleccionada de modelos de IA generativa que desarrollan las empresas asociadas de Google. Estos modelos de IA generativa se ofrecen como APIs administradas. Por ejemplo, Anthropic proporciona sus modelos de Claude como un servicio en Vertex AI.

  • Los modelos abiertos, como Llama, est�n disponibles para que los implementes en Vertex AI o en otras plataformas.

  • MedLM es una familia de modelos de base que se ajustan para el sector de la atenci�n m�dica.

Certificaciones y controles de seguridad

Vertex AI es compatible con CMEK, Controles del servicio de VPC, Residencia de datos y la Transparencia de acceso. Existen algunas limitaciones para las funciones de IA generativa. Para obtener m�s informaci�n, consulta Controles de seguridad de IA generativa.

Comenzar