Questa pagina � stata tradotta dall'API Cloud Translation.

Introduzione all'IA generativa

Questa guida per nuovi utenti illustra le tecnologie di base dell'AI generativa spiegando come si integrano tra loro per potenziare chatbot e applicazioni. L'IA generativa (nota anche come IA gen. o IA gen) � un campo del machine learning (ML) che sviluppa e utilizza modelli di ML per generare nuovi contenuti.

I modelli di IA generativa sono spesso chiamati modelli linguistici di grandi dimensioni (LLM) a causa le loro dimensioni e la loro capacit� di comprendere e generare un linguaggio naturale. Tuttavia, a seconda dei dati su cui vengono addestrati, questi modelli possono comprendere e generare contenuti da pi� modalit�, tra cui testo, immagini, video e audio. I modelli che funzionano con pi� modalit� di dati sono chiamati modelli multimodali.

Generazione di contenuti

Affinch� i modelli di AI generativa generino contenuti utili nella di applicazioni reali, devono avere le seguenti capacit�:

Scopri come eseguire nuove attivit�:

I modelli di IA generativa sono progettati per eseguire attivit� generiche. Se vuoi che un modello esegua attivit� univoche per il tuo caso d'uso, devi essere in grado di personalizzarlo. Attivato Vertex AI, puoi personalizzare il tuo modello mediante l'ottimizzazione.
Accedere a informazioni esterne:

I modelli di IA generativa vengono addestrati su grandi quantit� di dati. Tuttavia, per perch� questi modelli siano utili, devono poter accedere alle informazioni al di fuori dei propri dati di addestramento. Ad esempio, se vuoi creare una un chatbot di assistenza clienti basato su un modello di AI generativa, deve avere accesso alle informazioni sui prodotti e servizi che offerta. In Vertex AI, si usano le chiamate di funzione e il grounding per aiutare il modello ad accedere alle informazioni esterne.
Bloccare contenuti dannosi:

I modelli di IA generativa potrebbero generare output inaspettati, tra cui offensivo o insensibile. Per garantire la sicurezza e prevenire l'uso improprio, i modelli hanno bisogno di filtri di sicurezza per bloccare prompt e risposte che sono ritenuti potenzialmente dannosi. Vertex AI dispone di funzionalit� di sicurezza integrate che promuovono l'uso responsabile dei nostri servizi di AI generativa.

Il seguente diagramma mostra come queste diverse funzionalit� interagiscono tra loro generare i contenuti desiderati:

Diagramma del flusso di lavoro dell'IA generativa

Prompt

Il flusso di lavoro dell'AI generativa in genere inizia con i prompt. Un prompt � una richiesta in linguaggio naturale inviata a un modello di AI generativa per ricevere una risposta. A seconda sul modello, un prompt pu� contenere testo, immagini video, audio, documenti e altre modalit� o anche pi� modalit� (multimodali).

La creazione di un prompt per ottenere la risposta desiderata dal modello � una pratica chiamata progettazione dei prompt. Sebbene la progettazione dei prompt sia un processo basato su tentativi ed errori, ci sono i principi e le strategie di progettazione dei prompt utilizzabili per sollecitare affinch� il modello si comporti nel modo desiderato. Vertex AI Studio offre uno strumento di gestione dei prompt per aiutarti per gestire i tuoi prompt.

Modelli di base

I prompt vengono inviati a un modello di AI generativa per la generazione di risposte. Vertex AI offre una serie di modelli di base di AI generativa accessibili tramite un'API gestita, tra cui:

API Gemini: ragionamento avanzato, chat in pi� passaggi generazione di codice e prompt multimodali.
API Imagen:generazione di immagini, modifica delle immagini e didascalie visive.
MedLM: risposta a domande mediche e riassunto. (GA privata)

I modelli differiscono per dimensioni, modalit� e costo. In Model Garden puoi esplorare i modelli di Google, nonch� i modelli aperti e quelli dei partner di Google.

Personalizzazione dei modelli

Puoi personalizzare il comportamento predefinito dei modelli di base di Google in modo che generino in modo coerente i risultati desiderati senza utilizzare prompt complessi. Questo processo di personalizzazione � chiamato ottimizzazione del modello. La regolazione del modello ti aiuta a ridurre il costo e la latenza delle richieste consentendoti di semplificare i prompt.

Vertex AI offre anche strumenti di valutazione dei modelli per aiutarti a valutare le prestazioni del modello ottimizzato. Dopo il giorno il modello ottimizzato � pronto per la produzione, puoi eseguire il deployment su un endpoint e monitorare come nei flussi di lavoro MLOps standard.

Accedere a informazioni esterne

Vertex AI offre diversi modi per dare al modello accesso ad API esterne e informazioni in tempo reale.

Grounding: collega le risposte del modello a una fonte attendibile, come i tuoi dati o la ricerca web, contribuendo a ridurre le allucinazioni.
RAG: Collega i modelli a fonti di conoscenza esterne, come documenti e database, per generare risposte pi� accurate e informative.
Chiamata di funzione: consente al modello di interagire con API esterne per ottenere informazioni in tempo reale ed eseguire attivit� reali.

Verifica delle citazioni

Dopo aver generato la risposta, Vertex AI controlla se ci sono citazioni deve essere incluso nella risposta. Se una quantit� significativa di testo nella risposta proviene da una particolare fonte, che viene aggiunta i metadati della citazione nella risposta.

AI responsabile e sicurezza

L'ultimo livello di controlli a cui vengono sottoposti prima il prompt e la risposta restituire � la sicurezza filtri. Vertex AI controlla sia il prompt sia la risposta per verificare quanto il prompt o la risposta appartengano a una categoria di sicurezza. Se la soglia viene superata per una o pi� categorie, il valore la risposta � bloccata e Vertex AI restituisce un fallback risposta.

Risposta

Se il prompt e la risposta superano i controlli del filtro di sicurezza, viene restituita la risposta. In genere, la risposta viene restituita collettivamente. Tuttavia, con Vertex AI Inoltre, pu� ricevere le risposte in maniera progressiva man mano che vengono generate abilitando lo streaming.

Esperienze della console Vertex AI Studio

Quando usi Vertex AI Studio con la prova gratuita o senza accedere a Google Cloud, alcune funzionalit� non sono disponibili. Per provare Vertex AI Studio, accetta la finestra dei Termini di servizio di Vertex AI Studio nella console Google Cloud.

	Utilizzo senza un account Google Cloud	Utilizza con un account di prova gratuito di Google Cloud	Utilizza con un account Google Cloud esistente
Accesso obbligatorio	No	Sì	Sì
Query al minuto (QPM)	2 QPM per tutti i modelli multimodali	Visualizzare i limiti di quota	Visualizzare i limiti di quota
Crediti offerti	0 $	Fino a 300 € per 90 giorni	0 $
Galleria dei prompt	No	Sì	Sì
Designer del prompt	Sì	Sì	Sì
Salva i prompt	No	Sì	Sì
Cronologia dei prompt	No	Sì	Sì
Parametri avanzati	No	No	Sì
Ottimizzazione	No	No	Sì
Utilizzo delle API	No	Sì	Sì
Fatturazione obbligatoria	No	No	Sì
Come iniziare	Vai a Vertex AI Studio	Registrati per una prova gratuita	Prova Vertex AI Studio nella console

Inizia a utilizzare l'IA generativa su Vertex AI

Prova un tutorial rapido utilizzando Vertex AI Studio o l'API Vertex AI.
Esplora i modelli pre-addestrati in Model Garden.
Esplora il riferimento dell'SDK dell'API Vertex AI Gemini per Python, Node.js, Java, Go o C#.
Scopri le best practice per l'AI responsabile e i filtri di sicurezza di Vertex AI.
Scopri di più sui prezzi.
Scopri di più su come chiamare Gemini utilizzando la libreria OpenAI.