Feb 04, 2024
Google aggiorna Vertex AI per tenere il passo con il boom dell'intelligenza artificiale generativa
Secondo un recente sondaggio congiunto di Fortune e Deloitte, oltre la metà dei CEO di tutto il mondo sta sperimentando l’intelligenza artificiale per generare testo, immagini e altre forme di dati. Nel frattempo, un terzo delle organizzazioni lo sono
Secondo un recente sondaggio congiunto di Fortune e Deloitte, oltre la metà dei CEO di tutto il mondo sta sperimentando l’intelligenza artificiale per generare testo, immagini e altre forme di dati. Nel frattempo, un terzo delle organizzazioni utilizza l’intelligenza artificiale generativa “regolarmente” in almeno una funzione aziendale, mostra un rapporto McKinsey.
Dato l’enorme (e apparentemente in crescita) mercato a cui rivolgersi, non sorprende che Google Cloud stia spingendo forte – molto forte – per rimanere al passo.
Durante la conferenza annuale Cloud Next, Google ha annunciato gli aggiornamenti a Vertex AI, la sua piattaforma basata su cloud che fornisce flussi di lavoro per la creazione, la formazione e l'implementazione di modelli di machine learning. Vertex AI ora dispone di modelli AI aggiornati per la generazione di testo, immagini e codice, nonché nuovi modelli di terze parti provenienti da startup tra cui Anthropic e Meta ed estensioni che consentono agli sviluppatori di incorporare dati aziendali e agire per conto di un utente.
"[Con Vertex] stiamo adottando un approccio all'ecosistema molto aperto, lavorando con partner di ampio ecosistema per offrire scelta e flessibilità ai nostri clienti", ha affermato in una conferenza stampa June Yang, vicepresidente del settore AI cloud e soluzioni di settore presso Google. "Abbiamo sviluppato un approccio all'intelligenza artificiale generativa con al centro la preparazione aziendale, con una forte attenzione alla governance dei dati, alla sicurezza responsabile dell'intelligenza artificiale e altro ancora."
Per quanto riguarda il modello, Google afferma di aver aggiornato "significativamente" il suo modello di generazione del codice Codey, offrendo un miglioramento della qualità del 25% nelle "principali lingue supportate" per la generazione del codice. (Sfortunatamente Google non ha approfondito quella metrica vaga nei materiali forniti a questo giornalista.) Ha anche aggiornato Imagen, il suo modello di generazione di immagini, per migliorare la qualità delle immagini generate e supportare Style Tuning, che consente ai clienti di creare immagini "allineati al loro marchio" utilizzando solo 10 immagini di riferimento.
Altrove, il modello linguistico PaLM 2 di Google comprende nuove lingue (38 disponibili in generale e più di 100 in anteprima) e dispone di una finestra di contesto ampliata di 32.000 token. La finestra di contesto, misurata in token (ovvero frammenti di testo grezzi), si riferisce al testo che il modello considera prima di generare qualsiasi testo aggiuntivo (32.000 token equivalgono a circa 25.000 parole, o circa 80 pagine di testo, con interlinea doppia).
La finestra di contesto di PaLM 2 non è la più grande disponibile. Questa distinzione va a Claude 2 di Anthropic, che ha una finestra di contesto da 100.000 token, più di tre volte la dimensione sia dell'originale PaLM 2 che di GPT-4. Ma Nenshad Bardoliwalla, product leader di Vertex AI, ha affermato che la decisione di optare per 32.000 token è stata presa pensando alla “flessibilità” e al “costo”.
"I nostri clienti stanno cercando di bilanciare la flessibilità della modellazione che sono in grado di eseguire con modelli di grandi dimensioni e gli scenari che possono generare con il costo dell'inferenza e con la capacità di messa a punto", ha affermato Bardoliwalla durante il briefing. “Ognuno di questi ha un certo costo computazionale e costi umani a seconda di quanto si investe in esso. E quindi in questo momento abbiamo ritenuto che, data l'evoluzione del mercato, i risultati con 32.000 token siano piuttosto impressionanti in base alle valutazioni che abbiamo fatto. Riteniamo che abbia raggiunto il giusto equilibrio tra nuove capacità e un rapporto prezzo/prestazioni competitivo sul mercato”.
Non tutti i clienti saranno d'accordo. Ma nel tentativo di ottenere entrambe le cose, Google ha aggiunto modelli di terze parti, tra cui Claude 2, a Model Garden di Vertex AI, una raccolta di modelli e strumenti predefiniti che possono essere personalizzati in base alle esigenze di un'azienda. Altri modelli che si uniscono al Model Garden includono Llama 2 recentemente rilasciato da Meta e Falcon LLM open source del Technology Innovation Institute.
Le nuove aggiunte ai modelli rappresentano un colpo di prua per Amazon Bedrock, il prodotto AWS recentemente lanciato da Amazon che fornisce un modo per creare app generative basate sull'intelligenza artificiale tramite modelli preaddestrati da startup, tra cui AI21 Labs, Anthropic e Stability AI. Considerato il difficile lancio di Bedrock, Google, forse, vede un'opportunità per stabilire un punto di appoggio nel nascente mercato dei servizi modello gestiti,