Apple MGIE – AI per l'editing di immagini basato su testo

Quasi un mese fa Vi abbiamo presentato il modello linguistico multimodale di Apple “Ferret” qui nel blog e nel podcast. Ciò ha rivelato per la prima volta che gli sforzi dell'intelligenza artificiale del produttore di iPhone vengono condotti in segreto. Con MGIE ora c'è una nuova Apple AI che riunisce immagini e input di testo. Perché MGIE sta per “Modifica guidata delle immagini multimodale di grandi dimensioni”. Per l'elaborazione delle immagini viene utilizzato un modello linguistico multimodale (MLLM). Correzioni, filtri, effetti su singoli punti o oggetti e così via dovrebbero essere possibili utilizzando semplici istruzioni. Puoi provare il tutto utilizzando uno strumento online.

A sinistra puoi vedere l'immagine che ho caricato e il messaggio corrispondente. Sulla destra c'è l'immagine di output e l'interpretazione del prompt. Si può dire che c'è ancora bisogno di lavoro su MGIE.
A sinistra puoi vedere l'immagine che ho caricato e il messaggio corrispondente. Sulla destra c'è l'immagine di output e l'interpretazione del prompt. Si può dire che c'è ancora bisogno di lavoro su MGIE.

"Rimuovi le nuvole e dai all'immagine una dominante gialla soleggiata"

I comandi che puoi dare a MGIE per abbellire le foto di paesaggi sono qualcosa del genere. Cambiare il colore dei capelli nei selfie può essere utilizzato anche per prevedere il risultato dal parrucchiere. Dopo i primi test, la stampa specializzata di MGIE afferma addirittura che alcuni comandi trasmessi via testo per modificare l'immagine in ingresso potrebbero sostituire l'editing manuale, ad esempio in Photoshop o programmi simili. Questo vale sicuramente anche per i filtri e gli effetti integrati nell'app Foto che Apple offre su Mac, iPhone e iPad. Puoi trovare un esempio di test riuscito qui: B. a 9to5Mac.

Usa Apple MGIE tu stesso: GitHub e HuggingFace

Se stai cercando ulteriori informazioni di base su MGIE, troverai, tra le altre cose lo trovi su GitHub. Perché Apple ha reso disponibile lì il modello AI open source. Oltre ai dati grezzi ci sono anche alcune spiegazioni su come funziona e come viene utilizzato. Se non sai cosa fare con i dati e non puoi creare la tua interfaccia utente (come me), utilizza semplicemente lo strumento web fornito con MGIE a HuggingFace. Come Ferret, anche MGIE viene fornito con un articolo scientifico che tu hier herunterladen Potere. C'è un riepilogo con i punti più importanti al VentureBeat.

Per tutti coloro che preferiscono che le informazioni su MGIE siano tradotte, ecco le cose più importanti:

  • Editing espressivo basato su testo: MGIE può creare istruzioni concise e chiare che guidano efficacemente il processo di modifica. Ciò non solo migliora la qualità delle modifiche, ma aumenta anche l'usabilità complessiva.
  • Modifica simile a Photoshop: MGIE può eseguire modifiche comuni simili a Photoshop come: B. Ritaglia, ridimensiona, ruota, capovolgi e aggiungi filtri. Il modello può anche eseguire modifiche più avanzate, come: Ad esempio, cambia lo sfondo, aggiungi/rimuovi oggetti e unisci immagini.
  • Ottimizzazione fotografica globale: MGIE può ottimizzare la qualità complessiva di una foto, ad es. B. Luminosità, contrasto, nitidezza e bilanciamento del colore. Il modello può comunque applicare effetti artistici come schizzi, pittura e fumetti.
  • Modifica locale: MGIE può modificare regioni o oggetti specifici in un'immagine, come: B. Volti, occhi, capelli, vestiti e accessori. Il modello può anche modificare gli attributi di queste regioni o oggetti, come forma, dimensione, colore, trama e stile.

Siamo entusiasti delle novità di iOS 18

Si presume che Apple integrerà diverse funzioni AI in iOS 18 e probabilmente anche in iPadOS 18 e macOS 15. Oltre al miglioramento dell'assistente vocale Siri, Apple sembra ora concentrarsi sempre di più sull'area del riconoscimento e dell'elaborazione delle immagini. È possibile che l'attenzione non sia solo sugli scopi creativi, ma anche sugli aiuti operativi. Il riconoscimento dell'ambiente circostante fa già parte in una certa misura delle funzioni della fotocamera dell'iPhone, ma ora potrebbe essere notevolmente ampliato. Lo sapremo esattamente da giugno, quando Apple terrà la WWDC24.

Ti è piaciuto l'articolo e le istruzioni sul blog ti hanno aiutato? Allora sarei felice se tu il blog tramite un'iscrizione stabile sosterrebbe.

Scrivi un commento

Il tuo indirizzo e-mail non verrà pubblicato. I campi obbligatori sono contrassegnati con * segnato

Nel blog di Sir Apfelot troverai consigli, istruzioni e recensioni sui prodotti Apple come iPhone, iPad, Apple Watch, AirPods, iMac, Mac Pro, Mac Mini e Mac Studio.

Speciali