„Oz Magician” obraca się, aby Google mógł pokazać granice tworzenia
Wideo, obraz, mowa i muzyka. Google Cloud () zdobył pierwszy tytuł firmy, który dostarczył modele AI do tworzenia wszystkich rodzajów mediów na platformie. W środę (9) firma obejmowała Lyrię, model, który przekształca polecenie tekstu w muzykę, do swojej katalogu Vertex AI.
Przeczytaj także:
Nowy model obiecuje wyprodukować „audio o wysokiej zawartości, skrupulatnie wychwytując niuanse i dostarczając bogate i szczegółowe kompozycje według szerokiej serii gatunków”.
W demonstracji dokonanej w Google Cloud następnych 25 ′ piosenki z subiektywnymi opisami, takimi jak „Uchwycenie późnej nocy w klubie Jazz”, a także obiektywne wytyczne, takie jak „priorytetyzacja oszałamiającego saksofonu i gleby trąbki”.
Przeczytaj także:
„Dzisiaj udostępniamy Lyrię w Google Cloud, aby przekształcić podpowiedzi tekstu w klipach 30 sekund utworów muzycznych i jesteśmy pierwszymi Hyperscaler [grandes empresas de processamento de dados em nuvem] Oferując tę możliwość ” – powiedział Thomas Kurian, dyrektor generalny Google Cloud w prezentacji na imprezie.
Kontynuuje się po reklamie
Według Google Cloud narzędzie powinno szybko prowadzić firmy do tworzenia ścieżek dźwiękowych do kampanii marketingowych, wprowadzania produktów lub wciągających doświadczeń. Musisz także spotkać produkcję wideo, podcasty i tworzenie treści cyfrowych.
Wideo, obraz i głos
W testowym wyświetlaczu modeli AI do tworzenia mediów Google pokazał klasyczny „The Wizard of Oz” (1939) na „The Sphere”, gigantycznym sferycznym ekranie w Las Vegas. Sceny z oryginalnego filmu zostały odtworzone, a elementy, które uniknęły oryginalnego wymiaru, w którym został sfilmowany, zostały stworzone od zera. Na przykład strzał z oryginału pokazujący szef bohatera Dorothy (grany przez Judy Garland) został zawarty tańczącym ciałem do wypełnienia wymiarów ekranu.
Oprócz Lyrii, Veo 2, tworzenia wideo, Chirp 3, Audio i Imagen 3 są również dostępne na platformie szkoleniowej AI Vertex, Model Model Language Google Cloud. Aktualizacje narzędzi zostały również ogłoszone na imprezie.
Kontynuuje się po reklamie
Przeczytaj także:
Veo 2 ma teraz opcję sterowania aparatem. Użytkownicy mogą, na przykład, wspinać się na obraz w aplikacji i poprosić go o anime z pewnym ruchem, takim jak dron flyfish.
Aktualizacja Chirp 2 pozwala tworzyć niestandardowe głosy na podstawie 10 sekund audios wysłanych do modelu. Możliwe jest również dodanie narracji do istniejących nagrań i transkrybować rozmowę z automatyczną identyfikacją głośników.
Kontynuuje się po reklamie
Przez Imagen 3 użytkownicy mogą teraz rezygnować i odtwarzać brakujące lub uszkodzone obszary obrazu.
Wśród partnerów Adobe zamknął partnerstwo na temat włączenia modeli ImageN 3 na platformie Adobe Express; Kraft Heinz, L’Oreal i łyżki zginające już używają narzędzi AI Vertex w tworzeniu kampanii, klipach i zdjęciach.
*Reporter podróżował do Las Vegas na zaproszenie Google Cloud