„Oz Magician” obraca się, aby Google mógł pokazać granice tworzenia

Bogdan10.04.2025

Wideo, obraz, mowa i muzyka. Google Cloud () zdobył pierwszy tytuł firmy, który dostarczył modele AI do tworzenia wszystkich rodzajów mediów na platformie. W środę (9) firma obejmowała Lyrię, model, który przekształca polecenie tekstu w muzykę, do swojej katalogu Vertex AI.

Przeczytaj także:

Nowy model obiecuje wyprodukować „audio o wysokiej zawartości, skrupulatnie wychwytując niuanse i dostarczając bogate i szczegółowe kompozycje według szerokiej serii gatunków”.

„Oz Magician” obraca się, aby Google mógł pokazać granice tworzenia

W demonstracji dokonanej w Google Cloud następnych 25 ′ piosenki z subiektywnymi opisami, takimi jak „Uchwycenie późnej nocy w klubie Jazz”, a także obiektywne wytyczne, takie jak „priorytetyzacja oszałamiającego saksofonu i gleby trąbki”.

Przeczytaj także:

„Dzisiaj udostępniamy Lyrię w Google Cloud, aby przekształcić podpowiedzi tekstu w klipach 30 sekund utworów muzycznych i jesteśmy pierwszymi Hyperscaler [grandes empresas de processamento de dados em nuvem] Oferując tę możliwość ” – powiedział Thomas Kurian, dyrektor generalny Google Cloud w prezentacji na imprezie.

Kontynuuje się po reklamie

Według Google Cloud narzędzie powinno szybko prowadzić firmy do tworzenia ścieżek dźwiękowych do kampanii marketingowych, wprowadzania produktów lub wciągających doświadczeń. Musisz także spotkać produkcję wideo, podcasty i tworzenie treści cyfrowych.

Wideo, obraz i głos

W testowym wyświetlaczu modeli AI do tworzenia mediów Google pokazał klasyczny „The Wizard of Oz” (1939) na „The Sphere”, gigantycznym sferycznym ekranie w Las Vegas. Sceny z oryginalnego filmu zostały odtworzone, a elementy, które uniknęły oryginalnego wymiaru, w którym został sfilmowany, zostały stworzone od zera. Na przykład strzał z oryginału pokazujący szef bohatera Dorothy (grany przez Judy Garland) został zawarty tańczącym ciałem do wypełnienia wymiarów ekranu.

Odtworzenie głównego bohatera „Czarnoksiężnika z Oz”, Dorothy z Modeniami sztucznej inteligencji Google Cloud. (Zdjęcie: Ujawnienie/Google)

Oprócz Lyrii, Veo 2, tworzenia wideo, Chirp 3, Audio i Imagen 3 są również dostępne na platformie szkoleniowej AI Vertex, Model Model Language Google Cloud. Aktualizacje narzędzi zostały również ogłoszone na imprezie.

Kontynuuje się po reklamie

Przeczytaj także:

Veo 2 ma teraz opcję sterowania aparatem. Użytkownicy mogą, na przykład, wspinać się na obraz w aplikacji i poprosić go o anime z pewnym ruchem, takim jak dron flyfish.

Aktualizacja Chirp 2 pozwala tworzyć niestandardowe głosy na podstawie 10 sekund audios wysłanych do modelu. Możliwe jest również dodanie narracji do istniejących nagrań i transkrybować rozmowę z automatyczną identyfikacją głośników.

Kontynuuje się po reklamie

Przez Imagen 3 użytkownicy mogą teraz rezygnować i odtwarzać brakujące lub uszkodzone obszary obrazu.

Wśród partnerów Adobe zamknął partnerstwo na temat włączenia modeli ImageN 3 na platformie Adobe Express; Kraft Heinz, L’Oreal i łyżki zginające już używają narzędzi AI Vertex w tworzeniu kampanii, klipach i zdjęciach.

*Reporter podróżował do Las Vegas na zaproszenie Google Cloud

Source link

add a comment

Bogdan

Cześć, nazywam się Luca i jestem autorem tej strony z przydatnymi poradami kulinarnymi. Zawsze fascynowało mnie gotowanie i kulinarne eksperymenty. Dzięki wieloletniej praktyce i nauce różnych technik gotowania zdobyłem duże doświadczenie w gotowaniu różnych potraw.

view all posts