Skip to main content

OpenAI, znane z innowacji w dziedzinie sztucznej inteligencji, zaprezentowało swój najnowszy projekt – Sora. To narzędzie AI, które tworzy fotorealistyczne wideo, robi ogromne wrażenie dzięki zdolności symulowania świata w trzech wymiarach. Sora, określana mianem „symulatora świata”, potrafi nie tylko generować sceny CGI cyfrowych krajobrazów, ale również tworzyć wideo, na przykład kobiety idącej nocą po neonowo oświetlonej ulicy.

Co wyróżnia Sorę, to jej zdolność do uczenia się o geometrii 3D i spójności scen bez konieczności programowania tych właściwości – wszystko to osiąga, analizując ogromne ilości danych. Jest to ewolucja modelu transformatora dyfuzji, który dotychczas był używany głównie do generowania obrazów wysokiej rozdzielczości. Sora poszerza te możliwości, umożliwiając tworzenie nowych materiałów wideo na podstawie podanych opisów lub rozszerzanie istniejących klipów.

Podczas treningu, Sora była karmiona ogromną ilością opisanych wideo, co pozwoliło na stworzenie związku między materiałem wideo a tekstem. Narzędzie to wykazuje zdolność do symulacji aspektów świata fizycznego, takich jak ludzie, zwierzęta czy środowiska, i potrafi generować płynne zmiany kamer, co świadczy o głębokim zrozumieniu przestrzeni trójwymiarowej.

OpenAI sugeruje, że technologia ta może znaleźć zastosowanie w branży gier wideo, co otwiera ekscytujące perspektywy dla przyszłego rozwoju symulatorów fizycznego i cyfrowego świata. Pomimo tego, Sora nie jest pozbawiona ograniczeń – na przykład, model ten nie rozumie w pełni zasady przyczyny i skutku, co może prowadzić do niespójności w generowanych scenach.

Mimo tych wyzwań, Sora daje wgląd w przyszłość, w której materiały wideo generowane przez AI mogą stać się niemal nieodróżnialne od rzeczywistości. OpenAI jest świadome potencjalnego ryzyka nadużyć i dlatego wprowadza to narzędzie stopniowo, powierzając je zespołom testującym w celu oceny potencjalnych zagrożeń.

Źródło: Futurism