Kiedy OpenAI zaprezentowało Sora w lutym tego roku, byliśmy zaskoczeni. Chociaż byliśmy naocznymi świadkami ewolucji narzędzi do generowania obrazu, takich jak DALL-E, Midjourney czy Stable Diffusion, myśleliśmy, że minie trochę czasu, zanim pojawią się wysokiej klasy rozwiązania do generowania wideo.
Reklama
Mieliśmy powody, by wierzyć, że firma kierowana przez Sama Altmana jest lata świetlne przed konkurencją. W końcu, podobnie jak ChatGPT , właśnie zademonstrowała technologię, której nigdy wcześniej nie widziano. Ale w ostatnich miesiącach panorama znacznie się zmieniła.
Pas startowy Gen-3 Alpha i konkurs Sora
Okazuje się, że OpenAI wcale nie było takie nieosiągalne. W ciągu kilku miesięcy na scenie pojawiło się wiele narzędzi mających bezpośrednio konkurować z Sorą. Vidu i Kling AI wyłoniły się z Chin, podczas gdy Dream Machine i kilka godzin temu nowa Gen-3 Alpha pojawiły się w USA.
Ten ostatni instrument został opracowany przez słynną nowojorską firmę Runway. Gen-3 Alpha pojawi się po uruchomieniu Gen-1 i Gen-2 w 2023 roku, ale jest uważany za pierwszy z nowej serii modeli przeszkolonych w zakresie nowej infrastruktury multimodalnej. Model oferuje szereg nowych funkcji.
W przeciwieństwie do poprzednich produktów Runway ML, Gen-3 Alpha oferuje ulepszenia w trzech kluczowych aspektach. Z jednej strony, jak wyjaśnia firma, będzie miał lepszą jakość obrazu. Reprezentacje wizualne mogą przybierać abstrakcyjne lub realistyczne odcienie ze zwiększonym poziomem dokładności.