@比尔盖茨
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
基于Agent的模型和生成式多媒体的发展,出现更多实验性应用。
但对于沿着给定断层线正在发生什么,专家们基本上一无所知。
科学家们,在用AI做出尝试
@比尔盖茨
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
基于Agent的模型和生成式多媒体的发展,出现更多实验性应用。
但对于沿着给定断层线正在发生什么,专家们基本上一无所知。
科学家们,在用AI做出尝试