视频_第2页_坚曼百货商行

深入理解Sora技术原理

OpenAI发布的视频生成模型Sora，https，openai.com，sora，，能根据文本生成长达一分钟的高质量视频，理论上支持任意分辨率，如1920x1080、1080x1920，生成能力远超此前只能生成25帧576x1024图像的顶尖视频生成模型StableVideoDiffusion，一...

2024-11-14 982

科技

ShareGPT4V作者团队又一力作！百万高质量视频

继Sora官宣之后，多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来，LUMA、Gen，3Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力，文生视频、图生视频的新前沿不断被扩展令大家惊喜不已，抱有期待，最近，来自中国科学技术大学、北京大学、上海AILab等团队的研究人...

2024-11-14 499

玩具模型

Luma同时开放API 文生视频模型Runway

著名文生视频模型Runway宣布开放最新文生视频模型Gen，3AlphaTurbo的API，帮助开发者将该功能集成在应用中，Runway的API提供了两个套餐，Build，主要面向希望将文生视频集成在应用的个人和团队；Enterprise则面向更大型的组织和企业，目前，Runway的API需要申请候...

2024-11-14 723

饰品装饰

4090单卡可跑智谱版Sora正式开源！ 6秒直出电影级画质

7月26日，智谱发布AI生视频产品，清影，，30秒将任意文图生成视频，并上线在他们的AI助手，智谱清言，上，被誉为是国内首个人人可用的Sora，就在发布6天后，，清影，生成到视频数便已突破了百万量级，今天，智谱AI宣布将与，清影，同源的视频生成模型——CogVideoX正式开源，团队表示，希望每一位...

2024-11-14 628

母婴用品

VideoAgent基于大语言模型的视频QA系统斯坦福大学

架构上图是VideoAgent的概览图，VideoAgent通过搜索、聚合视频信息来完成长视频QA，整个系统包括一个核心LLM、VLM，视觉大语言模型，和CLIP工具，作者受到人类理解长视频的启发，提出了VideoAgent，通过基于Agent的系统来模拟这一过程的系统，将视频理解过程形式化为一系列...

2024-11-14 250

百货

文件上传之秒传 SpringBoot 分片上传断点续传实战

在日常开发中，文件上传的场景多种多样，比如，在线教育平台上的视频资源上传，社交平台上的图片分享，以及企业内部的知识文档管理等，这些场景对文件上传的要求也各不相同，有的追求速度，有的注重稳定性，还有的需要考虑文件大小和安全性，因此，针对不同需求，我们有了秒传、断点续传和分片上传等解决方案，...。...

2024-11-14 206

头条

去哪儿国际酒店AI生成视频实践

嘉宾，郑吉敏编辑，李美涵出品，技术栈，微信号，blog51cto，本文整理自去哪儿旅行技术总监郑吉敏在WOT2024大会上的主题分享，更多精彩内容及现场PPT，请关注技术栈公众号，发送，WOT，即可直接领取，日前，在主办的WOT全球技术创新大会上，去哪儿旅行技术总监郑吉敏带来了主题演讲，国际酒店AI...

2024-11-14 239

包包服装

百度内容生态视频AIGC新探索

嘉宾，张宝玉编辑，云昭出品，技术栈，微信号，blog51cto，本文整理自百度内容生态内容架构技术负责人张宝玉WOT2024大会上的主题分享，更多精彩内容及现场PPT，请关注技术栈公众号，发送，WOT，即可直接领取，日前，在主办的WOT全球技术创新大会上，百度内容生态内容架构技术负责人张宝玉带来了主...

2024-11-14 637

包含"视频"标签的文章