资讯

共有 214 篇文章
Text-to-CAD :通过文本提示生成 CAD文件
Text-to-CAD :通过文本提示生成 CAD文件

只需要输入自然语言描述,它就能根据这些描述创建相应的 B-Rep CAD 文件和网格模型。 生成的模型可以导入到用户选择的任何 CAD 程序中。 Text-to-CAD 背后的基础设施利用了 Zoo …

Google发布新的视频模型:VideoPoet
Google发布新的视频模型:VideoPoet

它可以根据文字描述来生成视频。但它不是基于扩散模型,而本身就是个LLM,可以理解和处理多模态信息,并将它们融合到视频生成过程中。 不仅能生成视频,还能给视频加上风格化的效果,还可修复和扩展视频,甚至从…

Gaussian-SLAM:能够从视频流中重建出逼真的3D场景
Gaussian-SLAM:能够从视频流中重建出逼真的3D场景

通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。 然后利用这些图像数据来创建、还原可以从各个角度观察的3D模型,重建现实世界场景。 而是这个过程…

ChatGPT发布一周年之回顾与展望
ChatGPT发布一周年之回顾与展望

自去年11月底ChatGPT横空出世,已经过去了近一年的时间。 在本期视频中,将回顾GPT在过去一年的发展历程, 并结合OpenAI的研发方向和Sam Altman最新访谈内容, 展望GPT5的实际形…

Zero2Story互动故事生成器,一键创建新故事
Zero2Story互动故事生成器,一键创建新故事

Zero2Story :一个互动故事生成器,从零开始创建一键创建互动故事,包括插画和背景音乐。 用户可以自定义故事的类型、背景、地点、情感氛围,以及角色的各种属性。然后,系统会根据这些设置生成故事。 …

更多