Meta开源的大规模预训练Transformer模型工具库,支持多模态模型开发
微软研究院的统一多模态预训练模型,实现跨模态任务的统一框架
百度文心大模型的多模态交互能力,支持文本、图像、语音等综合理解
AI数字人多模态交互平台,实现文本、语音、视觉的综合智能交互
阿里云推出的多模态AI对话平台,支持文本、图像、语音等多种交互方式
Runway推出的多模态AI视频生成模型,支持文本、图像到视频的综合交互