拓展医学教育的表达维度,支持图像、影像和音频三种模态的内容生成。
多模态工具可以单独使用,也可与 CSTAR 教学框架结合:
- 图像创作 — 为病例生成解剖示意图、病理图片等视觉辅助材料
- 影像渲染 — 生成医学操作演示视频或患者体征动画
- 音频合成 — 为病例生成标准化的语音描述或问诊对话音频
不同的多模态任务可能需要不同的 AI 模型。在设置面板中可以为每个工具选择适合的模型:
- 图像创作 — 推荐使用支持图像生成的模型
- 影像渲染 — 需要视频生成能力的模型
- 音频合成 — 推荐 TTS 能力强的模型