工具说明

多模态工具

拓展医学教育的表达维度,支持图像、影像和音频三种模态的内容生成。

工具一览

工具功能
图像创作AI 生成医学相关图像
影像渲染姿态与动作相关影像生成
音频合成AI 音频对话生成

应用场景

多模态工具可以单独使用,也可与 CSTAR 教学框架结合:

  • 图像创作 — 为病例生成解剖示意图、病理图片等视觉辅助材料
  • 影像渲染 — 生成医学操作演示视频或患者体征动画
  • 音频合成 — 为病例生成标准化的语音描述或问诊对话音频

模型配置

不同的多模态任务可能需要不同的 AI 模型。在设置面板中可以为每个工具选择适合的模型:

  • 图像创作 — 推荐使用支持图像生成的模型
  • 影像渲染 — 需要视频生成能力的模型
  • 音频合成 — 推荐 TTS 能力强的模型