工具说明

多模态工具

拓展医学教育的表达维度，支持图像、影像和音频三种模态的内容生成。

工具一览

工具	功能
图像创作	AI 生成医学相关图像
影像渲染	姿态与动作相关影像生成
音频合成	AI 音频对话生成

应用场景

多模态工具可以单独使用，也可与 CSTAR 教学框架结合：

图像创作 — 为病例生成解剖示意图、病理图片等视觉辅助材料
影像渲染 — 生成医学操作演示视频或患者体征动画
音频合成 — 为病例生成标准化的语音描述或问诊对话音频

模型配置

不同的多模态任务可能需要不同的 AI 模型。在设置面板中可以为每个工具选择适合的模型：

图像创作 — 推荐使用支持图像生成的模型
影像渲染 — 需要视频生成能力的模型
音频合成 — 推荐 TTS 能力强的模型