MiniMax推出MMX-CLI以提供AI代理本机多模式访问

该工具使用 TypeScript 构建并针对 Node.js 18+ 进行了优化，专门用于弥补 AI 代理（如 Claude Code 或 Cursor）的差距，传统上这些代理很难在没有复杂的 API 集成或额外的模型上下文协议 (MCP) 层的情况下生成媒体。

Kerem Gülen · April 13, 2026, 16:13 ·1 min read

MiniMax 为其 AI 平台发布了 MMX-CLI，这是一个基于 Node.js 的命令行界面，使开发人员和 AI 代理能够直接访问生成功能。

MMX-CLI 解决了基于大型语言模型 (LLM) 的代理所面临的挑战，这些代理很难在没有额外集成层的情况下生成媒体。新界面允许用户直接作为 shell 命令调用各种媒体生成函数，从而无需模型上下文协议。

该界面将 MiniMax 的功能集成到七个命令组中：mmx 文本、mmx 图像、mmx 视频、mmx 语音、mmx 音乐、mmx 视觉和 mmx 搜索。每个命令都提供为开发人员和人工智能应用程序量身定制的特定功能。

mmx 文本命令支持多回合聊天并针对特定的 MiniMax 模型变体。它默认使用 MiniMax-M2.7，允许高级文本生成任务。 mmx image 命令允许根据文本提示生成图像，提供跨多个输出的宽高比和主题一致性选项。此功能有助于需要视觉连续性的工作流程。 mmx 视频命令利用 MiniMax-Hailuo-2.3 进行视频生成，并提供同步轮询或异步任务跟踪选项。用户可以使用命令的标志指定视频生成的起始帧。

MMX-CLI 的 mmx 语音命令具有 30 多种文本转语音的功能。它允许用户调整速度、音量和音高等参数，同时支持字幕计时。输入限制为 10,000 个字符。

使用 mmx 音乐命令，用户可以从文本输入生成音乐并定义各种作曲参数，例如流派和乐器。还包括嵌入水印的选项。 mmx Vision命令使用视觉语言模型来解释图像，从而允许用户通过提示查询图像的内容。

mmx 搜索命令有助于 Web 搜索，以文本或 JSON 格式返回结果。命令结构和底层技术架构都针对各种环境的可用性进行了优化。 MMX-CLI 主要使用 TypeScript 开发，与 Node.js 18+ 兼容。它的部署非常简单，具有结构化错误处理和对双区域 API 路由的支持。

MiniMax表示，MMX-CLI通过为不同的媒体生成功能提供统一的工具，显着降低了AI开发的集成障碍。这与人工智能代理的简单设置相结合，简化了构建智能应用程序的过程。

<小时/>

精选图片来源

微软在威斯康星州推出费尔沃特人工智能数据中心

MiniMax推出MMX-CLI以提供AI代理本机多模式访问

Related Stories

OpenAI 获准于 7 月 9 日向公众推出 GPT-5.6 模型

Meta 推出工具来检测人工智能生成的带有隐形水印的图像

Claude Cowork 现在可以通过手机运行任务

苹果在 beta 3 中带来了更多个性化的 Siri 语音控制