跳转至

模型分类

TTS系列

TTS(Text-to-Speech)模型是一种将书面文字转换为语音的技术,使计算机可以“读出”文本。它通过将输入的文本解析成语音单元,然后生成自然听起来的语音。TTS 模型常用于导航系统、虚拟助手和有声读物等应用场景。

以下模型都已支持购买:

  • MaaS-Ele
  • MaaS-nar
  • MaaS ASpeech
  • MaaS OSpeech

MaaS-Ele

MaaS-Ele 是一个基于 AI 的文本转语音和语音克隆的模型,提供多种功能和服务

  1. 高质量语音生成:MaaS-Ele 的 AI 语音生成器能够以极高的保真度渲染人类语调和语气,根据上下文调整语音的传递。
  2. 多语言支持:支持32种语言和超过100种语音,适用于游戏、视频、播客等多种内容的语音生成。
  3. 语音克隆:提供语音克隆功能,用户可以创建独特的语音,并进行自定义设置。
  4. 多样化应用:适用于文本转语音、语音到语音、配音和音效生成等多种应用场景。
  5. 高级功能:相比其他文本转语音服务,MaaS-Ele提供更丰富的功能,包括电话格式支持和多语言生成。
  6. 项目支持:对于需要生成更长内容的用户,推荐使用项目功能来处理超长文本内容。
  7. 生成限制:每次生成最多可处理5,000个字符。

MaaS-Ele的文本转语音服务支持以下音频输出格式:

  • MP3
  • WAV

默认情况下,网站上生成的音频是 MP3 格式,但也可以选择其他格式,如 PCM 和 μ-law 格式。

MaaS-nar

MaaS-nar 是一个使用 AI 技术将文本转换为自然语音的模型,适用于创建视频、电子学习模块和有声书等多种内容,适合需要快速生成高质量语音内容的用户。

  1. 多语言支持:MaaS-nar 提供超过700种语音,支持100种语言,适合制作多种类型的音频和视频内容。
  2. 多样化的语音选择:可以选择不同年龄、性别和语调的语音,适用于培训材料、故事和有声书等。
  3. 简单易用:只需输入文本,选择语音选项,即可快速生成专业音频或视频。
  4. 高效生产:MaaS-nar 能将 Word 文档转换为 MP3、M4A 或 WAV 格式的自然语音,节省录音和编辑时间。

MaaS-nar的文本转语音服务支持以下音频输出格式:

  • MP3
  • M4A
  • WAV

这些格式适用于各种用途,包括创建视频、电子学习模块和有声书等。

MaaS ASpeech

MaaS-ASpeech使用语音生成技术生成高质量、自然的语音输出。该模型利用了最先进的机器学习和深度学习技术来实现高品质的语音合成效果,经过大量的语音和文本数据训练,以便在语音自然度、清晰度和情感表达等方面达到高标准。

  1. 高自然度的语音输出:利用深度学习技术,生成的语音更加接近人类自然发音,具备流畅的语调和情感表达。

  2. 多语言和多语种支持:支持多种语言和方言,能够为全球用户提供本地化的语音体验

  3. 快速响应和低延迟:采用优化的算法和高性能云计算资源,能够提供快速响应的语音生成体验,即使在大规模使用情况下也能保持低延迟。

  4. 高可用性和可扩展性:基于云平台,具有高度的可靠性和可扩展性,适合多种应用场景,从小型应用到大型企业级应用。

MaaS OSpeech

MaaS OSpeech通过深度学习和神经网络技术对输入的文本进行处理,然后生成高品质、自然的语音输出。该模型经过大量的语音数据训练,能够理解并合成各种语调和情感的语音。

  1. 自然逼真的语音输出:使用最先进的深度学习技术,生成的语音比传统TTS系统更加自然、流畅,具有人类发音的情感和语调变化。

  2. 多语言、多口音支持:支持多种语言和口音,适应不同地区和文化的用户需求,实现本地化的语音合成。

  3. 实时响应:借助云平台强大的计算能力,MaaS OSpeech模型能够快速处理和生成语音,满足实时交互应用的需求。

MaaS-C系列

MaaS-C是一个强大的自然语言处理模型,它的优势在于其强大的语言理解和生成能力。它可以理解复杂的语义关系和上下文信息,并生成质量高、流畅自然的文本。

以下模型都已支持购买:

  • MaaS-3.5 Sonnet
  • MaaS-3 Sonnet
  • MaaS-3 Haiku

MaaS-Ge系列

MaaS-Ge模型是一个高性能、多任务处理的人工智能模型,具有卓越的精度和效率。它能够高效处理多种不同类型的任务,展示出强大的适应性和灵活性。此外,MaaS-Ge模型的设计注重可扩展性,使其能够在各种应用场景中轻松部署和优化,满足不同业务需求。

以下模型都已支持购买:

  • MaaS-1.0 Pro
  • MaaS-1.5 Pro
  • MaaS-1.5 Flash

MaaS-GP系列

MaaS-4o 在单个模型中集成文本和图像,从而能够同时处理多个数据类型。 这种多模式方法提高了人机交互的准确性和响应能力。 MaaS-4o 在英语文本和编码任务方面与 MaaS-4 Turbo 相当,但在非英语语言和视觉任务方面具有更优越的性能,为 AI 功能设定了新的基准。

MaaS-4o

版本 说明 最大请求/tokens 支持状态
MaaS-4o mini(2024-07-18) 最新的小型 GA 模型
1.速度快、价格低廉、功能强大的模型,是替代 MaaS 3.5 Turbo 系列型号的理想选择。
2.文本、图像处理
3.JSON 模式
4.并行函数调用
5.不支持增强功能
输入:128,000
输出:16,384
已支持
MaaS-4o(2024-05-13) 最新的大型 GA 模型
1.文本、图像处理.
2.JSON Mode.
3. 并行函数调用.
4. 提高准确性和响应能力.
5.在英语文本和编码任务方面与支持视觉的 MaaS-4 Turbo 相当.
6.在非英语语言和视觉任务方面具有更优越的性能.
7.不支持增强功能
输入: 128,000
输出: 4,096
已支持

MaaS-4 Turbo

MaaS-4 Turbo 是一个大型多模态模型(接受文本或图像输入并生成文本),与 MaaS-3.5 Turbo 和较旧的 MaaS-4 模型一样,MaaS-4 Turbo 针对聊天进行了优化,能够很好地完成传统的补全任务。

版本 说明 最大请求/tokens 支持状态
MaaS-4 turbo-2024-04-09 最新 GA 模型
1.所有 MaaS-4 预览模型(vision-preview、1106-Preview、0125-Preview)的替代项。
2.功能可用性目前因输入的方法和部署类型而异。
3.不支持增强功能。
输入: 128,000
输出: 4,096
已支持

这是以下预览版模型的替代品:

  • MaaS-4版本:1106-Preview
  • MaaS-4版本:0125-Preview
  • MaaS-4版本:vision-preview

MaaS-4

MaaS-4 是 MaaS-4 Turbo 的前身。 MaaS-4 模型和 MaaS-4 Turbo 模型的基础模型名称均为 MaaS-4。 可以通过检查模型版本来区分 MaaS-4 模型和 Turbo 模型。

版本 说明 最大请求/tokens 支持状态
MaaS-4 (0125-Preview)
MaaS-4 Turbo 预览版
预览模型
1. 替换了 1106-Preview
2. 更好的代码生成性能
3.减少模型未完成任务的情况
4. JSON 模式
5.并行函数调用
6.可重现的输出(预览版)
输入: 128,000
输出: 4,096
已支持
MaaS-4 (vision-preview)
包含视觉功能预览版的 MaaS-4 Turbo
预览模型
1. 接受文本和图像输入
2. 支持增强功能
3. JSON 模式
4.并行函数调用
5.可重现的输出(预览版)
输入: 128,000
输出: 4,096
已支持
MaaS-4 (1106-Preview)
MaaS-4 Turbo 预览版
预览模型
1. JSON 模式
2.并行函数调用
3.可重现的输出(预览版)
输入: 128,000
输出: 4,096
已支持
MaaS-4-32k (0613) 旧版 GA 模型
1. 使用工具调用基本函数
32,768 按需申请
MaaS-4 (0613) 旧版 GA 模型
1. 使用工具调用基本函数
8,192 按需申请
MaaS-4-32k(0314) 旧版 GA 模型 32,768 按需申请
MaaS-4(0314) 旧版 GA 模型 8,192 按需申请
  • 与 MaaS-4-1106-preview 相比,MaaS-4 版本 0125-preview 更完整地完成了代码生成等任务。 因此,根据任务的不同,客户可能会发现 MaaS-4-0125-preview 比 MaaS-4-1106-preview 生成更多输出。 我们建议客户比较新模型的输出。 MaaS-4-0125-preview 还解决了 MaaS-4-1106-preview 中针对非英语语言的 UTF-8 处理中的 bug。 MaaS-4 版本 turbo-2024-04-09 是最新的 GA 版本,取代了 0125-Preview、1106-preview 和 vision-preview。

MaaS-3.5

MaaS-3.5 模型可以理解和生成自然语言或代码。 MaaS-3.5 系列中功能最强大且最具成本效益的模型是 MaaS-3.5 Turbo,该模型已针对聊天进行了优化,且能够很好地完成传统的补全任务。 MaaS-3.5 Turbo 可用于聊天完成 API。 MaaS-3.5 Turbo 指令具有与使用完成 API 而不是聊天完成 API 类似的功能 text-davinci-003。

版本 说明 最大请求/tokens 支持状态
MaaS-3.5-turbo-0125 最新GA模型
1. JSON模式
2.并行函数调用
3.可重现的输出(预览版)
4.以请求的格式响应的准确度更高
5.修复了导致非英语函数调用的文本编码问题的 bug
输入: 16,385
输出: 4,096
已支持
MaaS-35-turbo (1106) 旧版GA模型
1. JSON模式
2.并行函数调用
3.可重现的输出(预览版)
输入: 16,385
输出: 4,096
按需申请
MaaS-35-turbo-instruct (0914) 仅限完成终结点 4,097 已支持
MaaS-35-turbo-16k (0613) 旧版GA模型
1. 使用工具调用基本函数
16,384 按需申请
MaaS-35-turbo (0613) 旧版GA模型
1. 使用工具调用基本函数
4,096 按需申请
MaaS-5-turbo (0301) 旧版GA模型
4,096 按需申请

Embeddings

MaaS-embedding-3-large 是最新且能力最强的嵌入模型。 无法在嵌入模型之间进行升级。 若要从使用 text-embedding-ada-002 转移到 MaaS-embedding-3-large,你需要生成新的嵌入内容。

以下模型都已支持购买:

  • MaaS-embedding-3-large
  • MaaS-embedding-3-small
  • MaaS-embedding-ada-002

DALL·E

MaaS-DALL-E 模型根据用户提供的文本提示生成图像。 MaaS-DALL-E 3 可通过 REST API 供公众使用。

以下模型都已支持购买:

  • MaaS--DALL-E 3
  • MaaS--DALL-E 2