通义千问大语言模型介绍

发布时间:2025-09-12 23:42

自我介绍时保持语言流畅,清晰易懂 #生活常识# #社交技巧# #自我介绍#

通义千问是由阿里云自主研发的大模型,用于理解和分析用户输入的自然语言,以及图片、视频等多模态数据。在不同领域和任务为用户提供服务和帮助。您可以通过提供尽可能清晰详细的指令,来获取符合您预期的结果。

模型体验

您可以在模型体验中心(新加坡或北京)试用通义千问模型。

应用场景

通义千问凭借其强大的语言及多模态数据处理能力,为用户带来高效、智能的语言服务体验,其能力包括但不限于文字创作、翻译服务和对话模拟等,具体应用场景如下:

文字创作:撰写故事、公文、邮件、剧本和诗歌等。

文本处理:润色文本和提取文本摘要等。

编程辅助:编写和优化代码等。

翻译服务:提供各类语言的翻译服务,如英语、日语、法语或西班牙语等。

对话模拟:扮演不同角色进行交互式对话。

数据可视化:图表制作和数据呈现等。

模型列表

新加坡

北京

商业版

开源版

文本生成-通义千问

以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。

商业版模型参数量暂不透出。各模型会不定期更新升级。如需使用固定版本,请选择快照版本。快照版本通常维护至下个快照版本发布时间的后一个月。建议优先使用稳定版或最新版,限流条件更宽松。

通义千问Max

通义千问系列效果最好的模型,适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验

通义千问Max 模型暂不支持深度思考。

Qwen3-Max

Qwen-Max

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-max-preview

预览版

262,144

258,048

65,536

阶梯计价,请参见表格下方说明。

100万Token

有效期:百炼开通后90天内

qwen3-max-preview 模型根据输入 Token数,采取阶梯计费。

输入Token数

输入价格(每百万Token)

qwen3-max-preview 支持上下文缓存。

输出价格(每百万Token)

0-32K

$1.2

$6

32K-128K

$2.4

$12

128K-252K

$3

$15

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-max

当前与qwen-max-2025-01-25能力相同

稳定版

32,768

30,720

8,192

$1.6

Batch调用半价

$6.4

Batch调用半价

各100万Token

有效期:百炼开通后90天内

qwen-max-latest

始终与最新快照版能力相同

最新版

$1.6

$6.4

qwen-max-2025-01-25

又称qwen-max-0125、Qwen2.5-Max

快照版

通义千问Plus

能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Flash之间,适合中等复杂任务。使用方法 | API参考 | 在线体验|深度思考

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-plus

当前与qwen-plus-2025-04-28能力相同属于Qwen3系列

稳定版

131,072

思考模式

98,304

非思考模式

129,024

16,384

思维链最长38,912

$0.4

Batch调用半价

思考模式

$4

非思考模式

$1.2

Batch调用半价

各100万Token

有效期:百炼开通后90天内

qwen-plus-latest

始终与最新快照版能力相同属于Qwen3系列

最新版

1,000,000

思考模式

995,904

非思考模式

997,952

默认129,024,可通过max_input_tokens 参数调整

32,768

思维链最长81,920

阶梯计价,请参见表格下方说明。

qwen-plus-2025-07-28

又称qwen-plus-0728属于Qwen3系列

快照版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-07-14

又称qwen-plus-0714属于Qwen3系列

131,072

思考模式

98,304

非思考模式

129,024

16,384

思维链最长38,912

$0.4

思考模式

$4

非思考模式

$1.2

qwen-plus-2025-04-28

又称qwen-plus-0428属于Qwen3系列

qwen-plus-2025-01-25

又称qwen-plus-0125

129,024

8,192

$1.2

qwen-plus-latest和qwen-plus-2025-07-28 根据本次请求输入的 Token数,采取阶梯计费。

输入Token数

输入价格(每百万Token)

模式

输出价格(每百万Token)

0-256K

$0.4

非思考模式

$1.2

思考模式

$4

256K-1M

$1.2

非思考模式

$3.6

思考模式

$12

qwen-plus-2025-07-28、qwen-plus-2025-07-14、qwen-plus-2025-04-28、qwen-plus-latest 与 qwen-plus 模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:

推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

Agent 能力:在思考、非思考两种模式下都达到业界领先水平,能精准调用外部工具。

多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

支持的语言

英语(English)

简体中文(Simplified Chinese)

繁体中文(Traditional Chinese)

法语(French)

西班牙语(Spanish)

阿拉伯语(Arabic),使用阿拉伯字母。是众多阿拉伯国家的官方语言。

俄语(Russian),使用西里尔字母。在俄罗斯及其他一些国家是官方语言。

葡萄牙语(Portuguese),使用拉丁字母。在葡萄牙、巴西和其他葡萄牙语国家是官方语言。

德语(German),使用拉丁字母。在德国和奥地利等地是官方语言。

意大利语(Italian),使用拉丁字母。在意大利、圣马力诺以及瑞士的部分地区是官方语言。

荷兰语(Dutch),使用拉丁字母。在荷兰、比利时部分地区(弗拉芒地区)和苏里南是官方语言。

丹麦语(Danish),使用拉丁字母。在丹麦是官方语言。

爱尔兰语(Irish),使用拉丁字母。在爱尔兰是官方语言之一。

威尔士语(Welsh),使用拉丁字母。在威尔士使用,是官方语言之一。

芬兰语(Finnish),使用拉丁字母。在芬兰是官方语言。

冰岛语(Icelandic),使用拉丁字母。在冰岛是官方语言。

瑞典语(Swedish),使用拉丁字母。是瑞典的官方语言。

新挪威语(Norwegian Nynorsk),使用拉丁字母。在挪威与书面挪威语共同使用,属主流语言的一部分。

书面挪威语(Norwegian Bokmål),使用拉丁字母。在挪威使用,是主流语言的一部分。

日语(Japanese),使用日文字母。在日本是官方语言。

朝鲜语/韩语(Korean),使用韩字(Hangul)。在韩国和朝鲜是官方语言。

越南语(Vietnamese),使用拉丁字母。在越南是官方语言。

泰语(Thai),使用泰文字母。在泰国是官方语言。

印度尼西亚语(Indonesian),使用拉丁字母。是印度尼西亚的官方语言。

马来语(Malay),使用拉丁字母。是马来西亚等地的主要语言。

缅甸语(Burmese),使用缅甸字母。在缅甸是官方语言。

他加禄语(Tagalog),使用拉丁字母。菲律宾的主要语言之一。

高棉语(Khmer),使用高棉字母。在柬埔寨是官方语言。

老挝语(Lao),使用老挝字母。在老挝是官方语言。

印地语(Hindi),使用天城文(Devanagari)。是印度的官方语言之一。

孟加拉语(Bengali),使用孟加拉字母。在孟加拉国和印度西孟加拉邦是官方语言。

乌尔都语(Urdu),使用阿拉伯字母。在巴基斯坦是官方语言之一,也在印度使用。

尼泊尔语(Nepali),使用天城字母。在尼泊尔是官方语言。

希伯来语(Hebrew),使用希伯来字母。在以色列是官方语言。

土耳其语(Turkish),使用拉丁字母。在土耳其和塞浦路斯北部是官方语言。

波斯语(Persian),使用阿拉伯字母。在伊朗和塔吉克斯坦等地是官方语言。

波兰语(Polish),使用拉丁字母。在波兰是官方语言。

乌克兰语(Ukrainian),使用西里尔字母。在乌克兰是官方语言。

捷克语(Czech),使用拉丁字母。在捷克是官方语言。

罗马尼亚语(Romanian),使用拉丁字母。在罗马尼亚和摩尔多瓦是官方语言。

保加利亚语(Bulgarian),使用西里尔字母。在保加利亚是官方语言。

斯洛伐克语(Slovak),使用拉丁字母。在斯洛伐克是官方语言。

匈牙利语(Hungarian),使用拉丁字母。在匈牙利是官方语言。

斯洛文尼亚语(Slovenian),使用拉丁字母。在斯洛文尼亚是官方语言。

拉脱维亚语(Latvian),使用拉丁字母。在拉脱维亚是官方语言。

爱沙尼亚语(Estonian),使用拉丁字母。在爱沙尼亚是官方语言。

立陶宛语(Lithuanian),使用拉丁字母。在立陶宛是官方语言。

白俄罗斯语(Belarusian),使用西里尔字母。在白俄罗斯是官方语言之一。

希腊语(Greek),使用希腊字母。在希腊和塞浦路斯是官方语言。

克罗地亚语(Croatian),使用拉丁字母。在克罗地亚是官方语言。

马其顿语(Macedonian),使用西里尔字母。是北马其顿的官方语言。

马耳他语(Maltese),使用拉丁字母。在马耳他是官方语言。

塞尔维亚语(Serbian),使用西里尔字母。在塞尔维亚是官方语言。

波斯尼亚语(Bosnian),使用拉丁字母。在波斯尼亚和黑塞哥维那是官方语言之一。

格鲁吉亚语(Georgian),使用格鲁吉亚字母(Georgian script)。在格鲁吉亚是官方语言。

亚美尼亚语(Armenian),使用亚美尼亚字母。在亚美尼亚是官方语言。

北阿塞拜疆语(North Azerbaijani),使用拉丁字母。在阿塞拜疆是官方语言。

哈萨克语(Kazakh),使用西里尔字母。在哈萨克斯坦是官方语言。

北乌兹别克语(Northern Uzbek),使用拉丁字母。在乌兹别克斯坦是官方语言。

塔吉克语(Tajik),使用西里尔字母。在塔吉克斯坦是官方语言。

斯瓦西里语(Swahili),使用拉丁字母。在东非许多国家是通用语或官方语言。

南非语(Afrikaans),使用拉丁字母。主要在南非和纳米比亚使用。

粤语(Cantonese),使用繁体字。主要在中国广东省、香港和澳门使用,是这些地区的主要语言之一。

卢森堡语(Luxembourgish),使用拉丁字母。在卢森堡和德国部分地区使用,是官方语言之一。

林堡语(Limburgish),使用拉丁字母。主要在荷兰、比利时和德国部分地区使用。

加泰罗尼亚语(Catalan),使用拉丁字母。在加泰罗尼亚和其他部分西班牙地区使用。

加利西亚语(Galician),使用拉丁字母。主要在西班牙加利西亚地区使用。

阿斯图里亚斯语(Asturian),使用拉丁字母。主要在西班牙阿斯图里亚斯地区使用。

巴斯克语(Basque),使用拉丁字母。主要在西班牙和法国的巴斯克地区使用,是西班牙巴斯克自治区的官方语言之一。

奥克语(Occitan),使用拉丁字母。主要在法国南部地区使用。

威尼斯语(Venetian),使用拉丁字母。主要在意大利威尼斯地区使用。

撒丁语(Sardinian),使用拉丁字母。主要在意大利撒丁岛使用。

西西里语(Sicilian),使用拉丁字母。主要在意大利西西里岛使用。

弗留利语(Friulian),使用拉丁字母。主要在意大利弗留利-威尼斯朱利亚使用。

隆巴底语(Lombard),使用拉丁字母。主要在意大利伦巴第地区使用。

利古里亚语(Ligurian),使用拉丁字母。主要在意大利利古里亚地区使用。

法罗语(Faroese),使用拉丁字母。主要在法罗群岛使用,是法罗群岛的官方语言之一。

托斯克阿尔巴尼亚语(Tosk Albanian),使用拉丁字母。主要是阿尔巴尼亚南部方言。

西里西亚语(Silesian),使用拉丁字母。主要在波兰使用。

巴什基尔语(Bashkir),使用西里尔字母。主要在俄罗斯巴什科尔托斯坦使用。

鞑靼语(Tatar),使用西里尔字母。主要在俄罗斯塔塔尔斯坦使用。

美索不达米亚阿拉伯语(Mesopotamian Arabic),使用阿拉伯字母。主要在伊拉克使用。

内志阿拉伯语(Najdi Arabic),使用阿拉伯字母。主要在沙特阿拉伯的内志地区使用。

埃及阿拉伯语(Egyptian Arabic),使用阿拉伯字母。主要在埃及使用。

黎凡特阿拉伯语(Levantine Arabic),使用阿拉伯字母。主要在叙利亚和黎巴嫩使用。

闪米特阿拉伯语(Ta'izzi-Adeni Arabic),使用阿拉伯字母。主要在也门和沙特阿拉伯的哈德拉莫区域使用。

达里语(Dari),使用阿拉伯字母。在阿富汗是官方语言之一。

突尼斯阿拉伯语(Tunisian Arabic),使用阿拉伯字母。主要在突尼斯使用。

摩洛哥阿拉伯语(Moroccan Arabic),使用阿拉伯字母。主要在摩洛哥使用。

克里奥尔语(Kabuverdianu),使用拉丁字母。主要在佛得角使用。

托克皮辛语(Tok Pisin),使用拉丁字母。在巴布亚新几内亚是主要的通用语之一。

意第绪(Eastern Yiddish),使用希伯来字母。主要在犹太社区中使用。

信德阿拉伯语(Sindhi),使用阿拉伯字母。在巴基斯坦信德省是官方语言之一。

僧伽罗语(Sinhala),使用僧伽罗字母。在斯里兰卡是官方语言之一。

泰卢固语(Telugu),使用泰卢固字母。在印度安得拉邦和特伦甘纳邦是官方语言之一。

旁遮普语(Punjabi),使用古尔穆奇字母。在印度旁遮普邦使用,是印度的官方语言之一。

泰米尔语(Tamil),使用泰米尔字母。在印度泰米尔纳德邦和斯里兰卡是官方语言之一。

古吉拉特语(Gujarati),使用古吉拉特字母。在印度古吉拉特邦是官方语言之一。

马拉雅拉姆语(Malayalam),使用马拉雅拉姆字母。在印度喀拉拉邦是官方语言之一。

马拉地语(Marathi),使用天城字母。在印度马哈拉施特拉邦是官方语言之一。

卡纳达语(Kannada),使用卡纳达字母。在印度卡纳塔克邦是官方语言之一。

马加拉语(Magahi),使用天城文本。主要在印度比哈尔邦使用。

奥里亚语(Oriya),使用乌尔都语字母。在印度奥迪沙邦是官方语言之一。

阿瓦德语(Awadhi),使用天城字母。主要在印度北方邦使用。

迈蒂利语(Maithili),使用天城字母。在印度比哈尔邦和尼泊尔特莱平原使用,是印度的官方语言之一。

阿萨姆语(Assamese),使用孟加拉字母。在印度阿萨姆邦是官方语言之一。

切蒂斯格尔语(Chhattisgarhi),使用天城字母。主要在印度切蒂斯格尔邦使用。

比哈尔语(Bhojpuri),使用天城字母。在印度和尼泊尔部分地区使用。

米南加保语(Minangkabau),使用拉丁字母。主要在印度尼西亚苏门答腊岛使用。

巴厘语(Balinese),使用拉丁字母。主要在印度尼西亚巴厘岛使用。

爪哇语(Javanese),使用拉丁字母(也惯用爪哇文字)。在印度尼西亚爪哇岛广泛使用。

班章语(Banjar),使用拉丁字母。主要在印度尼西亚加里曼丹岛使用。

巽他语(Sundanese),使用拉丁字母(虽然传统上使用巽他文字)。主要在印度尼西亚爪哇岛的西部使用。

宿务语(Cebuano),使用拉丁字母。主要在菲律宾宿务地区使用。

邦阿西楠语(Pangasinan),使用拉丁字母。主要在菲律宾邦阿西楠语省使用。

伊洛卡诺语(Iloko),使用拉丁字母。主要在菲律宾使用。

瓦莱语(Waray (Philippines)),使用拉丁字母。主要在菲律宾使用。

海地语(Haitian),使用拉丁字母。在海地是官方语言之一。

帕皮阿门托语(Papiamento),使用拉丁字母。主要在加勒比地区如阿鲁巴岛和库拉索岛使用。

回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

通义千问Flash

通义千问系列速度最快、成本极低的模型,适合简单任务。通义千问Flash采用灵活的阶梯定价,计费更合理。使用方法 | API参考 | 在线体验 | 思考模式

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-flash

当前与 qwen-flash-2025-07-28能力相同属于Qwen3系列

Batch调用半价

稳定版

1,000,000

思考模式

995,904

非思考模式

997,952

32,768

思维链最长81,920

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

qwen-flash-2025-07-28

属于Qwen3系列

快照版

qwen-flash 和 qwen-flash-2025-07-28根据本次请求输入的 Token数,采取阶梯计费,其中qwen-flash支持缓存和 Batch调用。

输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0-256K

$0.05

$0.4

256K-1M

$0.25

$2

通义千问Turbo

通义千问Turbo 后续不再更新,建议替换为通义千问Flash。通义千问Flash采用灵活的阶梯定价,计费更合理。使用方法 | API参考 | 在线体验|深度思考

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-turbo

当前与qwen-turbo-2025-04-28能力相同属于Qwen3系列

稳定版

思考模式

131,072

非思考模式

1,000,000

思考模式

98,304

非思考模式

1,000,000

16,384

思维链最长38,912

$0.05

Batch调用半价

思考模式:$0.5

非思考模式:$0.2

Batch调用半价

各100万Token

有效期:百炼开通后90天内

qwen-turbo-latest

始终与最新快照版能力相同属于Qwen3系列

最新版

$0.05

思考模式:$0.5

非思考模式:$0.2

qwen-turbo-2025-04-28

又称qwen-turbo-0428属于Qwen3系列

快照版

qwen-turbo-2024-11-01

又称qwen-turbo-1101

1,000,000

1,000,000

8,192

$0.2

最新的qwen-turbo-2025-04-28与qwen-turbo-latest模型具备思考模式和非思考模式的回复能力,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:

推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

Agent 能力:在推理、非推理两种模式下都达到业界领先水平,能够实现精准的外部工具调用。

多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

支持的语言

英语(English)

简体中文(Simplified Chinese)

繁体中文(Traditional Chinese)

法语(French)

西班牙语(Spanish)

阿拉伯语(Arabic),使用阿拉伯字母。是众多阿拉伯国家的官方语言。

俄语(Russian),使用西里尔字母。在俄罗斯及其他一些国家是官方语言。

葡萄牙语(Portuguese),使用拉丁字母。在葡萄牙、巴西和其他葡萄牙语国家是官方语言。

德语(German),使用拉丁字母。在德国和奥地利等地是官方语言。

意大利语(Italian),使用拉丁字母。在意大利、圣马力诺以及瑞士的部分地区是官方语言。

荷兰语(Dutch),使用拉丁字母。在荷兰、比利时部分地区(弗拉芒地区)和苏里南是官方语言。

丹麦语(Danish),使用拉丁字母。在丹麦是官方语言。

爱尔兰语(Irish),使用拉丁字母。在爱尔兰是官方语言之一。

威尔士语(Welsh),使用拉丁字母。在威尔士使用,是官方语言之一。

芬兰语(Finnish),使用拉丁字母。在芬兰是官方语言。

冰岛语(Icelandic),使用拉丁字母。在冰岛是官方语言。

瑞典语(Swedish),使用拉丁字母。是瑞典的官方语言。

新挪威语(Norwegian Nynorsk),使用拉丁字母。在挪威与书面挪威语共同使用,属主流语言的一部分。

书面挪威语(Norwegian Bokmål),使用拉丁字母。在挪威使用,是主流语言的一部分。

日语(Japanese),使用日文字母。在日本是官方语言。

朝鲜语/韩语(Korean),使用韩字(Hangul)。在韩国和朝鲜是官方语言。

越南语(Vietnamese),使用拉丁字母。在越南是官方语言。

泰语(Thai),使用泰文字母。在泰国是官方语言。

印度尼西亚语(Indonesian),使用拉丁字母。是印度尼西亚的官方语言。

马来语(Malay),使用拉丁字母。是马来西亚等地的主要语言。

缅甸语(Burmese),使用缅甸字母。在缅甸是官方语言。

他加禄语(Tagalog),使用拉丁字母。菲律宾的主要语言之一。

高棉语(Khmer),使用高棉字母。在柬埔寨是官方语言。

老挝语(Lao),使用老挝字母。在老挝是官方语言。

印地语(Hindi),使用天城文(Devanagari)。是印度的官方语言之一。

孟加拉语(Bengali),使用孟加拉字母。在孟加拉国和印度西孟加拉邦是官方语言。

乌尔都语(Urdu),使用阿拉伯字母。在巴基斯坦是官方语言之一,也在印度使用。

尼泊尔语(Nepali),使用天城字母。在尼泊尔是官方语言。

希伯来语(Hebrew),使用希伯来字母。在以色列是官方语言。

土耳其语(Turkish),使用拉丁字母。在土耳其和塞浦路斯北部是官方语言。

波斯语(Persian),使用阿拉伯字母。在伊朗和塔吉克斯坦等地是官方语言。

波兰语(Polish),使用拉丁字母。在波兰是官方语言。

乌克兰语(Ukrainian),使用西里尔字母。在乌克兰是官方语言。

捷克语(Czech),使用拉丁字母。在捷克是官方语言。

罗马尼亚语(Romanian),使用拉丁字母。在罗马尼亚和摩尔多瓦是官方语言。

保加利亚语(Bulgarian),使用西里尔字母。在保加利亚是官方语言。

斯洛伐克语(Slovak),使用拉丁字母。在斯洛伐克是官方语言。

匈牙利语(Hungarian),使用拉丁字母。在匈牙利是官方语言。

斯洛文尼亚语(Slovenian),使用拉丁字母。在斯洛文尼亚是官方语言。

拉脱维亚语(Latvian),使用拉丁字母。在拉脱维亚是官方语言。

爱沙尼亚语(Estonian),使用拉丁字母。在爱沙尼亚是官方语言。

立陶宛语(Lithuanian),使用拉丁字母。在立陶宛是官方语言。

白俄罗斯语(Belarusian),使用西里尔字母。在白俄罗斯是官方语言之一。

希腊语(Greek),使用希腊字母。在希腊和塞浦路斯是官方语言。

克罗地亚语(Croatian),使用拉丁字母。在克罗地亚是官方语言。

马其顿语(Macedonian),使用西里尔字母。是北马其顿的官方语言。

马耳他语(Maltese),使用拉丁字母。在马耳他是官方语言。

塞尔维亚语(Serbian),使用西里尔字母。在塞尔维亚是官方语言。

波斯尼亚语(Bosnian),使用拉丁字母。在波斯尼亚和黑塞哥维那是官方语言之一。

格鲁吉亚语(Georgian),使用格鲁吉亚字母(Georgian script)。在格鲁吉亚是官方语言。

亚美尼亚语(Armenian),使用亚美尼亚字母。在亚美尼亚是官方语言。

北阿塞拜疆语(North Azerbaijani),使用拉丁字母。在阿塞拜疆是官方语言。

哈萨克语(Kazakh),使用西里尔字母。在哈萨克斯坦是官方语言。

北乌兹别克语(Northern Uzbek),使用拉丁字母。在乌兹别克斯坦是官方语言。

塔吉克语(Tajik),使用西里尔字母。在塔吉克斯坦是官方语言。

斯瓦西里语(Swahili),使用拉丁字母。在东非许多国家是通用语或官方语言。

南非语(Afrikaans),使用拉丁字母。主要在南非和纳米比亚使用。

粤语(Cantonese),使用繁体字。主要在中国广东省、香港和澳门使用,是这些地区的主要语言之一。

卢森堡语(Luxembourgish),使用拉丁字母。在卢森堡和德国部分地区使用,是官方语言之一。

林堡语(Limburgish),使用拉丁字母。主要在荷兰、比利时和德国部分地区使用。

加泰罗尼亚语(Catalan),使用拉丁字母。在加泰罗尼亚和其他部分西班牙地区使用。

加利西亚语(Galician),使用拉丁字母。主要在西班牙加利西亚地区使用。

阿斯图里亚斯语(Asturian),使用拉丁字母。主要在西班牙阿斯图里亚斯地区使用。

巴斯克语(Basque),使用拉丁字母。主要在西班牙和法国的巴斯克地区使用,是西班牙巴斯克自治区的官方语言之一。

奥克语(Occitan),使用拉丁字母。主要在法国南部地区使用。

威尼斯语(Venetian),使用拉丁字母。主要在意大利威尼斯地区使用。

撒丁语(Sardinian),使用拉丁字母。主要在意大利撒丁岛使用。

西西里语(Sicilian),使用拉丁字母。主要在意大利西西里岛使用。

弗留利语(Friulian),使用拉丁字母。主要在意大利弗留利-威尼斯朱利亚使用。

隆巴底语(Lombard),使用拉丁字母。主要在意大利伦巴第地区使用。

利古里亚语(Ligurian),使用拉丁字母。主要在意大利利古里亚地区使用。

法罗语(Faroese),使用拉丁字母。主要在法罗群岛使用,是法罗群岛的官方语言之一。

托斯克阿尔巴尼亚语(Tosk Albanian),使用拉丁字母。主要是阿尔巴尼亚南部方言。

西里西亚语(Silesian),使用拉丁字母。主要在波兰使用。

巴什基尔语(Bashkir),使用西里尔字母。主要在俄罗斯巴什科尔托斯坦使用。

鞑靼语(Tatar),使用西里尔字母。主要在俄罗斯塔塔尔斯坦使用。

美索不达米亚阿拉伯语(Mesopotamian Arabic),使用阿拉伯字母。主要在伊拉克使用。

内志阿拉伯语(Najdi Arabic),使用阿拉伯字母。主要在沙特阿拉伯的内志地区使用。

埃及阿拉伯语(Egyptian Arabic),使用阿拉伯字母。主要在埃及使用。

黎凡特阿拉伯语(Levantine Arabic),使用阿拉伯字母。主要在叙利亚和黎巴嫩使用。

闪米特阿拉伯语(Ta'izzi-Adeni Arabic),使用阿拉伯字母。主要在也门和沙特阿拉伯的哈德拉莫区域使用。

达里语(Dari),使用阿拉伯字母。在阿富汗是官方语言之一。

突尼斯阿拉伯语(Tunisian Arabic),使用阿拉伯字母。主要在突尼斯使用。

摩洛哥阿拉伯语(Moroccan Arabic),使用阿拉伯字母。主要在摩洛哥使用。

克里奥尔语(Kabuverdianu),使用拉丁字母。主要在佛得角使用。

托克皮辛语(Tok Pisin),使用拉丁字母。在巴布亚新几内亚是主要的通用语之一。

意第绪(Eastern Yiddish),使用希伯来字母。主要在犹太社区中使用。

信德阿拉伯语(Sindhi),使用阿拉伯字母。在巴基斯坦信德省是官方语言之一。

僧伽罗语(Sinhala),使用僧伽罗字母。在斯里兰卡是官方语言之一。

泰卢固语(Telugu),使用泰卢固字母。在印度安得拉邦和特伦甘纳邦是官方语言之一。

旁遮普语(Punjabi),使用古尔穆奇字母。在印度旁遮普邦使用,是印度的官方语言之一。

泰米尔语(Tamil),使用泰米尔字母。在印度泰米尔纳德邦和斯里兰卡是官方语言之一。

古吉拉特语(Gujarati),使用古吉拉特字母。在印度古吉拉特邦是官方语言之一。

马拉雅拉姆语(Malayalam),使用马拉雅拉姆字母。在印度喀拉拉邦是官方语言之一。

马拉地语(Marathi),使用天城字母。在印度马哈拉施特拉邦是官方语言之一。

卡纳达语(Kannada),使用卡纳达字母。在印度卡纳塔克邦是官方语言之一。

马加拉语(Magahi),使用天城文本。主要在印度比哈尔邦使用。

奥里亚语(Oriya),使用乌尔都语字母。在印度奥迪沙邦是官方语言之一。

阿瓦德语(Awadhi),使用天城字母。主要在印度北方邦使用。

迈蒂利语(Maithili),使用天城字母。在印度比哈尔邦和尼泊尔特莱平原使用,是印度的官方语言之一。

阿萨姆语(Assamese),使用孟加拉字母。在印度阿萨姆邦是官方语言之一。

切蒂斯格尔语(Chhattisgarhi),使用天城字母。主要在印度切蒂斯格尔邦使用。

比哈尔语(Bhojpuri),使用天城字母。在印度和尼泊尔部分地区使用。

米南加保语(Minangkabau),使用拉丁字母。主要在印度尼西亚苏门答腊岛使用。

巴厘语(Balinese),使用拉丁字母。主要在印度尼西亚巴厘岛使用。

爪哇语(Javanese),使用拉丁字母(也惯用爪哇文字)。在印度尼西亚爪哇岛广泛使用。

班章语(Banjar),使用拉丁字母。主要在印度尼西亚加里曼丹岛使用。

巽他语(Sundanese),使用拉丁字母(虽然传统上使用巽他文字)。主要在印度尼西亚爪哇岛的西部使用。

宿务语(Cebuano),使用拉丁字母。主要在菲律宾宿务地区使用。

邦阿西楠语(Pangasinan),使用拉丁字母。主要在菲律宾邦阿西楠语省使用。

伊洛卡诺语(Iloko),使用拉丁字母。主要在菲律宾使用。

瓦莱语(Waray (Philippines)),使用拉丁字母。主要在菲律宾使用。

海地语(Haitian),使用拉丁字母。在海地是官方语言之一。

帕皮阿门托语(Papiamento),使用拉丁字母。主要在加勒比地区如阿鲁巴岛和库拉索岛使用。

回复格式问题修复:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

QwQ

基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。使用方法

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwq-plus

稳定版

131,072

98,304

32,768

8,192

$0.8

$2.4

100万 Token

有效期:百炼开通后90天内

通义千问Omni

通义千问全新多模态理解生成大模型,支持文本、图像、语音与视频输入,并输出文本与音频,提供了4种自然对话音色。使用方法|API 参考

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo

当前与qwen-omni-turbo-2025-03-26能力相同

稳定版

32,768

30,720

2,048

各100万Token(不区分模态)

有效期:百炼开通后90天内

qwen-omni-turbo-latest

始终与最新快照版 能力相同

最新版

qwen-omni-turbo-2025-03-26

又称qwen-omni-turbo-0326

快照版

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.07

输入:音频

$4.44

输入:图片/视频

$0.21

输出计费项

单价(每百万 Token)

输出:文本

$0.27(输入仅包含文本时)

$0.63(输入包含图片/音频/视频时)

输出:文本+音频

$8.89(音频)

输出的文本不计费。通义千问Omni-Realtime

相比于通义千问Omni,支持音频的流式输入,且内置 VAD(Voice Activity Detection,语音活动检测)功能,可自动检测用户语音的开始和结束。

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo-realtime

当前能力等同 qwen-omni-turbo-realtime-2025-05-08

稳定版

32,768

30,720

2,048

各100万Token(不区分模态)

有效期:百炼开通后90天内

qwen-omni-turbo-realtime-latest

能力始终等同最新快照版

最新版

qwen-omni-turbo-realtime-2025-05-08

快照版

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.270

输入:音频

$4.440

输入:图片

$0.840

输出计费项

单价(每百万Token)

输出:文本

$1.070(输入仅包含文本时)

$2.520(输入包含图片/音频时)

输出:文本+音频

$8.890(音频)

输出的文本不计费。

QVQ

QVQ是视觉推理模型,支持视觉输入及思维链输出,在数学、编程、视觉分析、创作以及通用任务上都表现了更强的能力。使用方法

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qvq-max

当前与 qvq-max-2025-03-25能力相同

稳定版

131,072

106,496

单图最大16384

16,384

8,192

$1.2

$4.8

各100万 Token

有效期:百炼开通后90天内

qvq-max-latest

始终与最新快照版能力相同

最新版

qvq-max-2025-03-25

又称qvq-max-0325

快照版

通义千问VL

通义千问VL是具有视觉(图像)理解能力的文本生成模型,有通义千问VL-MAX和通义千问VL-PLUS两种系列。不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。如何使用 | API参考 | 在线体验

通义千问VL模型按输入和输出的总Token数进行计费。图像Token的计算规则:每28x28像素对应一个Token,一张图最少需要4个Token。详细计算规则请参见视觉理解。

通义千问VL-Max系列

通义千问VL-Plus系列

通义千问VL系列能力最强的模型。以下模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-vl-max

相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。当前与qwen-vl-max-2025-04-08能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.8

$3.2

各100万Token

有效期:百炼开通后90天内

qwen-vl-max-latest

始终与最新快照版能力相同

最新版

qwen-vl-max-2025-08-13

又称qwen-vl-max-0813视觉理解指标全面提升,数学、推理、物体识别、多语言处理能力显著增强。

快照版

qwen-vl-max-2025-04-08

又称qwen-vl-max-0408属于Qwen2.5-VL系列模型,扩展上下文至128k,显著增强数学和推理能力。

通义千问VL-Plus模型在效果、成本上比较均衡。以下模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-vl-plus

当前与qwen-vl-plus-2025-05-07能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.21

$0.63

各100万Token

有效期:百炼开通后90天内

qwen-vl-plus-latest

始终与最新快照版能力相同

最新版

qwen-vl-plus-2025-08-15

又称qwen-vl-plus-0815在物体识别与定位、多语言处理的能力上有显著提升

快照版

qwen-vl-plus-2025-05-07

又称qwen-vl-plus-0507显著提升数学、推理、监控视频内容的理解能力

qwen-vl-plus-2025-01-25

又称qwen-vl-plus-0125属于Qwen2.5-VL系列模型,扩展上下文至128k,显著增强图像和视频的理解能力。通义千问OCR

通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。使用方法 | API参考|在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入输出单价

免费额度

(注)

(Token数)

(每百万Token)

qwen-vl-ocr

稳定版

34,096

30,000

单图最大30000

4096

$0.72

各100万Token

有效期:百炼开通后90天内

通义千问Coder

通义千问代码模型。最新的 Qwen3-Coder 系列模型是基于 Qwen3 的代码生成模型,具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程、代码能力卓越的同时兼具通用能力。使用方法 | API参考

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-coder-plus

当前与qwen3-coder-plus-2025-07-22能力相同

稳定版

1,000,000

997,952

65,536

阶梯计价,请参见表格下方说明。

各100万Token

有效期:百炼开通后90天内

qwen3-coder-plus-2025-07-22

快照版

qwen3-coder-flash

当前与qwen3-coder-flash-2025-07-28能力相同

稳定版

qwen3-coder-flash-2025-07-28

快照版

上述模型根据本次请求输入的Token数,采取阶梯计费。

qwen3-coder-plus系列

qwen3-coder-flash系列

qwen3-coder-plus 和 qwen3-coder-plus-2025-07-22 价格如下,其中 qwen3-coder-plus 支持上下文缓存:

输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0-32K

$1

$5

32K-128K

$1.8

$9

128K-256K

$3

$15

256K-1M

$6

$60

qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 价格如下,其中 qwen3-coder-flash 支持上下文缓存:

输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0-32K

$0.3

$1.5

32K-128K

$0.5

$2.5

128K-256K

$0.8

$4

256K-1M

$1.6

$9.6

通义千问翻译模型

基于 Qwen 3全面升级的旗舰级翻译大模型,支持92个语种(包括中、英、日、韩、法、西、德、泰、印尼、越、阿等)互译,模型性能和翻译效果全面升级,提供更稳定的术语定制、格式还原度、领域提示能力,让译文更精准、自然。使用方法

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen-mt-plus

4,096

2,048

2,048

$2.46

$7.37

各100万Token

有效期:百炼开通后90天内

qwen-mt-turbo

$0.16

$0.49

文本生成-通义千问-开源版

模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。

百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen3和Qwen2.5模型。

Qwen3

2025 年 7月发布的 qwen3-235b-a22b-thinking-2507 模型仅支持思考模式,是qwen3-235b-a22b(思考模式)的升级版。

2025 年 7月发布的 qwen3-235b-a22b-instruct-2507 模型仅支持非思考模式,是qwen3-235b-a22b(非思考模式)的升级版。

2025 年 7月发布的 qwen3-30b-a3b-thinking-2507模型仅支持思考模式,是qwen3-30b-a3b (思考模式)的升级版。

2025 年 7月发布的 qwen3-30b-a3b-instruct-2507模型仅支持非思考模式,是qwen3-30b-a3b (非思考模式)的升级版。

2025 年 4月发布的 Qwen3 模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,Qwen3 模型的能力得到了大幅提升:

推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

Agent 能力:在推理、非推理两种模式下都达到业界领先水平,能够实现精准的外部工具调用。

多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

支持的语言

英语(English)

简体中文(Simplified Chinese)

繁体中文(Traditional Chinese)

法语(French)

西班牙语(Spanish)

阿拉伯语(Arabic),使用阿拉伯字母。是众多阿拉伯国家的官方语言。

俄语(Russian),使用西里尔字母。在俄罗斯及其他一些国家是官方语言。

葡萄牙语(Portuguese),使用拉丁字母。在葡萄牙、巴西和其他葡萄牙语国家是官方语言。

德语(German),使用拉丁字母。在德国和奥地利等地是官方语言。

意大利语(Italian),使用拉丁字母。在意大利、圣马力诺以及瑞士的部分地区是官方语言。

荷兰语(Dutch),使用拉丁字母。在荷兰、比利时部分地区(弗拉芒地区)和苏里南是官方语言。

丹麦语(Danish),使用拉丁字母。在丹麦是官方语言。

爱尔兰语(Irish),使用拉丁字母。在爱尔兰是官方语言之一。

威尔士语(Welsh),使用拉丁字母。在威尔士使用,是官方语言之一。

芬兰语(Finnish),使用拉丁字母。在芬兰是官方语言。

冰岛语(Icelandic),使用拉丁字母。在冰岛是官方语言。

瑞典语(Swedish),使用拉丁字母。是瑞典的官方语言。

新挪威语(Norwegian Nynorsk),使用拉丁字母。在挪威与书面挪威语共同使用,属主流语言的一部分。

书面挪威语(Norwegian Bokmål),使用拉丁字母。在挪威使用,是主流语言的一部分。

日语(Japanese),使用日文字母。在日本是官方语言。

朝鲜语/韩语(Korean),使用韩字(Hangul)。在韩国和朝鲜是官方语言。

越南语(Vietnamese),使用拉丁字母。在越南是官方语言。

泰语(Thai),使用泰文字母。在泰国是官方语言。

印度尼西亚语(Indonesian),使用拉丁字母。是印度尼西亚的官方语言。

马来语(Malay),使用拉丁字母。是马来西亚等地的主要语言。

缅甸语(Burmese),使用缅甸字母。在缅甸是官方语言。

他加禄语(Tagalog),使用拉丁字母。菲律宾的主要语言之一。

高棉语(Khmer),使用高棉字母。在柬埔寨是官方语言。

老挝语(Lao),使用老挝字母。在老挝是官方语言。

印地语(Hindi),使用天城文(Devanagari)。是印度的官方语言之一。

孟加拉语(Bengali),使用孟加拉字母。在孟加拉国和印度西孟加拉邦是官方语言。

乌尔都语(Urdu),使用阿拉伯字母。在巴基斯坦是官方语言之一,也在印度使用。

尼泊尔语(Nepali),使用天城字母。在尼泊尔是官方语言。

希伯来语(Hebrew),使用希伯来字母。在以色列是官方语言。

土耳其语(Turkish),使用拉丁字母。在土耳其和塞浦路斯北部是官方语言。

波斯语(Persian),使用阿拉伯字母。在伊朗和塔吉克斯坦等地是官方语言。

波兰语(Polish),使用拉丁字母。在波兰是官方语言。

乌克兰语(Ukrainian),使用西里尔字母。在乌克兰是官方语言。

捷克语(Czech),使用拉丁字母。在捷克是官方语言。

罗马尼亚语(Romanian),使用拉丁字母。在罗马尼亚和摩尔多瓦是官方语言。

保加利亚语(Bulgarian),使用西里尔字母。在保加利亚是官方语言。

斯洛伐克语(Slovak),使用拉丁字母。在斯洛伐克是官方语言。

匈牙利语(Hungarian),使用拉丁字母。在匈牙利是官方语言。

斯洛文尼亚语(Slovenian),使用拉丁字母。在斯洛文尼亚是官方语言。

拉脱维亚语(Latvian),使用拉丁字母。在拉脱维亚是官方语言。

爱沙尼亚语(Estonian),使用拉丁字母。在爱沙尼亚是官方语言。

立陶宛语(Lithuanian),使用拉丁字母。在立陶宛是官方语言。

白俄罗斯语(Belarusian),使用西里尔字母。在白俄罗斯是官方语言之一。

希腊语(Greek),使用希腊字母。在希腊和塞浦路斯是官方语言。

克罗地亚语(Croatian),使用拉丁字母。在克罗地亚是官方语言。

马其顿语(Macedonian),使用西里尔字母。是北马其顿的官方语言。

马耳他语(Maltese),使用拉丁字母。在马耳他是官方语言。

塞尔维亚语(Serbian),使用西里尔字母。在塞尔维亚是官方语言。

波斯尼亚语(Bosnian),使用拉丁字母。在波斯尼亚和黑塞哥维那是官方语言之一。

格鲁吉亚语(Georgian),使用格鲁吉亚字母(Georgian script)。在格鲁吉亚是官方语言。

亚美尼亚语(Armenian),使用亚美尼亚字母。在亚美尼亚是官方语言。

北阿塞拜疆语(North Azerbaijani),使用拉丁字母。在阿塞拜疆是官方语言。

哈萨克语(Kazakh),使用西里尔字母。在哈萨克斯坦是官方语言。

北乌兹别克语(Northern Uzbek),使用拉丁字母。在乌兹别克斯坦是官方语言。

塔吉克语(Tajik),使用西里尔字母。在塔吉克斯坦是官方语言。

斯瓦西里语(Swahili),使用拉丁字母。在东非许多国家是通用语或官方语言。

南非语(Afrikaans),使用拉丁字母。主要在南非和纳米比亚使用。

粤语(Cantonese),使用繁体字。主要在中国广东省、香港和澳门使用,是这些地区的主要语言之一。

卢森堡语(Luxembourgish),使用拉丁字母。在卢森堡和德国部分地区使用,是官方语言之一。

林堡语(Limburgish),使用拉丁字母。主要在荷兰、比利时和德国部分地区使用。

加泰罗尼亚语(Catalan),使用拉丁字母。在加泰罗尼亚和其他部分西班牙地区使用。

加利西亚语(Galician),使用拉丁字母。主要在西班牙加利西亚地区使用。

阿斯图里亚斯语(Asturian),使用拉丁字母。主要在西班牙阿斯图里亚斯地区使用。

巴斯克语(Basque),使用拉丁字母。主要在西班牙和法国的巴斯克地区使用,是西班牙巴斯克自治区的官方语言之一。

奥克语(Occitan),使用拉丁字母。主要在法国南部地区使用。

威尼斯语(Venetian),使用拉丁字母。主要在意大利威尼斯地区使用。

撒丁语(Sardinian),使用拉丁字母。主要在意大利撒丁岛使用。

西西里语(Sicilian),使用拉丁字母。主要在意大利西西里岛使用。

弗留利语(Friulian),使用拉丁字母。主要在意大利弗留利-威尼斯朱利亚使用。

隆巴底语(Lombard),使用拉丁字母。主要在意大利伦巴第地区使用。

利古里亚语(Ligurian),使用拉丁字母。主要在意大利利古里亚地区使用。

法罗语(Faroese),使用拉丁字母。主要在法罗群岛使用,是法罗群岛的官方语言之一。

托斯克阿尔巴尼亚语(Tosk Albanian),使用拉丁字母。主要是阿尔巴尼亚南部方言。

西里西亚语(Silesian),使用拉丁字母。主要在波兰使用。

巴什基尔语(Bashkir),使用西里尔字母。主要在俄罗斯巴什科尔托斯坦使用。

鞑靼语(Tatar),使用西里尔字母。主要在俄罗斯塔塔尔斯坦使用。

美索不达米亚阿拉伯语(Mesopotamian Arabic),使用阿拉伯字母。主要在伊拉克使用。

内志阿拉伯语(Najdi Arabic),使用阿拉伯字母。主要在沙特阿拉伯的内志地区使用。

埃及阿拉伯语(Egyptian Arabic),使用阿拉伯字母。主要在埃及使用。

黎凡特阿拉伯语(Levantine Arabic),使用阿拉伯字母。主要在叙利亚和黎巴嫩使用。

闪米特阿拉伯语(Ta'izzi-Adeni Arabic),使用阿拉伯字母。主要在也门和沙特阿拉伯的哈德拉莫区域使用。

达里语(Dari),使用阿拉伯字母。在阿富汗是官方语言之一。

突尼斯阿拉伯语(Tunisian Arabic),使用阿拉伯字母。主要在突尼斯使用。

摩洛哥阿拉伯语(Moroccan Arabic),使用阿拉伯字母。主要在摩洛哥使用。

克里奥尔语(Kabuverdianu),使用拉丁字母。主要在佛得角使用。

托克皮辛语(Tok Pisin),使用拉丁字母。在巴布亚新几内亚是主要的通用语之一。

意第绪(Eastern Yiddish),使用希伯来字母。主要在犹太社区中使用。

信德阿拉伯语(Sindhi),使用阿拉伯字母。在巴基斯坦信德省是官方语言之一。

僧伽罗语(Sinhala),使用僧伽罗字母。在斯里兰卡是官方语言之一。

泰卢固语(Telugu),使用泰卢固字母。在印度安得拉邦和特伦甘纳邦是官方语言之一。

旁遮普语(Punjabi),使用古尔穆奇字母。在印度旁遮普邦使用,是印度的官方语言之一。

泰米尔语(Tamil),使用泰米尔字母。在印度泰米尔纳德邦和斯里兰卡是官方语言之一。

古吉拉特语(Gujarati),使用古吉拉特字母。在印度古吉拉特邦是官方语言之一。

马拉雅拉姆语(Malayalam),使用马拉雅拉姆字母。在印度喀拉拉邦是官方语言之一。

马拉地语(Marathi),使用天城字母。在印度马哈拉施特拉邦是官方语言之一。

卡纳达语(Kannada),使用卡纳达字母。在印度卡纳塔克邦是官方语言之一。

马加拉语(Magahi),使用天城文本。主要在印度比哈尔邦使用。

奥里亚语(Oriya),使用乌尔都语字母。在印度奥迪沙邦是官方语言之一。

阿瓦德语(Awadhi),使用天城字母。主要在印度北方邦使用。

迈蒂利语(Maithili),使用天城字母。在印度比哈尔邦和尼泊尔特莱平原使用,是印度的官方语言之一。

阿萨姆语(Assamese),使用孟加拉字母。在印度阿萨姆邦是官方语言之一。

切蒂斯格尔语(Chhattisgarhi),使用天城字母。主要在印度切蒂斯格尔邦使用。

比哈尔语(Bhojpuri),使用天城字母。在印度和尼泊尔部分地区使用。

米南加保语(Minangkabau),使用拉丁字母。主要在印度尼西亚苏门答腊岛使用。

巴厘语(Balinese),使用拉丁字母。主要在印度尼西亚巴厘岛使用。

爪哇语(Javanese),使用拉丁字母(也惯用爪哇文字)。在印度尼西亚爪哇岛广泛使用。

班章语(Banjar),使用拉丁字母。主要在印度尼西亚加里曼丹岛使用。

巽他语(Sundanese),使用拉丁字母(虽然传统上使用巽他文字)。主要在印度尼西亚爪哇岛的西部使用。

宿务语(Cebuano),使用拉丁字母。主要在菲律宾宿务地区使用。

邦阿西楠语(Pangasinan),使用拉丁字母。主要在菲律宾邦阿西楠语省使用。

伊洛卡诺语(Iloko),使用拉丁字母。主要在菲律宾使用。

瓦莱语(Waray (Philippines)),使用拉丁字母。主要在菲律宾使用。

海地语(Haitian),使用拉丁字母。在海地是官方语言之一。

帕皮阿门托语(Papiamento),使用拉丁字母。主要在加勒比地区如阿鲁巴岛和库拉索岛使用。

回复格式问题修复:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

2025 年 4月发布的Qwen3 开源模型在思考模式下不支持非流式输出方式。Qwen3 开源模型开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

思考模式 | 非思考模式 | 使用方法

模型名称

模式

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen3-235b-a22b-thinking-2507

仅支持思考模式

131,072

126,976

81,920

32,768

$0.7

$8.4

各100万 Token

有效期:百炼开通后90天内

qwen3-235b-a22b-instruct-2507

不支持思考模式

129,024

-

$0.7

$2.8

各100万 Token

有效期:百炼开通后90天内

qwen3-30b-a3b-thinking-2507

仅支持思考模式

126,976

81,920

$0.2

$2.4

qwen3-30b-a3b-instruct-2507

不支持思考模式

129,024

-

$0.8

qwen3-235b-a22b

本模型与以下模型均于2025 年 4月发布

非思考

129,024

-

16,384

$0.7

$2.8

思考

98,304

38,912

$8.4

qwen3-32b

非思考

129,024

-

$2.8

思考

98,304

38,912

$8.4

qwen3-30b-a3b

非思考

129,024

-

$0.2

$0.8

思考

98,304

38,912

$2.4

qwen3-14b

非思考

129,024

-

8,192

$0.35

$1.4

思考

98,304

38,912

$4.2

qwen3-8b

非思考

129,024

-

$0.18

$0.7

思考

98,304

38,912

$2.1

qwen3-4b

非思考

129,024

-

$0.11

$0.42

思考

98,304

38,912

$1.26

qwen3-1.7b

非思考

32,768

30,720

-

$0.42

思考

28,672

与输入相加不超过30,720

$1.26

qwen3-0.6b

非思考

30,720

-

$0.42

思考

28,672

与输入相加不超过30,720

$1.26

Qwen2.5

Qwen2.5是Qwen大型语言模型系列。针对Qwen2.5,我们发布了一系列基础语言模型和指令调优语言模型,参数规模从70亿到720亿不等。Qwen2.5在Qwen2基础上进行了以下改进:

在我们最新的大规模数据集上进行预训练,包含多达18万亿个Token。

由于我们在这些领域的专业专家模型,模型的知识显著增多,编码和数学能力也大幅提高。

在遵循指令、生成长文本(超过8K个标记)、理解结构化数据(例如表格)和生成结构化输出(尤其是JSON)方面有显著改进。对系统提示的多样性更具弹性,增强了聊天机器人的角色扮演实现和条件设置。

支持超过29种语言,包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。

使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每百万Token)

qwen2.5-14b-instruct-1m

1,008,192

1,000,000

8,192

$0.805

$3.22

各100万 Token

有效期:百炼开通后90天内

qwen2.5-7b-instruct-1m

$0.368

$1.47

qwen2.5-72b-instruct

131,072

129,024

$1.4

$5.6

qwen2.5-32b-instruct

$0.7

$2.8

qwen2.5-14b-instruct

$0.35

$1.4

qwen2.5-7b-instruct

$0.175

$0.7

Qwen-Omni

基于Qwen2.5训练的全新多模态理解生成大模型,支持文本、图像、语音、视频输入理解,具备文本和语音同时流式生成的能力,多模态内容理解速度显著提升。使用方法|API 参考

模型名称

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen2.5-omni-7b

32,768

30,720

2,048

100万Token(不区分模态)

有效期:百炼开通后90天内

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.10

输入:音频

$6.76

输入:图片/视频

$0.28

输出计费项

单价(每百万 Token)

输出:文本

$0.40(输入仅包含文本时)

$0.84(输入包含图片/音频/视频时)

输出:文本+音频

$13.51(音频)

输出的文本不计费。

Qwen-VL

阿里云的通义千问VL开源版。使用方法 | API参考

其中,Qwen2.5-VL在Qwen2-VL的基础上做了如下改进:

感知更丰富的世界:Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫等,还能分析图像中的文本、图表、图标、图形和布局等。

长视频理解能力:支持对长视频文件(最长10分钟)进行理解,具备通过精准定位相关视频片段来捕捉事件的新能力

视觉定位:Qwen2.5-VL可通过生成bounding box(矩形框的左上角和右下角坐标)或者point(矩形框的中心点坐标)来准确定位图像中的物体,并能够为坐标和属性提供稳定的JSON输出。

结构化输出:可支持对发票、表单、表格等数据进行结构化输出,惠及金融、商业等领域的应用。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每百万Token)

qwen2.5-vl-72b-instruct 

131,072

129,024

单图最大16384

8,192

$2.8

$8.4

各100万 Token

有效期:百炼开通后90天内

qwen2.5-vl-32b-instruct

$1.4

$4.2

qwen2.5-vl-7b-instruct

$0.35

$1.05

qwen2.5-vl-3b-instruct

$0.21

$0.63

商业版

开源版

文本生成-通义千问

以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。

各模型会不定期更新升级。如需使用固定版本,请选择快照版本。快照版本通常维护至下个快照版本发布时间的后一个月。建议优先使用稳定版或最新版,限流条件更宽松。通义千问Max

通义千问系列效果最好的模型,适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验

Qwen3-Max

Qwen-Max

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen3-max-preview

预览版

262,144

258,048

65,536

阶梯计价,请参见表格下方说明。

qwen3-max-preview 模型根据输入 Token数,采取阶梯计费。

输入Token数

输入价格(每百万Token)

qwen3-max-preview 支持上下文缓存。

输出价格(每百万Token)

0-32K

$0.861

$3.441

32K-128K

$1.434

$5.735

128K-252K

$2.151

$8.602

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-max

当前与qwen-max-2024-09-19能力相同

稳定版

32,768

30,720

8,192

$0.345

$1.377

qwen-max-latest

始终与最新快照版能力相同

最新版

131,072

129,024

qwen-max-2025-01-25

又称qwen-max-0125、Qwen2.5-Max

快照版

qwen-max-2024-09-19

又称qwen-max-0919

32,768

30,720

$2.868

$8.602

通义千问Plus

能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。

使用方法 | API参考 | 在线体验|思考模式

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-plus

当前与qwen-plus-2025-04-28能力相同属于Qwen3系列

稳定版

131,072

思考模式

98,304

非思考模式

129,024

16,384

思维链最长38,912

$0.115

思考模式

$1.147

非思考模式

$0.287

qwen-plus-latest

始终与最新快照版能力相同属于Qwen3系列

最新版

1,000,000

思考模式

995,904

非思考模式

997,952

默认129,024,可通过max_input_tokens 参数调整

32,768

思维链最长81,920

阶梯计价,请参见表格下方说明。

qwen-plus-2025-07-28

又称qwen-plus-0728属于Qwen3系列

快照版

思考模式

995,904

非思考模式

997,952

qwen-plus-2025-07-14

又称qwen-plus-0714属于Qwen3系列

131,072

思考模式

98,304

非思考模式

129,024

16,384

思维链最长38,912

$0.115

思考模式

$1.147

非思考模式

$0.287

qwen-plus-2025-04-28

又称qwen-plus-0428属于Qwen3系列

qwen-plus-latest和qwen-plus-2025-07-28 根据本次请求输入的 Token数,采取阶梯计费。

输入Token数

输入价格(每百万Token)

模式

输出价格(每百万Token)

0-128K

$0.115

非思考模式

$0.287

思考模式

$1.147

128K-256K

$0.345

非思考模式

$2.868

思考模式

$3.441

256K-1M

$0.689

非思考模式

$6.881

思考模式

$9.175

上述模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:

推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

Agent 能力:在思考、非思考两种模式下都达到业界领先水平,能精准调用外部工具。

多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

对于上述模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

更多历史快照模型

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-plus-2025-01-25

又称qwen-plus-0125

快照版

131,072

129,024

8,192

$0.115

$0.287

qwen-plus-2025-01-12

又称qwen-plus-0112

qwen-plus-2024-12-20

又称qwen-plus-1220

qwen-plus-2024-11-27

又称qwen-plus-1127

qwen-plus-2024-11-25

又称qwen-plus-1125

qwen-plus-2024-09-19

又称qwen-plus-0919

qwen-plus-2024-08-06

又称qwen-plus-0806

128,000

$0.574

$1.721

通义千问Flash

通义千问系列速度最快、成本极低的模型,适合简单任务。通义千问Flash采用灵活的阶梯定价,计费更合理。使用方法| API参考 | 深度思考

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qwen-flash

当前与 qwen-flash-2025-07-28能力相同属于Qwen3系列

稳定版

1,000,000

1,044,480

32,768

81,920

阶梯计价,请参见表格下方说明。

qwen-flash-2025-07-28

又称qwen-flash-0728

快照版

qwen-flash 和 qwen-flash-2025-07-28根据本次请求输入的 Token数,采取阶梯计费,其中qwen-flash支持上下文缓存。

输入Token数

输入价格(每百万Token)

输出价格(每百万Token)

0-128K

$0.022

$0.216

128K-256K

$0.087

$0.861

256K-1M

$0.173

$1.721

通义千问Turbo

通义千问Turbo 后续不再更新,建议替换为通义千问Flash。通义千问Flash采用灵活的阶梯定价,计费更合理。使用方法 | API参考 | 在线体验|思考模式

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-turbo

当前与 qwen-turbo-2025-04-28能力相同属于Qwen3系列

稳定版

思考模式

131,072

非思考模式

1,000,000

思考模式

98,304

非思考模式

1,000,000

16,384

思维链最长38,912

$0.044

思考模式

$0.431

非思考模式

$0.087

qwen-turbo-latest

始终与最新快照版能力相同属于Qwen3系列

最新版

qwen-turbo-2025-07-15

又称qwen-turbo-0715属于Qwen3系列

快照版

qwen-turbo-2025-04-28

又称qwen-turbo-0428属于Qwen3系列

上述模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:

推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

Agent 能力:在思考、非思考模式下都达到业界领先水平,能精准调用外部工具。

多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

对于上述模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

更多历史快照模型

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-turbo-2025-02-11

又称qwen-turbo-0211

快照版

1,000,000

1,000,000

8,192

$0.044

$0.087

qwen-turbo-2024-11-01

又称qwen-turbo-1101

qwen-turbo-2024-09-19

又称qwen-turbo-0919

131,072

129,024

QwQ

基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。使用方法

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qwq-plus

当前与qwq-plus-2025-03-05能力相同

稳定版

131,072

98,304

32,768

8,192

$0.230

$0.574

qwq-plus-latest

始终与最新快照版能力相同

最新版

qwq-plus-2025-03-05

又称qwq-plus-0305

快照版

通义千问Long

通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。使用方法 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-long-latest

始终与最新快照版能力相同

稳定版

10,000,000

10,000,000

8,192

$0.072

$0.287

qwen-long-2025-01-25

又称qwen-long-0125

快照版

通义千问Omni

通义千问全新多模态理解生成大模型,支持文本、图像、语音与视频输入,并输出文本与音频,提供了4种自然对话音色。使用方法|API 参考

模型名称

版本

上下文长度

最大输入

最大输出

(Token数)

qwen-omni-turbo

当前与qwen-omni-turbo-2025-03-26能力相同

稳定版

32,768

30,720

2,048

qwen-omni-turbo-latest

始终与最新快照版 能力相同

最新版

qwen-omni-turbo-2025-03-26

又称qwen-omni-turbo-0326

快照版

qwen-omni-turbo-2025-01-19

又称qwen-omni-turbo-0119

输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.058

输入:音频

$3.584

输入:图片/视频

$0.216

输出计费项

单价(每百万 Token)

输出:文本

$0.230(输入仅包含文本时)

$0.646(输入包含图片/音频/视频时)

输出:文本+音频

$7.168(音频)

输出的文本不计费。

计费示例:某次请求输入了1000 Token 的文本和1000 Token 的图片,输出了1000 Token 的文本和1000 Token 的音频,则该请求花费:$0.000058(文本输入)+ $0.000216(图片输入)+ $0.007168(音频输出)

通义千问Omni-Realtime

相比于通义千问Omni,支持音频的流式输入,且内置 VAD(Voice Activity Detection,语音活动检测)功能,可自动检测用户语音的开始和结束。使用方法

模型名称

版本

上下文长度

最大输入

最大输出

(Token数)

qwen-omni-turbo-realtime

当前与qwen-omni-turbo-2025-05-08能力相同

稳定版

32,768

30,720

2,048

qwen-omni-turbo-realtime-latest

始终与最新快照版能力相同

最新版

qwen-omni-turbo-realtime-2025-05-08

快照版

输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.230

输入:音频

$3.584

输入:图片

$0.861

输出计费项

单价(每百万 Token)

输出:文本

$0.918(输入仅包含文本时)

$2.581(输入包含图片/音频时)

输出:文本+音频

$7.168(音频)

输出的文本不计费。QVQ

QVQ是视觉推理模型,支持视觉输入及思维链输出,在数学、编程、视觉分析、创作以及通用任务上都表现了更强的能力。使用方法 | 在线体验

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qvq-max

相比 qvq-plus 具有更强的视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。当前与qvq-max-2025-03-25能力相同

稳定版

131,072

106,496

单图最大16384

16,384

8,192

$1.147

$4.588

qvq-max-latest

始终与最新快照版能力相同

最新版

qvq-max-2025-05-15

又称qvq-max-0515

快照版

qvq-max-2025-03-25

又称qvq-max-0325

qvq-plus

当前与qvq-plus-2025-05-15能力相同

稳定版

$0.287

$0.717

qvq-plus-latest

始终与最新快照版能力相同

最新版

qvq-plus-2025-05-15

又称qvq-plus-0515

快照版

通义千问VL

通义千问VL是具有视觉(图像)理解能力的文本生成模型,有通义千问VL-MAX和通义千问VL-PLUS两种系列。不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。使用方法 | API参考 | 在线体验

通义千问VL模型按输入和输出的总Token数进行计费。图像Token的计算规则:每28x28像素对应一个Token,一张图最少需要4个Token。详细计算规则请参见视觉理解。

通义千问VL-Max系列

通义千问VL-Plus系列

通义千问VL效果最强的模型。以下模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-vl-max

相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能。当前与qwen-vl-max-2025-04-08能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.431

$1.291

qwen-vl-max-latest

始终与最新快照版能力相同

最新版

$0.23

$0.574

qwen-vl-max-2025-08-13

又称qwen-vl-max-0813视觉理解指标全面提升,数学、推理、物体识别、多语言处理能力显著增强。

快照版

qwen-vl-max-2025-04-08

又称qwen-vl-max-0408增强数学和推理能力

$0.431

$1.291

qwen-vl-max-2025-04-02

又称qwen-vl-max-0402显著提高解决复杂数学问题的准确性

qwen-vl-max-2025-01-25

又称qwen-vl-max-0125升级至Qwen2.5-VL系列,扩展上下文至128k,显著增强图像和视频的理解能力

通义千问VL-Plus模型在效果、成本上比较均衡。以下模型均属于Qwen2.5-VL系列。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-vl-plus

当前与qwen-vl-plus-2025-05-07能力相同

稳定版

131,072

129,024

单图最大16384

8,192

$0.216

$0.646

qwen-vl-plus-latest

始终与最新快照版能力相同

最新版

$0.115

$0.287

qwen-vl-plus-2025-08-15

又称qwen-vl-plus-0815在物体识别与定位、多语言处理的能力上有显著提升

快照版

qwen-vl-plus-2025-07-10

又称qwen-vl-plus-0710进一步提升监控视频内容的理解能力

32,768

30,720

单图最大16384

$0.022

$0.216

qwen-vl-plus-2025-05-07

又称qwen-vl-plus-0507显著提升数学、推理、监控视频内容的理解能力

131,072

129,024

单图最大16384

$0.216

$0.646

qwen-vl-plus-2025-01-25

又称qwen-vl-plus-0125升级至Qwen2.5-VL系列,扩展上下文至128k,显著增强图像和视频理解能力

更多历史快照版本

通义千问VL-Max系列

通义千问VL-Plus系列

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-vl-max-2024-12-30

又称qwen-vl-max-1230

快照版

32,768

30,720

单图最大16384

2,048

$0.431

$1.291

qwen-vl-max-2024-11-19

又称qwen-vl-max-1119

qwen-vl-max-2024-10-30

又称qwen-vl-max-1030

$2.868

qwen-vl-max-2024-08-09

又称qwen-vl-max-0809

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-vl-plus-2025-01-02

又称qwen-vl-plus-0102

快照版

32,768

30,720

单图最大16384

2,048

$0.216

$0.646

qwen-vl-plus-2024-08-09

又称qwen-vl-plus-0809 通义千问OCR

通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。使用方法 | API参考|在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入/输出单价

(Token数)

(每百万Token)

qwen-vl-ocr

当前与qwen-vl-ocr-2025-04-13能力相同

稳定版

34,096

30,000

单图最大30000

4,096

$0.717

qwen-vl-ocr-latest

始终与最新快照版能力相同

最新版

qwen-vl-ocr-2025-04-13

又称qwen-vl-ocr-0413大幅提升文字识别能力,新增六种内置的OCR任务,增加了自定义Prompt、图像旋转矫正等功能。

快照版

qwen-vl-ocr-2024-10-28

又称qwen-vl-ocr-1028

快照版

通义千问数学模型

通义千问数学模型是专门用于数学解题的语言模型。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-math-plus

当前与qwen-math-plus-2024-09-19能力相同

稳定版

4,096

3,072

3,072

$0.574

$1.721

qwen-math-plus-latest

始终与最新快照版能力相同

最新版

qwen-math-plus-2024-09-19

又称qwen-math-plus-0919

快照版

qwen-math-plus-2024-08-16

又称qwen-math-plus-0816

qwen-math-turbo

当前与qwen-math-turbo-2024-09-19能力相同

稳定版

$0.287

$0.861

qwen-math-turbo-latest

始终与最新快照版能力相同

最新版

qwen-math-turbo-2024-09-19

又称qwen-math-turbo-0919

快照版

通义千问Coder

通义千问代码模型。最新的 Qwen3-Coder-Plus 系列模型是基于 Qwen3 的代码生成模型,具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程,代码能力卓越的同时兼具通用能力。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen3-coder-plus

当前与qwen3-coder-plus-2025-07-22能力相同

稳定版

1,000,000

997,952

65,536

阶梯计价,请参见表格下方说明。

qwen3-coder-plus-2025-07-22

快照版

qwen3-coder-flash

当前与qwen3-coder-flash-2025-07-28能力相同

稳定版

qwen3-coder-flash-2025-07-28

快照版

上述模型根据本次请求输入的Token数,采取阶梯计费。

qwen3-coder-plus系列

qwen3-coder-flash系列

qwen3-coder-plus 和 qwen3-coder-plus-2025-07-22 价格如下,其中 qwen3-coder-plus 支持上下文缓存:

输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0-32K

$0.574

$2.294

32K-128K

$0.861

$3.441

128K-256K

$1.434

$5.735

256K-1M

$2.868

$28.671

qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 价格如下,其中 qwen3-coder-flash 支持上下文缓存:

输入Token数

输入成本(每百万Token)

输出成本(每百万Token)

0-32K

$0.144

$0.574

32K-128K

$0.216

$0.861

128K-256K

$0.359

$1.434

256K-1M

$0.717

$3.584

早期版本

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-coder-plus

当前与qwen-coder-plus-2024-11-06能力相同

稳定版

131,072

129,024

8,192

$0.502

$1.004

qwen-coder-plus-latest

与qwen-coder-plus的最新快照版能力相同

最新版

qwen-coder-plus-2024-11-06

又称qwen-coder-plus-1106

快照版

qwen-coder-turbo

当前与qwen-coder-turbo-2024-09-19能力相同

稳定版

131,072

129,024

8,192

$0.287

$0.861

qwen-coder-turbo-latest

与qwen-coder-turbo的最新快照版能力相同

最新版

qwen-coder-turbo-2024-09-19

又称qwen-coder-turbo-0919

快照版

通义千问翻译模型

基于 Qwen 3全面升级的旗舰级翻译大模型,支持92个语种(包括中、英、日、韩、法、西、德、泰、印尼、越、阿等)互译,模型性能和翻译效果全面升级,提供更稳定的术语定制、格式还原度、领域提示能力,让译文更精准、自然。使用方法 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen-mt-plus

属于Qwen3-MT

4,096

2,048

2,048

$0.259

$0.775

qwen-mt-turbo

属于Qwen3-MT

$0.101

$0.280

通义千问ASR

基于通义千问多模态基座,支持多语言识别、歌唱识别、定制化语音识别、噪声拒识等功能。使用方法

基于通义千问多模态基座,支持多语言识别、歌唱识别、噪声拒识等功能,推荐用于生产环境。

具备如下优势:

多语种高精度识别:支持多语言高精度语音识别。

复杂环境适应:具备应对复杂声学环境的能力,支持自动语种检测与智能非人声过滤。

高精度歌唱识别:即使在伴随背景音乐(BGM)的情况下,也能实现整首歌曲的准确转写。

上下文增强:通过配置上下文提高识别准确率。参见上下文增强。

模型名称

版本

支持的语言

支持的采样率

单价

qwen3-asr-flash

当前等同qwen3-asr-flash-2025-09-08

稳定版

中文、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语

16kHz

$0.000032/秒

qwen3-asr-flash-2025-09-08

快照版

文本生成-通义千问-开源版

模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。

百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen3或Qwen2.5模型。

Qwen3

2025 年 7月发布的 qwen3-235b-a22b-thinking-2507 模型仅支持思考模式,是qwen3-235b-a22b(思考模式)的升级版。

2025 年 7月发布的 qwen3-235b-a22b-instruct-2507 模型仅支持非思考模式,是qwen3-235b-a22b(非思考模式)的升级版。

2025 年 7月发布的 qwen3-30b-a3b-thinking-2507 模型仅支持思考模式,是qwen3-30b-a3b (思考模式)的升级版。

2025 年 7月发布的 qwen3-30b-a3b-instruct-2507模型仅支持非思考模式,是qwen3-30b-a3b (非思考模式)的升级版。

2025 年 4月发布的 Qwen3 模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,Qwen3 模型的能力得到了大幅提升:

推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

Agent 能力:在推理、非推理两种模式下都达到业界领先水平,能精准调用外部工具。

多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

支持的语言

英语(English)

简体中文(Simplified Chinese)

繁体中文(Traditional Chinese)

法语(French)

西班牙语(Spanish)

阿拉伯语(Arabic),使用阿拉伯字母。是众多阿拉伯国家的官方语言。

俄语(Russian),使用西里尔字母。在俄罗斯及其他一些国家是官方语言。

葡萄牙语(Portuguese),使用拉丁字母。在葡萄牙、巴西和其他葡萄牙语国家是官方语言。

德语(German),使用拉丁字母。在德国和奥地利等地是官方语言。

意大利语(Italian),使用拉丁字母。在意大利、圣马力诺以及瑞士的部分地区是官方语言。

荷兰语(Dutch),使用拉丁字母。在荷兰、比利时部分地区(弗拉芒地区)和苏里南是官方语言。

丹麦语(Danish),使用拉丁字母。在丹麦是官方语言。

爱尔兰语(Irish),使用拉丁字母。在爱尔兰是官方语言之一。

威尔士语(Welsh),使用拉丁字母。在威尔士使用,是官方语言之一。

芬兰语(Finnish),使用拉丁字母。在芬兰是官方语言。

冰岛语(Icelandic),使用拉丁字母。在冰岛是官方语言。

瑞典语(Swedish),使用拉丁字母。是瑞典的官方语言。

新挪威语(Norwegian Nynorsk),使用拉丁字母。在挪威与书面挪威语共同使用,属主流语言的一部分。

书面挪威语(Norwegian Bokmål),使用拉丁字母。在挪威使用,是主流语言的一部分。

日语(Japanese),使用日文字母。在日本是官方语言。

朝鲜语/韩语(Korean),使用韩字(Hangul)。在韩国和朝鲜是官方语言。

越南语(Vietnamese),使用拉丁字母。在越南是官方语言。

泰语(Thai),使用泰文字母。在泰国是官方语言。

印度尼西亚语(Indonesian),使用拉丁字母。是印度尼西亚的官方语言。

马来语(Malay),使用拉丁字母。是马来西亚等地的主要语言。

缅甸语(Burmese),使用缅甸字母。在缅甸是官方语言。

他加禄语(Tagalog),使用拉丁字母。菲律宾的主要语言之一。

高棉语(Khmer),使用高棉字母。在柬埔寨是官方语言。

老挝语(Lao),使用老挝字母。在老挝是官方语言。

印地语(Hindi),使用天城文(Devanagari)。是印度的官方语言之一。

孟加拉语(Bengali),使用孟加拉字母。在孟加拉国和印度西孟加拉邦是官方语言。

乌尔都语(Urdu),使用阿拉伯字母。在巴基斯坦是官方语言之一,也在印度使用。

尼泊尔语(Nepali),使用天城字母。在尼泊尔是官方语言。

希伯来语(Hebrew),使用希伯来字母。在以色列是官方语言。

土耳其语(Turkish),使用拉丁字母。在土耳其和塞浦路斯北部是官方语言。

波斯语(Persian),使用阿拉伯字母。在伊朗和塔吉克斯坦等地是官方语言。

波兰语(Polish),使用拉丁字母。在波兰是官方语言。

乌克兰语(Ukrainian),使用西里尔字母。在乌克兰是官方语言。

捷克语(Czech),使用拉丁字母。在捷克是官方语言。

罗马尼亚语(Romanian),使用拉丁字母。在罗马尼亚和摩尔多瓦是官方语言。

保加利亚语(Bulgarian),使用西里尔字母。在保加利亚是官方语言。

斯洛伐克语(Slovak),使用拉丁字母。在斯洛伐克是官方语言。

匈牙利语(Hungarian),使用拉丁字母。在匈牙利是官方语言。

斯洛文尼亚语(Slovenian),使用拉丁字母。在斯洛文尼亚是官方语言。

拉脱维亚语(Latvian),使用拉丁字母。在拉脱维亚是官方语言。

爱沙尼亚语(Estonian),使用拉丁字母。在爱沙尼亚是官方语言。

立陶宛语(Lithuanian),使用拉丁字母。在立陶宛是官方语言。

白俄罗斯语(Belarusian),使用西里尔字母。在白俄罗斯是官方语言之一。

希腊语(Greek),使用希腊字母。在希腊和塞浦路斯是官方语言。

克罗地亚语(Croatian),使用拉丁字母。在克罗地亚是官方语言。

马其顿语(Macedonian),使用西里尔字母。是北马其顿的官方语言。

马耳他语(Maltese),使用拉丁字母。在马耳他是官方语言。

塞尔维亚语(Serbian),使用西里尔字母。在塞尔维亚是官方语言。

波斯尼亚语(Bosnian),使用拉丁字母。在波斯尼亚和黑塞哥维那是官方语言之一。

格鲁吉亚语(Georgian),使用格鲁吉亚字母(Georgian script)。在格鲁吉亚是官方语言。

亚美尼亚语(Armenian),使用亚美尼亚字母。在亚美尼亚是官方语言。

北阿塞拜疆语(North Azerbaijani),使用拉丁字母。在阿塞拜疆是官方语言。

哈萨克语(Kazakh),使用西里尔字母。在哈萨克斯坦是官方语言。

北乌兹别克语(Northern Uzbek),使用拉丁字母。在乌兹别克斯坦是官方语言。

塔吉克语(Tajik),使用西里尔字母。在塔吉克斯坦是官方语言。

斯瓦西里语(Swahili),使用拉丁字母。在东非许多国家是通用语或官方语言。

南非语(Afrikaans),使用拉丁字母。主要在南非和纳米比亚使用。

粤语(Cantonese),使用繁体字。主要在中国广东省、香港和澳门使用,是这些地区的主要语言之一。

卢森堡语(Luxembourgish),使用拉丁字母。在卢森堡和德国部分地区使用,是官方语言之一。

林堡语(Limburgish),使用拉丁字母。主要在荷兰、比利时和德国部分地区使用。

加泰罗尼亚语(Catalan),使用拉丁字母。在加泰罗尼亚和其他部分西班牙地区使用。

加利西亚语(Galician),使用拉丁字母。主要在西班牙加利西亚地区使用。

阿斯图里亚斯语(Asturian),使用拉丁字母。主要在西班牙阿斯图里亚斯地区使用。

巴斯克语(Basque),使用拉丁字母。主要在西班牙和法国的巴斯克地区使用,是西班牙巴斯克自治区的官方语言之一。

奥克语(Occitan),使用拉丁字母。主要在法国南部地区使用。

威尼斯语(Venetian),使用拉丁字母。主要在意大利威尼斯地区使用。

撒丁语(Sardinian),使用拉丁字母。主要在意大利撒丁岛使用。

西西里语(Sicilian),使用拉丁字母。主要在意大利西西里岛使用。

弗留利语(Friulian),使用拉丁字母。主要在意大利弗留利-威尼斯朱利亚使用。

隆巴底语(Lombard),使用拉丁字母。主要在意大利伦巴第地区使用。

利古里亚语(Ligurian),使用拉丁字母。主要在意大利利古里亚地区使用。

法罗语(Faroese),使用拉丁字母。主要在法罗群岛使用,是法罗群岛的官方语言之一。

托斯克阿尔巴尼亚语(Tosk Albanian),使用拉丁字母。主要是阿尔巴尼亚南部方言。

西里西亚语(Silesian),使用拉丁字母。主要在波兰使用。

巴什基尔语(Bashkir),使用西里尔字母。主要在俄罗斯巴什科尔托斯坦使用。

鞑靼语(Tatar),使用西里尔字母。主要在俄罗斯塔塔尔斯坦使用。

美索不达米亚阿拉伯语(Mesopotamian Arabic),使用阿拉伯字母。主要在伊拉克使用。

内志阿拉伯语(Najdi Arabic),使用阿拉伯字母。主要在沙特阿拉伯的内志地区使用。

埃及阿拉伯语(Egyptian Arabic),使用阿拉伯字母。主要在埃及使用。

黎凡特阿拉伯语(Levantine Arabic),使用阿拉伯字母。主要在叙利亚和黎巴嫩使用。

闪米特阿拉伯语(Ta'izzi-Adeni Arabic),使用阿拉伯字母。主要在也门和沙特阿拉伯的哈德拉莫区域使用。

达里语(Dari),使用阿拉伯字母。在阿富汗是官方语言之一。

突尼斯阿拉伯语(Tunisian Arabic),使用阿拉伯字母。主要在突尼斯使用。

摩洛哥阿拉伯语(Moroccan Arabic),使用阿拉伯字母。主要在摩洛哥使用。

克里奥尔语(Kabuverdianu),使用拉丁字母。主要在佛得角使用。

托克皮辛语(Tok Pisin),使用拉丁字母。在巴布亚新几内亚是主要的通用语之一。

意第绪(Eastern Yiddish),使用希伯来字母。主要在犹太社区中使用。

信德阿拉伯语(Sindhi),使用阿拉伯字母。在巴基斯坦信德省是官方语言之一。

僧伽罗语(Sinhala),使用僧伽罗字母。在斯里兰卡是官方语言之一。

泰卢固语(Telugu),使用泰卢固字母。在印度安得拉邦和特伦甘纳邦是官方语言之一。

旁遮普语(Punjabi),使用古尔穆奇字母。在印度旁遮普邦使用,是印度的官方语言之一。

泰米尔语(Tamil),使用泰米尔字母。在印度泰米尔纳德邦和斯里兰卡是官方语言之一。

古吉拉特语(Gujarati),使用古吉拉特字母。在印度古吉拉特邦是官方语言之一。

马拉雅拉姆语(Malayalam),使用马拉雅拉姆字母。在印度喀拉拉邦是官方语言之一。

马拉地语(Marathi),使用天城字母。在印度马哈拉施特拉邦是官方语言之一。

卡纳达语(Kannada),使用卡纳达字母。在印度卡纳塔克邦是官方语言之一。

马加拉语(Magahi),使用天城文本。主要在印度比哈尔邦使用。

奥里亚语(Oriya),使用乌尔都语字母。在印度奥迪沙邦是官方语言之一。

阿瓦德语(Awadhi),使用天城字母。主要在印度北方邦使用。

迈蒂利语(Maithili),使用天城字母。在印度比哈尔邦和尼泊尔特莱平原使用,是印度的官方语言之一。

阿萨姆语(Assamese),使用孟加拉字母。在印度阿萨姆邦是官方语言之一。

切蒂斯格尔语(Chhattisgarhi),使用天城字母。主要在印度切蒂斯格尔邦使用。

比哈尔语(Bhojpuri),使用天城字母。在印度和尼泊尔部分地区使用。

米南加保语(Minangkabau),使用拉丁字母。主要在印度尼西亚苏门答腊岛使用。

巴厘语(Balinese),使用拉丁字母。主要在印度尼西亚巴厘岛使用。

爪哇语(Javanese),使用拉丁字母(也惯用爪哇文字)。在印度尼西亚爪哇岛广泛使用。

班章语(Banjar),使用拉丁字母。主要在印度尼西亚加里曼丹岛使用。

巽他语(Sundanese),使用拉丁字母(虽然传统上使用巽他文字)。主要在印度尼西亚爪哇岛的西部使用。

宿务语(Cebuano),使用拉丁字母。主要在菲律宾宿务地区使用。

邦阿西楠语(Pangasinan),使用拉丁字母。主要在菲律宾邦阿西楠语省使用。

伊洛卡诺语(Iloko),使用拉丁字母。主要在菲律宾使用。

瓦莱语(Waray (Philippines)),使用拉丁字母。主要在菲律宾使用。

海地语(Haitian),使用拉丁字母。在海地是官方语言之一。

帕皮阿门托语(Papiamento),使用拉丁字母。主要在加勒比地区如阿鲁巴岛和库拉索岛使用。

回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

2025 年 4月发布的Qwen3 开源模型在思考模式下不支持非流式输出方式。

思考模式 | 非思考模式 | API 参考

模型名称

模式

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qwen3-235b-a22b-thinking-2507

仅思考模式

131,072

126,976

81,920

32,768

$0.287

$2.868

qwen3-235b-a22b-instruct-2507

仅非思考模式

129,024

-

$1.147

qwen3-30b-a3b-thinking-2507

仅思考模式

126,976

81,920

$0.108

$1.076

qwen3-30b-a3b-instruct-2507

仅非思考模式

129,024

-

$0.431

qwen3-235b-a22b

非思考

129,024

-

16,384

$0.287

$1.147

思考

98,304

38,912

$2.868

qwen3-32b

非思考

129,024

-

$0.287

$1.147

思考

98,304

38,912

$2.868

qwen3-30b-a3b

非思考

129,024

-

$0.108

$0.431

思考

98,304

38,912

$1.076

qwen3-14b

非思考

129,024

-

8,192

$0.144

$0.574

思考

98,304

38,912

$1.434

qwen3-8b

非思考

129,024

-

$0.072

$0.287

思考

98,304

38,912

$0.717

qwen3-4b

非思考

129,024

-

$0.044

$0.173

思考

98,304

38,912

$0.431

qwen3-1.7b

非思考

32,768

30,720

-

$0.173

思考

28,672

与输入相加不超过30,720

$0.431

qwen3-0.6b

非思考

30,720

-

$0.173

思考

28,672

与输入相加不超过30,720

$0.431

对于 Qwen3 模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

QwQ-开源版

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法|API 参考

模型名称

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

(Token数)

(每百万Token)

qwq-32b

131,072

98,304

32,768

8,192

$0.287

$0.861

QwQ-Preview

qwq-32b-preview 模型是由 Qwen 团队于2024年开发的实验性研究模型,专注于增强 AI 推理能力,尤其是数学和编程领域。qwq-32b-preview 模型的局限性请参见QwQ官方博客。使用方法 | API参考|在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwq-32b-preview

32,768

30,720

16,384

$0.287

$0.861

Qwen2.5

Qwen2.5是Qwen大型语言模型系列。针对Qwen2.5,我们发布了一系列基础语言模型和指令调优语言模型,参数规模从5亿到720亿不等。Qwen2.5在Qwen2基础上进行了以下改进:

在我们最新的大规模数据集上进行预训练,包含多达18万亿个Token。

由于我们在这些领域的专业专家模型,模型的知识显著增多,编码和数学能力也大幅提高。

在遵循指令、生成长文本(超过8K个标记)、理解结构化数据(例如表格)和生成结构化输出(尤其是JSON)方面有显著改进。对系统提示的多样性更具弹性,增强了聊天机器人的角色扮演实现和条件设置。

支持超过29种语言,包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。

使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen2.5-14b-instruct-1m

1,000,000

1,000,000

8,192

$0.144

$0.431

qwen2.5-7b-instruct-1m

$0.072

$0.144

qwen2.5-72b-instruct

131,072

129,024

$0.574

$1.721

qwen2.5-32b-instruct

$0.287

$0.861

qwen2.5-14b-instruct

$0.144

$0.431

qwen2.5-7b-instruct

$0.072

$0.144

qwen2.5-3b-instruct

32,768

30,720

$0.044

$0.130

qwen2.5-1.5b-instruct

限时免费

qwen2.5-0.5b-instruct

QVQ

qvq-72b-preview模型是由 Qwen 团队开发的实验性研究模型,专注于提升视觉推理能力,尤其在数学推理领域。qvq-72b-preview模型的局限性请参见QVQ官方博客。使用方法 | API参考

如果希望模型先输出思考过程再输出回答内容,请使用商业版模型QVQ。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qvq-72b-preview

32,768

16,384

单图最大16384

16,384

$1.721

$5.161

Qwen-Omni

基于Qwen2.5训练的全新多模态理解生成大模型,支持文本、图像、语音、视频输入理解,具备文本和语音同时流式生成的能力,多模态内容理解速度显著提升。使用方法|API 参考

模型名称

上下文长度

最大输入

最大输出

(Token数)

qwen2.5-omni-7b

32,768

30,720

2,048

输入与输出的计费规则如下:

输入计费项

单价(每百万 Token)

输入:文本

$0.087

输入:音频

$5.448

输入:图片/视频

$0.287

输出计费项

单价(每百万 Token)

输出:文本

$0.345(输入仅包含文本时)

$0.861(输入包含图片/音频/视频时)

输出:文本+音频

$10.895(音频)

输出的文本不计费。

计费示例:某次请求输入了1000 Token 的文本和1000 Token 的图片,输出了1000 Token 的文本和1000 Token 的音频,则该请求花费:$0.000087(文本输入)+ $0.000287(图片输入)+ $0.010895(音频输出)。

Qwen-VL

阿里云的通义千问VL开源版。使用方法 | API参考

其中,Qwen2.5-VL在Qwen2-VL的基础上做了如下改进:

感知更丰富的世界:Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫等,还能分析图像中的文本、图表、图标、图形和布局等。

长视频理解能力:支持对长视频文件(最长10分钟)进行理解,具备通过精准定位相关视频片段来捕捉事件的新能力

视觉定位:Qwen2.5-VL可通过生成bounding box(矩形框的左上角和右下角坐标)或者point(矩形框的中心点坐标)来准确定位图像中的物体,并能够为坐标和属性提供稳定的JSON输出。

结构化输出:可支持对发票、表单、表格等数据进行结构化输出,惠及金融、商业等领域的应用。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen2.5-vl-72b-instruct 

131,072

129,024

单图最大16384

8,192

$2.294

$6.881

qwen2.5-vl-32b-instruct

$1.147

$3.441

qwen2.5-vl-7b-instruct

$0.287

$0.717

qwen2.5-vl-3b-instruct

$0.173

$0.517

qwen2-vl-72b-instruct

32,768

30,720

单图最大16384

2,048

$2.294

$6.881

qwen2-vl-7b-instruct

32,000

30,000

单图最大16384

2,000

限时免费

qwen2-vl-2b-instruct

Qwen-Math

基于Qwen模型构建的专门用于数学解题的语言模型。Qwen2.5-Math支持中文和英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen2.5-math-72b-instruct

4,096

3,072

3,072

$0.574

$1.721

qwen2.5-math-7b-instruct

$0.144

$0.287

qwen2.5-math-1.5b-instruct

限时免费

Qwen-Coder

通义千问代码模型开源版。最新的 qwen3-coder-480b-a35b-instruct 是基于 Qwen3 的代码生成模型,具有强大的Coding Agent能力,擅长工具调用和环境交互,能够实现自主编程、代码能力卓越的同时兼具通用能力。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

(Token数)

(每百万Token)

qwen3-coder-480b-a35b-instruct

262,144

204,800

65,536

阶梯计价,请参见表格下方说明。

qwen3-coder-30b-a3b-instruct

qwen2.5-coder-32b-instruct

131,072

129,024

8,192

$0.287

$0.861

qwen2.5-coder-14b-instruct

qwen2.5-coder-7b-instruct

$0.144

$0.287

qwen2.5-coder-3b-instruct

32,768

30,720

限时免费体验

qwen2.5-coder-1.5b-instruct

qwen2.5-coder-0.5b-instruct

qwen3-coder-480b-a35b-instruct 与 qwen3-coder-30b-a3b-instruct 根据本次请求输入的 Token数,采取阶梯计费。

模型名称

输入 Token 数

输入成本(每百万Token)

输出成本(每百万Token)

qwen3-coder-480b-a35b-instruct

0-32K

$0.861

$3.441

32K-128K

$1.291

$5.161

128K-200K

$2.151

$8.602

qwen3-coder-30b-a3b-instruct

0-32K

$0.216

$0.861

32K-128K

$0.323

$1.291

128K-200K

$0.538

$2.151

基础限流

关于模型的限流条件,请参见限流。

网址:通义千问大语言模型介绍 https://klqsh.com/news/view/237176

相关内容

通义千问网页版入口、使用教程
人工智能提供学习知识新途径,大语言模型对数学问题有“新见解”
介绍
春节习俗介绍PPT模板
综艺嘉宾介绍MG动态AE模板
手帐介绍课件模板图片.pptx
兵马俑的历史文化介绍
古典风中国美食文化介绍PPT模板
比较幽默诙谐的搞笑自我介绍通用范文(通用17篇)
高效沟通:八大沟通模型和沟通方法论

随便看看