星空app以豆包主力模子 pro-32k 为例-🔥星空app官网版下载v.9.55.87-星空app

🔥星空app官网版下载v.9.55.87-星空app
你的位置:🔥星空app官网版下载v.9.55.87-星空app > 新闻资讯 > 星空app以豆包主力模子 pro-32k 为例-🔥星空app官网版下载v.9.55.87-星空app
星空app以豆包主力模子 pro-32k 为例-🔥星空app官网版下载v.9.55.87-星空app
发布日期:2024-06-28 05:39    点击次数:93

星空app以豆包主力模子 pro-32k 为例-🔥星空app官网版下载v.9.55.87-星空app

(原标题:豆包大模子公布价钱清单星空app,搭救国内最高并发尺度)

文/赵磊

近期,火山引擎官网更新了豆包大模子的订价折服,全面展示豆包通用模子不同版块、不同规格的价钱信息。在模子推理订价大幅低于行业价钱的基础上,豆包通用模子的 TPM(每分钟Tokens)、RPM(每分钟央求数)均达到国内最高尺度。以豆包主力模子 pro-32k 为例,价钱比行业低99%,TPM名额则高达同规格模子的2.7倍到8倍。

图:豆包系列模子“后付费”订价信息

官方信息贯通:在按照 Tokens 骨子使用量计算用度的“后付费”方法下,豆包通用模子-pro、豆包通用模子-lite的 32k 及以下窗口版块,模子限流为 10K RPM 和 800K TPM(以 RPM 和 TPM 其中之一到达上限为准)。国内其他主流模子的 TPM 名额大多在 100K 到 300K 之间,RPM则是在60到120区间,轻量级模子的RPM名额相对较高,但只是在300到500之间。

按照 10K RPM 名额计算,企业客户平均每秒不错同期调用167次豆包通用模子,从而高亢绝大大量业务场景在坐褥系统的大模子愚弄需求。这一尺度,还是达到 OpenAI 为高等别客户( Tier4 及 Tier5 等第客户)提供的 RPM 上限。

在算力挑战更大的长文本模子上,豆包通用模子 pro 和 lite 的 128k 版块,模子限流为 1K RPM 和 400K TPM,雷同大幅高于国内其他的128k长文本模子。

此外,豆包大模子公布了最新的“预支费”模子单位价钱。“预支费”所以调用某个特定模子的 TPM 配额,企业购买后无需再为 Tokens 糜掷付费,提前为不错预念念的流量波动指标好算力 。

图:豆包系列模子“预支费”模子单位价目表

以豆包通用模子 pro-32k为例:

按照 “预支费”模子单位价钱计算,10K TPM 的包月价钱为2000元。10K*60*24*30=43200K。即 432000K Tokens的价钱为2000元,平均价钱为 0.0046元/千Tokens。

按照“后付费”方法计算:在模子推理的计算资本中,推理输入经常占绝大部分比例,业界一般合计推理输入是输出的5倍。字据豆包通用模子 pro-32k 推理输入 0.0008元/千Tokens、推理输出 0.002元/千Tokens 计算,模子推理的抽象价钱为 0.001元/千Tokens。

火山引擎方面默示,豆包大模子为客户提供了纯真、经济的付费方法,“后付费”即可高亢绝大大量企业客户的业务需求,助力企业以极低资本使用大模子、加快大模子的愚弄落地。

“豆包模子的超低订价,着手于咱们有信心用本事技能优化资本,而不是补贴或是打价钱搏斗夺商场份额。”火山引擎总裁谭待合计,“羊毛出在猪身上”在企业商场行欠亨,本事出手的极致性价比智力确凿创造价值。火山引擎与字节朝上豆包大模子团队正在密切融合,将抓续优化模子成果和推理资本,为企业和建立者提供更好模子、更低资本和更易落地的平台搭救。

附:火山引擎官网的模子就业价钱文档https://www.volcengine.com/docs/82379/1099320星空app