随着大模型竞争加剧,各大厂商纷纷推出不同的优惠策略以吸引用户。为了让更多的开发者和企业能够体验和使用大规模 AI 模型,许多厂商提供了免费 API 接口,这不仅为用户提供了更多的选择,也降低了接入 AI 模型的门槛。
目前,我们已经收集了多个免费大模型 API,这些 API 的使用限制和特点各不相同,部分模型不设使用量上限,但存在一定的请求频率限制;有些则设置了流量、并发数等多方面的限制。无论你是开发者、研究人员还是企业用户,都可以根据自己的需求选择适合的免费大模型来集成或测试。
1. 讯飞星火大模型
免费版本: spark-lite
限制: 每秒请求数 (QPS):2
讯飞星火大模型是讯飞推出的一款大规模语言处理模型。其免费版本 spark-lite 在一定请求量范围内提供了基础服务,适合小型项目或个人开发者进行尝试。对于需要高频次调用的用户,可能需要升级至付费版本以解除频率限制。
2. 百度千帆大模型平台
免费版本: yi_34b_chat, ERNIE-Speed-8K, ERNIE-Speed-128K, ERNIE-Lite-8K, ERNIE-Lite-8K-0922, ERNIE-Tiny-8K
限制:
Lite、Speed-8K:请求每分钟 (RPM) = 300,Token 每分钟 (TPM) = 300000
Speed-128K:RPM = 60,TPM = 300000
百度千帆大模型平台提供了多个免费模型,适合不同需求的开发者使用。用户可以根据自己的需求选择适合的版本,了解详细的调用限制和 API 文档。
3. 腾讯混元大模型
免费版本: hunyuan-lite
限制: 每次请求并发数限制为 5 路
腾讯混元大模型提供的免费版本适合并发量较小的用户,能够支持一些轻量级的应用和测试。在高并发应用场景中,用户可能需要根据需求进行升级。
4. 智谱大模型
免费版本: glm-4-flash
限制: 目前每用户最大并发数为 5
智谱的免费大模型提供了基本的 API 支持,适用于中小型应用,用户可以根据需要进行调用和测试,但并发数的限制可能影响到高频请求的场景。
5. 硅基流动 (SiliconFlow)
免费版本: Qwen2-7B-Instruct, Qwen2-1.5B-Instruct, Qwen1.5-7B-Chat, glm-4-9b-chat, chatglm3-6b 等
限制:
请求每分钟 (RPM) 限制为 100
每秒请求数 (QPS) 限制为 3
更多额度可以申请
硅基流动提供了多种语言模型,适用于不同的应用场景,包括对话生成、文本理解等。对于需要高频率调用的用户,可以申请更高的额度。
6. Cloudflare Workers AI (国外)
免费版本: 所有模型
限制:
每天免费 1 万次请求,最多可达 30 万次/月
测试版本模型不限请求频率
Cloudflare 提供的免费版本对于开发者来说是一个非常实惠的选择。它允许每天进行大量的 API 调用,非常适合初创企业和个人开发者进行测试和开发。
7. Llama Family
免费版本: "Atom-13B-Chat", "Atom-7B-Chat", "Atom-1B-Chat", "Llama3-Chinese-8B-Instruct"
限制:
每天 8-22 点:每分钟最多 20 次并发
每天 22 点至次日 8 点:每分钟最多 50 次并发
Llama 系列模型适用于多语言的应用开发,特别是在中文处理方面表现突出。其灵活的请求频率控制能够很好地满足不同时段的需求。
8. Groq
免费版本: gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192
限制:
每分钟请求数 (RPM) 为 30
每日请求数 (RPD) 为 14400
每分钟令牌数 (TOKENS PER MINUTE) 也有限制
Groq 提供的 AI 模型包括多种不同规模的 Llama 和 Gemma 系列,适用于复杂的文本生成任务,特别适合对计算资源要求较高的场景。
9. Google Gemini
免费版本: gemini-1.5-pro、gemini-1.5-flash、gemini-1.0-pro、gemini-pro-vision
限制:
每分钟请求数 (RPM) = 15
每分钟令牌数 (TPM) = 100 万
每日请求数 (RPD) = 1500 次
Google 的 Gemini 系列大模型适合大规模的自然语言处理和视觉任务,特别适合图像与文本结合的应用场景。其每日请求和令牌限制对于大多数中小型应用足够使用,但对于高频次使用的场景可能需要申请更高的额度。
10. 阿里灵积 Dashscope
免费版本: "chatglm3-6b", "baichuan-7b-v1", "yi-6b-chat", "yi-34b-chat", "aquilachat-7b", "deepseek-7b-chat", "internlm-7b-chat" 等
限制:
流量:每分钟请求数 (QPM) ≤ 120
Token 消耗:每分钟消耗的 Token 数目 ≤ 200,000
超出上述任何条件时,将触发限流
阿里云的灵积 Dashscope 提供了多个免费的 AI 模型,适合小规模的开发和测试。流量和令牌的限制使得该平台非常适合中小型项目,而大流量的应用可能需要向阿里申请更高的配额。
11. 文心智能体
免费版本: 文心大模型 3.5
限制: 目前免费
文心智能体是文心大模型的一个版本,适用于多种语言任务,包括文本生成、对话系统等。该平台目前对用户免费开放,适合那些希望探索自然语言处理能力的用户。
12. NVIDIA
免费版本: 所有模型
限制:
商业邮箱:获得 5000 个 API 积分
个人邮箱:获得 1000 个 API 积分
NVIDIA 提供的 API 积分可以帮助用户在不付费的情况下进行一定量的模型调用,非常适合开发者在其平台上进行AI模型实验。
13. Github Models
免费版本: 所有模型
限制: 需要申请
GitHub 提供的模型接口需要申请接入,其免费版本的使用限制因具体模型而异。用户可以通过GitHub Marketplace申请并等待批准,适合希望通过开源社区共享资源的开发者。