免费ChatGpt大模型API大全：最新免费ChatGpt API

随着大模型竞争加剧，各大厂商纷纷推出不同的优惠策略以吸引用户。为了让更多的开发者和企业能够体验和使用大规模 AI 模型，许多厂商提供了免费 API 接口，这不仅为用户提供了更多的选择，也降低了接入 AI 模型的门槛。

目前，我们已经收集了多个免费大模型 API，这些 API 的使用限制和特点各不相同，部分模型不设使用量上限，但存在一定的请求频率限制；有些则设置了流量、并发数等多方面的限制。无论你是开发者、研究人员还是企业用户，都可以根据自己的需求选择适合的免费大模型来集成或测试。

What Is ChatGPT? - Here is all you need to know!

1. 讯飞星火大模型

免费版本: spark-lite
限制: 每秒请求数 (QPS)：2
讯飞星火大模型是讯飞推出的一款大规模语言处理模型。其免费版本 spark-lite 在一定请求量范围内提供了基础服务，适合小型项目或个人开发者进行尝试。对于需要高频次调用的用户，可能需要升级至付费版本以解除频率限制。

2. 百度千帆大模型平台

免费版本: yi_34b_chat, ERNIE-Speed-8K, ERNIE-Speed-128K, ERNIE-Lite-8K, ERNIE-Lite-8K-0922, ERNIE-Tiny-8K
限制:

Lite、Speed-8K：请求每分钟 (RPM) = 300，Token 每分钟 (TPM) = 300000
Speed-128K：RPM = 60，TPM = 300000
百度千帆大模型平台提供了多个免费模型，适合不同需求的开发者使用。用户可以根据自己的需求选择适合的版本，了解详细的调用限制和 API 文档。

3. 腾讯混元大模型

免费版本: hunyuan-lite
限制: 每次请求并发数限制为 5 路
腾讯混元大模型提供的免费版本适合并发量较小的用户，能够支持一些轻量级的应用和测试。在高并发应用场景中，用户可能需要根据需求进行升级。

4. 智谱大模型

免费版本: glm-4-flash
限制: 目前每用户最大并发数为 5
智谱的免费大模型提供了基本的 API 支持，适用于中小型应用，用户可以根据需要进行调用和测试，但并发数的限制可能影响到高频请求的场景。

5. 硅基流动 (SiliconFlow)

免费版本: Qwen2-7B-Instruct, Qwen2-1.5B-Instruct, Qwen1.5-7B-Chat, glm-4-9b-chat, chatglm3-6b 等
限制:

请求每分钟 (RPM) 限制为 100
每秒请求数 (QPS) 限制为 3
更多额度可以申请
硅基流动提供了多种语言模型，适用于不同的应用场景，包括对话生成、文本理解等。对于需要高频率调用的用户，可以申请更高的额度。

6. Cloudflare Workers AI (国外)

免费版本: 所有模型
限制:

每天免费 1 万次请求，最多可达 30 万次/月
测试版本模型不限请求频率
Cloudflare 提供的免费版本对于开发者来说是一个非常实惠的选择。它允许每天进行大量的 API 调用，非常适合初创企业和个人开发者进行测试和开发。

7. Llama Family

免费版本: "Atom-13B-Chat", "Atom-7B-Chat", "Atom-1B-Chat", "Llama3-Chinese-8B-Instruct"
限制:

每天 8-22 点：每分钟最多 20 次并发
每天 22 点至次日 8 点：每分钟最多 50 次并发
Llama 系列模型适用于多语言的应用开发，特别是在中文处理方面表现突出。其灵活的请求频率控制能够很好地满足不同时段的需求。

8. Groq

免费版本: gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192
限制:

每分钟请求数 (RPM) 为 30
每日请求数 (RPD) 为 14400
每分钟令牌数 (TOKENS PER MINUTE) 也有限制
Groq 提供的 AI 模型包括多种不同规模的 Llama 和 Gemma 系列，适用于复杂的文本生成任务，特别适合对计算资源要求较高的场景。

9. Google Gemini

免费版本: gemini-1.5-pro、gemini-1.5-flash、gemini-1.0-pro、gemini-pro-vision
限制:

每分钟请求数 (RPM) = 15
每分钟令牌数 (TPM) = 100 万
每日请求数 (RPD) = 1500 次
Google 的 Gemini 系列大模型适合大规模的自然语言处理和视觉任务，特别适合图像与文本结合的应用场景。其每日请求和令牌限制对于大多数中小型应用足够使用，但对于高频次使用的场景可能需要申请更高的额度。

10. 阿里灵积 Dashscope

免费版本: "chatglm3-6b", "baichuan-7b-v1", "yi-6b-chat", "yi-34b-chat", "aquilachat-7b", "deepseek-7b-chat", "internlm-7b-chat" 等
限制:

流量：每分钟请求数 (QPM) ≤ 120
Token 消耗：每分钟消耗的 Token 数目 ≤ 200,000
超出上述任何条件时，将触发限流
阿里云的灵积 Dashscope 提供了多个免费的 AI 模型，适合小规模的开发和测试。流量和令牌的限制使得该平台非常适合中小型项目，而大流量的应用可能需要向阿里申请更高的配额。

11. 文心智能体

免费版本: 文心大模型 3.5
限制: 目前免费
文心智能体是文心大模型的一个版本，适用于多种语言任务，包括文本生成、对话系统等。该平台目前对用户免费开放，适合那些希望探索自然语言处理能力的用户。

12. NVIDIA

免费版本: 所有模型
限制:

商业邮箱：获得 5000 个 API 积分
个人邮箱：获得 1000 个 API 积分
NVIDIA 提供的 API 积分可以帮助用户在不付费的情况下进行一定量的模型调用，非常适合开发者在其平台上进行AI模型实验。

13. Github Models

免费版本: 所有模型
限制: 需要申请
GitHub 提供的模型接口需要申请接入，其免费版本的使用限制因具体模型而异。用户可以通过GitHub Marketplace申请并等待批准，适合希望通过开源社区共享资源的开发者。