免费ChatGpt大模型API大全:最新免费ChatGpt API 免费ChatGpt大模型API大全:最新免费ChatGpt API

免费ChatGpt大模型API大全:最新免费ChatGpt API

随着大模型竞争加剧,各大厂商纷纷推出不同的优惠策略以吸引用户。为了让更多的开发者和企业能够体验和使用大规模 AI 模型,许多厂商提供了免费 API 接口,这不仅为用户提供了更多的选择,也降低了接入 AI 模型的门槛。

目前,我们已经收集了多个免费大模型 API,这些 API 的使用限制和特点各不相同,部分模型不设使用量上限,但存在一定的请求频率限制;有些则设置了流量、并发数等多方面的限制。无论你是开发者、研究人员还是企业用户,都可以根据自己的需求选择适合的免费大模型来集成或测试。

What Is ChatGPT? - Here is all you need to know!

1. 讯飞星火大模型

  • 免费版本: spark-lite

  • 限制: 每秒请求数 (QPS):2
    讯飞星火大模型是讯飞推出的一款大规模语言处理模型。其免费版本 spark-lite 在一定请求量范围内提供了基础服务,适合小型项目或个人开发者进行尝试。对于需要高频次调用的用户,可能需要升级至付费版本以解除频率限制。

2. 百度千帆大模型平台

  • 免费版本: yi_34b_chat, ERNIE-Speed-8K, ERNIE-Speed-128K, ERNIE-Lite-8K, ERNIE-Lite-8K-0922, ERNIE-Tiny-8K

  • 限制:

    • Lite、Speed-8K:请求每分钟 (RPM) = 300,Token 每分钟 (TPM) = 300000

    • Speed-128K:RPM = 60,TPM = 300000
      百度千帆大模型平台提供了多个免费模型,适合不同需求的开发者使用。用户可以根据自己的需求选择适合的版本,了解详细的调用限制和 API 文档。

3. 腾讯混元大模型

  • 免费版本: hunyuan-lite

  • 限制: 每次请求并发数限制为 5 路
    腾讯混元大模型提供的免费版本适合并发量较小的用户,能够支持一些轻量级的应用和测试。在高并发应用场景中,用户可能需要根据需求进行升级。

4. 智谱大模型

  • 免费版本: glm-4-flash

  • 限制: 目前每用户最大并发数为 5
    智谱的免费大模型提供了基本的 API 支持,适用于中小型应用,用户可以根据需要进行调用和测试,但并发数的限制可能影响到高频请求的场景。

5. 硅基流动 (SiliconFlow)

  • 免费版本: Qwen2-7B-Instruct, Qwen2-1.5B-Instruct, Qwen1.5-7B-Chat, glm-4-9b-chat, chatglm3-6b 等

  • 限制:

    • 请求每分钟 (RPM) 限制为 100

    • 每秒请求数 (QPS) 限制为 3

    • 更多额度可以申请
      硅基流动提供了多种语言模型,适用于不同的应用场景,包括对话生成、文本理解等。对于需要高频率调用的用户,可以申请更高的额度。

6. Cloudflare Workers AI (国外)

  • 免费版本: 所有模型

  • 限制:

    • 每天免费 1 万次请求,最多可达 30 万次/月

    • 测试版本模型不限请求频率
      Cloudflare 提供的免费版本对于开发者来说是一个非常实惠的选择。它允许每天进行大量的 API 调用,非常适合初创企业和个人开发者进行测试和开发。

7. Llama Family

  • 免费版本: "Atom-13B-Chat", "Atom-7B-Chat", "Atom-1B-Chat", "Llama3-Chinese-8B-Instruct"

  • 限制:

    • 每天 8-22 点:每分钟最多 20 次并发

    • 每天 22 点至次日 8 点:每分钟最多 50 次并发
      Llama 系列模型适用于多语言的应用开发,特别是在中文处理方面表现突出。其灵活的请求频率控制能够很好地满足不同时段的需求。

8. Groq

  • 免费版本: gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192

  • 限制:

    • 每分钟请求数 (RPM) 为 30

    • 每日请求数 (RPD) 为 14400

    • 每分钟令牌数 (TOKENS PER MINUTE) 也有限制
      Groq 提供的 AI 模型包括多种不同规模的 Llama 和 Gemma 系列,适用于复杂的文本生成任务,特别适合对计算资源要求较高的场景。

9. Google Gemini

  • 免费版本: gemini-1.5-pro、gemini-1.5-flash、gemini-1.0-pro、gemini-pro-vision

  • 限制:

    • 每分钟请求数 (RPM) = 15

    • 每分钟令牌数 (TPM) = 100 万

    • 每日请求数 (RPD) = 1500 次
      Google 的 Gemini 系列大模型适合大规模的自然语言处理和视觉任务,特别适合图像与文本结合的应用场景。其每日请求和令牌限制对于大多数中小型应用足够使用,但对于高频次使用的场景可能需要申请更高的额度。

10. 阿里灵积 Dashscope

  • 免费版本: "chatglm3-6b", "baichuan-7b-v1", "yi-6b-chat", "yi-34b-chat", "aquilachat-7b", "deepseek-7b-chat", "internlm-7b-chat" 等

  • 限制:

    • 流量:每分钟请求数 (QPM) ≤ 120

    • Token 消耗:每分钟消耗的 Token 数目 ≤ 200,000

    • 超出上述任何条件时,将触发限流
      阿里云的灵积 Dashscope 提供了多个免费的 AI 模型,适合小规模的开发和测试。流量和令牌的限制使得该平台非常适合中小型项目,而大流量的应用可能需要向阿里申请更高的配额。

11. 文心智能体

  • 免费版本: 文心大模型 3.5

  • 限制: 目前免费
    文心智能体是文心大模型的一个版本,适用于多种语言任务,包括文本生成、对话系统等。该平台目前对用户免费开放,适合那些希望探索自然语言处理能力的用户。

12. NVIDIA

  • 免费版本: 所有模型

  • 限制:

    • 商业邮箱:获得 5000 个 API 积分

    • 个人邮箱:获得 1000 个 API 积分
      NVIDIA 提供的 API 积分可以帮助用户在不付费的情况下进行一定量的模型调用,非常适合开发者在其平台上进行AI模型实验。

13. Github Models

  • 免费版本: 所有模型

  • 限制: 需要申请
    GitHub 提供的模型接口需要申请接入,其免费版本的使用限制因具体模型而异。用户可以通过GitHub Marketplace申请并等待批准,适合希望通过开源社区共享资源的开发者。