Files
docker-configs/list.md
2025-07-18 00:00:01 -05:00

6.0 KiB
Raw Permalink Blame History

AI API 价格对比与 SillyTavern 选择指南

🎯 问题背景

  • SillyTavern 使用 Claude Sonnet 3.5 API 成本高达 $0.22/轮对话
  • 寻找性价比更高的 AI API 替代方案
  • 需要支持长上下文(至少 32K以满足角色扮演需求

💰 API 价格对比表2025年2月

服务商 模型 输入价格 输出价格 月成本(12M tokens) 上下文长度 备注
DeepSeek V3 $0.07/M $1.10/M $4.96 较短 最便宜API暂停充值
DeepSeek R1 $0.14/M $2.19/M $9.88 较短 强推理能力
Moonshot v1-8k $0.83/M $0.83/M $10.00 8K 统一定价
Moonshot v1-32k $1.67/M $1.67/M $20.00 32K 适合长对话
Moonshot v1-128k $4.17/M $4.17/M $50.00 128K 超长上下文
Gemini 2.5 Pro $1.25/M $10.00/M $50.00 1M 最长上下文
OpenAI GPT-4o $3.00/M $10.00/M $64.00 128K 标准选择
Claude Sonnet 4 $3.00/M $15.00/M $84.00 200K 当前使用
Claude Opus $15.00/M $75.00/M $420.00 200K 最贵

🆓 白嫖 Gemini 2.5 Pro 攻略

免费额度详情

  • 每天限制: 100 次请求
  • 每分钟限制: 250,000 tokens
  • 估算月免费额度: 约 750 万 tokens
  • 相当于价值: $37.5/月

获取方法

  1. Google AI Studio: https://aistudio.google.com/
  2. 国内镜像站点:
    • chat.lanjingai.org
    • 其他免翻墙镜像
  3. 多账号策略: 注册多个 Google 账号轮换使用

技术优势

  • 1M token 上下文窗口 (业界最长)
  • 强代码生成能力
  • 内置推理能力
  • 多模态支持 (文本+图片)
  • 无需翻墙 (通过国内镜像)

SillyTavern 接入配置

{
  "api": "openai",
  "api_server": "https://generativelanguage.googleapis.com/v1beta/",
  "model": "gemini-2.5-pro",
  "context_size": 1000000,
  "max_tokens": 8192
}

🎮 SillyTavern 最佳选择推荐

预算优先 (月成本 <$10)

  1. DeepSeek V3: $4.96/月 - 极致性价比,但上下文较短
  2. DeepSeek R1: $9.88/月 - 强推理能力,适合复杂对话

平衡选择 (月成本 $10-50)

  1. Moonshot v1-32k: $20/月 - 32K上下文中文优化
  2. Gemini 2.5 Pro: $50/月 - 1M上下文技术领先

土豪选择 (月成本 >$50)

  1. Claude Sonnet 4: $84/月 - 高质量输出200K上下文
  2. Claude Opus: $420/月 - 最强智能,最贵价格

🏆 类脑社区选择 Gemini 2.5 Pro 的原因

开发者角度

  • 免费额度充足: 每天750万tokens够开发使用
  • 超长上下文: 1M tokens 满足复杂角色设定
  • 稳定输出: 格式化要求高的场景
  • 成本分摊: 开发成本分摊到整个社区

用户角度

  • 免费使用: 通过社区共享的卡片
  • 高质量体验: 1M上下文提供流畅对话
  • 无需付费: 薅免费额度即可

🔧 实际部署建议

立即可行方案

  1. 试用 Gemini 2.5 Pro 免费额度
  2. 配置 SillyTavern 接入
  3. 测试长对话效果

备选方案

  1. Moonshot v1-32k - 如果免费额度不够用
  2. DeepSeek V3 - 如果预算极其有限
  3. 本地模型 - 如果要完全免费

混合策略

  • 开发测试: 使用 Gemini 2.5 Pro 免费额度
  • 日常使用: Moonshot v1-32k 付费API
  • 备用方案: DeepSeek V3 应急使用

🇺🇸 美国用户特殊优势

直接访问优势

  • 无需翻墙: 直接访问 https://aistudio.google.com/
  • 官方服务: 更稳定,完整功能
  • 时区优势: 避开高峰期,响应更快

免费资源扩展

  • Google Colab: 免费GPU + Gemini API
  • Vertex AI: 新用户$300免费额度
  • 多账号策略: 5个Gmail账号 × 750万tokens = 3750万tokens/月

特殊技巧

  • 企业邮箱: .edu邮箱可能有更高限制
  • 开发者计划: Google Developer Program额外额度
  • 学生优惠: GitHub Student Pack等资源

📋 TODO: 今晚配置任务

🎯 主要任务 (晚上回家完成)

  • 注册/登录 Google AI Studio (https://aistudio.google.com/)
  • 获取 Gemini 2.5 Pro API Key
  • 配置 SillyTavern 接入 Gemini 2.5 Pro
  • 测试基本对话功能
  • 测试长上下文能力 (角色扮演场景)

🔧 具体配置步骤

  1. Google AI Studio设置

  2. SillyTavern配置

    {
      "api": "google",
      "api_server": "https://generativelanguage.googleapis.com/v1beta/",
      "model": "gemini-2.5-pro",
      "api_key": "your-google-api-key",
      "context_size": 1000000,
      "max_tokens": 8192
    }
    
  3. 测试项目

    • 基础对话测试
    • 长对话测试 (>32K tokens)
    • 角色扮演场景测试
    • 与现有Claude API效果对比

🚀 扩展任务 (可选)

  • 注册2-3个额外Gmail账号 (扩大免费额度)
  • 申请Google Cloud $300免费额度
  • 配置备用API (Moonshot v1-32k)
  • 记录使用体验和成本对比

📊 测试指标

  • 响应速度: 与Claude Sonnet对比
  • 对话质量: 角色扮演效果
  • 上下文能力: 长对话连贯性
  • 成本效益: 免费额度使用情况
  • 稳定性: 是否有限制或中断

🎯 预期结果

  • 月成本: 从$84降到$0-50
  • 上下文: 从200K提升到1M tokens
  • 体验: 保持或提升对话质量

🚨 注意事项

DeepSeek 限制

  • API 充值暂停 (服务器压力大)
  • 上下文长度不足 (SillyTavern 体验差)
  • 输出格式不稳定

Gemini 2.5 Pro 限制

  • 免费额度有限 (每天100次)
  • 需要 Google 账号
  • 可能需要处理访问限制

长期趋势

  • 中国 AI 公司价格战激烈
  • 免费额度可能随时调整
  • 建议多准备几个备选方案

更新时间: 2025-07-17
下次更新: 价格变化时及时更新