# AI API 价格对比与 SillyTavern 选择指南 ## 🎯 问题背景 - SillyTavern 使用 Claude Sonnet 3.5 API 成本高达 $0.22/轮对话 - 寻找性价比更高的 AI API 替代方案 - 需要支持长上下文(至少 32K)以满足角色扮演需求 ## 💰 API 价格对比表(2025年2月) | 服务商 | 模型 | 输入价格 | 输出价格 | 月成本(12M tokens) | 上下文长度 | 备注 | |--------|------|----------|----------|-------------------|------------|------| | **DeepSeek** | V3 | $0.07/M | $1.10/M | **$4.96** | 较短 | 最便宜,API暂停充值 | | **DeepSeek** | R1 | $0.14/M | $2.19/M | $9.88 | 较短 | 强推理能力 | | **Moonshot** | v1-8k | $0.83/M | $0.83/M | $10.00 | 8K | 统一定价 | | **Moonshot** | v1-32k | $1.67/M | $1.67/M | $20.00 | 32K | 适合长对话 | | **Moonshot** | v1-128k | $4.17/M | $4.17/M | $50.00 | 128K | 超长上下文 | | **Gemini** | 2.5 Pro | $1.25/M | $10.00/M | $50.00 | 1M | 最长上下文 | | **OpenAI** | GPT-4o | $3.00/M | $10.00/M | $64.00 | 128K | 标准选择 | | **Claude** | Sonnet 4 | $3.00/M | $15.00/M | $84.00 | 200K | 当前使用 | | **Claude** | Opus | $15.00/M | $75.00/M | $420.00 | 200K | 最贵 | ## 🆓 白嫖 Gemini 2.5 Pro 攻略 ### 免费额度详情 - **每天限制**: 100 次请求 - **每分钟限制**: 250,000 tokens - **估算月免费额度**: 约 750 万 tokens - **相当于价值**: $37.5/月 ### 获取方法 1. **Google AI Studio**: https://aistudio.google.com/ 2. **国内镜像站点**: - chat.lanjingai.org - 其他免翻墙镜像 3. **多账号策略**: 注册多个 Google 账号轮换使用 ### 技术优势 - **1M token 上下文窗口** (业界最长) - **强代码生成能力** - **内置推理能力** - **多模态支持** (文本+图片) - **无需翻墙** (通过国内镜像) ### SillyTavern 接入配置 ```json { "api": "openai", "api_server": "https://generativelanguage.googleapis.com/v1beta/", "model": "gemini-2.5-pro", "context_size": 1000000, "max_tokens": 8192 } ``` ## 🎮 SillyTavern 最佳选择推荐 ### 预算优先 (月成本 <$10) 1. **DeepSeek V3**: $4.96/月 - 极致性价比,但上下文较短 2. **DeepSeek R1**: $9.88/月 - 强推理能力,适合复杂对话 ### 平衡选择 (月成本 $10-50) 1. **Moonshot v1-32k**: $20/月 - 32K上下文,中文优化 2. **Gemini 2.5 Pro**: $50/月 - 1M上下文,技术领先 ### 土豪选择 (月成本 >$50) 1. **Claude Sonnet 4**: $84/月 - 高质量输出,200K上下文 2. **Claude Opus**: $420/月 - 最强智能,最贵价格 ## 🏆 类脑社区选择 Gemini 2.5 Pro 的原因 ### 开发者角度 - **免费额度充足**: 每天750万tokens够开发使用 - **超长上下文**: 1M tokens 满足复杂角色设定 - **稳定输出**: 格式化要求高的场景 - **成本分摊**: 开发成本分摊到整个社区 ### 用户角度 - **免费使用**: 通过社区共享的卡片 - **高质量体验**: 1M上下文提供流畅对话 - **无需付费**: 薅免费额度即可 ## 🔧 实际部署建议 ### 立即可行方案 1. **试用 Gemini 2.5 Pro 免费额度** 2. **配置 SillyTavern 接入** 3. **测试长对话效果** ### 备选方案 1. **Moonshot v1-32k** - 如果免费额度不够用 2. **DeepSeek V3** - 如果预算极其有限 3. **本地模型** - 如果要完全免费 ### 混合策略 - **开发测试**: 使用 Gemini 2.5 Pro 免费额度 - **日常使用**: Moonshot v1-32k 付费API - **备用方案**: DeepSeek V3 应急使用 ## 🇺🇸 美国用户特殊优势 ### 直接访问优势 - **无需翻墙**: 直接访问 https://aistudio.google.com/ - **官方服务**: 更稳定,完整功能 - **时区优势**: 避开高峰期,响应更快 ### 免费资源扩展 - **Google Colab**: 免费GPU + Gemini API - **Vertex AI**: 新用户$300免费额度 - **多账号策略**: 5个Gmail账号 × 750万tokens = 3750万tokens/月 ### 特殊技巧 - **企业邮箱**: .edu邮箱可能有更高限制 - **开发者计划**: Google Developer Program额外额度 - **学生优惠**: GitHub Student Pack等资源 ## 📋 TODO: 今晚配置任务 ### 🎯 主要任务 (晚上回家完成) - [ ] **注册/登录 Google AI Studio** (https://aistudio.google.com/) - [ ] **获取 Gemini 2.5 Pro API Key** - [ ] **配置 SillyTavern 接入 Gemini 2.5 Pro** - [ ] **测试基本对话功能** - [ ] **测试长上下文能力** (角色扮演场景) ### 🔧 具体配置步骤 1. **Google AI Studio设置** - 访问 https://aistudio.google.com/ - 点击 "Get API Key" - 创建新项目或选择现有项目 - 复制API Key 2. **SillyTavern配置** ```json { "api": "google", "api_server": "https://generativelanguage.googleapis.com/v1beta/", "model": "gemini-2.5-pro", "api_key": "your-google-api-key", "context_size": 1000000, "max_tokens": 8192 } ``` 3. **测试项目** - 基础对话测试 - 长对话测试 (>32K tokens) - 角色扮演场景测试 - 与现有Claude API效果对比 ### 🚀 扩展任务 (可选) - [ ] **注册2-3个额外Gmail账号** (扩大免费额度) - [ ] **申请Google Cloud $300免费额度** - [ ] **配置备用API** (Moonshot v1-32k) - [ ] **记录使用体验和成本对比** ### 📊 测试指标 - **响应速度**: 与Claude Sonnet对比 - **对话质量**: 角色扮演效果 - **上下文能力**: 长对话连贯性 - **成本效益**: 免费额度使用情况 - **稳定性**: 是否有限制或中断 ### 🎯 预期结果 - **月成本**: 从$84降到$0-50 - **上下文**: 从200K提升到1M tokens - **体验**: 保持或提升对话质量 ## 🚨 注意事项 ### DeepSeek 限制 - API 充值暂停 (服务器压力大) - 上下文长度不足 (SillyTavern 体验差) - 输出格式不稳定 ### Gemini 2.5 Pro 限制 - 免费额度有限 (每天100次) - 需要 Google 账号 - 可能需要处理访问限制 ### 长期趋势 - 中国 AI 公司价格战激烈 - 免费额度可能随时调整 - 建议多准备几个备选方案 --- **更新时间**: 2025-07-17 **下次更新**: 价格变化时及时更新