6.0 KiB
6.0 KiB
AI API 价格对比与 SillyTavern 选择指南
🎯 问题背景
- SillyTavern 使用 Claude Sonnet 3.5 API 成本高达 $0.22/轮对话
- 寻找性价比更高的 AI API 替代方案
- 需要支持长上下文(至少 32K)以满足角色扮演需求
💰 API 价格对比表(2025年2月)
| 服务商 | 模型 | 输入价格 | 输出价格 | 月成本(12M tokens) | 上下文长度 | 备注 |
|---|---|---|---|---|---|---|
| DeepSeek | V3 | $0.07/M | $1.10/M | $4.96 | 较短 | 最便宜,API暂停充值 |
| DeepSeek | R1 | $0.14/M | $2.19/M | $9.88 | 较短 | 强推理能力 |
| Moonshot | v1-8k | $0.83/M | $0.83/M | $10.00 | 8K | 统一定价 |
| Moonshot | v1-32k | $1.67/M | $1.67/M | $20.00 | 32K | 适合长对话 |
| Moonshot | v1-128k | $4.17/M | $4.17/M | $50.00 | 128K | 超长上下文 |
| Gemini | 2.5 Pro | $1.25/M | $10.00/M | $50.00 | 1M | 最长上下文 |
| OpenAI | GPT-4o | $3.00/M | $10.00/M | $64.00 | 128K | 标准选择 |
| Claude | Sonnet 4 | $3.00/M | $15.00/M | $84.00 | 200K | 当前使用 |
| Claude | Opus | $15.00/M | $75.00/M | $420.00 | 200K | 最贵 |
🆓 白嫖 Gemini 2.5 Pro 攻略
免费额度详情
- 每天限制: 100 次请求
- 每分钟限制: 250,000 tokens
- 估算月免费额度: 约 750 万 tokens
- 相当于价值: $37.5/月
获取方法
- Google AI Studio: https://aistudio.google.com/
- 国内镜像站点:
- chat.lanjingai.org
- 其他免翻墙镜像
- 多账号策略: 注册多个 Google 账号轮换使用
技术优势
- 1M token 上下文窗口 (业界最长)
- 强代码生成能力
- 内置推理能力
- 多模态支持 (文本+图片)
- 无需翻墙 (通过国内镜像)
SillyTavern 接入配置
{
"api": "openai",
"api_server": "https://generativelanguage.googleapis.com/v1beta/",
"model": "gemini-2.5-pro",
"context_size": 1000000,
"max_tokens": 8192
}
🎮 SillyTavern 最佳选择推荐
预算优先 (月成本 <$10)
- DeepSeek V3: $4.96/月 - 极致性价比,但上下文较短
- DeepSeek R1: $9.88/月 - 强推理能力,适合复杂对话
平衡选择 (月成本 $10-50)
- Moonshot v1-32k: $20/月 - 32K上下文,中文优化
- Gemini 2.5 Pro: $50/月 - 1M上下文,技术领先
土豪选择 (月成本 >$50)
- Claude Sonnet 4: $84/月 - 高质量输出,200K上下文
- Claude Opus: $420/月 - 最强智能,最贵价格
🏆 类脑社区选择 Gemini 2.5 Pro 的原因
开发者角度
- 免费额度充足: 每天750万tokens够开发使用
- 超长上下文: 1M tokens 满足复杂角色设定
- 稳定输出: 格式化要求高的场景
- 成本分摊: 开发成本分摊到整个社区
用户角度
- 免费使用: 通过社区共享的卡片
- 高质量体验: 1M上下文提供流畅对话
- 无需付费: 薅免费额度即可
🔧 实际部署建议
立即可行方案
- 试用 Gemini 2.5 Pro 免费额度
- 配置 SillyTavern 接入
- 测试长对话效果
备选方案
- Moonshot v1-32k - 如果免费额度不够用
- DeepSeek V3 - 如果预算极其有限
- 本地模型 - 如果要完全免费
混合策略
- 开发测试: 使用 Gemini 2.5 Pro 免费额度
- 日常使用: Moonshot v1-32k 付费API
- 备用方案: DeepSeek V3 应急使用
🇺🇸 美国用户特殊优势
直接访问优势
- 无需翻墙: 直接访问 https://aistudio.google.com/
- 官方服务: 更稳定,完整功能
- 时区优势: 避开高峰期,响应更快
免费资源扩展
- Google Colab: 免费GPU + Gemini API
- Vertex AI: 新用户$300免费额度
- 多账号策略: 5个Gmail账号 × 750万tokens = 3750万tokens/月
特殊技巧
- 企业邮箱: .edu邮箱可能有更高限制
- 开发者计划: Google Developer Program额外额度
- 学生优惠: GitHub Student Pack等资源
📋 TODO: 今晚配置任务
🎯 主要任务 (晚上回家完成)
- 注册/登录 Google AI Studio (https://aistudio.google.com/)
- 获取 Gemini 2.5 Pro API Key
- 配置 SillyTavern 接入 Gemini 2.5 Pro
- 测试基本对话功能
- 测试长上下文能力 (角色扮演场景)
🔧 具体配置步骤
-
Google AI Studio设置
- 访问 https://aistudio.google.com/
- 点击 "Get API Key"
- 创建新项目或选择现有项目
- 复制API Key
-
SillyTavern配置
{ "api": "google", "api_server": "https://generativelanguage.googleapis.com/v1beta/", "model": "gemini-2.5-pro", "api_key": "your-google-api-key", "context_size": 1000000, "max_tokens": 8192 } -
测试项目
- 基础对话测试
- 长对话测试 (>32K tokens)
- 角色扮演场景测试
- 与现有Claude API效果对比
🚀 扩展任务 (可选)
- 注册2-3个额外Gmail账号 (扩大免费额度)
- 申请Google Cloud $300免费额度
- 配置备用API (Moonshot v1-32k)
- 记录使用体验和成本对比
📊 测试指标
- 响应速度: 与Claude Sonnet对比
- 对话质量: 角色扮演效果
- 上下文能力: 长对话连贯性
- 成本效益: 免费额度使用情况
- 稳定性: 是否有限制或中断
🎯 预期结果
- 月成本: 从$84降到$0-50
- 上下文: 从200K提升到1M tokens
- 体验: 保持或提升对话质量
🚨 注意事项
DeepSeek 限制
- API 充值暂停 (服务器压力大)
- 上下文长度不足 (SillyTavern 体验差)
- 输出格式不稳定
Gemini 2.5 Pro 限制
- 免费额度有限 (每天100次)
- 需要 Google 账号
- 可能需要处理访问限制
长期趋势
- 中国 AI 公司价格战激烈
- 免费额度可能随时调整
- 建议多准备几个备选方案
更新时间: 2025-07-17
下次更新: 价格变化时及时更新