188 lines
6.0 KiB
Markdown
188 lines
6.0 KiB
Markdown
# AI API 价格对比与 SillyTavern 选择指南
|
||
|
||
## 🎯 问题背景
|
||
- SillyTavern 使用 Claude Sonnet 3.5 API 成本高达 $0.22/轮对话
|
||
- 寻找性价比更高的 AI API 替代方案
|
||
- 需要支持长上下文(至少 32K)以满足角色扮演需求
|
||
|
||
## 💰 API 价格对比表(2025年2月)
|
||
|
||
| 服务商 | 模型 | 输入价格 | 输出价格 | 月成本(12M tokens) | 上下文长度 | 备注 |
|
||
|--------|------|----------|----------|-------------------|------------|------|
|
||
| **DeepSeek** | V3 | $0.07/M | $1.10/M | **$4.96** | 较短 | 最便宜,API暂停充值 |
|
||
| **DeepSeek** | R1 | $0.14/M | $2.19/M | $9.88 | 较短 | 强推理能力 |
|
||
| **Moonshot** | v1-8k | $0.83/M | $0.83/M | $10.00 | 8K | 统一定价 |
|
||
| **Moonshot** | v1-32k | $1.67/M | $1.67/M | $20.00 | 32K | 适合长对话 |
|
||
| **Moonshot** | v1-128k | $4.17/M | $4.17/M | $50.00 | 128K | 超长上下文 |
|
||
| **Gemini** | 2.5 Pro | $1.25/M | $10.00/M | $50.00 | 1M | 最长上下文 |
|
||
| **OpenAI** | GPT-4o | $3.00/M | $10.00/M | $64.00 | 128K | 标准选择 |
|
||
| **Claude** | Sonnet 4 | $3.00/M | $15.00/M | $84.00 | 200K | 当前使用 |
|
||
| **Claude** | Opus | $15.00/M | $75.00/M | $420.00 | 200K | 最贵 |
|
||
|
||
## 🆓 白嫖 Gemini 2.5 Pro 攻略
|
||
|
||
### 免费额度详情
|
||
- **每天限制**: 100 次请求
|
||
- **每分钟限制**: 250,000 tokens
|
||
- **估算月免费额度**: 约 750 万 tokens
|
||
- **相当于价值**: $37.5/月
|
||
|
||
### 获取方法
|
||
1. **Google AI Studio**: https://aistudio.google.com/
|
||
2. **国内镜像站点**:
|
||
- chat.lanjingai.org
|
||
- 其他免翻墙镜像
|
||
3. **多账号策略**: 注册多个 Google 账号轮换使用
|
||
|
||
### 技术优势
|
||
- **1M token 上下文窗口** (业界最长)
|
||
- **强代码生成能力**
|
||
- **内置推理能力**
|
||
- **多模态支持** (文本+图片)
|
||
- **无需翻墙** (通过国内镜像)
|
||
|
||
### SillyTavern 接入配置
|
||
```json
|
||
{
|
||
"api": "openai",
|
||
"api_server": "https://generativelanguage.googleapis.com/v1beta/",
|
||
"model": "gemini-2.5-pro",
|
||
"context_size": 1000000,
|
||
"max_tokens": 8192
|
||
}
|
||
```
|
||
|
||
## 🎮 SillyTavern 最佳选择推荐
|
||
|
||
### 预算优先 (月成本 <$10)
|
||
1. **DeepSeek V3**: $4.96/月 - 极致性价比,但上下文较短
|
||
2. **DeepSeek R1**: $9.88/月 - 强推理能力,适合复杂对话
|
||
|
||
### 平衡选择 (月成本 $10-50)
|
||
1. **Moonshot v1-32k**: $20/月 - 32K上下文,中文优化
|
||
2. **Gemini 2.5 Pro**: $50/月 - 1M上下文,技术领先
|
||
|
||
### 土豪选择 (月成本 >$50)
|
||
1. **Claude Sonnet 4**: $84/月 - 高质量输出,200K上下文
|
||
2. **Claude Opus**: $420/月 - 最强智能,最贵价格
|
||
|
||
## 🏆 类脑社区选择 Gemini 2.5 Pro 的原因
|
||
|
||
### 开发者角度
|
||
- **免费额度充足**: 每天750万tokens够开发使用
|
||
- **超长上下文**: 1M tokens 满足复杂角色设定
|
||
- **稳定输出**: 格式化要求高的场景
|
||
- **成本分摊**: 开发成本分摊到整个社区
|
||
|
||
### 用户角度
|
||
- **免费使用**: 通过社区共享的卡片
|
||
- **高质量体验**: 1M上下文提供流畅对话
|
||
- **无需付费**: 薅免费额度即可
|
||
|
||
## 🔧 实际部署建议
|
||
|
||
### 立即可行方案
|
||
1. **试用 Gemini 2.5 Pro 免费额度**
|
||
2. **配置 SillyTavern 接入**
|
||
3. **测试长对话效果**
|
||
|
||
### 备选方案
|
||
1. **Moonshot v1-32k** - 如果免费额度不够用
|
||
2. **DeepSeek V3** - 如果预算极其有限
|
||
3. **本地模型** - 如果要完全免费
|
||
|
||
### 混合策略
|
||
- **开发测试**: 使用 Gemini 2.5 Pro 免费额度
|
||
- **日常使用**: Moonshot v1-32k 付费API
|
||
- **备用方案**: DeepSeek V3 应急使用
|
||
|
||
## 🇺🇸 美国用户特殊优势
|
||
|
||
### 直接访问优势
|
||
- **无需翻墙**: 直接访问 https://aistudio.google.com/
|
||
- **官方服务**: 更稳定,完整功能
|
||
- **时区优势**: 避开高峰期,响应更快
|
||
|
||
### 免费资源扩展
|
||
- **Google Colab**: 免费GPU + Gemini API
|
||
- **Vertex AI**: 新用户$300免费额度
|
||
- **多账号策略**: 5个Gmail账号 × 750万tokens = 3750万tokens/月
|
||
|
||
### 特殊技巧
|
||
- **企业邮箱**: .edu邮箱可能有更高限制
|
||
- **开发者计划**: Google Developer Program额外额度
|
||
- **学生优惠**: GitHub Student Pack等资源
|
||
|
||
## 📋 TODO: 今晚配置任务
|
||
|
||
### 🎯 主要任务 (晚上回家完成)
|
||
- [ ] **注册/登录 Google AI Studio** (https://aistudio.google.com/)
|
||
- [ ] **获取 Gemini 2.5 Pro API Key**
|
||
- [ ] **配置 SillyTavern 接入 Gemini 2.5 Pro**
|
||
- [ ] **测试基本对话功能**
|
||
- [ ] **测试长上下文能力** (角色扮演场景)
|
||
|
||
### 🔧 具体配置步骤
|
||
1. **Google AI Studio设置**
|
||
- 访问 https://aistudio.google.com/
|
||
- 点击 "Get API Key"
|
||
- 创建新项目或选择现有项目
|
||
- 复制API Key
|
||
|
||
2. **SillyTavern配置**
|
||
```json
|
||
{
|
||
"api": "google",
|
||
"api_server": "https://generativelanguage.googleapis.com/v1beta/",
|
||
"model": "gemini-2.5-pro",
|
||
"api_key": "your-google-api-key",
|
||
"context_size": 1000000,
|
||
"max_tokens": 8192
|
||
}
|
||
```
|
||
|
||
3. **测试项目**
|
||
- 基础对话测试
|
||
- 长对话测试 (>32K tokens)
|
||
- 角色扮演场景测试
|
||
- 与现有Claude API效果对比
|
||
|
||
### 🚀 扩展任务 (可选)
|
||
- [ ] **注册2-3个额外Gmail账号** (扩大免费额度)
|
||
- [ ] **申请Google Cloud $300免费额度**
|
||
- [ ] **配置备用API** (Moonshot v1-32k)
|
||
- [ ] **记录使用体验和成本对比**
|
||
|
||
### 📊 测试指标
|
||
- **响应速度**: 与Claude Sonnet对比
|
||
- **对话质量**: 角色扮演效果
|
||
- **上下文能力**: 长对话连贯性
|
||
- **成本效益**: 免费额度使用情况
|
||
- **稳定性**: 是否有限制或中断
|
||
|
||
### 🎯 预期结果
|
||
- **月成本**: 从$84降到$0-50
|
||
- **上下文**: 从200K提升到1M tokens
|
||
- **体验**: 保持或提升对话质量
|
||
|
||
## 🚨 注意事项
|
||
|
||
### DeepSeek 限制
|
||
- API 充值暂停 (服务器压力大)
|
||
- 上下文长度不足 (SillyTavern 体验差)
|
||
- 输出格式不稳定
|
||
|
||
### Gemini 2.5 Pro 限制
|
||
- 免费额度有限 (每天100次)
|
||
- 需要 Google 账号
|
||
- 可能需要处理访问限制
|
||
|
||
### 长期趋势
|
||
- 中国 AI 公司价格战激烈
|
||
- 免费额度可能随时调整
|
||
- 建议多准备几个备选方案
|
||
|
||
---
|
||
|
||
**更新时间**: 2025-07-17
|
||
**下次更新**: 价格变化时及时更新 |