docker-configs/list.md

# AI API 价格对比与 SillyTavern 选择指南

## 🎯 问题背景
- SillyTavern 使用 Claude Sonnet 3.5 API 成本高达 $0.22/轮对话
- 寻找性价比更高的 AI API 替代方案
- 需要支持长上下文（至少 32K）以满足角色扮演需求

## 💰 API 价格对比表（2025年2月）

| 服务商 | 模型 | 输入价格 | 输出价格 | 月成本(12M tokens) | 上下文长度 | 备注 |
|--------|------|----------|----------|-------------------|------------|------|
| **DeepSeek** | V3 | $0.07/M | $1.10/M | **$4.96** | 较短 | 最便宜，API暂停充值 |
| **DeepSeek** | R1 | $0.14/M | $2.19/M | $9.88 | 较短 | 强推理能力 |
| **Moonshot** | v1-8k | $0.83/M | $0.83/M | $10.00 | 8K | 统一定价 |
| **Moonshot** | v1-32k | $1.67/M | $1.67/M | $20.00 | 32K | 适合长对话 |
| **Moonshot** | v1-128k | $4.17/M | $4.17/M | $50.00 | 128K | 超长上下文 |
| **Gemini** | 2.5 Pro | $1.25/M | $10.00/M | $50.00 | 1M | 最长上下文 |
| **OpenAI** | GPT-4o | $3.00/M | $10.00/M | $64.00 | 128K | 标准选择 |
| **Claude** | Sonnet 4 | $3.00/M | $15.00/M | $84.00 | 200K | 当前使用 |
| **Claude** | Opus | $15.00/M | $75.00/M | $420.00 | 200K | 最贵 |

## 🆓 白嫖 Gemini 2.5 Pro 攻略

### 免费额度详情
- **每天限制**: 100 次请求
- **每分钟限制**: 250,000 tokens
- **估算月免费额度**: 约 750 万 tokens
- **相当于价值**: $37.5/月

### 获取方法
1. **Google AI Studio**: https://aistudio.google.com/
2. **国内镜像站点**:
   - chat.lanjingai.org
   - 其他免翻墙镜像
3. **多账号策略**: 注册多个 Google 账号轮换使用

### 技术优势
- **1M token 上下文窗口** (业界最长)
- **强代码生成能力**
- **内置推理能力**
- **多模态支持** (文本+图片)
- **无需翻墙** (通过国内镜像)

### SillyTavern 接入配置
```json
{
  "api": "openai",
  "api_server": "https://generativelanguage.googleapis.com/v1beta/",
  "model": "gemini-2.5-pro",
  "context_size": 1000000,
  "max_tokens": 8192
}
```

## 🎮 SillyTavern 最佳选择推荐

### 预算优先 (月成本 <$10)
1. **DeepSeek V3**: $4.96/月 - 极致性价比，但上下文较短
2. **DeepSeek R1**: $9.88/月 - 强推理能力，适合复杂对话

### 平衡选择 (月成本 $10-50)
1. **Moonshot v1-32k**: $20/月 - 32K上下文，中文优化
2. **Gemini 2.5 Pro**: $50/月 - 1M上下文，技术领先

### 土豪选择 (月成本 >$50)
1. **Claude Sonnet 4**: $84/月 - 高质量输出，200K上下文
2. **Claude Opus**: $420/月 - 最强智能，最贵价格

## 🏆 类脑社区选择 Gemini 2.5 Pro 的原因

### 开发者角度
- **免费额度充足**: 每天750万tokens够开发使用
- **超长上下文**: 1M tokens 满足复杂角色设定
- **稳定输出**: 格式化要求高的场景
- **成本分摊**: 开发成本分摊到整个社区

### 用户角度
- **免费使用**: 通过社区共享的卡片
- **高质量体验**: 1M上下文提供流畅对话
- **无需付费**: 薅免费额度即可

## 🔧 实际部署建议

### 立即可行方案
1. **试用 Gemini 2.5 Pro 免费额度**
2. **配置 SillyTavern 接入**
3. **测试长对话效果**

### 备选方案
1. **Moonshot v1-32k** - 如果免费额度不够用
2. **DeepSeek V3** - 如果预算极其有限
3. **本地模型** - 如果要完全免费

### 混合策略
- **开发测试**: 使用 Gemini 2.5 Pro 免费额度
- **日常使用**: Moonshot v1-32k 付费API
- **备用方案**: DeepSeek V3 应急使用

## 🇺🇸 美国用户特殊优势

### 直接访问优势
- **无需翻墙**: 直接访问 https://aistudio.google.com/
- **官方服务**: 更稳定，完整功能
- **时区优势**: 避开高峰期，响应更快

### 免费资源扩展
- **Google Colab**: 免费GPU + Gemini API
- **Vertex AI**: 新用户$300免费额度
- **多账号策略**: 5个Gmail账号 × 750万tokens = 3750万tokens/月

### 特殊技巧
- **企业邮箱**: .edu邮箱可能有更高限制
- **开发者计划**: Google Developer Program额外额度
- **学生优惠**: GitHub Student Pack等资源

## 📋 TODO: 今晚配置任务

### 🎯 主要任务 (晚上回家完成)
- [ ] **注册/登录 Google AI Studio** (https://aistudio.google.com/)
- [ ] **获取 Gemini 2.5 Pro API Key**
- [ ] **配置 SillyTavern 接入 Gemini 2.5 Pro**
- [ ] **测试基本对话功能**
- [ ] **测试长上下文能力** (角色扮演场景)

### 🔧 具体配置步骤
1. **Google AI Studio设置**
   - 访问 https://aistudio.google.com/
   - 点击 "Get API Key"
   - 创建新项目或选择现有项目
   - 复制API Key

2. **SillyTavern配置**
   ```json
   {
     "api": "google",
     "api_server": "https://generativelanguage.googleapis.com/v1beta/",
     "model": "gemini-2.5-pro",
     "api_key": "your-google-api-key",
     "context_size": 1000000,
     "max_tokens": 8192
   }
   ```

3. **测试项目**
   - 基础对话测试
   - 长对话测试 (>32K tokens)
   - 角色扮演场景测试
   - 与现有Claude API效果对比

### 🚀 扩展任务 (可选)
- [ ] **注册2-3个额外Gmail账号** (扩大免费额度)
- [ ] **申请Google Cloud $300免费额度**
- [ ] **配置备用API** (Moonshot v1-32k)
- [ ] **记录使用体验和成本对比**

### 📊 测试指标
- **响应速度**: 与Claude Sonnet对比
- **对话质量**: 角色扮演效果
- **上下文能力**: 长对话连贯性
- **成本效益**: 免费额度使用情况
- **稳定性**: 是否有限制或中断

### 🎯 预期结果
- **月成本**: 从$84降到$0-50
- **上下文**: 从200K提升到1M tokens
- **体验**: 保持或提升对话质量

## 🚨 注意事项

### DeepSeek 限制
- API 充值暂停 (服务器压力大)
- 上下文长度不足 (SillyTavern 体验差)
- 输出格式不稳定

### Gemini 2.5 Pro 限制
- 免费额度有限 (每天100次)
- 需要 Google 账号
- 可能需要处理访问限制

### 长期趋势
- 中国 AI 公司价格战激烈
- 免费额度可能随时调整
- 建议多准备几个备选方案

---

**更新时间**: 2025-07-17
**下次更新**: 价格变化时及时更新