Files
docker-configs/list.md
2025-07-18 00:00:01 -05:00

188 lines
6.0 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# AI API 价格对比与 SillyTavern 选择指南
## 🎯 问题背景
- SillyTavern 使用 Claude Sonnet 3.5 API 成本高达 $0.22/轮对话
- 寻找性价比更高的 AI API 替代方案
- 需要支持长上下文(至少 32K以满足角色扮演需求
## 💰 API 价格对比表2025年2月
| 服务商 | 模型 | 输入价格 | 输出价格 | 月成本(12M tokens) | 上下文长度 | 备注 |
|--------|------|----------|----------|-------------------|------------|------|
| **DeepSeek** | V3 | $0.07/M | $1.10/M | **$4.96** | 较短 | 最便宜API暂停充值 |
| **DeepSeek** | R1 | $0.14/M | $2.19/M | $9.88 | 较短 | 强推理能力 |
| **Moonshot** | v1-8k | $0.83/M | $0.83/M | $10.00 | 8K | 统一定价 |
| **Moonshot** | v1-32k | $1.67/M | $1.67/M | $20.00 | 32K | 适合长对话 |
| **Moonshot** | v1-128k | $4.17/M | $4.17/M | $50.00 | 128K | 超长上下文 |
| **Gemini** | 2.5 Pro | $1.25/M | $10.00/M | $50.00 | 1M | 最长上下文 |
| **OpenAI** | GPT-4o | $3.00/M | $10.00/M | $64.00 | 128K | 标准选择 |
| **Claude** | Sonnet 4 | $3.00/M | $15.00/M | $84.00 | 200K | 当前使用 |
| **Claude** | Opus | $15.00/M | $75.00/M | $420.00 | 200K | 最贵 |
## 🆓 白嫖 Gemini 2.5 Pro 攻略
### 免费额度详情
- **每天限制**: 100 次请求
- **每分钟限制**: 250,000 tokens
- **估算月免费额度**: 约 750 万 tokens
- **相当于价值**: $37.5/月
### 获取方法
1. **Google AI Studio**: https://aistudio.google.com/
2. **国内镜像站点**:
- chat.lanjingai.org
- 其他免翻墙镜像
3. **多账号策略**: 注册多个 Google 账号轮换使用
### 技术优势
- **1M token 上下文窗口** (业界最长)
- **强代码生成能力**
- **内置推理能力**
- **多模态支持** (文本+图片)
- **无需翻墙** (通过国内镜像)
### SillyTavern 接入配置
```json
{
"api": "openai",
"api_server": "https://generativelanguage.googleapis.com/v1beta/",
"model": "gemini-2.5-pro",
"context_size": 1000000,
"max_tokens": 8192
}
```
## 🎮 SillyTavern 最佳选择推荐
### 预算优先 (月成本 <$10)
1. **DeepSeek V3**: $4.96/月 - 极致性价比,但上下文较短
2. **DeepSeek R1**: $9.88/月 - 强推理能力,适合复杂对话
### 平衡选择 (月成本 $10-50)
1. **Moonshot v1-32k**: $20/月 - 32K上下文中文优化
2. **Gemini 2.5 Pro**: $50/月 - 1M上下文技术领先
### 土豪选择 (月成本 >$50)
1. **Claude Sonnet 4**: $84/月 - 高质量输出200K上下文
2. **Claude Opus**: $420/月 - 最强智能,最贵价格
## 🏆 类脑社区选择 Gemini 2.5 Pro 的原因
### 开发者角度
- **免费额度充足**: 每天750万tokens够开发使用
- **超长上下文**: 1M tokens 满足复杂角色设定
- **稳定输出**: 格式化要求高的场景
- **成本分摊**: 开发成本分摊到整个社区
### 用户角度
- **免费使用**: 通过社区共享的卡片
- **高质量体验**: 1M上下文提供流畅对话
- **无需付费**: 薅免费额度即可
## 🔧 实际部署建议
### 立即可行方案
1. **试用 Gemini 2.5 Pro 免费额度**
2. **配置 SillyTavern 接入**
3. **测试长对话效果**
### 备选方案
1. **Moonshot v1-32k** - 如果免费额度不够用
2. **DeepSeek V3** - 如果预算极其有限
3. **本地模型** - 如果要完全免费
### 混合策略
- **开发测试**: 使用 Gemini 2.5 Pro 免费额度
- **日常使用**: Moonshot v1-32k 付费API
- **备用方案**: DeepSeek V3 应急使用
## 🇺🇸 美国用户特殊优势
### 直接访问优势
- **无需翻墙**: 直接访问 https://aistudio.google.com/
- **官方服务**: 更稳定,完整功能
- **时区优势**: 避开高峰期,响应更快
### 免费资源扩展
- **Google Colab**: 免费GPU + Gemini API
- **Vertex AI**: 新用户$300免费额度
- **多账号策略**: 5个Gmail账号 × 750万tokens = 3750万tokens/月
### 特殊技巧
- **企业邮箱**: .edu邮箱可能有更高限制
- **开发者计划**: Google Developer Program额外额度
- **学生优惠**: GitHub Student Pack等资源
## 📋 TODO: 今晚配置任务
### 🎯 主要任务 (晚上回家完成)
- [ ] **注册/登录 Google AI Studio** (https://aistudio.google.com/)
- [ ] **获取 Gemini 2.5 Pro API Key**
- [ ] **配置 SillyTavern 接入 Gemini 2.5 Pro**
- [ ] **测试基本对话功能**
- [ ] **测试长上下文能力** (角色扮演场景)
### 🔧 具体配置步骤
1. **Google AI Studio设置**
- 访问 https://aistudio.google.com/
- 点击 "Get API Key"
- 创建新项目或选择现有项目
- 复制API Key
2. **SillyTavern配置**
```json
{
"api": "google",
"api_server": "https://generativelanguage.googleapis.com/v1beta/",
"model": "gemini-2.5-pro",
"api_key": "your-google-api-key",
"context_size": 1000000,
"max_tokens": 8192
}
```
3. **测试项目**
- 基础对话测试
- 长对话测试 (>32K tokens)
- 角色扮演场景测试
- 与现有Claude API效果对比
### 🚀 扩展任务 (可选)
- [ ] **注册2-3个额外Gmail账号** (扩大免费额度)
- [ ] **申请Google Cloud $300免费额度**
- [ ] **配置备用API** (Moonshot v1-32k)
- [ ] **记录使用体验和成本对比**
### 📊 测试指标
- **响应速度**: 与Claude Sonnet对比
- **对话质量**: 角色扮演效果
- **上下文能力**: 长对话连贯性
- **成本效益**: 免费额度使用情况
- **稳定性**: 是否有限制或中断
### 🎯 预期结果
- **月成本**: 从$84降到$0-50
- **上下文**: 从200K提升到1M tokens
- **体验**: 保持或提升对话质量
## 🚨 注意事项
### DeepSeek 限制
- API 充值暂停 (服务器压力大)
- 上下文长度不足 (SillyTavern 体验差)
- 输出格式不稳定
### Gemini 2.5 Pro 限制
- 免费额度有限 (每天100次)
- 需要 Google 账号
- 可能需要处理访问限制
### 长期趋势
- 中国 AI 公司价格战激烈
- 免费额度可能随时调整
- 建议多准备几个备选方案
---
**更新时间**: 2025-07-17
**下次更新**: 价格变化时及时更新