#deepseek

4 篇文章

ai deep-dive 2026年5月9日

DeepSeek-OCR：把長上下文壓成圖片的 10× 壓縮實驗

DeepSeek-OCR 的論文題目是 Contexts Optical Compression — OCR 只是手段，真正驗證的是『把文字渲染成圖片再餵給 VLM』能達到 10× 壓縮且 97% 精度。這對長上下文 LLM 與 RAG 的 token 成本是質變。

#ocr #deepseek #vision-language-model #long-context #context-compression #rag

ai 2026年5月9日

2026 年 LLM Inference 服務商免費額度與定價：40+ 家分梯整理

個人專案、玩具 demo、做 RAG 原型，不想第一步就掏卡。整理 2026/05 還在運作的 40+ 家 LLM inference 服務商，按免費資源「是持續補充還是一次性」分梯，標註綁卡需求、模型清單、付費起價，數字全部從官方 pricing 頁驗證。中國原廠含智谱 GLM（永久免費）、豆包（每日 200 萬 tokens）、Kimi、百煉、Ollama 本地跑法一併收錄。

#llm #inference #pricing #free-tier #cerebras #groq #cloudflare-workers-ai #gemini #openrouter #deepseek #nvidia-nim #modal #ollama #mistral

ai project 2026年3月31日

2026 Q1 開源 LLM 全景圖：從前沿大模型到手機端，完整盤點

2026 Q1 開源模型全面爆發：LLM 方面 GLM-5、Kimi K2.5、Qwen3.5 追上閉源；Embedding 和 Reranker 由 Qwen3 和 BGE 主導；語音有 Voxtral TTS 和 Whisper V3；圖像有 FLUX.2；影片有 Wan 2.2 追平 Sora。這篇是完整導覽地圖。

#open-source #llm #glm-5 #kimi #deepseek #qwen #llama #gemma #mistral #minimax #phi #smollm #gpt-oss #moe #on-device-ai #embedding #reranker #tts #stt #image-generation #video-generation #code-model #ollama #vllm

ai guide 2026年3月28日

OpenClaw 更多供應商：DeepSeek、Groq、Ollama、OpenRouter、Bedrock...

除了 Anthropic/OpenAI/Google 三大家，OpenClaw 還支援 30+ 供應商，從 DeepSeek 到本地 Ollama 都有。

#openclaw #deepseek #groq #ollama #openrouter #vllm #bedrock #sglang #mistral