111 Nếu bạn đang tìm một open-weight LLM thật sự dùng được cho coding và agentic task dài hơi— không phải chỉ giải bài toán nhỏ mà còn duy trì context và logic xuyên suốt nhiều giờ làm việc— GLM-5.2 của Z.ai (Zhipu) đáng để bạn thử ngay. 

Model 744B tham số (MoE, chỉ 40B active mỗi lần inference) được phát hành dưới license MIT hoàn toàn, có thể chạy qua Ollama, llama.cpp, vLLM hoặc LM Studio — tự host trên hạ tầng của chính bạn.Tính năng nổi bật:• 1M-token context "thực dùng được": không chỉ nhận nhiều token mà còn duy trì hiệu suất ổn định xuyên suốt context dài — đủ để load cả project-level engineering context.• Hiệu năng sát frontier closed-source: trên Terminal-Bench 2.1 đạt 81.0 điểm, chỉ kém Claude Opus 4.8 (85.0) vài điểm, vượt qua Gemini 3.1 Pro.• Hai cấp độ reasoning effort: chọn giữa "max" (đẩy giới hạn năng lực) và "high" (cân bằng tốc độ/chi phí) tùy nhu cầu task.• Benchmark long-horizon mạnh: trên FrontierSWE (đo khả năng hoàn thành project mở kéo dài hàng chục giờ) chỉ kém Opus 4.8 1%, vượt GPT-5.5 và Opus 4.7• MIT license hoàn toàn: weight, inference stack đều mở — tự deploy, không phụ thuộc cloud, không sợ bị "rút phích".• Tích hợp sẵn vào agent ecosystem: chạy trực tiếp với Claude Code, Codex App, Hermes Agent, OpenClaw chỉ bằng một lệnh `ollama launch ... --model glm-5.2:cloud`.• Có cả bản cloud (qua Ollama, hosting trên NVIDIA Blackwell GPU, chính sách zero-retention) và bản tự host local cho ai muốn full control phần cứng.• MoE architecture giúp khả thi chạy local: dù 744B tham số tổng nhưng chỉ 40B active, nên quant 2-bit có thể chạy trên máy 256GB+ RAM (Mac Studio, multi-GPU setup).

Phù hợp cho ai:🤖 AI Engineer/Developer muốn agent coding mạnh ngang tầm Opus mà không lệ thuộc API closed-source

🏢 Team muốn tự host LLM cho dữ liệu nhạy cảm, không muốn gửi code/data lên cloud bên thứ ba🔬 Researcher cần model open-weight để fine-tune hoặc nghiên cứu reasoning dài hạn

Điểm thú vị:GLM-5.2 là phiên bản thứ 3 trong dòng GLM-5 chỉ trong thời gian ngắn — từ GLM-5 → GLM-5.1 → GLM-5.2 — cho thấy Z.ai đang chạy đua tốc độ cải tiến rất nhanh để bám sát các model closed-source hàng đầu.

#aicoding#python#docker#git#claudecode#aiagents#vibecoding