Bắt đầu từ con số 0, cài đặt Claude Code—trình hiểu ngôn ngữ tự nhiên, viết mã và tự động hóa công việc—trên máy tính của bạn, và sử dụng nó để tạo ra sản phẩm chức năng đầu tiên của bạn.
Bắt Đầu
- Người Mới Hoàn Toàn: Làm theo Chương 1 đến 5 theo thứ tự. Khi bạn chạy được công cụ web đầu tiên, bạn đã chính thức bắt đầu.
- Gặp Lỗi: Chụp ảnh màn hình và đưa cho Claude Code hoặc Doubao. Mô tả "tôi đang ở bước nào và thấy lỗi gì." Cách này hiệu quả gấp 10 lần so với tự mình tìm kiếm trên Google.
Chương 1: Nắm Vững Các Khái Niệm Cơ Bản
Nếu bạn không thể hiểu được các bài livestream hay hướng dẫn, thường không phải vì bạn không thông minh, mà vì các thuật ngữ chưa được kết nối với nhau. Chương này sẽ giải thích các từ sẽ xuất hiện nhiều lần.
1.1 Ba Khái Niệm Cốt Lõi
1Model = Bộ não (Chỉ biết suy nghĩ, không có tay chân)2Chatbot = Bộ não + Miệng (Có thể nói nhưng không thể làm)3Agent = Bộ não + Tay/Chân + Hộp công cụ (Vừa nói vừa làm)
- Model: GPT, Claude, Gemini, DeepSeek, Doubao, Qwen, Kimi, GLM, MiniMax... đây là các model, "bộ não."
- Chatbot: Giao diện web ChatGPT, Ứng dụng Doubao, hộp thoại DeepSeek. Bạn hỏi, nó trả lời, nhưng bạn phải tự làm mọi việc.
- Agent: Bạn nói "giúp tôi xây một website," nó tự tạo thư mục, viết mã, chạy và sửa lỗi trên máy tính của bạn, cuối cùng nói với bạn "xong rồi." Claude Code là một Agent.
Cùng một model nhưng trong các công cụ khác nhau có khả năng rất khác nhau. Cùng một model Claude chỉ là chat trên trình duyệt, nhưng trong Claude Code, nó có thể tự viết mã.
1.2 Token, Context, Harness
- Token: Đơn vị nhỏ nhất AI dùng để hiểu văn bản. 1 chữ tiếng Trung khoảng 1-2 Token; 1 từ tiếng Anh khoảng 1 Token. Token là "hóa đơn tiền điện" của bạn. Đừng tiết kiệm Token trong giai đoạn học.
- Context (Ngữ cảnh): Mọi thứ trong lượt trò chuyện này. AI không có trí nhớ dài hạn; nó chỉ có thể tham khảo những gì trên "bàn làm việc" hiện tại.
- Context Window (Cửa sổ ngữ cảnh): Kích thước "bàn làm việc" của mỗi model. Vào năm 2026, các model chính thống đã đạt 1 triệu Token (khoảng 700k-800k từ).
- Context Pollution (Ô nhiễm ngữ cảnh): Nói chuyện về nhiều chủ đề khác nhau trong một cửa sổ khiến AI bối rối. Một cửa sổ cho một nhiệm vụ; mở cửa sổ mới cho chủ đề mới.
- Harness / Context Engineering: Không phải phần mềm, mà là một tập hợp các phương pháp để làm chủ AI—cách tổ chức thông tin, quản lý ngữ cảnh, hướng dẫn AI và xác minh kết quả. Claude Code rất tốt vì Harness của nó là hoàn thiện nhất.
1.3 Kỹ Năng (Skill) là gì?
Kỹ năng (Skill) là một Sổ Tay Quy Trình (SOP) cho Claude.
Bánh Big Mac của McDonald's có vị giống nhau trên toàn cầu không phải vì mỗi cửa hàng có đầu bếp bậc thầy, mà vì mỗi cửa hàng đều có SOP. Một Kỹ năng (Skill) chính là SOP này cho Claude—xác định "làm gì trước, làm gì tiếp theo, dùng công cụ gì và thế nào là thành công."
- Viết một lần, gọi lại nhiều lần.
- Viết SOP của riêng bạn giống như việc "dạy" kinh nghiệm làm việc của bạn cho Claude; nó trở thành "nhân viên ảo" của bạn.
1.4 Ba Phương Thức Thanh Toán

Giải pháp thực tế nhất: Sử dụng API của các model nội địa + cc-switch để chuyển đổi một cú nhấp chuột. Chi tiết trong Chương 3.
1.5 Công Cụ Hỗ Trợ Cần Biết Trước Khi Cài Đặt

1.6 MCP — "Chuẩn Ổ Cắm" cho Agent
MCP là viết tắt của Model Context Protocol.
Hãy nghĩ về nó như một chuẩn ổ cắm—cho phép các Agent kết nối với nhiều công cụ và nguồn dữ liệu bên ngoài (Feishu, cơ sở dữ liệu, trình duyệt, Xiaohongshu, WeChat, v.v.).
So sánh:
- Cổng USB cho phép bạn cắm thiết bị ngoại vi vào máy tính; cắm loa vào, máy tính có thêm khả năng "phát nhạc."
- MCP cho phép bạn cắm các công cụ vào Claude Code; cắm Tavily vào, nó có thêm khả năng "tìm kiếm xu hướng thời gian thực"; cắm xiaohongshu-mcp vào, nó có thể "đăng bài lên Xiaohongshu."
Theo mặc định, Claude Code chỉ xử lý thông tin bạn đưa cho nó và sẽ không chủ động tìm kiếm trên internet. Bạn cần MCP để tìm kiếm, đọc cơ sở dữ liệu hoặc gọi các API bên ngoài.
1.7 Đa Phương Thức (Multimodal) — AI Làm Nhiều Hơn "Đọc Văn Bản"
Phương thức (Modality) là loại thông tin. Văn bản là một phương thức; hình ảnh, âm thanh và video là các phương thức khác.
- Đơn phương thức (Unimodal): Chỉ có thể xử lý văn bản.
- Đa phương thức (Multimodal): Có thể xử lý đồng thời văn bản, hình ảnh, âm thanh, video, tệp tin và ảnh chụp màn hình.
Hỗ trợ của các model chính thống năm 2026:

Đầu vào ≠ Đầu ra
AI có thể "nhìn thấy" một phương thức không có nghĩa là nó có thể "tạo ra" nó.
- Hình ảnh: Hầu hết các model chính thống đều có thể nhìn thấy hình ảnh; chỉ một số có thể vẽ chúng (GPT Image, Gemini, Doubao Seedance, Jimeng, Nano Banana, v.v.).
- Video: Gemini, Doubao và Kimi có thể xem video; nhưng các LLM không trực tiếp tạo video; chúng sử dụng các công cụ chuyên dụng (Wan, Seaweed Dance, Jimeng).
Điểm mạnh của Model:

Lời khuyên thực tế cho người mới bắt đầu: Đừng chỉ gõ chữ; hãy học cách ném ảnh chụp màn hình, bản ghi âm và video trực tiếp cho AI để tăng hiệu quả.
1.8 Bản Đồ Các Công Cụ AI (Ai Là Ai)
Một bản đồ để làm rõ sự nhầm lẫn về các công cụ khác nhau.
Công Cụ Agent (Giúp bạn làm việc)
``text
Công Cụ Agent
├── Dòng lệnh (Dựa trên Terminal, mạnh mẽ nhất)
│ ├── Claude Code —— Bởi Anthropic, hiện mạnh nhất, ngôi sao của hướng dẫn này
│ └── Codex CLI —— Bởi OpenAI, mã nguồn mở
│
├── GUI (Giao diện trực quan, thân thiện với người dùng)
│ ├── Codex Desktop/Web —— Bởi OpenAI
│ ├── Claude Cowork —— Bởi Anthropic, dành cho người dùng phi kỹ thuật
│ ├── Trae Solo —— Bởi ByteDance, nội địa, có chế độ Code và MTC
│ ├── WorkBuddy —— Bởi Tencent, nội địa, dành cho công việc văn phòng phi lập trình
│ └── Kiro —— Bởi AWS, IDE dựa trên spec (nhánh rẽ của VS Code)
│
├── Tự động (Chạy nền)
│ ├── OpenClaw —— Trước đây là Clawdbot, mã nguồn mở, điều khiển từ xa qua WeChat/TG
│ └── Hermes —— Bởi Nous Research, mã nguồn mở, bộ nhớ liên tục
│
└── Điều phối quy trình làm việc (Tự động hóa kiểu xếp khối)
└── COZE —— Bởi ByteDance, quy trình làm việc kéo-thả
``
Công Cụ Chatbot (Nói chuyện với bạn)
``text
Chatbot
├── Nước ngoài
│ ├── ChatGPT (model GPT)
│ ├── Claude.ai (model Claude)
│ ├── Gemini (model Google)
│ └── Grok (xAI/Elon Musk, dành cho các tác vụ liên quan đến X)
│
└── Nội địa
├── Doubao (ByteDance)
├── DeepSeek (Chi phí-hiệu suất cao)
├── Qwen (Alibaba)
├── Kimi (Moonshot AI)
├── WeChat Yuanbao (Tencent, dữ liệu hệ sinh thái WeChat mạnh)
└── GLM / Zhipu Qingyan (Zhipu AI)
``
"Tiếng Lóng" Phổ Biến trong Bình Luận:

1.9 Tóm Tắt Mối Quan Hệ Bằng Một Câu
1Bạn (Con người)2 ↕ Ngôn ngữ tự nhiên3Claude Code (Agent) —— Kết nối công cụ bên ngoài qua MCP4 ↕ Gọi5Model (Claude / GLM / MiniMax / Kimi…)6 ↕ Tiêu thụ7Token (Hóa đơn tiền điện)
Chương 2: Thiết Lập Môi Trường
Cài đặt 4 thứ theo thứ tự: Git → Node.js → VS Code → Claude Code.
2.1 Xác Nhận Loại Chip
- Mac: Biểu tượng Apple -> Giới thiệu về máy Mac này. M1/M2/M3/M4 là ARM; Intel là x86_64.
- Windows: Nhấp chuột phải "PC này" -> Thuộc tính. Intel/AMD là x86_64.
2.2 Cài Đặt Git
- Mac: Mở Terminal, dán:
/bin/zsh -c "$(curl -fsSL https://gitee.com/happyaicoder/HomebrewCN/raw/master/Homebrew.sh)". Xác minh vớigit --version. - Windows: Tải về từ https://git-scm.com/https://git-scm.com/). Sử dụng cài đặt mặc định.
2.3 Cài Đặt Node.js (18+, khuyến nghị 20 hoặc 22)
- Mac: Dán:
/bin/bash -c "$(curl -fsSL https://gitee.com/iamzhihuix/nvm-install-cn/raw/main/install.sh)". Xác minh vớinode -v. - Windows: Tải LTS từ https://nodejs.org/https://nodejs.org/). Nếu
npm -vbị lỗi trong PowerShell, chạy:Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser.
2.4 Cài Đặt VS Code
Tải về từ https://code.visualstudio.com/https://code.visualstudio.com/). Trên Windows, chọn các tùy chọn "Thêm vào PATH" và "Mở với Code".
2.5 Cài Đặt Claude Code
- Mac:
npm install -g @anthropic-ai/claude-code --registry=https://registry.npmmirror.com. Sử dụngsudonếu bị từ chối quyền. - Windows: Chạy PowerShell với quyền Quản trị viên, sau đó:
npm install -g @anthropic-ai/claude-code --registry=https://registry.npmmirror.com.
2.6 Xử Lý Lỗi Thường Gặp

Chương 3: Cấu Hình Claude Code với Các Model Nội Địa
Claude Code là vỏ; nó cần một model (bộ não). Các model Claude chính thức yêu cầu thẻ tín dụng nước ngoài và có nguy cơ bị chặn. Giải pháp thực tế nhất cho người dùng nội địa là sử dụng cc-switch với các model nội địa.
3.1 Chọn Model

Khuyến nghị cho người mới bắt đầu: Gói Coding MiniMax (29 RMB/tháng).
3.2 Cài Đặt cc-switch
Tải về từ GitHub hoặc Gitee Mirror.
3.3 Lấy API Key (Ví dụ: MiniMax)
- Đăng ký tại MiniMax Platform.
- Mua Gói Coding.
- Sao chép Khóa Gói Coding (không phải API Key thông thường).
3.4 Cấu Hình trong cc-switch
- Mở cc-switch, nhấp vào biểu tượng Claude.
- Nhấp +, chọn nhà cung cấp (ví dụ: MiniMax), dán Key và nhấp Thêm.
- Di chuyển chuột qua model và nhấp "Bật."
3.5 Xác Minh
Trong terminal, gõ claude. Hỏi: "Bạn là model gì?" Nếu nó trả lời MiniMax/GLM, bạn đã sẵn sàng.
Chương 4: Các Thao Tác Cơ Bản Với Claude Code
4.1 Hai Cách Khởi Động
- Terminal: Mở một thư mục trong VS Code, mở terminal, gõ
claude. - Plugin: Cài tiện ích mở rộng "Claude Code" của Anthropic trong VS Code.
4.2 Các Phím Tắt Cần Thiết

4.3 Ba Chế Độ Làm Việc

Chế độ lập kế hoạch (Plan mode) rất quan trọng—Claude suy nghĩ qua các bước trước khi hành động. Sử dụng nó cho các tính năng phức tạp.
4.4 Suy Nghĩ Thông Thường vs. Suy Nghĩ Sâu (ultrathink)

4.5 Chế Độ YOLO (Rảnh tay)
Bỏ qua các lời nhắc cấp quyền cho mỗi lần thay đổi tệp. Sử dụng: claude --dangerously-skip-permissions.
4.6 CLAUDE.md cho Tùy Chỉnh
Viết tùy chỉnh của bạn vào tệp CLAUDE.md trong thư mục gốc dự án (ví dụ: "Sử dụng tiếng Trung cho chú thích").
Chương 5: Xây Dựng "Công Cụ Đọc Sớm"
5.1 Tạo Thư Mục và PRD
Tạo prd.md trong VS Code với các yêu cầu cho một ứng dụng HTML/JS tạo ra các con vật emoji khi âm lượng micro vượt quá một ngưỡng nhất định.
5.2 Triển Khai
Trong terminal, chạy claude --dangerously-skip-permissions và gõ: @prd.md hãy triển khai tính năng này.
5.3 Kết Quả
Mở index.html trong trình duyệt, cho phép truy cập micro và nói để thấy các con vật xuất hiện.
Chương 6: Nắm Vững Kỹ Năng Quy Trình Làm Việc
Kỹ năng (Skills) là các SOP có thể tái sử dụng. Một Kỹ năng bao gồm SKILL.md (cấu hình), các tập lệnh và mẫu.
6.2 Sử dụng npx skills
Cài đặt kỹ năng bằng một lệnh: npx skills add jimliu/baoyu-skills. Chọn kỹ năng và mục tiêu (Claude Code).
6.3 Kho Kỹ Năng

6.5 Tạo Kỹ Năng Tùy Chỉnh: Tự Động Minh Họa
Sử dụng API Nano Banana 2 của APImart để tạo một kỹ năng tạo ra 3 hình minh họa phong cách vẽ tay cho bất kỳ bài viết nào bạn viết.
6.6 Kỹ Năng (Skill) vs MCP vs Hooks vs Plugin

- Kỹ năng: Công thức (Các bước cho đầu bếp).
- MCP: Tiện ích (Nước/Điện/Gas cho nhà bếp).
Chương 7: Phần Cứng và Mạng
- Mac tốt hơn cho AI nhờ bộ nhớ hợp nhất (unified memory), nhưng Windows vẫn hoạt động tốt.
- Sử dụng chế độ TUN trong proxy của bạn (ví dụ: clash.verge) nếu bạn gặp lỗi mạng với MCP hoặc tạo hình ảnh.
Phụ Lục A: Bảng Lệnh Nhanh
claude, /skills list, /clear, /compact, /doctor, /model.
Phụ Lục B: Các Lỗi Thường Gặp

Phụ Lục C: Thuật Ngữ





Lời Cuối
Hãy lên đường trước, rồi hãy nói về kỹ năng lái xe. Bắt đầu với Chương 2-5. AI là một bộ nhân năng suất 10x-100x. Hãy bắt đầu ngay hôm nay.





