Hầu hết các kỹ sư AI đều biết cách xây dựng một agent.
Rất ít người biết cách xây dựng một hệ thống trở nên tốt hơn sau lần thử đầu tiên.
Khoảng cách đó trị giá sáu con số.
Đây là sự khác biệt:
Một agent là một người lao động.
Một vòng lặp là thứ giúp người lao động đó tiến bộ.
Các hệ thống AI có năng lực nhất trong sản xuất hiện nay không phải là các lệnh gọi mô hình đơn lẻ.
Chúng là các vòng lặp.
Tạo ra → Đánh giá → Học hỏi → Cải thiện.
Lặp đi lặp lại.
Cho đến khi đầu ra thực sự tốt.
Dưới đây là 20 mẫu thiết kế vòng lặp xuất hiện lặp đi lặp lại trong các hệ thống AI sản xuất.
Hãy lưu lại. Bạn sẽ xây dựng với những thứ này.
Agents vs Vòng lặp
Cách cũ: Nhắc → Phản hồi → Xong.
Cách mới: Tạo ra → Phê bình → Viết lại → Chấm điểm → Thử lại → Ghi nhớ → Cải thiện.
Một bên là công nhân nhà máy làm việc một lần.
Bên kia là công nhân nhà máy nghiên cứu mọi sai lầm, viết lại kịch bản và giỏi hơn 3% sau mỗi ca làm việc.
Các nhóm đang triển khai AI sản xuất ngay bây giờ không phải đang viết những lời nhắc tốt hơn.
Họ đang xây dựng các vòng lặp tốt hơn.

DANH MỤC 1 — VÒNG LẶP CẢI THIỆN CHẤT LƯỢNG (Làm cho đầu ra tốt hơn trước khi nó rời khỏi hệ thống)
1. Tạo ra → Phê bình → Viết lại
Vòng lặp quan trọng nhất trong kỹ thuật AI.
Tạo đầu ra. Người phê bình xem xét nó. Trình tạo viết lại dựa trên phản hồi. Lặp lại cho đến khi đạt ngưỡng chất lượng.
Không phải một mô hình. Hai vai trò. Một đường ống.
1[Trình tạo] → bản nháp2[Người phê bình] → "đoạn 3 mơ hồ. thiếu bằng chứng. giọng văn không phù hợp."3[Trình tạo] → viết lại dựa trên phê bình4[Người phê bình] → "tốt hơn. nhưng kết luận vẫn yếu."5[Trình tạo] → viết lại lần cuối
Được sử dụng cho: viết lách, đánh giá mã, báo cáo, tài liệu chiến lược, email bán hàng.
Hiểu biết sâu sắc: mô hình tạo ra không phải là người đánh giá tốt nhất đầu ra của chính nó.
Một người phê bình riêng biệt luôn tìm ra những gì trình tạo đã bỏ sót.

2. Vòng lặp Chấm điểm và Thử lại
Tạo ra. Chấm điểm. Thử lại nếu dưới ngưỡng.
Đơn giản. Mạnh mẽ. Ít được sử dụng.
điểm = đánh giá(đầu ra)
1điểm = đánh giá(đầu ra)23while điểm < ngưỡng:4 đầu_ra = tạo_ra(lời_nhắc)5 điểm = đánh giá(đầu_ra)6 số_lần_thử += 17 if số_lần_thử > số_lần_thử_tối_đa:8 trả_về tốt_nhất_cho_đến_nay
Tốt nhất khi chất lượng có thể đo lường được — độ chính xác trích xuất, tuân thủ định dạng, tính đúng đắn thực tế, chấm điểm khách hàng tiềm năng.
Trình tạo không biết nó đang bị chấm điểm.
Người đánh giá thì biết.
Sự tách biệt đó chính là mẫu hình.
3. Vòng lặp Nhiều Người phê bình
Một người phê bình có điểm mù.
Hãy sử dụng bốn người.
→ Người phê bình tính đúng đắn: nó có chính xác về mặt thực tế không?
→ Người phê bình phong cách: nó có rõ ràng và được viết tốt không?
→ Người phê bình an toàn: nó có phù hợp và an toàn không?
→ Người phê bình lĩnh vực: nó có đáp ứng các tiêu chuẩn chuyên môn không?
Mỗi người đánh giá độc lập.
Đầu ra cuối cùng phải đáp ứng cả bốn người trước khi thoát ra.
Được sử dụng trong: AI y tế, xem xét tài liệu pháp lý, phân tích tài chính, nội dung được quản lý.

4. Vòng lặp Phê bình Đối kháng
Công việc duy nhất của người phê bình là phá vỡ câu trả lời.
Không phải cải thiện nó. Phá vỡ nó.
Các câu hỏi mà người phê bình đối kháng đặt ra:
→ Những giả định nào thất bại ở đây? → Bằng chứng nào còn thiếu? → Một người hoài nghi sẽ nói gì? → Ở đâu điều này tự tin sai?
Sau đó, trình tạo bảo vệ hoặc viết lại.
Câu trả lời tốt nhất sống sót sau cuộc tấn công.
Được sử dụng cho: tổng hợp nghiên cứu, xem xét luận điểm đầu tư, lập kế hoạch chiến lược, phân tích rủi ro.
5. Vòng lặp Hội đồng Giám khảo
Một giám khảo đưa ra điểm số nhiễu.
Năm giám khảo làm trung bình nhiễu.
Chạy cùng một đầu ra qua nhiều người đánh giá.
Tổng hợp điểm số.
Chỉ những đầu ra có sự đồng thuận cao mới được tiến lên.
Được sử dụng khi: đánh giá mô hình đơn lẻ không đáng tin cậy, rủi ro cao, các trường hợp ngoại lệ quan trọng.

DANH MỤC 2 — VÒNG LẶP BỘ NHỚ (Học từ những gì đã xảy ra để lần sau thông minh hơn)
6. Vòng lặp Phản xạ
Mẫu hình tự cải thiện quan trọng nhất hiện có.
Agent thất bại. Agent phân tích lý do tại sao nó thất bại. Agent lưu trữ bài học. Agent thử lại với bài học đó trong ngữ cảnh.
Mỗi lần lặp: thông minh hơn lần trước.
1lần 1: thất bại2suy ngẫm: "Tôi đã giả định X nhưng X sai. Lần sau hãy xác minh X trước."3lần 2: kết hợp bài học → thành công một phần4suy ngẫm: "Tốt hơn. Nhưng tôi đã bỏ qua Y. Thêm kiểm tra Y."5lần 3: thành công
Sự khác biệt giữa một hệ thống thất bại một lần và một hệ thống chỉ thất bại một lần.

7. Vòng lặp Cập nhật Bộ nhớ
Sau mỗi nhiệm vụ, lưu trữ ba điều:
→ Quyết định nào đã được đưa ra → Kết quả là gì → Điều gì sẽ được làm khác đi
Các lần chạy trong tương lai kế thừa kiến thức này.
Hệ thống ở tháng thứ 6 không giống hệ thống ở tháng thứ 1.
Nó đã đọc 6 tháng lịch sử của chính nó.
8. Vòng lặp Thư viện Lỗi
Lưu trữ mọi thất bại.
Câu trả lời sai. Đầu ra xấu. Thực thi thất bại. Trường hợp ngoại lệ.
Trước khi hành động trên một nhiệm vụ mới:
Tìm kiếm thư viện lỗi trước.
Nếu tồn tại một thất bại tương tự → áp dụng bản sửa lỗi đã biết trước khi bắt đầu.
Hệ thống ngừng mắc cùng một sai lầm hai lần.
Mẫu hình ít được sử dụng nhất trong AI sản xuất.
9. Vòng lặp Mẫu hình Thành công
Hầu hết các kỹ sư chỉ lưu trữ thất bại.
Hãy lưu trữ cả thành công.
Khi một nhiệm vụ diễn ra tốt đẹp:
→ Lưu cách tiếp cận → Lưu ngữ cảnh → Lưu điều gì đã làm nó hoạt động
Truy xuất các mẫu hình thành công khi đối mặt với các nhiệm vụ tương tự.
Học từ chiến thắng. Không chỉ từ sai lầm.
10. Vòng lặp Nén Bộ nhớ
Bộ nhớ phát triển mãi mãi.
Bộ nhớ không giới hạn là bộ nhớ không thể sử dụng được.
Sau khi N mục tích lũy:
Hãy nén chúng.
Nhiều ký ức cụ thể → ít khái niệm trừu tượng cấp cao hơn.
1Trước khi nén:2"Thất bại ở nhiệm vụ A vì X"3"Thất bại ở nhiệm vụ B vì X"4"Thất bại ở nhiệm vụ C vì X"56Sau khi nén:7"Mẫu hình: X gây ra thất bại. Luôn kiểm tra X trước."
Ngữ cảnh vẫn có thể quản lý được. Các mẫu hình vẫn có thể truy cập được. Hệ thống vẫn nhanh.

DANH MỤC 3 — VÒNG LẶP LẬP KẾ HOẠCH (Thích ứng kế hoạch khi thực tế thay đổi)
11. Lập kế hoạch → Thực thi → Lập kế hoạch lại
Sai lầm phổ biến nhất trong thiết kế agent AI:
Coi kế hoạch là cố định.
Kế hoạch tan vỡ khi tiếp xúc với thực tế.
Mẫu hình:
Tạo kế hoạch → thực hiện bước → quan sát kết quả → cập nhật kế hoạch → tiếp tục
Không phải là thác nước.
Mà là một đường xoắn ốc.
Mỗi vòng lặp thắt chặt cách tiếp cận.
Được sử dụng khi: môi trường thay đổi, nhiệm vụ có sự phụ thuộc, mục tiêu dài hạn.

12. Vòng lặp Quy trình làm việc Động
Hầu hết các đường ống là cố định.
Bước 1 → Bước 2 → Bước 3. Luôn luôn.
Quy trình làm việc động thay đổi dựa trên kết quả.
Nếu đầu ra A → chạy nhánh X Nếu đầu ra B → chạy nhánh Y Nếu đầu ra C → bỏ qua đến bước 5
Đường ống tự quyết định hình dạng của nó tại thời gian chạy.
Được sử dụng trong: nghiên cứu đa tài liệu, định tuyến hỗ trợ khách hàng, đường ống nội dung thích ứng.
13. Vòng lặp Phân rã Mục tiêu
Mục tiêu lớn đi vào.
Hệ thống chia nó thành các mục tiêu phụ.
Mỗi mục tiêu phụ chia thành các nhiệm vụ.
Mỗi nhiệm vụ chia thành các bước.
Phân rã cho đến khi mỗi đơn vị đủ nhỏ để thực thi trong một lần gọi.
1Mục tiêu: "Viết một phân tích cạnh tranh toàn diện"2↓3Mục tiêu phụ 1: "Xác định 5 đối thủ cạnh tranh hàng đầu"4Mục tiêu phụ 2: "Phân tích sản phẩm của từng đối thủ"5Mục tiêu phụ 3: "So sánh mô hình giá"6Mục tiêu phụ 4: "Xác định khoảng trống"7↓8Mỗi mục tiêu phụ → nhiệm vụ → các lệnh gọi mô hình riêng lẻ
Vòng lặp tiếp tục phân rã cho đến khi hệ thống có thể hành động.
14. Vòng lặp Đánh giá Tiến độ
Cứ sau N bước: dừng lại và hỏi.
"Chúng ta có thực sự đang tiến gần hơn đến mục tiêu không?"
Nếu có: tiếp tục chiến lược hiện tại. Nếu không: thay đổi chiến lược, công cụ hoặc kế hoạch.
Hệ thống giám sát tiến trình của chính nó.
Không chỉ thực thi một cách mù quáng.
Được sử dụng trong: các agent nghiên cứu chạy dài, các nhiệm vụ tự động kéo dài nhiều ngày, agent gỡ lỗi.
15. Vòng lặp Thỏa mãn Ràng buộc
Tiếp tục chạy cho đến khi tất cả các ràng buộc được đáp ứng.
1while not tất_cả_các_ràng_buộc_được_đáp_ứng(đầu_ra):2 đầu_ra = cải_thiện(đầu_ra, các_ràng_buộc_chưa_được_đáp_ứng)34các_ràng_buộc = [5 dưới_ngân_sách,6 chất_lượng_trên_ngưỡng,7 độ_trễ_dưới_200ms,8 giọng_văn_phù_hợp_thương_hiệu,9 không_có_ảo_giác10]
Rất phổ biến trong các hệ thống sản xuất.
Đầu ra chưa hoàn thành cho đến khi mọi quy tắc kinh doanh được thông qua.

DANH MỤC 4 — VÒNG LẶP KHÁM PHÁ (Tìm câu trả lời tốt nhất bằng cách thử nhiều hướng)
16. Vòng lặp Phân nhánh và Khám phá
Đừng cam kết với một hướng đi.
Khám phá nhiều hướng cùng một lúc.
1các_hướng = [2 tạo_ra(cách_tiếp_cận="bảo_thủ"),3 tạo_ra(cách_tiếp_cận="tích_cực"),4 tạo_ra(cách_tiếp_cận="sáng_tạo")5]67điểm_số = [đánh_giá(h) for h in các_hướng]8tốt_nhất = các_hướng[điểm_số.index(max(điểm_số))]
So sánh kết quả. Chọn nhánh tốt nhất. Loại bỏ phần còn lại.
Được sử dụng cho: các biến thể nội dung, quyết định kiến trúc, gỡ lỗi nhiều giả thuyết, tạo A/B.

17. Vòng lặp Tìm kiếm Cây
Phân nhánh và Khám phá đi sâu một cấp độ.
Tìm kiếm Cây đi sâu khi cần thiết.
Mở rộng các nút hứa hẹn nhất. Tỉa bỏ những nút yếu nhất. Tiếp tục khám phá cho đến khi tìm thấy giải pháp.
1gốc → [A, B, C]2A → [A1, A2] # A có vẻ hứa hẹn, mở rộng nó3B → tỉa bỏ # B yếu, dừng lại ở đây4A1 → [A1a, A1b]5A1a → giải pháp ✓
Được sử dụng cho: chuỗi lý luận phức tạp, lập kế hoạch nhiều bước, gỡ lỗi mã, tổng hợp nghiên cứu.
Tốn kém về mặt tính toán nhưng tìm ra giải pháp mà các lệnh gọi một lần không thể.
18. Vòng lặp Tranh luận
Hai agent. Một chủ đề. Quan điểm đối lập.
Agent A lập luận cho câu trả lời. Agent B lập luận chống lại nó.
Mỗi vòng thách thức các giả định, yêu cầu bằng chứng, phơi bày logic yếu.
Câu trả lời cuối cùng xuất hiện thông qua bất đồng.
Không phải thông qua đồng thuận.
Áp lực đối kháng tìm ra những gì các câu trả lời tự tin của agent đơn lẻ bỏ sót.
Được sử dụng cho: quyết định đầu tư, lập kế hoạch chiến lược, đánh giá rủi ro, phê bình nghiên cứu.

DANH MỤC 5 — VÒNG LẶP TỐI ƯU HÓA HỆ THỐNG (Vòng lặp cải thiện vòng lặp)
19. Vòng lặp Tối ưu hóa Lời nhắc
Hầu hết các kỹ sư viết một lời nhắc một lần và không bao giờ chạm vào nó nữa.
Các vòng lặp tối ưu hóa lời nhắc thay đổi điều đó.
Hệ thống:
→ Chạy lời nhắc trên một bộ kiểm tra
→ Chấm điểm mọi đầu ra
→ Xác định nơi lời nhắc thất bại
→ Viết lại lời nhắc để sửa những thất bại đó → Chạy lại và chấm điểm lại
Lời nhắc tự động trở nên tốt hơn.
Mà không cần con người chạm vào nó.
1lời_nhắc_hiện_tại = "Tóm tắt tài liệu này."23for lần_lặp in range(số_lần_lặp_tối_đa):4 đầu_ra = [chạy(lời_nhắc_hiện_tại, tài_liệu) for tài_liệu in bộ_kiểm_tra]5 điểm_số = [đánh_giá(o) for o in đầu_ra]6 điểm_trung_bình = trung_bình(điểm_số)78 if điểm_trung_bình >= mục_tiêu:9 break1011 thất_bại = [o for o, s in zip(đầu_ra, điểm_số) if s < ngưỡng]12 lời_nhắc_hiện_tại = cải_thiện_lời_nhắc(lời_nhắc_hiện_tại, thất_bại)13 # Lời nhắc tự viết lại dựa trên nơi nó thất bại
Được sử dụng trong: đường ống sản xuất, hệ thống nội dung tự động, nhiệm vụ phân loại.
Những lời nhắc tốt nhất trong AI sản xuất không được viết bởi con người.
Chúng đã được tiến hóa.

20. Vòng lặp Tối ưu hóa Quy trình làm việc
Đây là nơi mọi thứ trở nên thú vị.
Vòng lặp cải thiện vòng lặp.
Hệ thống đo lường hiệu suất của chính nó:
→ độ trễ: mỗi bước mất bao lâu?
→ chi phí: mỗi lần gọi sử dụng bao nhiêu token?
→ chất lượng: điểm đầu ra ở mỗi giai đoạn là bao nhiêu?
Sau đó, nó sửa đổi quy trình làm việc của chính nó.
Quá chậm? Song song hóa hai bước. Quá đắt? Thay thế lệnh gọi GPT-4 bằng một mô hình nhỏ hơn nơi chất lượng được giữ vững. Chất lượng giảm? Thêm một người phê bình trước đầu ra cuối cùng.
1các_chỉ_số = đo_lường_quy_trình_làm_việc(đầu_ra, độ_trễ, chi_phí)23if các_chỉ_số.độ_trễ > độ_trễ_mục_tiêu:4 quy_trình = song_song_hóa(các_bước_chậm)56if các_chỉ_số.chi_phí > ngân_sách:7 quy_trình = thay_thế_bằng_mô_hình_rẻ_hơn(các_bước_chi_phí_cao)89if các_chỉ_số.chất_lượng < ngưỡng:10 quy_trình = thêm_người_phê_bình_trước(bước_đầu_ra_cuối_cùng)
Đây là nơi các hệ thống thực sự tự cải thiện bắt đầu.
Không chỉ là đầu ra được cải thiện.
Mà là các hệ thống tự thiết kế lại chính mình.

Mẫu hình đằng sau tất cả 20 mẫu hình
Mọi vòng lặp đơn lẻ ở trên đều chia sẻ một cấu trúc:
Hành động → Quan sát → Đánh giá → Điều chỉnh
Đó là toàn bộ công thức.
Đầu ra không bao giờ là cuối cùng ở lần thử đầu tiên.
Đầu ra là một điểm khởi đầu.
Vòng lặp là thứ biến một điểm khởi đầu thành thứ gì đó đáng để đưa vào sản xuất.

Bản đồ đầy đủ
Danh mục 1 — Vòng lặp Chất lượng (Làm cho đầu ra tốt hơn trước khi nó rời đi)
→ 1. Tạo ra → Phê bình → Viết lại
→ 2. Chấm điểm và Thử lại
→ 3. Nhiều Người phê bình
→ 4. Phê bình Đối kháng
→ 5. Hội đồng Giám khảo
Danh mục 2 — Vòng lặp Bộ nhớ (Học từ những gì đã xảy ra)
→ 6. Phản xạ
→ 7. Cập nhật Bộ nhớ
→ 8. Thư viện Lỗi
→ 9. Mẫu hình Thành công
→ 10. Nén Bộ nhớ
Danh mục 3 — Vòng lặp Lập kế hoạch (Thích ứng khi thực tế thay đổi)
→ 11. Lập kế hoạch → Thực thi → Lập kế hoạch lại
→ 12. Quy trình làm việc Động
→ 13. Phân rã Mục tiêu
→ 14. Đánh giá Tiến độ
→ 15. Thỏa mãn Ràng buộc
Danh mục 4 — Vòng lặp Khám phá (Tìm câu trả lời tốt nhất bằng cách thử nhiều hướng)
→ 16. Phân nhánh và Khám phá
→ 17. Tìm kiếm Cây
→ 18. Tranh luận
Danh mục 5 — Vòng lặp Tối ưu hóa Hệ thống (Vòng lặp cải thiện vòng lặp)
→ 19. Tối ưu hóa Lời nhắc
→ 20. Tối ưu hóa Quy trình làm việc
Hầu hết các kỹ sư nghĩ rằng agent là tương lai.
Agent chỉ là những người lao động.
Vòng lặp là thứ giúp người lao động tiến bộ.
Sự thay đổi lớn nhất đang diễn ra trong AI hiện nay không phải là các mô hình tốt hơn.
Đó là việc chuyển từ:
Lời nhắc → Phản hồi
sang
Tạo ra → Đánh giá → Học hỏi → Cải thiện
Các nhóm thành thạo thiết kế vòng lặp sẽ không xây dựng những lời nhắc tốt hơn.
Họ sẽ xây dựng các hệ thống trở nên tốt hơn mỗi ngày sau khi triển khai.
Mà không cần ai chạm vào chúng.
Nếu điều này hữu ích:
→ Đăng lại để chia sẻ nó với mọi kỹ sư AI bạn biết
→ Theo dõi @sairahul1 để biết thêm các mẫu hình như thế này
→ Đánh dấu trang này — chọn một vòng lặp và triển khai nó trong tuần này
Tôi viết về AI, xây dựng sản phẩm và các hệ thống hoạt động mà không cần bạn.





