6 cấp độ tự chủ của tác nhân AI trong kỹ thuật

Trong hầu hết các cuộc thảo luận về kỹ thuật agentic, trọng tâm hành động đã chuyển từ việc đưa ra prompt sang vận hành. Đây là một ranh giới đang nhìn vào màn sương mù: nhà máy phần mềm, mục tiêu, vòng lặp, phiên nền, tác nhân phụ, hook, môi trường sandbox, tác nhân phê duyệt tác nhân khác. Đối với nhiều nhà sáng tạo của tương lai, hành vi này sẽ được tích hợp sẵn vào sản phẩm ngay từ ngày đầu: Claude Code và Codex đã phơi bày trực tiếp sự thay đổi này.

Từ góc nhìn của kỹ sư, bạn sẽ sử dụng mức độ tự chủ thấp để giới hạn rủi ro và tăng khả năng đảo ngược, nhưng sử dụng mức độ tự chủ cao hơn cho các hoạt động rõ ràng, và các đội tác nhân song song có thể tái cấu trúc một cách an toàn các codebase khổng lồ. Câu hỏi cốt lõi về một hành động luôn là: nhiệm vụ này xứng đáng ở cấp độ nào, và sự xác minh nào làm cho cấp độ đó trở nên bảo vệ được?

Vị trí tiên phong là tác nhân quản lý thức dậy khi có kích hoạt, ủy quyền cho các trợ lý của nó trong khi liên tục xác minh đầu ra của chúng, và chỉ quay lại với những quyết định phải do con người đưa ra. Những người sử dụng kiểu thiết lập này thực sự có thể đã đang chạy hàng trăm hoặc hàng nghìn tác nhân, chủ yếu trên các codebase thường xanh. Giống như hầu hết mọi suy nghĩ về quyền tự chủ, cách bạn nhận thức về quy mô vẫn khác nhau đối với mỗi người.

Thang đo thường được nhắc đến nhất là từ thang đơn trục của Steve Yegge được đề cập trong "Welcome to Gas Town" và trong The Pragmatic Engineer. Đó là một tài liệu tham khảo tốt nếu bạn muốn một con số cho biết bạn thân thiện với AI đến mức nào: thang đo cung cấp cho bạn một con số duy nhất để đo lường nếu bạn biết sự tin tưởng của mình vào một tác nhân duy nhất. Dưới đây là một phiên bản của nó:

Vào đầu năm 2026, ngay cả khi công việc bắt đầu chuyển từ ủy quyền sang phối hợp, đây vẫn là một đại diện khá tốt để đo lường rủi ro. Tuy nhiên, ngày nay, nhiều bộ kỹ năng có thể có tầm quan trọng và đòn bẩy tăng lên khi bạn có thể chạy nhiều tác nhân cùng một lúc. Một bậc thang duy nhất không thể giúp bạn xác định vị trí cho kỹ năng đa tác nhân.

Thay vào đó, hầu hết mọi cuộc tranh luận về quyền tự chủ mà tôi thấy đều gộp chung hai câu hỏi cần được tách biệt: chúng ta đang để tác nhân đơn lẻ này đi xa khỏi bản thân mình đến mức nào, và kỹ năng phối hợp nhiều tác nhân của chúng ta là gì?

Để nắm bắt hai khía cạnh này một cách riêng biệt, chúng ta sẽ sử dụng hai trục: tác nhân (agency) và sự phối hợp (orchestration).

Trên trục tác nhân, mức thấp bao gồm việc đề xuất các hành động tiềm năng và chờ đợi một quyết định.

Mức trung bình có nghĩa là tác nhân đang làm việc trên một nhiệm vụ cụ thể, nhưng xác định phạm vi những gì nó làm, và liên tục báo cáo lại những gì nó làm cùng với bằng chứng, để bạn có thể tiếp tục định hướng nó.

Ở mức tác nhân cao, tác nhân đang làm việc hướng tới một mục tiêu, thử nghiệm, học hỏi, kiểm tra, tìm cách giải quyết vấn đề, gặp phải rào cản, đặt câu hỏi, thử các cách tiếp cận khác nhau, và trả lại tất cả công việc này dưới dạng bằng chứng.

Trên trục phối hợp, mức thấp có nghĩa là một tác nhân, một luồng. Ở mức trung bình, bạn có vài tác nhân, mỗi tác nhân làm việc trong cây thư mục làm việc riêng của nó, có thể hướng tới các mục tiêu khác nhau, nhưng bị cô lập. Ở mức cao, bạn có một bộ điều phối có thể lấy một backlog, trình theo dõi vấn đề, lịch trình hoặc hàng đợi khác, và biến nó thành công việc liên tục, và bạn chỉ cần can thiệp khi mọi thứ thất bại: "quản lý theo ngoại lệ". Các sản phẩm và tính năng kết hợp những ý tưởng này bao gồm:

Các chế độ /plan, /goal, /loop, /background, /batch, /code-review, /security-review của Claude Code, tác nhân phụ, hook, điểm kiểm tra, thực hành ủy quyền và quản lý tác nhân, phiên nền, mẫu nhóm tác nhân, đối số /schedule
Luồng local/cloud của Codex, chế độ Goal, cây thư mục làm việc, Automations, tác nhân phụ, ngăn xem xét, đánh giá mã GitHub, hook, sandboxing, Auto-review và chạy lại

Những khả năng này không nằm gọn trên một thang đơn lẻ.

Sự leo trèo: ba kỷ nguyên và một ngăn xếp duy nhất

Nếu bạn đọc thang đo từ dưới lên, bạn đang tưởng tượng việc leo lên cả tác nhân và sự phối hợp cùng một lúc. Trên thực tế, sáu cấp độ đại diện cho ba kỷ nguyên riêng biệt mà tất cả chúng ta đều trải qua:

Đầu tiên, bạn là người cầm lái, và một tác nhân chủ yếu chỉ giúp đỡ, chờ bạn điều khiển nó.

Thứ hai, tác nhân đảm nhận một nhiệm vụ hoặc mục tiêu có giới hạn, nhưng bạn vẫn ở đó để định hướng và xác minh những gì nó làm.

Và thứ ba, trong kỷ nguyên phối hợp, hệ thống có khả năng điều hành mọi thứ, phân phối công việc cho nhiều tác nhân, và bạn hầu như chỉ cần can thiệp khi mọi thứ sai lệch: "quản lý theo ngoại lệ".

Điều này làm cho mọi thứ đơn giản hơn, bởi vì vị trí dọc trên thang đo nắm bắt gọn gàng hai trục (sự phối hợp chỉ bắt đầu xuất hiện gần đỉnh), để lại nó như một sự leo lên đều đặn duy nhất qua các bậc. Tuy nhiên, sự leo lên này vẫn là một phần của sự thay đổi mà tất cả chúng ta đang trải qua.

Một ngày làm kỹ thuật tốt bao gồm việc chạm vào vài bậc thang, đôi khi nhiều hơn: việc chuyển đổi giữa các kỷ nguyên vài lần trong quá trình thực hiện một nhiệm vụ là điều bình thường.

Sáu cấp độ chi tiết

Cấp độ 0: Hỗ trợ

Tác nhân đưa ra các đề xuất hầu hết là tốt và thường hoàn hảo, nhưng bạn sẽ luôn quyết định xem chúng có đủ tốt để hành động hay không. Hãy nghĩ đến tính năng tự động hoàn thành, đề xuất chỉnh sửa nội tuyến, hoặc tham gia vào một phiên trò chuyện thảo luận về một thay đổi mà chưa ai thực sự nắm quyền sở hữu. Sử dụng cho các lỗi tốn kém, các thay đổi nhỏ, hoặc khi bạn đang hình thành phán đoán của riêng mình. Việc xác minh chủ yếu diễn ra tại chỗ.

Cấp độ 1: Hành động có giám sát

Tác nhân chỉnh sửa hoặc chạy các lệnh thay mặt bạn, hỏi bạn trước khi thực thi bất cứ điều gì quan trọng. Đây là tư thế mặc định của hầu hết mọi người. Việc này có thể được thực hiện trong sandbox cục bộ với sự chấp thuận trước khi áp dụng các thay đổi - trong đó mỗi lần chấp thuận là một xác minh độc lập rằng thay đổi đó an toàn để áp dụng - hoặc trong một phiên tương tác. Chế độ thất bại là sự mệt mỏi khi phải chấp thuận; tất cả các lần chấp thuận đều có cảm giác giống nhau bất kể chúng đang chấp thuận cái gì. Bạn có thể giải quyết điều này bằng cách liếc nhìn sự khác biệt, tuân theo một số phỏng đoán, kiểm tra với người khác trước khi chấp thuận, hoặc chỉ đồng ý để tác nhân chịu trách nhiệm. Codex Auto-review giải quyết vấn đề này bằng cách ủy quyền phê duyệt cuối cùng của các điều kiện biên cho một tác nhân đánh giá riêng biệt.

Cấp độ 2: Ủy quyền nhiệm vụ có phạm vi

Bàn giao một nhiệm vụ có giới hạn cho tác nhân. Nhiệm vụ đó sẽ có một mục tiêu rõ ràng, các ràng buộc và một định nghĩa công việc về việc "hoàn thành" trông như thế nào. Bạn sẽ ở gần đó, có thể can thiệp, nhưng hầu như không tham gia. Đây là trọng tâm chính trong thế giới kỹ thuật phần mềm. Việc xác minh đang chuyển từ bạn (bạn có thể cần nghỉ ngơi và ngủ) sang bằng chứng mà tác nhân có thể tạo ra: các bài kiểm tra tự động vượt qua, kiểu dữ liệu phù hợp, gợi ý lint, ảnh chụp màn hình, các bước tái tạo, nguồn gốc bằng ví dụ, v.v.

Cấp độ 3: Tự chủ theo mục tiêu

Tác nhân làm bất cứ điều gì cần thiết để đạt được một mục tiêu, chỉ dừng lại khi một số điều kiện được đáp ứng. Ở chế độ prompt, điều này có nghĩa là bản thân prompt trở thành mục tiêu (ví dụ: "Bạn có thể giảm thời gian tương tác của trang này xuống dưới 1 giây không?"). Trong Codex, đây là chế độ Goal: tác nhân lặp qua các bước lập kế hoạch->hành động->kiểm tra->xem xét cho đến khi nó ngừng đáp ứng các tiêu chí thành công. Trong Claude Code, đó là các lệnh /goal, /loop và /schedule. Để cấp độ này hữu ích, điều kiện dừng phải có thể đo lường được theo cách có thể tự động hóa.

Đừng yêu cầu tác nhân của bạn giúp đỡ với những mục tiêu mơ hồ, chung chung như "cải thiện trải nghiệm người dùng nói chung" hoặc "làm cho codebase dễ kiểm tra hơn". Hãy chọn một cái gì đó cụ thể, có thể đo lường và tự động hóa: tìm lỗi trong quá trình sản xuất mà phân tích tĩnh không phát hiện được, giảm thời gian tải, đảm bảo rằng chúng ta có bản dựng TypeScript nghiêm ngặt không có bất kỳ 'any' rõ ràng nào, phân loại tất cả các phụ thuộc để chỉ giữ lại những cái chúng ta hiểu và vượt qua các bài kiểm tra của chúng ta, v.v. Và, cuối cùng, để tìm lỗi trong quá trình sản xuất, tác nhân sẽ cần ở trong một môi trường giống như sản xuất.

Cấp độ 4: Ủy quyền song song

Làm việc với nhiều tác nhân cùng một lúc. Mỗi tác nhân làm việc trên một phần cô lập của nhiệm vụ. Nút thắt cổ chai lớn nhất ở cấp độ này là sự phân rã: xác định các phần phù hợp để ủy quyền. Các công cụ hỗ trợ bao gồm: tác nhân phụ, phiên nền, /batch, cây thư mục làm việc, nhóm tác nhân, v.v. Chế độ thất bại là sự song song giả: chạy nhiều tác nhân trên các phần chồng chéo cùng một lúc, do đó thay vì nhiều công việc hơn, bạn nhận được xung đột hợp nhất và các quyết định trùng lặp. Để làm tốt điều này, các tác nhân cần được cô lập với nhau, mỗi tác nhân sở hữu các tệp và trạng thái riêng của chúng. Mỗi tác nhân cũng cần có hàng đợi xem xét riêng. Và cuối cùng, mỗi tác nhân phải chịu một chi phí - về số lượng token tiêu thụ - tỷ lệ thuận với số lượng tác nhân đang chạy cùng một lúc. Về phía con người, thuế phối hợp làm cho chi phí biên của việc thêm một tác nhân tăng lên sau một vài tác nhân.

Cấp độ 5: Phối hợp quản lý theo ngoại lệ

Xác định sự thành công trông như thế nào và những chính sách nào sẽ được áp dụng. Một tác nhân quản lý sẽ thức dậy dựa trên các trình kích hoạt (ví dụ: vấn đề mới, nhiệm vụ mới, đồng hồ), điều phối các tác nhân công nhân, giám sát tiến trình của chúng, xác minh đầu ra, thử lại khi thất bại, chuyển tiếp lên các tác nhân hoặc con người có năng lực hơn khi các điều kiện được đáp ứng, tổng hợp kết quả và cuối cùng trả lại các sản phẩm công việc (ví dụ: PR) và bằng chứng cho các hệ thống bên ngoài. Hãy nghĩ về nhà máy: trình theo dõi vấn đề hoặc backlog là đầu vào, và sản phẩm của nhà máy là đầu ra (tức là nhiều vấn đề, lỗi đã được sửa). Các tác nhân làm việc trong một môi trường được cô lập thích hợp với nhiều bức tường (và nếu cần, các cửa thoát hiểm), và chỉ một hệ điều hành - được xác định bởi tác nhân quản lý - định nghĩa nhà máy dự kiến sẽ làm gì.

Việc thiết kế hệ điều hành này được để cho con người; OpenAI đã đề xuất một đặc tả kỹ thuật cho Symphony, trong đó có một bảng Linear ở trung tâm: mỗi vấn đề có một không gian làm việc tác nhân riêng, và tác nhân liên tục đảm bảo rằng nó đang tiến triển hướng tới mục tiêu của mình như được định nghĩa trong một tệp spec trong không gian làm việc riêng của nó. Việc xem xét của con người có thể được thực hiện ở cấp độ nơi bằng chứng được tạo ra, nhưng ranh giới (tức là điều gì mạnh mẽ nhất trong thế giới phối hợp) là xây dựng các nhà máy tác nhân liên tục với hàng trăm hoặc thậm chí hàng nghìn tác nhân. Tại thời điểm này trong quá trình leo lên, việc có xác minh độc lập ngày càng trở nên quan trọng: người thực hiện và người đánh giá riêng biệt, người chạy thử nghiệm và QA riêng biệt, kiểm tra bảo mật riêng biệt, các cổng quy trình riêng biệt cho việc chấp nhận.

Rủi ro và khả năng đảo ngược đặt ra giới hạn tối đa.

Tôi nhớ đã đọc một nghiên cứu trước đây của Anthropic về một số nhiệm vụ khó nhất với Claude Code, nơi nó yêu cầu làm rõ thường xuyên hơn gấp đôi so với khi người dùng ngắt lời. Những người dùng có kinh nghiệm (~750 phiên so với dưới 50) có nhiều khả năng tự động phê duyệt và ngắt lời để theo dõi tiến trình hơn.

Họ cũng đã thực hiện một phân tích rộng hơn về cách mọi người sử dụng Claude Code. Họ đã xem xét ~400K phiên từ ~235K người trong khoảng thời gian từ tháng 10 năm 2025 đến tháng 4 năm 2026. Từ mỗi phiên, họ có thể tìm ra các quyết định mà ai đó đưa ra như họ yêu cầu bao nhiêu hành động trong mỗi prompt, hành động nào trong số đó họ chọn để tự động phê duyệt, tần suất họ ngắt lời, v.v. Mọi người thực hiện ~70% các quyết định lập kế hoạch, nhưng Claude thực hiện ~80% việc thực thi. Tự chủ cao không phải là loại bỏ con người khỏi vòng lặp, mà là chuyển từ việc bắt họ thực hiện từng bước sang việc để họ quyết định hướng đi tiếp theo.

Nếu chúng ta muốn xác định liệu một hệ thống AI lớn có đang hoạt động với mức độ tự chủ cao hay không, ba câu hỏi chúng ta nên đặt ra là:

Chúng ta sẽ biết mình sai về những gì nó đang làm nhanh đến mức nào?
Chúng ta có thể hoàn tác những gì nó đang làm một cách sạch sẽ đến mức nào?
Điều gì sẽ chứng minh rằng chúng ta đúng về những gì nó đang làm?

Nếu câu trả lời cho cả ba là: không nhanh chóng, rất khó khăn và tin tưởng vào bản tóm tắt, thì đó không phải là tự chủ cao.

Mỗi lần chạy một tác nhân phải được bắt đầu bằng một hợp đồng xác định những gì nó đang cố gắng làm.

Mục tiêu: những gì chúng ta đang cố gắng đạt được (không phải một hoạt động, không phải kỹ thuật, mà là một kết quả).

Phạm vi: lĩnh vực chúng ta đang hoạt động và những kỹ thuật nào được phép.

Các mục tiêu không phải: những gì không phải là một phần của mục tiêu.

Công cụ và quyền hạn: cách tác nhân có thể tương tác với thế giới. Điều kiện dừng: thời điểm dừng; lý tưởng nhất là một biến có thể đo lường được.

Bằng chứng: các bài kiểm tra cụ thể, ảnh chụp màn hình, nhật ký, bản ghi cơ sở dữ liệu hoặc các chỉ số khác có thể được sử dụng để xác nhận rằng một việc đã được thực hiện (độc lập với tác nhân).

Sự chuyển tiếp: ai tham gia trong trường hợp nào (bao gồm cả người chạy tác nhân).

Và ngân sách: giới hạn về thời gian, công sức và token sẽ được dành cho nhiệm vụ (token là ngân sách của các mô hình AI lớn - bạn cũng có thể bao gồm giới hạn về số lần nó có thể thử nhiệm vụ và giới hạn về mức độ song song).

Các chỉ số làm cho quyền tự chủ đáng tin cậy hơn một chút

Quyết định về chỉ số sau khi sự việc xảy ra có lẽ là chưa đủ. Các chỉ số có thể được thiết lập trước, trong một tài liệu ngắn gọn. Và điều đó làm cho quyền tự chủ có cảm giác đáng tin cậy hơn và làm cho bước nhảy vọt về niềm tin dễ thực hiện hơn một chút.

Mặc dù có nhiều cách để đo lường thành công, hãy xem xét theo dõi một số phiên bản của các chỉ số này cho mỗi cấp độ tự chủ:

Thời gian trung bình giữa các lần can thiệp
Lần chạy không có người giám sát thành công dài nhất với công việc được chấp nhận
Tỷ lệ các hành động chạy trong sandbox so với được chuyển tiếp
Tỷ lệ phần trăm các hành động được tự động phê duyệt so với bị từ chối
Số lượng hành động trung bình của tác nhân trên mỗi hướng dẫn của con người
Tỷ lệ yêu cầu làm rõ / Tỷ lệ yêu cầu ngắt lời
Thời gian xem xét cho mỗi thay đổi được chấp nhận
Tỷ lệ làm lại ở mỗi mức độ tự tin
Tỷ lệ lỗi thoát ra ở mỗi mức độ tự tin
Chi phí token cho mỗi thay đổi được chấp nhận

Các chỉ số như vậy có thể kể một câu chuyện: một tác nhân duy nhất được giữ cho bận rộn bằng các bàn giao thủ công của con người là Cấp độ 4 với một bảng điều khiển. Một tác nhân thận trọng, không sẵn sàng tiếp tục nếu không có sự tiếp nhận tự động, thử lại và bằng chứng tốt, là Cấp độ 5 với một cổng thực sự.

Hãy suy nghĩ về sự sẵn sàng

Phân loại công việc theo rủi ro và theo mức độ dễ dàng để hoàn tác. Áp dụng quyền tự chủ một cách thận trọng, chỉ tăng lên khi bằng chứng hỗ trợ cho cấp độ cao hơn được tích lũy. Việc tái cấu trúc công cụ thanh toán được bảo vệ bởi các bài kiểm tra mạnh mẽ và các tác nhân đánh giá với một đường dẫn khôi phục sạch sẽ có thể hỗ trợ mức độ tự chủ cao hơn nhiều so với một nhiệm vụ tự động hóa tài liệu thiếu bất kỳ sự thật kinh điển nào. Mức độ tự chủ nên tuân theo quy trình xác minh, không phải tên nhiệm vụ.

Bốn phản mẫu

Mọi hệ thống đều có thể dễ dàng rơi vào bốn phản mẫu tự chủ này trừ khi được tránh một cách cảnh giác.

Tự chủ như một địa vị - xếp hạng tự chủ của một tác nhân trở thành một huy hiệu địa vị vô nghĩa. Mức tự chủ cao hơn được coi là bằng chứng về năng lực, chứ không phải sự an toàn, và các tác nhân được chạy nóng hơn mức xác minh cho phép. Khắc phục: Khen ngợi và thưởng cho những người xác định đúng mức độ tự chủ và kiên quyết tránh vượt quá giới hạn.

Rửa quyền - sự chuyên chế của sự mệt mỏi khi phê duyệt khiến chúng ta cấp cho các tác nhân và công cụ AI quyền truy cập rộng rãi hơn nhiều so với mức cần thiết. Khắc phục: Các ranh giới tốt hơn luôn là một giải pháp, chẳng hạn như hồ sơ sandbox, thư mục gốc có thể ghi có phạm vi, danh sách lệnh được phép, hook và Auto-review.

Thay thế tóm tắt - bản tóm tắt công việc của tác nhân thay thế cho việc xem xét, giả sử bản tóm tắt là đủ. Khắc phục: Đóng gói cùng một gói bằng chứng như với các đánh giá thủ công hoàn toàn (một sự khác biệt, bài kiểm tra, nhật ký, ảnh chụp màn hình, phát hiện của người đánh giá, rủi ro, khoảng trống, v.v.) trong khi tránh sự đầu hàng về nhận thức.

Cosplay đội tàu - hàng chục tác nhân chạy song song, nhưng một con người vẫn kiên trì điều phối mọi sự phụ thuộc theo cách thủ công. Khắc phục: Trạng thái chia sẻ, quy tắc sở hữu và theo dõi phụ thuộc tốt hơn dần dần làm giảm nhu cầu phối hợp thủ công. Các giới hạn WIP nhỏ hơn buộc phải tập trung vào việc mã hóa và ghi lại các bước phối hợp cho đến khi việc phối hợp trở nên tự động.

Một bài tập hiệu chuẩn

Xem xét mười nhiệm vụ cuối cùng bạn đã thực hiện với sự hỗ trợ của tác nhân. Đối với mỗi nhiệm vụ, hãy ghi lại mức độ tự chủ đã thực hiện, rủi ro liên quan, mức độ dễ dàng để hoàn tác công việc, bằng chứng được tạo ra để đáp ứng các yêu cầu xác minh, thời gian xem xét, nếu có bất kỳ việc làm lại nào cần thiết và liệu mức độ tự chủ đã chọn có còn phù hợp cho lần tiếp theo hay không.

Cách leo lên an toàn

Di chuyển lên một trục tại một thời điểm. Bắt đầu với một tác nhân được giám sát duy nhất để thực hiện một nhiệm vụ có phạm vi duy nhất tạo ra bằng chứng có thể bảo vệ được về sự thành công (mức tự chủ 1, nếu đủ gọn gàng). Sau đó, mở rộng dần dần theo ba hướng trực giao. Song song hóa các nhiệm vụ khám phá nặng về đọc (mức tự chủ 4). Thêm các tác nhân ghi hành động trên các cây thư mục làm việc riêng biệt với các quy tắc sở hữu tệp bị ràng buộc (mức tự chủ 4). Thêm các tự động hóa định kỳ, sau đó là sự phối hợp do tác nhân dẫn dắt dựa trên các vấn đề, giọng nói, v.v. Mỗi bước tiến lên trên đòn bẩy đòi hỏi một bộ cơ chế an toàn mới (chẳng hạn như các chế độ thất bại mới).

Hãy đặt tên cho chúng: Các lần chạy tác nhân đơn lẻ dài hơn có thể dẫn đến trôi dạt, mục nát ngữ cảnh, giao tiếp bị rơi hoặc mục tiêu đi lạc. Công việc nền có thể dẫn đến các giả định cũ và bàn giao yếu. Quá nhiều công việc song song có thể dẫn đến xung đột hợp nhất hoặc các quyết định trùng lặp. Quá nhiều công việc định kỳ có thể dẫn đến chi tiêu token thầm lặng hoặc các prompt cũ. Quản lý theo ngoại lệ có thể dẫn đến hàng đợi xem xét dài và mệt mỏi khi có cảnh báo. Khắc phục: đừng tin tưởng khó khăn hơn; thay vào đó, hãy thu hẹp phạm vi, đảm bảo bằng chứng tốt hơn, cho phép các đường dẫn khôi phục rẻ hơn, củng cố các cổng và xác định các quy tắc sở hữu rõ ràng hơn.

Sử dụng mức độ tự chủ:

Cấp độ 0 là tốt nhất cho công việc tinh tế và khi phán đoán vẫn đang được hình thành.
Cấp độ 1 là tốt nhất cho hầu hết các khám phá, nếu công việc được thực hiện gần ranh giới của những gì đã được hiểu rõ.
Cấp độ 2 là tốt nhất cho hầu hết các nhiệm vụ có giới hạn, biết rằng có thể có các phụ thuộc chưa biết và các trở ngại không lường trước được.
Cấp độ 3 là tốt nhất khi các điều kiện thành công có thể được nêu rõ ràng.
Cấp độ 4 là tốt nhất khi công việc có thể được phân chia rõ ràng theo các điều kiện thành công này.
Cấp độ 5 là tốt nhất khi sự phối hợp và giao tiếp cần thiết giữa các điều kiện thành công khác nhau đã được mã hóa hoàn toàn.

Xác minh sẽ luôn là nút thắt cổ chai.

Bất chấp sự dũng cảm và công cụ hiện tại, tư thế trưởng thành của một nhóm kỹ thuật làm việc với các tác nhân AI là tự chủ hiệu chỉnh.

Các nút thắt cổ chai là sự phối hợp, xác minh, bảo trì, phán đoán sản phẩm và học hỏi từ sự cố

Trong tương lai gần, chúng ta sẽ muốn thiết kế các vòng lặp biết khi nào nên làm việc, khi nào nên xác minh và khi nào nên hỏi - nhưng kỹ năng của kỹ sư vẫn nằm ở việc chọn đúng mức độ tự chủ và xây dựng các mẫu và bằng chứng có thể bảo vệ được để bảo vệ khỏi những góc tối của nó.

Lưu ý: Pangram xác nhận bài viết này được viết 100% bởi con người: https://www.pangram.com/history/87531e13-cd12-4cb0-9e02-9579719ddc26

Các cấp độ tự chủ của tác nhân AI

Sự leo trèo: ba kỷ nguyên và một ngăn xếp duy nhất

Sáu cấp độ chi tiết

Rủi ro và khả năng đảo ngược đặt ra giới hạn tối đa.

Các chỉ số làm cho quyền tự chủ đáng tin cậy hơn một chút

Hãy suy nghĩ về sự sẵn sàng

Bốn phản mẫu

Cách leo lên an toàn

Use YouMind to read viral articles deeply

Bài viết viral gần đây

MercadoLibre có vẻ đang gặp khó khăn. Nhưng thực tế thì công việc kinh doanh đang tăng trưởng mạnh mẽ.

The Grid đã thức tỉnh: Tổng kết tháng 6 năm 2026 của OriginTrail

Giới thiệu về Rialto

AI Agent đột phá năm 2024: Hướng dẫn toàn diện từ A đến Z về WorkBuddy

Hướng dẫn thực tế về Fable: Khám phá những ẩn số của bạn

Token hóa SECZ: Securitize đưa cổ phiếu đại chúng của chính mình lên onchain ngay ngày niêm yết

Các cấp độ tự chủ của tác nhân AI

Sự leo trèo: ba kỷ nguyên và một ngăn xếp duy nhất

Sáu cấp độ chi tiết

Rủi ro và khả năng đảo ngược đặt ra giới hạn tối đa.

Các chỉ số làm cho quyền tự chủ đáng tin cậy hơn một chút

Hãy suy nghĩ về sự sẵn sàng

Bốn phản mẫu

Cách leo lên an toàn

Use YouMind to read viral articles deeply

Biến Markdown của bạn thành bài viết 𝕏 gọn gàng

Bài viết viral gần đây

MercadoLibre có vẻ đang gặp khó khăn. Nhưng thực tế thì công việc kinh doanh đang tăng trưởng mạnh mẽ.

The Grid đã thức tỉnh: Tổng kết tháng 6 năm 2026 của OriginTrail

Giới thiệu về Rialto

AI Agent đột phá năm 2024: Hướng dẫn toàn diện từ A đến Z về WorkBuddy

Hướng dẫn thực tế về Fable: Khám phá những ẩn số của bạn

Token hóa SECZ: Securitize đưa cổ phiếu đại chúng của chính mình lên onchain ngay ngày niêm yết