Xây dựng kho tri thức AI giống Karpathy mà không cần viết code

Bạn, người đang mắc hội chứng FOMO, lại bị Karpathy "dắt mũi" một vố rồi

Tuần trước, Andrej Karpathy đã đăng một dòng tweet nói rằng hiện tại anh ấy không còn dành phần lớn AI token của mình cho việc viết code nữa, mà dành cho việc xây dựng kho tri thức cá nhân. Dòng tweet này đã đạt 17 triệu lượt xem và lan truyền chóng mặt trong cộng đồng AI cả tiếng Trung lẫn tiếng Anh.

Vị đại thần này lại một lần nữa tạo ra tâm lý FOMO (sợ bỏ lỡ), khiến ai nấy đều muốn bắt tay vào thử ngay lập tức.

Nhưng nếu bạn thực sự thử rồi mới biết, phương pháp này về lý thuyết tuy rất mạnh mẽ, nhưng khi thực hiện lại nảy sinh rất nhiều vấn đề.

Vấn đề 1: Ngưỡng thiết lập cao

Cách Karpathy dùng LLM để xây dựng kho tri thức là: đưa tài liệu thô cho LLM, không dùng RAG, không dùng cơ sở dữ liệu vector, mà hoàn toàn dựa vào LLM để "biên dịch" cứng thành một kho tri thức dạng markdown có đầy đủ tóm tắt, liên kết ngược (backlink) và chỉ mục khái niệm.

Dòng tweet này dài hơn 600 chữ. Thành thật mà nói, đối với những người biết viết code, quy trình này thực sự không phức tạp.

Tuy nhiên, với tư cách là một kỹ sư đại tài, vài dòng ngắn ngủi của Karpathy trông có vẻ đơn giản nhưng lại ẩn chứa một lượng lớn "kiến thức ngầm". Nếu không, đã chẳng có nhiều người sau khi anh ấy đăng tweet lại phải tung ra các bài hướng dẫn thiết lập từng bước (step-by-step) đến thế.

Thế nhưng, nếu bạn mở những bài hướng dẫn đó ra, bạn sẽ thấy chúng cũng đều do các kỹ sư viết. Mặc dù rất chi tiết — nào là cách tạo cấu trúc ba tầng thư mục raw/, wiki/, outputs/, cách cấu hình Claude Code trong terminal, cách viết system prompt để LLM xuất ra định dạng markdown...

Nhưng kỹ sư suy cho cùng vẫn là thiểu số. Đại đa số những người làm việc trí óc khi đối mặt với những hướng dẫn này vẫn gặp phải rào cản học tập cực lớn, điều này giải thích tại sao nó lại gây ra sự FOMO lớn đến vậy.

Các blogger tự truyền thông, những người làm marketing thương hiệu, sinh viên cao học đang viết luận văn, giáo viên chuẩn bị bài giảng, hay các nhà đầu tư nghiên cứu xu hướng ngành — những người này hàng ngày đều thực hiện quy trình "thu thập thông tin → thấu hiểu thông tin → tạo ra nội dung". Họ có lẽ còn cần một hệ thống tri thức AI hơn cả các kỹ sư. Nhưng bảo họ đi cấu hình môi trường terminal, viết markdown, tinh chỉnh prompt?

Không thực tế chút nào.

Là đại đa số những người không biết code, họ vẫn cần phải vượt qua nỗi sợ hãi khi đối mặt với terminal và dòng lệnh.

Công cụ nên phục vụ người dùng, chứ không phải người dùng phải thỏa hiệp vì công cụ.

Vấn đề 2: "Kho tri thức" là một cái bẫy lớn

Karpathy đã dùng LLM để giảm đáng kể chi phí "sắp xếp thông tin". Trước đây chúng ta cần tự viết tóm tắt, gắn thẻ, tạo liên kết, giờ đây hãy để LLM làm. Cách xây dựng "bộ não thứ hai" lại có thêm một bước tiến mới.

Nhưng điểm đích vẫn không đổi: kho tri thức này chỉ có thể để "đọc".

Nếu chỉ dùng để nghiên cứu và học tập, thì một "kho tri thức được sắp xếp tự động cực tốt" là hoàn toàn đủ dùng.

Tuy nhiên, bản chất của người làm việc trí óc là người làm công tác văn bản, và bản chất của người làm công tác văn bản chính là người sáng tạo. Đối với tất cả những người làm việc trí óc, công việc thực sự không phải là thu thập kiến thức, mà là dùng kiến thức để tạo ra nội dung.

Mọi hoạt động học tập và nghiên cứu trong công việc hàng ngày, điểm đích cuối cùng đều là để tạo ra nội dung. Điều này có nghĩa là, chỉ có một trang wiki đẹp đẽ thôi thì không thể giúp chúng ta hoàn thành công việc cuối cùng.

Khái niệm kho tri thức giống như một ngõ cụt hào nhoáng, thứ bạn nhận được chỉ là sự thỏa mãn giả tạo kiểu "thấy gì được nấy" (WYSIWYG), nhưng không thu hoạch được giá trị thực sự từ việc "tạo ra sản phẩm và bàn giao".

Vì vậy, bản chất của kho tri thức là "năng suất ảo" (productivity porn) — nó mô phỏng hoàn hảo cảm giác sung sướng khi "thu hoạch", nhưng không cung cấp kết quả của năng suất lao động.

Tôi sẽ dùng một tình huống thực tế để minh họa sự khác biệt.

Hãy lấy chính câu chuyện của Karpathy làm ví dụ. Giả sử bạn là một nhân viên marketing của một công ty AI, bạn thấy tweet của anh ấy và muốn tận dụng sức nóng này để làm một chuỗi nội dung xoay quanh chủ đề đó.

Nếu làm theo phương pháp của Karpathy, bạn cần trải qua các bước sau:

Thu thập tweet của anh ấy, các tệp ý tưởng (idea file), các bài bình luận liên quan thông qua script và tải xuống thư mục raw/
Cài đặt Node.js, cài đặt Claude Code trong terminal, viết tệp chỉ lệnh để Claude Code biên dịch các tài liệu này thành vài bài viết wiki
Tải Obsidian hoặc các trình soạn thảo markdown khác để có được một kho tri thức có cấu trúc về "LLM Knowledge Base"
Sau đó, bạn mở một tài liệu trắng và bắt đầu tự viết

Nick Spisak trình diễn cách thiết lập kho tri thức LLM

Chưa nói đến bước 4, chỉ riêng 3 bước đầu, bạn đã cần biết dùng terminal, cài Node.js, cấu hình API key, viết chỉ lệnh prompt, tải Obsidian... Với đa số mọi người, chưa kịp bắt đầu xây dựng kho tri thức thì đã bị chuỗi công cụ làm cho nản lòng.

Và ngay cả khi bạn đã vượt qua tất cả để đến bước 4, bạn lại quay về vạch xuất phát. Kho tri thức giúp bạn hiểu vấn đề, nhưng việc viết lách, tìm hình minh họa, đăng tải... tất cả những thứ này bạn vẫn phải bắt đầu từ con số không.

Vậy, có phương pháp nào có thể giải quyết đồng thời cả hai vấn đề này, giúp dễ dàng xây dựng một "bộ não thứ hai" hướng tới kết quả đầu ra không?

Có. Chính bài viết bạn đang đọc đây là sản phẩm tôi tạo ra theo cách đó. Trong suốt quá trình, tôi chỉ sử dụng duy nhất một công cụ: YouMind. Tôi sẽ trình diễn các bước cụ thể:

Cụ thể làm như thế nào?

Bước 1: Thu thập tư liệu

Mở YouMind trên trình duyệt, tạo một Board mới (bạn có thể hiểu đây là một không gian dự án), sau đó lưu tất cả các tư liệu liên quan vào đó:

Bài viết trên web: Dán link, tự động lấy toàn bộ nội dung.
Video YouTube: Dán link, tự động lấy phụ đề và nội dung.
Luận văn PDF: Tải lên trực tiếp.
Podcast: Dán link, tự động phân tích âm thanh.
Ý tưởng cá nhân: Viết nhanh vào ghi chú.

Đây chính là thư mục raw/ của Karpathy, nhưng không cần tải xuống thủ công bất cứ thứ gì, cũng không cần thao tác với hệ thống tệp tin.

Bước 2: AI thấu hiểu và đối thoại

Sau khi tư liệu đã được lưu, bạn có thể đối thoại trực tiếp với AI ngay trong Board. Ngữ cảnh của AI chính là những tài liệu gốc liên quan đến chủ đề này mà chúng ta đã tự tay tuyển chọn, chứ không phải là những thông tin chung chung trên internet.

Bạn có thể hỏi nó:

"Các quan điểm cốt lõi của những bài viết này có gì giống và khác nhau?"
"Sự khác biệt bản chất giữa phương pháp của Karpathy và phương pháp luận PARA của Tiago Forte là gì?"
"Dựa trên những tư liệu này, hãy giúp tôi đúc kết ba góc độ chủ đề đáng viết nhất."

Bước này tương ứng với quá trình biên dịch wiki của Karpathy. Nhưng điểm khác biệt là: bạn không cần đợi LLM tự động tạo ra một bộ wiki hoàn chỉnh, mà thông qua đối thoại để chủ động dẫn dắt hướng thấu hiểu.

Bước 3: Từ thấu hiểu đến sáng tạo

Bước này là ranh giới then chốt. Quy trình làm việc của Karpathy kết thúc ở bước trên. Còn trong YouMind, bạn có thể trực tiếp dùng ngôn ngữ tự nhiên để ra lệnh cho AI chuyển từ thấu hiểu sang sáng tạo:

Dựa trên tư liệu và đối thoại, tạo một bản thảo blog có cấu trúc hoàn chỉnh.
Từ đối thoại và thấu hiểu, trích xuất các nội dung ngắn phù hợp để đăng lên Twitter.
Biến các luận điểm cốt lõi thành sơ đồ thông tin (infographic) trực quan.
Tạo trực tiếp các bản thuyết trình Slides.

Tất cả những sản phẩm này đều được lưu trong cùng một Board, cùng với tư liệu và lịch sử đối thoại của bạn. Chúng không phải là những tệp tin cô lập, mà là các nút thắt khác nhau trên cùng một chuỗi liên kết tri thức.

Bước 4: Kiến thức liên tục phát triển

Board không phải dùng một lần rồi bỏ. Bạn có thể thiết lập các tác vụ định kỳ để YouMind tự động thu thập các cập nhật tweet của Karpathy cho bạn và lưu vào cùng một Board, hoàn thành việc tích lũy tri thức theo lãi suất kép.

Đây mới là dáng vẻ mà một "bộ não thứ hai" nên có, không chỉ là tích lũy mà còn phải tạo ra kết quả.

Đặt phương pháp của Karpathy và YouMind cạnh nhau, chúng đại diện cho hai triết lý "bộ não thứ hai AI" khác nhau:

	Kho tri thức LLM của Karpathy	YouMind
Phù hợp với ai	Kỹ sư	Người sáng tạo, người làm việc trí óc
Chi phí thiết lập	Node.js, Terminal, Obsidian, Claude Code	Mở phiên bản trình duyệt YouMind là dùng được ngay
Hành động cốt lõi	Tư liệu → Kho tri thức (wiki)	Tư liệu → Thấu hiểu → Sáng tạo
Vai trò của AI	Thủ thư (sắp xếp, lập chỉ mục)	Cộng sự (đối thoại, thấu hiểu, cùng sáng tạo)
Điểm đích	Đọc và nghiên cứu	Sản xuất và xuất bản
Hình thái kiến thức	Tệp markdown	Nội dung đa phương thức, trực quan (bài viết, hình ảnh, Slides, trang web, video, v.v.)

Giải pháp thực sự cho nỗi lo âu thông tin

Cuối cùng, xin nói về một điều thú vị.

Karpathy đã xây dựng một wiki dài 400.000 chữ. Nhưng bạn thử nghĩ xem, cả thế giới đang trích dẫn điều gì? Không phải cái wiki đó, mà là các dòng tweet, video và các bài viết của anh ấy. Tệp markdown của anh ấy chỉ có mình anh ấy xem, còn tweet của anh ấy có 12 triệu người xem.

Kho tri thức thực sự không phải là một hệ thống, mà là một con người.

Bạn viết một bài báo giải thích thấu đáo một vấn đề, người khác lưu bài viết của bạn, trích dẫn quan điểm của bạn — khi đó bạn chính là kho tri thức của họ.

Đây mới là liều thuốc giải cho nỗi lo âu về kiến thức. Những người lo âu đang đổ dồn thông tin vào hệ thống, nghĩ rằng hệ thống sẽ thấu hiểu thay mình. Nhưng những người thực sự có tầm ảnh hưởng đang xuất bản sự thấu hiểu ra bên ngoài, biến mình thành nguồn thông tin của người khác.

Nhóm trước sẽ luôn lo âu vì thông tin là vô tận; nhóm sau không lo âu vì họ đã hoàn thành việc thấu hiểu thông qua sự diễn đạt.

Vì vậy, vấn đề chưa bao giờ là "làm thế nào để xây dựng một kho tri thức tốt hơn", mà là "làm thế nào để biến mình thành một kho tri thức". Câu trả lời rất đơn giản: liên tục xuất bản.

Việc YouMind làm chính là giúp bạn từ một người tiêu thụ thông tin trở thành nguồn phát thông tin.

Bài viết và hình ảnh minh họa này được đồng sáng tạo bởi biên tập viên và YouMind.