Tôi đã dành cả ngày để dùng Spec Kit của GitHub, cái vừa ra mắt tuần này, và nó thật là một cực hình.
Tôi có một bài kiểm tra tôi chạy trên tất cả các tác nhân code. Tôi yêu cầu nó xây dựng một thư mục nhân viên với khả năng cho HR thêm/cập nhật hồ sơ nhân viên
Với bài kiểm tra của tôi, tôi tự thiết lập một dự án với Nextjs, shadcn và Neon, sau đó để model tự làm.
Đôi khi một model tạo ra điều kỳ diệu, và những lúc khác nó tạo ra đống lộn xộn không biên dịch được. Trong thử nghiệm của tôi, Claude 4 và GPT-5 mang lại thiết kế tốt nhất và chức năng đầy đủ nhất.
Spec Kit của GitHub hứa hẹn sẽ loại bỏ sự ngẫu nhiên khi sử dụng các model code. Nó hướng dẫn model tạo ra các câu chuyện người dùng và các tác vụ để đi đúng hướng.
Vậy, nó hoạt động như thế nào?
Spec Kit với GPT-5 mất hàng giờ trao đổi qua lại, đọc và phản hồi và nhả ra...thư mục nhân viên được thiết kế tệ nhất và ít chức năng nhất trong các bài kiểm tra của tôi.
Mặc dù tất cả các tác vụ đã được hoàn thành, nó không tạo ra một biểu mẫu đăng nhập cho HR hoặc gieo mầm thư mục với các hồ sơ. Về mặt kỹ thuật, đó là lỗi của tôi vì không bắt được điều đó trong kế hoạch, nhưng tất cả các tác nhân code khác đều làm được điều đó mà không cần tôi yêu cầu.
Sử dụng Spec Kit giống như việc quản lý vi mô một nhà phát triển siêu tài năng. Nó đã làm những gì tôi yêu cầu nhưng KHÔNG hơn gì cả.
Và việc trao đổi qua lại mất nhiều thời gian hơn là chỉ để một model tự tạo ra một cái gì đó, và vứt bỏ nó nếu nó không hoạt động, sau đó thử lại.
Vì vậy, nó chắc chắn không dành cho việc code theo cảm hứng. Tôi nghĩ nó giống như code một cách vất vả hơn.