Người đứng sau hậu trường AI toàn cầu là ai?

Đằng sau các mô hình như ChatGPT, Gemini hay Llama không chỉ có thuật toán và máy chủ. Phần lớn dữ liệu huấn luyện chúng được con người gắn nhãn, phân loại và kiểm duyệt thủ công — công việc mà Scale AI biến thành một ngành kinh doanh riêng.

Khi các phòng lab AI chạy đua tăng số tham số mô hình, Alexandr Wang và Lucy Guo lại đặt câu hỏi khác: dữ liệu huấn luyện lấy từ đâu, và làm sao đảm bảo chất lượng.

Câu trả lời là Scale AI, thành lập năm 2016 khi Wang mới học năm nhất tại MIT. Wang sinh năm 1997 tại Los Alamos, New Mexico, nơi bố mẹ anh — đều là nhà vật lý — làm việc tại Phòng thí nghiệm Quốc gia Los Alamos.

Lớn lên trong môi trường nghiên cứu khoa học, Wang học lập trình sớm và thi toán, tin học cấp quốc gia từ lớp 6. Trước khi vào MIT, anh gap year ở Silicon Valley, làm kỹ sư tại Quora — nơi gặp Lucy Guo, người sau này đồng sáng lập Scale AI cùng anh.

Ý tưởng Scale AI xuất phát từ một vấn đề cụ thể: mọi mô hình học máy đều cần dữ liệu gắn nhãn chính xác để nhận diện vật thể, hiểu văn bản, đánh giá câu trả lời. Trước đó việc này thường thuê qua các nền tảng crowdsourcing như Amazon Mechanical Turk, nhưng khó kiểm soát chất lượng và khó mở rộng quy mô.

Alexandr Wang, nhà đồng sáng lập Scale AI - (Ảnh: Internet)

Wang rời MIT năm 2016, cùng Guo xây dựng Scale AI theo hướng kết hợp tự động hóa với lao động con người, để kiểm soát quy trình gắn nhãn tốt hơn.

Công ty khởi đầu với vòng gọi vốn hạt giống 120.000 USD từ Y Combinator. Đến năm 2021, Scale AI được định giá hơn 7 tỷ USD, đưa Wang, khi đó 24 tuổi, thành tỷ phú tự thân trẻ nhất thế giới theo Forbes.

Hiện Scale AI cung cấp dữ liệu huấn luyện và dịch vụ đánh giá mô hình cho OpenAI, Google, Microsoft, Meta, General Motors và nhiều công ty khác. Công ty cũng có các hợp đồng quốc phòng với chính phủ Mỹ, trong đó có dự án Thunderforge triển khai từ tháng 3/2025 cùng Anduril và Microsoft, dùng AI hỗ trợ lập kế hoạch, điều phối tàu chiến, máy bay và các khí tài quân sự khác.

Về vận hành, Scale AI hoạt động như một công ty dịch vụ dữ liệu công nghệ cao: tuyển lao động tự do, chủ yếu tại Philippines, Kenya và Venezuela, giao việc gắn nhãn, kiểm soát chất lượng đầu ra rồi bán kết quả cho các phòng lab AI. Mô hình tính phí theo tác vụ giúp công ty đạt biên lợi nhuận gộp trên 50%.

Tháng 6/2025, Meta đầu tư 14,3 tỷ USD vào Scale AI, đổi lấy 49% cổ phần không có quyền biểu quyết, nâng định giá công ty lên gần 29 tỷ USD. Alexandr Wang chuyển sang Meta làm Chief AI Officer, phụ trách Meta Superintelligence Labs. Ghế CEO Scale AI chuyển cho Jason Droege, cựu giám đốc chiến lược công ty, còn Scale AI tiếp tục hoạt động độc lập.

Thỏa thuận này khiến một số khách hàng lớn của Scale AI — trong đó có các phòng lab cạnh tranh trực tiếp với Meta như Google và OpenAI — tìm nhà cung cấp dữ liệu khác, vì lo ngại Meta có thể tiếp cận thông tin về quy trình huấn luyện mô hình của họ.

Scale AI cũng đối mặt nhiều vụ kiện từ cựu nhân viên. Từ tháng 12/2024, công ty bị kiện vì phân loại sai lao động tự do thay vì nhân viên chính thức, ảnh hưởng đến quyền làm thêm giờ và phúc lợi. Một nhóm nhân viên khác kiện công ty vì tổn hại tâm lý do phải tiếp xúc liên tục với nội dung bạo lực, độc hại khi gắn nhãn dữ liệu. Bộ Lao động Mỹ cũng đang điều tra Scale AI về việc tuân thủ Đạo luật Tiêu chuẩn Lao động Công bằng (FLSA), bắt đầu ít nhất từ tháng 8/2024.

Trụ sở Scale AI tại San Francisco - (Ảnh: Internet)

Trước mắt, Scale AI còn phải tính đến ảnh hưởng của dữ liệu tổng hợp — dữ liệu do AI tạo ra để huấn luyện AI khác — lên nhu cầu gắn nhãn thủ công. Tháng 3/2026, công ty ra mắt Scale Labs, bộ phận nghiên cứu tập trung vào đánh giá mô hình, phương pháp huấn luyện sau và giám sát rủi ro AI, mở rộng vai trò ra ngoài việc cung cấp nhân lực gắn nhãn.

Theo Forbes, tài sản ròng của Alexandr Wang ước tính khoảng 3,6 tỷ USD tính đến tháng 4/2025.