Meta releases AI model that can check other AI models' work
October 19, 2024
Facebook owner Meta said on Friday it was releasing a batch of new AI models from its research division, including a "Self-Taught Evaluator" that may offer a path toward less human involvement in the AI development process.
- Công ty chủ sở hữu Facebook, Meta, cho biết vào thứ Sáu rằng họ đang phát hành một loạt các mô hình AI mới từ bộ phận nghiên cứu của mình, bao gồm một "Người Đánh Giá Tự Học" có thể cung cấp một con đường giảm sự tham gia của con người trong quá trình phát triển AI.
A logo panel of Meta is placed at the Innovate Vietnam 2024 event in Hanoi, October 2024. Photo by VnExpress/Luu Quy
- Một bảng logo của Meta được đặt tại sự kiện Innovate Vietnam 2024 ở Hà Nội, tháng 10 năm 2024. Ảnh của VnExpress/Lưu Quý
The release follows Meta's introduction of the tool in an August paper, which detailed how it relies upon the same "chain of thought" technique used by OpenAI's recently released o1 models to get it to make reliable judgments about models' responses.
- Việc phát hành này theo sau việc Meta giới thiệu công cụ này trong một bài báo vào tháng 8, trong đó chi tiết cách công cụ này dựa vào kỹ thuật "chuỗi suy nghĩ" tương tự như các mô hình o1 mới được OpenAI phát hành gần đây để đưa ra những đánh giá đáng tin cậy về các phản hồi của mô hình.
That technique involves breaking down complex problems into smaller logical steps and appears to improve the accuracy of responses on challenging problems in subjects like science, coding and math.
- Kỹ thuật này bao gồm việc phân tích các vấn đề phức tạp thành các bước logic nhỏ hơn và dường như cải thiện độ chính xác của các phản hồi về các vấn đề thách thức trong các môn học như khoa học, lập trình và toán học.
Meta's researchers used entirely AI-generated data to train the evaluator model, eliminating human input at that stage as well.
- Các nhà nghiên cứu của Meta đã sử dụng hoàn toàn dữ liệu do AI tạo ra để huấn luyện mô hình đánh giá, loại bỏ sự tham gia của con người ở giai đoạn này.
The ability to use AI to evaluate AI reliably offers a glimpse at a possible pathway toward building autonomous AI agents that can learn from their own mistakes, two of the Meta researchers behind the project told Reuters.
- Khả năng sử dụng AI để đánh giá AI một cách đáng tin cậy mang đến cái nhìn thoáng qua về một con đường có thể xây dựng các tác nhân AI tự động có thể học từ những sai lầm của chính mình, hai trong số các nhà nghiên cứu của Meta đứng sau dự án đã nói với Reuters.
Many in the AI field envision such agents as digital assistants intelligent enough to carry out a vast array of tasks without human intervention.
- Nhiều người trong lĩnh vực AI hình dung các tác nhân như vậy là các trợ lý kỹ thuật số thông minh đủ để thực hiện một loạt các nhiệm vụ mà không cần sự can thiệp của con người.
Self-improving models could cut out the need for an often expensive and inefficient process used today called Reinforcement Learning from Human Feedback, which requires input from human annotators who must have specialized expertise to label data accurately and verify that answers to complex math and writing queries are correct.
- Các mô hình tự cải thiện có thể loại bỏ nhu cầu về một quy trình thường đắt đỏ và không hiệu quả được sử dụng ngày nay gọi là Học Tăng cường từ Phản hồi của Con người, đòi hỏi sự tham gia của các chú thích viên có chuyên môn đặc biệt để gắn nhãn dữ liệu một cách chính xác và xác minh rằng các câu trả lời cho các câu hỏi phức tạp về toán học và viết là đúng.
"We hope, as AI becomes more and more super-human, that it will get better and better at checking its work, so that it will actually be better than the average human," said Jason Weston, one of the researchers.
- "Chúng tôi hy vọng, khi AI trở nên ngày càng siêu nhân, nó sẽ ngày càng giỏi hơn trong việc kiểm tra công việc của mình, để nó thực sự tốt hơn so với con người trung bình," Jason Weston, một trong những nhà nghiên cứu, cho biết.
"The idea of being self-taught and able to self-evaluate is basically crucial to the idea of getting to this sort of super-human level of AI," he said.
- "Ý tưởng tự học và có thể tự đánh giá cơ bản là then chốt để đạt được mức độ AI siêu nhân này," ông nói.
Other companies including Google and Anthropic have also published research on the concept of RLAIF, or Reinforcement Learning from AI Feedback. Unlike Meta, however, those companies tend not to release their models for public use.
- Các công ty khác bao gồm Google và Anthropic cũng đã công bố nghiên cứu về khái niệm RLAIF, hay Học Tăng cường từ Phản hồi của AI. Tuy nhiên, không giống như Meta, những công ty này thường không phát hành các mô hình của họ cho công chúng sử dụng.
Other AI tools released by Meta on Friday included an update to the company's image-identification Segment Anything model, a tool that speeds up LLM response generation times and datasets that can be used to aid the discovery of new inorganic materials.
- Các công cụ AI khác được Meta phát hành vào thứ Sáu bao gồm một bản cập nhật cho mô hình nhận dạng hình ảnh của công ty, Segment Anything, một công cụ tăng tốc thời gian tạo phản hồi của LLM và các bộ dữ liệu có thể được sử dụng để hỗ trợ phát hiện các vật liệu vô cơ mới.