AI huấn luyện trên máy tính lượng tử IBM trả lời chính xác hơn mô hình gốc

Các nhà nghiên cứu đã phát triển một phương pháp giúp giảm độ bất định trong các hệ thống trí tuệ nhân tạo (AI) bằng cách tận dụng sức mạnh của máy tính lượng tử. Họ cho biết công trình này là minh chứng đầu tiên về ‘tăng cường lượng tử’ trên một mô hình ngôn ngữ lớn (LLM) quy mô sản xuất, đã được huấn luyện trước.

Một trong những thước đo chính để đánh giá chất lượng và khả năng của các hệ thống AI như Claude của Anthropic, ChatGPT của OpenAI và các dịch vụ tương tự là đơn vị gọi là ‘perplexity’ (độ bất định) – thường được viết tắt là PPL. Chỉ số này đo khả năng tổng quát của hệ thống trong việc dự đoán chính xác từ tiếp theo trong một câu hoặc chuỗi từ.

Hệ thống có PPL thấp được coi là tốt hơn trong việc dự đoán từ tiếp theo, trong khi hệ thống có PPL cao có khả năng toán học cao hơn trong việc tạo ra các đầu ra thất thường. Có nhiều phương pháp để giảm PPL trong các mô hình AI lớn, bao gồm tinh chỉnh, huấn luyện trên tập dữ liệu lớn hơn và thêm tham số.

Ví dụ, GPT-5.5 được ước tính có từ 2 nghìn tỷ đến 5 nghìn tỷ tham số. Trong tất cả các LLM tiêu chuẩn, mỗi tham số chiếm không gian trong bộ nhớ của hệ thống, nghĩa là khi các mô hình này trở nên lớn hơn và có khả năng hơn, chúng yêu cầu cơ sở hạ tầng ngày càng lớn hơn.

Nhưng các nhà khoa học tại Multiverse Computing đã tìm ra một giải pháp thay thế cho việc mở rộng quy mô cơ sở hạ tầng xung quanh AI. Trong một nghiên cứu mới được đăng tải lên cơ sở dữ liệu arXiv ngày 7 tháng 5, họ đề xuất rằng một sự gia tăng tương đối nhỏ về số lượng tham số trong mô hình AI có thể dẫn đến giảm đáng kể độ bất định khi chạy chúng bằng các khối mạch lượng tử – đơn vị cơ bản của tính toán lượng tử.

‘Các kết quả được báo cáo ở đây cấu thành, theo hiểu biết của chúng tôi, là minh chứng đầu tiên về tăng cường lượng tử đầu cuối của một LLM quy mô sản xuất, được triển khai rộng rãi trên phần cứng lượng tử siêu dẫn thực tế để tạo ngôn ngữ tự hồi quy’, các nhà khoa học viết trong nghiên cứu. ‘Ý nghĩa của chúng không nằm ở mức độ cải thiện độ bất định – vốn sẽ tăng lên cùng với độ trung thực của phần cứng và số lượng qubit – mà nằm ở thực tế là chúng tồn tại.’

Bước tiến cho AI tăng cường lượng tử

Trong nghiên cứu, các nhà nghiên cứu đã tạo ra và thực thi các khối mạch lượng tử gọi là bộ chuyển đổi đơn nhất tham số hóa Cayley (CUA).

Tham số Cayley là một tập hợp các ma trận toán học có thể được ‘huấn luyện’ bằng cách gán trọng số cho chúng theo các thành phần ma trận cụ thể. Chúng được chèn vào một lớp cụ thể của LLM để huấn luyện trên máy tính cổ điển.

Các tham số gốc của LLM được đóng băng trong quá trình này để chúng không thay đổi. Hệ thống lai mới chứa cả tham số Cayley đã được huấn luyện và tham số mô hình gốc sau đó được thực thi trên bộ xử lý lượng tử siêu dẫn IBM Quantum System Two 156 qubit.

Mô hình lai lượng tử-cổ điển kết quả đã giảm độ bất định của Llama 3.1 8B – một mô hình 8 tỷ tham số do Meta tạo ra – xuống 1,4% trong khi chỉ thêm 6.000 tham số (tăng 0,000075%).

Borja Aizpurua, nhà khoa học nghiên cứu cao cấp tại Multiverse Computing và là tác giả chính của nghiên cứu, mô tả kỹ thuật mới này như một bằng chứng về khái niệm cho sự phát triển tiếp theo. Trao đổi với Live Science, ông giải thích rằng máy tính lượng tử có thể mang lại một số lợi thế so với mô hình cổ điển thuần túy – nhưng đi kèm với sự đánh đổi.

‘Điều đầu tiên bạn làm là mã hóa [các tham số] trong máy tính lượng tử. Một khi bạn đã mã hóa trạng thái, bạn đã sẵn sàng áp dụng bộ chuyển đổi đơn nhất Cayley, mà chúng tôi huấn luyện theo cách cổ điển và sau đó triển khai trên phần cứng lượng tử’, ông nói.

Ông giải thích rằng các bộ chuyển đổi này nhỏ, điều này rất quan trọng vì mạch càng lớn thì càng có nhiều ‘nhiễu’. Nhiễu được tạo ra trong quá trình tính toán lượng tử – có thể đến từ tương tác với các qubit lân cận, nhiễu loạn từ từ trường Trái Đất, bức xạ từ Wi-Fi hoặc điện thoại, và thậm chí cả tia vũ trụ – có thể gây ra lỗi và làm cho đầu ra và phép đo trở nên vô nghĩa.

Như trong phần lớn nghiên cứu về điện toán lượng tử, sửa lỗi lượng tử là một trong những lĩnh vực quan tâm chính. Trong nghiên cứu này, giảm thiểu lỗi do nhiễu là trở ngại chính mà Aizpurua và nhóm Multiverse Computing đang cố gắng vượt qua.

Giải quyết các vấn đề thực tế

Các nhà khoa học đã nạp các bộ chuyển đổi đơn nhất Cayley đã được huấn luyện cổ điển vào hệ thống lượng tử trước khi suy luận đầu cuối – giai đoạn sử dụng AI nơi mô hình thực thi phản hồi – diễn ra. Sau đó, các đầu ra lai có thể được đo lường so với kết quả không tăng cường lượng tử thông thường.

Các nhà nghiên cứu phát hiện ra rằng mô hình lai có thể trả lời chính xác một số câu hỏi mà mô hình Llama gốc không thể.

Trong một câu hỏi thiên văn, mô hình gốc đã chọn sai đáp án chỉ ra rằng chỉ có Sao Thổ có các hành tinh kiểu Sao Mộc. Tuy nhiên, mô hình tăng cường CUA đã xác định chính xác tất cả các hành tinh kiểu Sao Mộc đều có vành đai.

Trong một ví dụ khác, mô hình gốc đã trả lời sai một câu hỏi sinh học về hậu quả di truyền quần thể của dòng gen, chọn ‘Phá vỡ cân bằng Hardy–Weinberg’ trong khi mô hình tăng cường CUA đã chọn chính xác ‘Tăng tính đồng nhất di truyền’.

‘Vì vậy, ở đây chúng ta có thể thấy một ví dụ trong đó một mô hình không trả lời đúng, và sau đó bạn thêm một thứ gì đó lượng tử và đột nhiên nó trả lời đúng’, Aizpurua nói.

Kết quả này, cùng với mức giảm độ bất định 1,4% được đo lường, cho thấy một con đường rõ ràng để phát triển các hệ thống AI lai lượng tử, Aizpurua cho biết. Ông nói thêm rằng nghiên cứu này có thể giúp các nhà nghiên cứu vượt qua các nút thắt phát triển hiện tại, nơi các hệ thống bị giới hạn bởi khả năng mở rộng cơ sở hạ tầng tính toán cổ điển của các nhà phát triển.

Nghiên cứu trong tương lai sẽ liên quan đến việc phát triển các phương pháp mà toàn bộ mạch lượng tử, không chỉ các bộ chuyển đổi đơn nhất Cayley, được mã hóa trực tiếp, Aizpurua nói. Điều này dự kiến sẽ tạo ra một LLM có khả năng đạt được độ bất định thấp hơn và độ chính xác cao hơn, sử dụng ít tham số hơn bất kỳ phương pháp cổ điển thuần túy nào.

Cuối cùng, ông nói, mục tiêu của nghiên cứu là tạo ra các hệ thống AI chất lượng cao hơn có khả năng đạt được ‘lợi thế lượng tử’, một thuật ngữ mô tả một hệ thống máy tính dựa trên lượng tử có khả năng thực hiện các kỳ tích mà bất kỳ máy tính cổ điển nào cũng không thể đạt được.

Related Stories