banner-news

 

Google chính thức phát hành Gemini 2.5 Deep Think: Trí tuệ nhân tạo đạt chuẩn Olympic Toán học bước vào tay người dùng

Ngày 01 tháng 8 năm 2025, Google chính thức công bố tính năng Deep Think trong mô hình Gemini 2.5, hiện đã có mặt cho người đăng ký gói Gemini Advanced. Đây là cột mốc mới khi một mô hình AI thương mại thể hiện năng lực giải toán nâng cao, đạt mức bronze trong bài kiểm tra mô phỏng chuẩn IMO do Google phát triển.

1

Deep Think là gì?

Deep Think là chế độ suy luận nâng cao (advanced reasoning mode) được tích hợp trong Gemini 2.5 – mô hình ngôn ngữ hàng đầu của Google. Khác với các mô hình AI truyền thống chỉ phản hồi dựa trên một dòng suy nghĩ đơn tuyến, Deep Think vận hành bằng phương pháp “tư duy song song” (parallel thinking).

Cụ thể, khi nhận một câu hỏi, Deep Think sẽ:

  • Đồng thời tạo ra nhiều hướng tư duy, giả thuyết, hoặc lời giải khác nhau.
  • So sánh, đánh giá và chọn phương án hợp lý nhất trước khi phản hồi người dùng.

Cách tiếp cận này mô phỏng quy trình suy nghĩ của chuyên gia, giúp mô hình có khả năng giải quyết các vấn đề logic phức tạp, bài toán nhiều bước, hoặc lập trình sâu, thay vì chỉ tạo văn bản bề mặt.

Có thể nói, AI đầu tiên tiếp cận chuẩn Olympic Toán học là Gemini 2.5 Deep Think.

Một trong những minh chứng nổi bật cho sức mạnh của Deep Think là việc giải thành công các bài toán của kỳ thi Olympic Toán quốc tế (IMO). Trong thử nghiệm nội bộ, phiên bản nghiên cứu của Gemini 2.5 Deep Think đã đạt 35/42 điểm – tương đương “huy chương vàng” theo chuẩn của IMO.

Dù phiên bản đạt chuẩn gold-medal này hiện chỉ được sử dụng trong môi trường nghiên cứu nội bộ tại Google DeepMind, thì người dùng gói Ultra từ hôm nay đã có thể trải nghiệm một phiên bản tối ưu hóa dành cho thực tế, đạt mức "bronze-level performance" trong các benchmark tương đương.

Vậy có những gì trong bản phát hành cho người dùng?

Người dùng gói Google AI Ultra ($249/tháng) hiện đã có thể truy cập Deep Think thông qua:

  • Ứng dụng Gemini App trên điện thoại hoặc web.
  • Chọn model Gemini 2.5 Pro → bật tùy chọn Deep Think trong phần thiết lập.

Phiên bản phát hành cho người dùng vẫn giữ được:

  • Khả năng lập luận nhiều bước, đặc biệt trong toán học, vật lý, viết mã.
  • Tích hợp Google Search, code execution và hỗ trợ câu trả lời dài, giàu lý luận.
  • Giao diện đơn giản, dễ dùng, phản hồi chậm hơn bình thường nhưng sâu hơn và có dẫn giải.

Ngoài IMO, Deep Think còn vượt trội trong nhiều bài đánh giá tiêu chuẩn cao:

  • LiveCodeBench v6 – bài test chuyên cho khả năng viết và sửa mã phức tạp.
  • Humanity’s Last Exam – một tập hợp các câu hỏi kiểm tra suy luận, đạo đức, tư duy phản biện.
  • Vượt nhiều đối thủ như GPT-4o, Claude 3.5 Sonnet, Grok 4 trên các tiêu chí reasoning depth và structured output.

Như Sundar Pichai từng chia sẻ trên blog Google, Deep Think là một bước tiến quan trọng nhằm đưa AI tiến gần hơn đến khả năng hiểu, lập luận và cộng tác như con người. Google cũng nhấn mạnh rằng Deep Think sẽ là phần không thể thiếu trong hành trình hướng tới Trí tuệ nhân tạo cấp độ con người (AGI), với các phiên bản mạnh hơn nữa đang được thử nghiệm trong các lĩnh vực như giáo dục, toán học và khoa học mở.

2
Sundar Pichai - người dẫn đầu tầm nhìn AI của Google

Như Sundar Pichai từng chia sẻ trên blog Google, Deep Think là một bước tiến quan trọng nhằm đưa AI tiếNói tóm lại, Deep Think không chỉ là một bản nâng cấp – nó là lời khẳng định rằng AI hoàn toàn có thể trở thành cộng sự tư duy thực thụ, đồng hành cùng con người trong những vấn đề khó khăn nhất. gần hơn đến khả năng hiểu, lập luận và cộng tác như con người. Google cũng nhấn mạnh rằng Deep Think sẽ là phần không thể thiếu trong hành trình hướng tới Trí tuệ nhân tạo cấp độ con người (AGI), với các phiên bản mạnh hơn nữa đang được thử nghiệm trong các lĩnh vực như giáo dục, toán học và khoa học mở.

Nguồn tham khảo:

  1. Google. (2025, August 1). Gemini 2.5: Deep Think is now rolling out. Google Blog. https://blog.google/products/gemini/gemini-2-5-deep-think/
  2. TechCrunch. (2025, August 1). Google rolls out Gemini Deep Think AI, a reasoning model that tests multiple ideas in parallel. https://techcrunch.com/2025/08/01/google-rolls-out-gemini-deep-think-ai-a-reasoning-model-that-tests-multiple-ideas-in-parallel/
  3. Tom’s Guide. (2025, August 1). Google’s new Deep Think feature is here: What it does and why it might not stay Ultra-exclusive for long. https://www.tomsguide.com/ai/googles-new-deep-think-feature-is-here-what-it-does-and-why-it-might-not-stay-ultra-exclusive-for-long