Google chính thức ra mắt Gemini 2.5 Pro: Không trả phí vẫn dùng được

Google đã chính thức kết thúc giai đoạn thử nghiệm và phát hành rộng rãi mô hình AI Gemini 2.5 Pro sau 3 tháng thử nghiệm.

Sau ba tháng thử nghiệm kể từ cuối tháng 3, nhãn "preview" (xem trước) đã được gỡ bỏ khỏi bộ chọn mô hình trong ứng dụng Gemini, đánh dấu sự ổn định và sẵn sàng của phiên bản này. Quá trình ra mắt diễn ra khá nhanh chóng, khi mô hình này đã bất ngờ được mở cho người dùng miễn phí chỉ vài ngày sau khi giới thiệu cho các tài khoản trả phí.

Gemini 2.5 Pro nổi bật với khả năng suy luận logic, giải toán, lập trình phức tạp và đặc biệt là cửa sổ ngữ cảnh khổng lồ lên tới 2 triệu token. Điều này cho phép nó xử lý và phân tích một lượng thông tin khổng lồ cùng lúc, tương đương với việc "đọc" toàn bộ một series tiểu thuyết hoặc một kho mã nguồn lớn chỉ trong một lần yêu cầu.

Google chính thức ra mắt Gemini 2.5 Pro: Không trả phí vẫn dùng được- Ảnh 1.

Thông tin đáng chú ý nhất trong lần ra mắt này là chiến lược phân cấp quyền truy cập của Google:

Người dùng miễn phí: Sẽ tiếp tục có "quyền truy cập hạn chế" vào Gemini 2.5 Pro. Điều này cho phép người dùng phổ thông có cơ hội trải nghiệm sức mạnh của mô hình AI tiên tiến nhất mà không cần trả phí.
Người dùng trả phí (Gói AI Pro): Sẽ có "quyền truy cập mở rộng" với giới hạn 100 câu lệnh mỗi ngày, phù hợp cho những người cần sử dụng thường xuyên cho các tác vụ phức tạp.
Người dùng cao cấp (Gói AI Ultra): Sẽ có "quyền truy cập cao nhất", đảm bảo hiệu năng và sự ưu tiên tối đa.

Bên cạnh đó, Google cũng làm rõ sự khác biệt giữa hai mô hình chính trong ứng dụng: Pro dành cho các tác vụ đòi hỏi “Suy luận, toán học & lập trình”, trong khi Flash tập trung vào việc “Trợ giúp nhanh toàn diện”.

Song song với việc ra mắt 2.5 Pro, Google cũng mang đến những cập nhật lớn cho các nhà phát triển đang xây dựng ứng dụng trên nền tảng của mình.

Google chính thức ra mắt Gemini 2.5 Pro: Không trả phí vẫn dùng được- Ảnh 2. — Google

Theo đó, mô hình Gemini 2.5 Flash, vốn được tối ưu cho tốc độ và hiệu quả chi phí, cũng đã được phát hành chính thức. Bảng giá API của mô hình này đã được điều chỉnh như sau:

Token đầu vào: 0.30 USD / 1 triệu token (tăng từ 0.15 USD)
Token đầu ra: 2.50 USD / 1 triệu token (giảm từ 3.50 USD)

Google cũng đã loại bỏ sự chênh lệch giá giữa chế độ “thinking” (có suy nghĩ) và “non-thinking” (không suy nghĩ) trước đây, áp dụng một bậc giá duy nhất để đơn giản hóa việc tính toán chi phí cho nhà phát triển.

Ngoài ra, Google còn bất ngờ giới thiệu một thành viên mới trong gia đình Gemini: Gemini 2.5 Flash Lite, hiện đang ở giai đoạn xem trước. Đây là mô hình được thiết kế đặc biệt cho các tác vụ "có khối lượng lớn và nhạy cảm với độ trễ" như dịch thuật, phân loại văn bản, nơi chi phí và tốc độ là ưu tiên hàng đầu.

Flash Lite được quảng cáo là có độ trễ thấp hơn và chất lượng vượt trội hơn phiên bản 2.0 Flash-Lite, hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token và tích hợp sẵn các công cụ mạnh mẽ như lấy thông tin nền tảng từ Google Search và thực thi mã.

Động thái này của Google cho thấy một chiến lược phân cấp sản phẩm AI vô cùng rõ ràng. Bằng cách cung cấp quyền truy cập hạn chế vào mô hình Pro cho người dùng miễn phí, Google vừa giữ chân được một lượng lớn người dùng phổ thông, vừa tạo ra động lực để họ nâng cấp lên các gói trả phí. Đồng thời, việc cung cấp một loạt các mô hình chuyên biệt (Pro, Flash, Flash Lite) với các mức giá khác nhau cho thấy Google muốn trao cho các nhà phát triển một bộ công cụ linh hoạt và tối ưu nhất, củng cố vị thế cạnh tranh trực tiếp với các đối thủ như OpenAI và Anthropic trên thị trường AI toàn cầu.

Theo: 9to5Google